摩根士丹利 (MS.US) 近日發(fā)布一份研究報(bào)告,提前揭露中國(guó)人工智慧(AI)新創(chuàng)公司 DeepSeek 即將推出的最新大語(yǔ)言模型 R2。儘管篇幅不長(zhǎng),報(bào)告內(nèi)容卻資訊量很多,引起 AI 圈關(guān)注。
根據(jù)報(bào)告,DeepSeek R2 模型總參數(shù)高達(dá) 1.2 兆,是前一代 R1 的兩倍以上。活躍參數(shù)(active parameters)也從 370 億提升至 780 億,使模型在推理過(guò)程中調(diào)用更多「腦細(xì)胞」,大幅提升語(yǔ)言理解與輸出品質(zhì)。
這一設(shè)計(jì)理念與 Google (GOOGL.US) Gemini、Anthropic Claude 等頂級(jí)模型策略一致,主打更深層、更準(zhǔn)確的 AI 思考能力。
DeepSeek R2 不僅更強(qiáng),還更便宜。報(bào)告指出,R2 每百萬(wàn)個(gè)字符(Token)輸入僅需 0.07 美元,輸出字符成本則降至 0.27 美元,相較於 OpenAI GPT-4o 的 2.50 美元輸入與 10.00 美元輸出,價(jià)格整體便宜約 97%。
如此大幅成本優(yōu)勢(shì),對(duì) AI 開(kāi)發(fā)者、SaaS 平臺(tái)與企業(yè)使用者都是極具吸引力的替代選擇。
此外,R2 在三大技術(shù)面也有顯著提升:
- 多語(yǔ)言與程式碼生成能力優(yōu)化:尤其針對(duì)英文以外語(yǔ)言進(jìn)行強(qiáng)化,並強(qiáng)化程式語(yǔ)言理解與輸出。
- 採(cǎi)用高效混合專家 MoE(Mixture of Experts)架構(gòu):透過(guò)動(dòng)態(tài)啟用子網(wǎng)路提升推理效率與節(jié)省運(yùn)算成本。
- 多模態(tài)能力強(qiáng)化:視覺(jué)處理與圖像理解表現(xiàn)優(yōu)於前代,有望在 AI 助理、圖文生成等領(lǐng)域展現(xiàn)更高價(jià)值。
報(bào)告同時(shí)指出,DeepSeek 已逐步擺脫對(duì)輝達(dá) (NVDA.US) H100 晶片依賴,轉(zhuǎn)而採(cǎi)用華為昇騰 910B 晶片集群進(jìn)行訓(xùn)練與推理作業(yè),被視為中國(guó) AI 供應(yīng)鏈自主化的重大突破,有望降低對(duì)美國(guó)晶片技術(shù)的依賴,強(qiáng)化本土算力供應(yīng)鏈。
目前,DeepSeek 的模型產(chǎn)品線包含三大核心系列:
- V 系列:泛用型大語(yǔ)言模型,涵蓋推理、效率與 AI Agent 應(yīng)用;
- R 系列:主打數(shù)理推理、多步邏輯與工具鏈整合,R2 即屬該系列;
- Prover-V2:針對(duì)數(shù)學(xué)任務(wù)高度優(yōu)化的模型,專為精準(zhǔn)計(jì)算與證明設(shè)計(jì)。
雖然摩根士丹利說(shuō) R2 快來(lái)了,但以 DeepSeek 一貫的節(jié)奏推測(cè),真正的 R2 估計(jì)還得再等等。
從過(guò)去看,DeepSeek 的模型更新節(jié)奏比較固定,每?jī)蓚€(gè)月會(huì)有一個(gè)小版本更新,接著進(jìn)行一個(gè)大版本換代。
以通用模型 V1 為例,V1 是在 2023 年 11 月發(fā)布,V2 的發(fā)佈時(shí)間是 2024 年 5 月,而 V3 的發(fā)佈時(shí)間則到了 2024 年 12 月。依照這個(gè)節(jié)奏,2025 年 6、7 月份,DeepSeek 會(huì)有一個(gè)比較大的版本更新。
值得一提的是,DeepSeek 於 5 月 29 日悄然推出強(qiáng)化版 R1-0528。雖然架構(gòu)沒(méi)動(dòng),但這個(gè)版本引入了強(qiáng)化學(xué)習(xí)訓(xùn)練(RLHF),推理深度明顯加強(qiáng)。
該版本在多項(xiàng) AI 基準(zhǔn)測(cè)試中大幅進(jìn)步:
- AIME 2024 數(shù)學(xué)競(jìng)賽:+21 分
- LiveCodeBench 程式生成:+15 分
- GPQA Diamond 科學(xué)推理:+10 分
- Humanity"s Last Exam 知識(shí)推理:+6 分
強(qiáng)化後的邏輯、程式設(shè)計(jì)與互動(dòng)能力獲得開(kāi)發(fā)者與用戶的正面評(píng)價(jià),也讓外界猜測(cè)這或許是 R2 的前導(dǎo)版本或測(cè)試平臺(tái)。
(美股為即時(shí)串流報(bào)價(jià); OTC市場(chǎng)股票除外,資料延遲最少15分鐘。)新聞來(lái)源 (不包括新聞圖片): 鉅亨網(wǎng)