針鋒相對!Kimi和DeepSeek同日發(fā)布新模型,對標(biāo) OpenAI o1!
來源:證券時報網(wǎng)作者:周春媚2025-01-21 12:52

國產(chǎn)AI大模型,提前過年了。

1月20日晚間,月之暗面(Kimi)和深度求索(DeepSeek)這兩大備受矚目的AI大模型創(chuàng)業(yè)公司,幾乎是同時發(fā)布了新模型,并均聲稱新模型的性能對標(biāo)OpenAI的o1模型。值得注意的是,在DeepSeek發(fā)布新模型后的兩小時后,Kimi緊隨其后也推出了新模型,頗有些“針鋒相對”的意味。

在去年年底DeepSeek爆火之后,這家來自來自杭州、低調(diào)又神秘的創(chuàng)業(yè)公司賺足世人眼球的同時,也極大地改變了國產(chǎn)大模型創(chuàng)業(yè)公司的競爭格局,對國產(chǎn)大模型“六小虎”構(gòu)成了一定的沖擊。作為行業(yè)的“鯰魚”,DeepSeek如今的一舉一動都攪動著行業(yè)的潮流。進入2025年,國產(chǎn)大模型之間的競爭將變得越來越激烈,一場決定存亡的“決戰(zhàn)”已經(jīng)打槍。

同日發(fā)布對標(biāo)OpenAI o1的新模型

1月20日晚間,深度求索公司正式發(fā)布新模型DeepSeek-R1,并同步開源模型權(quán)重。據(jù)官方介紹,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。

根據(jù)其發(fā)布的模型性能評測結(jié)果,在美國數(shù)學(xué)競賽(AMC)中難度等級最高的AIME以及全球頂級編程競賽(codeforces)等權(quán)威評測中,DeepSeek-R1模型成績與OpenAIo1不相上下,甚至在某些指標(biāo)小幅超越OpenAIo1模型。與此同時,除了DeepSeek-R1以外,團隊還開源了6個由R1模型蒸餾而來的小型模型,其中的32B與70B模型性能也能比肩OpenAI-o1-mini模型。

在API定價方面,DeepSeek延續(xù)了一貫的低價風(fēng)格,輸入費用低至每百萬tokens1元(緩存命中)/4元(緩存未命中),輸出費用僅為每百萬tokens16元,整體支出較o1節(jié)省96%,這無疑使得Deepseek-R1在成本效益上具備了壓倒性的競爭力。

就在DeepSeek-R1發(fā)布后的短短兩個小時后,月之暗面也發(fā)布了k1.5多模態(tài)思考模型。據(jù)介紹,從基準(zhǔn)測試成績看,k1.5多模態(tài)思考模型實現(xiàn)了SOTA(state-of-the-art)級別的多模態(tài)推理和通用推理能力。(在科學(xué)研究、技術(shù)發(fā)展和各種專業(yè)領(lǐng)域中,“SOTA”,通常用來指代某個領(lǐng)域中最先進的技術(shù)或方法。)

具體來看,在short-CoT模式下,Kimik1.5的數(shù)學(xué)、代碼、視覺多模態(tài)和通用能力,大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude3.5 Sonnet的水平,領(lǐng)先達到550%;在long-CoT模式下,Kimik1.5的數(shù)學(xué)、代碼、多模態(tài)推理能力,也達到長思考SOTA模型OpenAIo1正式版的水平。

國產(chǎn)大模型“六小虎”已變?yōu)椤捌咝姟?/strong>

去年12月26日,深度求索宣布全新系列模型DeepSeek-V3上線并同步開源。這一模型不僅以卓越的性能超越或媲美全球頂級的開源及閉源模型,更重要的是訓(xùn)練成本極低,被稱為“AI界的拼多多”,以史無前例的性價比被國內(nèi)外一眾圈內(nèi)大佬點贊,引發(fā)廣泛關(guān)注。

隨著DeepSeek-V3的爆火,其背后的大模型創(chuàng)業(yè)公司深度求索也進入了大家的視野。過去的半個多月里,全網(wǎng)都在扒DeepSeek背后的團隊,并發(fā)現(xiàn)DeepSeek團隊最大的特點就是年輕,來自清華北大的應(yīng)屆生在其中非?;钴S,核心技術(shù)崗位基本以應(yīng)屆和畢業(yè)一兩年的人為主。因此,這個年輕的、由清北應(yīng)屆生撐起來的公司也被稱為“組織形態(tài)上最像OpenAI的中國AI公司”。

業(yè)內(nèi)人士分析稱,DeepSeek從創(chuàng)立開始就是中國大模型的技術(shù)創(chuàng)新者,在大廠和創(chuàng)業(yè)公司都在遵循著Llama架構(gòu)的時候,它選擇對模型架構(gòu)進行了全方位創(chuàng)新,提出的一種嶄新的MLA(一種新的多頭潛在注意力機制)架構(gòu),把顯存占用降到了過去最常用的MHA架構(gòu)的5%—13%,同時獨創(chuàng)的DeepSeekMoESparse結(jié)構(gòu)也把計算量降到極致,最終促成了成本的下降。而且與早期的OpenAI類似的是,Deepseek兼具高密度的人才團隊和持續(xù)創(chuàng)新的精神,因而能持續(xù)地給中國大模型帶來驚喜。

而事實上,月之暗面也曾被視為“最有可能成為中國OpenAI的公司”。去年年初,月之暗面憑借以長文本為核心優(yōu)勢的Kimi智能助手產(chǎn)品火爆出圈。彼時,頭頂著“90后清華校友技術(shù)天才創(chuàng)業(yè)者”“最強長文本”等諸多光環(huán),月之暗面迅速完成了巨額的融資,吸引一眾知名投資機構(gòu)加持,躋身“200億元估值俱樂部”,成為國產(chǎn)大模型創(chuàng)業(yè)公司的“頂流”。

然而在爆火之后,Kimi因激進的流量投放策略、創(chuàng)始人套現(xiàn)傳聞、投資人仲裁風(fēng)波等事件,屢屢陷入輿論的風(fēng)口浪尖。與此同時,國產(chǎn)大模型的競賽在經(jīng)歷了“百模大戰(zhàn)”后,尚留在牌桌中的玩家之間的競爭也更趨于激烈。Kimi不僅在流量投放上面臨著字節(jié)豆包的瘋狂進攻,而且競爭對手也紛紛發(fā)力長文本能力,Kimi的優(yōu)勢逐漸變得不那么明顯。

頭頂著“清北應(yīng)屆生”光環(huán)的DeepSeek,無疑給包括Kimi在內(nèi)的國產(chǎn)大模型創(chuàng)業(yè)公司帶來了壓力。業(yè)內(nèi)有人認(rèn)為,DeepSeek事實上已經(jīng)可以和“六小虎”(智譜AI、月之暗面、百川智能、Minimax、階躍星辰、零一萬物)并列成為“七小強”。更重要的是,DeepSeek由國內(nèi)知名量化資管巨頭幻方量化創(chuàng)立,未進行過任何融資,特點是“少花錢多辦事”,與依靠融資輸血、估值水漲船高的其他創(chuàng)業(yè)公司相比顯得格外另類。

這一低調(diào)的技術(shù)黑馬,無論是技術(shù)路線還是發(fā)展模式,都走出了一條與眾不同的道路,也改變了國產(chǎn)大模型的競爭格局。隨著競爭繼續(xù)向深水區(qū)挺進,誰能留在牌桌上笑到最后,或許能在2025年見分曉。

校對:祝甜婷

責(zé)任編輯: 冉超
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換