51吃瓜中心,波多野结衣一区二区三区av

針鋒相對！Kimi和DeepSeek同日發(fā)布新模型，對標(biāo) OpenAI o1！

來源：證券時報網(wǎng)作者：周春媚2025-01-21 12:52

國產(chǎn)AI大模型，提前過年了。

1月20日晚間，月之暗面（Kimi）和深度求索（DeepSeek）這兩大備受矚目的AI大模型創(chuàng)業(yè)公司，幾乎是同時發(fā)布了新模型，并均聲稱新模型的性能對標(biāo)OpenAI的o1模型。值得注意的是，在DeepSeek發(fā)布新模型后的兩小時后，Kimi緊隨其后也推出了新模型，頗有些“針鋒相對”的意味。

在去年年底DeepSeek爆火之后，這家來自來自杭州、低調(diào)又神秘的創(chuàng)業(yè)公司賺足世人眼球的同時，也極大地改變了國產(chǎn)大模型創(chuàng)業(yè)公司的競爭格局，對國產(chǎn)大模型“六小虎”構(gòu)成了一定的沖擊。作為行業(yè)的“鯰魚”，DeepSeek如今的一舉一動都攪動著行業(yè)的潮流。進入2025年，國產(chǎn)大模型之間的競爭將變得越來越激烈，一場決定存亡的“決戰(zhàn)”已經(jīng)打槍。

同日發(fā)布對標(biāo)OpenAI o1的新模型

1月20日晚間，深度求索公司正式發(fā)布新模型DeepSeek-R1，并同步開源模型權(quán)重。據(jù)官方介紹，DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù)，在僅有極少標(biāo)注數(shù)據(jù)的情況下，極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上，性能比肩OpenAI o1正式版。

根據(jù)其發(fā)布的模型性能評測結(jié)果，在美國數(shù)學(xué)競賽（AMC）中難度等級最高的AIME以及全球頂級編程競賽（codeforces）等權(quán)威評測中，DeepSeek-R1模型成績與OpenAIo1不相上下，甚至在某些指標(biāo)小幅超越OpenAIo1模型。與此同時，除了DeepSeek-R1以外，團隊還開源了6個由R1模型蒸餾而來的小型模型，其中的32B與70B模型性能也能比肩OpenAI-o1-mini模型。

在API定價方面，DeepSeek延續(xù)了一貫的低價風(fēng)格，輸入費用低至每百萬tokens1元（緩存命中）/4元（緩存未命中），輸出費用僅為每百萬tokens16元，整體支出較o1節(jié)省96%，這無疑使得Deepseek-R1在成本效益上具備了壓倒性的競爭力。

就在DeepSeek-R1發(fā)布后的短短兩個小時后，月之暗面也發(fā)布了k1.5多模態(tài)思考模型。據(jù)介紹，從基準(zhǔn)測試成績看，k1.5多模態(tài)思考模型實現(xiàn)了SOTA（state-of-the-art）級別的多模態(tài)推理和通用推理能力。（在科學(xué)研究、技術(shù)發(fā)展和各種專業(yè)領(lǐng)域中，“SOTA”，通常用來指代某個領(lǐng)域中最先進的技術(shù)或方法。）

具體來看，在short-CoT模式下，Kimik1.5的數(shù)學(xué)、代碼、視覺多模態(tài)和通用能力，大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude3.5 Sonnet的水平，領(lǐng)先達到550%；在long-CoT模式下，Kimik1.5的數(shù)學(xué)、代碼、多模態(tài)推理能力，也達到長思考SOTA模型OpenAIo1正式版的水平。

國產(chǎn)大模型“六小虎”已變?yōu)椤捌咝姟?/strong>

去年12月26日，深度求索宣布全新系列模型DeepSeek-V3上線并同步開源。這一模型不僅以卓越的性能超越或媲美全球頂級的開源及閉源模型，更重要的是訓(xùn)練成本極低，被稱為“AI界的拼多多”，以史無前例的性價比被國內(nèi)外一眾圈內(nèi)大佬點贊，引發(fā)廣泛關(guān)注。

隨著DeepSeek-V3的爆火，其背后的大模型創(chuàng)業(yè)公司深度求索也進入了大家的視野。過去的半個多月里，全網(wǎng)都在扒DeepSeek背后的團隊，并發(fā)現(xiàn)DeepSeek團隊最大的特點就是年輕，來自清華北大的應(yīng)屆生在其中非?；钴S，核心技術(shù)崗位基本以應(yīng)屆和畢業(yè)一兩年的人為主。因此，這個年輕的、由清北應(yīng)屆生撐起來的公司也被稱為“組織形態(tài)上最像OpenAI的中國AI公司”。

業(yè)內(nèi)人士分析稱，DeepSeek從創(chuàng)立開始就是中國大模型的技術(shù)創(chuàng)新者，在大廠和創(chuàng)業(yè)公司都在遵循著Llama架構(gòu)的時候，它選擇對模型架構(gòu)進行了全方位創(chuàng)新，提出的一種嶄新的MLA（一種新的多頭潛在注意力機制）架構(gòu)，把顯存占用降到了過去最常用的MHA架構(gòu)的5%—13%，同時獨創(chuàng)的DeepSeekMoESparse結(jié)構(gòu)也把計算量降到極致，最終促成了成本的下降。而且與早期的OpenAI類似的是，Deepseek兼具高密度的人才團隊和持續(xù)創(chuàng)新的精神，因而能持續(xù)地給中國大模型帶來驚喜。

而事實上，月之暗面也曾被視為“最有可能成為中國OpenAI的公司”。去年年初，月之暗面憑借以長文本為核心優(yōu)勢的Kimi智能助手產(chǎn)品火爆出圈。彼時，頭頂著“90后清華校友技術(shù)天才創(chuàng)業(yè)者”“最強長文本”等諸多光環(huán)，月之暗面迅速完成了巨額的融資，吸引一眾知名投資機構(gòu)加持，躋身“200億元估值俱樂部”，成為國產(chǎn)大模型創(chuàng)業(yè)公司的“頂流”。

然而在爆火之后，Kimi因激進的流量投放策略、創(chuàng)始人套現(xiàn)傳聞、投資人仲裁風(fēng)波等事件，屢屢陷入輿論的風(fēng)口浪尖。與此同時，國產(chǎn)大模型的競賽在經(jīng)歷了“百模大戰(zhàn)”后，尚留在牌桌中的玩家之間的競爭也更趨于激烈。Kimi不僅在流量投放上面臨著字節(jié)豆包的瘋狂進攻，而且競爭對手也紛紛發(fā)力長文本能力，Kimi的優(yōu)勢逐漸變得不那么明顯。

頭頂著“清北應(yīng)屆生”光環(huán)的DeepSeek，無疑給包括Kimi在內(nèi)的國產(chǎn)大模型創(chuàng)業(yè)公司帶來了壓力。業(yè)內(nèi)有人認(rèn)為，DeepSeek事實上已經(jīng)可以和“六小虎”（智譜AI、月之暗面、百川智能、Minimax、階躍星辰、零一萬物）并列成為“七小強”。更重要的是，DeepSeek由國內(nèi)知名量化資管巨頭幻方量化創(chuàng)立，未進行過任何融資，特點是“少花錢多辦事”，與依靠融資輸血、估值水漲船高的其他創(chuàng)業(yè)公司相比顯得格外另類。

這一低調(diào)的技術(shù)黑馬，無論是技術(shù)路線還是發(fā)展模式，都走出了一條與眾不同的道路，也改變了國產(chǎn)大模型的競爭格局。隨著競爭繼續(xù)向深水區(qū)挺進，誰能留在牌桌上笑到最后，或許能在2025年見分曉。

校對：祝甜婷

責(zé)任編輯：冉超

機構(gòu)

拼多多

st

聲明：證券時報力求信息真實、準(zhǔn)確，文章提及內(nèi)容僅供參考，不構(gòu)成實質(zhì)性投資建議，據(jù)此操作風(fēng)險自擔(dān)

下載“證券時報”官方APP，或關(guān)注官方微信公眾號，即可隨時了解股市動態(tài)，洞察政策信息，把握財富機會。

網(wǎng)友評論

登錄后可以發(fā)言

發(fā)送

網(wǎng)友評論僅供其表達個人看法，并不表明證券時報立場

暫無評論

為你推薦

芯原股份預(yù)計2024年第四季度收入同比增長超17% 年末在手訂單24.06億元

證券時報網(wǎng) 王一鳴 2025-01-21 18:47

“自由畫布”開啟公測百度文庫AI功能MAU超9000萬

證券時報網(wǎng) 王小偉 2025-01-21 19:28

數(shù)據(jù)復(fù)盤丨主力資金凈買入67股超億元龍虎榜機構(gòu)搶籌13股

證券時報網(wǎng) 闕福生 2025-01-21 18:08

12個雞蛋64元！美國出現(xiàn)“蛋荒”，價格創(chuàng)歷史新高！

證券時報網(wǎng) 黃翔 2025-01-21 18:53

華勤技術(shù)預(yù)計2024年營收突破千億筆電業(yè)務(wù)和數(shù)據(jù)中心業(yè)務(wù)均保持增長

證券時報網(wǎng) 李映泉 2025-01-21 19:29

金杯汽車收到某頭部主機廠兩個內(nèi)飾項目定點預(yù)計總金額合計62.7億元

證券時報網(wǎng) 孫憲超 2025-01-21 19:28

時報熱榜
換一換

熱點視頻
換一換