機(jī)構(gòu)指出,隨著AI應(yīng)用進(jìn)入爆發(fā)期,企業(yè)級部署需求呼之欲出,醫(yī)療、政務(wù)、Manus等應(yīng)用落地都成為了市場關(guān)注的焦點(diǎn),科技大廠也在加速AI投入,實現(xiàn)向下個時代的布局。雖然大模型推理成本在下降,但是由此帶來的應(yīng)用爆發(fā)有望帶來更多的應(yīng)用需求,成為下一階段拉動算力增長的主要驅(qū)動力。
核心邏輯
1.3月9日,國家超算互聯(lián)網(wǎng)平臺正式上線通義千問QwQ-32B API服務(wù),向用戶提供免費(fèi)100萬tokens的試用額度。該模型以320億參數(shù)量實現(xiàn)性能突破,在數(shù)學(xué)、代碼及通用能力的多項權(quán)威評測中,表現(xiàn)與參數(shù)規(guī)模更大的DeepSeek-R1模型相當(dāng)。除了國家超算互聯(lián)網(wǎng)平臺,國產(chǎn)算力平臺紛紛接入阿里千問QwQ。算能科技官方公眾號顯示,算能SophNet平臺火速上線了QwQ-32B大模型,開發(fā)者僅需創(chuàng)建服務(wù)時選擇QwQ-32B模型,即可完成API配置;硅基流動SiliconCloud也在第一時間上線了推理加速版QwQ-32B,免去開發(fā)者部署門檻;同期,壁仞科技推出QwQ-32B大模型一體機(jī),通過軟硬件協(xié)同優(yōu)化實現(xiàn)75TPS(每秒處理75萬條請求)的推理速度;青云科技AI算力云平臺亦上線該模型,進(jìn)一步降低企業(yè)部署門檻。
2.AI領(lǐng)域軟硬件共振。軟件方面,谷歌Research、谷歌Search、谷歌DeepMind三大團(tuán)隊發(fā)布論文《Communication-Efficient Language Model Training Scales Reliably and Robustly: Scaling Laws for DiLoCo》,論文中重點(diǎn)分析了算法因素如何影響訓(xùn)練過程,并證明這些影響可通過Scaling Law準(zhǔn)確預(yù)測。結(jié)果表明,DiLoCo在模型規(guī)模增長時,表現(xiàn)出穩(wěn)定且可預(yù)測的擴(kuò)展性,這表明Scaling Law繼續(xù)有效。此外,近期AI領(lǐng)域仍持續(xù)發(fā)布新型軟硬件產(chǎn)品,如近期開源的Open-Sora 2.0,再次推進(jìn)了視頻生成領(lǐng)域的進(jìn)展。硬件方面,英偉達(dá)在GTC大會上有望提出新產(chǎn)品的相關(guān)更新。
3.DeepSeek的技術(shù)突破雖然短期內(nèi)引發(fā)市場對高端AI芯片需求的擔(dān)憂,但通過降低大模型訓(xùn)練準(zhǔn)入門檻擴(kuò)大了整體市場規(guī)模。首先受益的是國產(chǎn)算力芯片廠商,特別是華為昇騰等已經(jīng)在推理性能上接近國際水平的企業(yè),將借助性價比優(yōu)勢在企業(yè)級部署市場獲得突破。隨著企業(yè)級部署需求增長,算力租賃商將迎來增長,大量中小企業(yè)會選擇更靈活的租賃方案來降低初始投入。當(dāng)大模型部署成本降低到一定水平后,終端設(shè)備推理算力需求將顯著提升,驅(qū)動端側(cè)AI芯片市場擴(kuò)容。
利好個股:
信達(dá)證券建議關(guān)注:工業(yè)富聯(lián)、滬電股份、生益科技、深南電路、藍(lán)思科技等。
本文內(nèi)容精選自以下研報:
《平安證券:國產(chǎn)算力平臺加速適配通義千問,強(qiáng)勁推理能力領(lǐng)跑開源生態(tài)》
《國泰君安計算機(jī)行業(yè)專題研究:DeepSeek重構(gòu)算力基建長期價值的認(rèn)知》
《中原證券計算機(jī)行業(yè)月報:國內(nèi)算力投入明顯加快,平臺企業(yè)借勢積極入局》
《信達(dá)證券:英偉達(dá)GTC大會在即,建議關(guān)注算力產(chǎn)業(yè)鏈》
校對:劉榕枝