黑暗的場館中,大屏幕上播放的宣傳片吸引了全場人的目光。一段堪比動作大片的賽車競逐之后,畫面通過蒙太奇手法巧妙切換,觀眾瞬間穿越到藝術(shù)世界,名畫中的人物“活”了過來,花草也隨之搖曳生姿——這,是字節(jié)跳動旗下火山引擎Force原動力大會的現(xiàn)場演示。
6月11日,“2025火山引擎春季Force原動力大會”上,豆包大模型1.6正式發(fā)布,視頻生成模型Seedance 1.0 pro首次亮相。上述宣傳片中的影像正是由Seedance 1.0 pro生成。
值得一提的是,在國際知名評測榜單Artificial Analysis上,Seedance在文生視頻、圖生視頻兩項(xiàng)任務(wù)方面均排名首位,超越Veo3、可靈2.0等模型。
Seedance 1.0 pro的性價(jià)比同樣受到市場關(guān)注?!睹咳战?jīng)濟(jì)新聞》記者現(xiàn)場了解到,Seedance 1.0 pro的價(jià)格是0.015元/千tokens(語言生成模型在運(yùn)作時(shí)的最小工作單元),相當(dāng)于每生成一條5秒的1080P視頻只需3.67元。據(jù)稱,這個價(jià)格已經(jīng)為當(dāng)前行業(yè)最低。
把價(jià)格打下來的不只有視頻生成模型,最新發(fā)布的豆包大模型1.6也展現(xiàn)了火山引擎要降低大模型使用成本的決心。
火山引擎總裁譚待 圖片來源:企業(yè)供圖
據(jù)火山引擎總裁譚待現(xiàn)場表示,豆包1.6首創(chuàng)按“輸入長度”區(qū)間定價(jià),深度思考、多模態(tài)能力與基礎(chǔ)語言模型統(tǒng)一價(jià)格。豆包1.6的綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。
豆包此番“雙箭齊發(fā)”,字節(jié)跳動摁下Agent(智能體)加速鍵。
國內(nèi)首個支持256K上下文的思考模型 豆包1.6正式發(fā)布
今年以來,字節(jié)跳動的進(jìn)化頻率幾乎要從“季更”演變?yōu)椤霸赂薄?/p>
4月,豆包發(fā)布1.5深度思考模型,具備“邊想邊搜”和視覺版的多模態(tài)能力。5月,豆包視頻生成模型 Seedance 1.0 lite發(fā)布,豆包1.5視覺深度思考模型也同時(shí)發(fā)布。6月,到了本次的大會上,豆包1.6正式登場。據(jù)介紹,豆包1.6系列當(dāng)前由三個模型組成,分別是doubao-seed-1.6、doubao-seed-1.6-thinking和doubao-seed-1.6-flash。
doubao-seed-1.6是“all-in-one”的綜合模型,支持深度思考、多模態(tài)理解、圖形界面操作等多項(xiàng)能力。據(jù)譚待介紹,該模型在自適應(yīng)思考下,可以根據(jù)prompt(提示詞)難度自動決定是否開啟thinking(思考),在提升效果的情況下,大幅減少tokens開銷。
發(fā)布會現(xiàn)場 圖片來源:企業(yè)供圖
doubao-seed-1.6-thinking是1.6系列在深度思考方面的強(qiáng)化版本,在許多基礎(chǔ)能力上都有進(jìn)一步提升;doubao-seed-1.6-flash則是1.6系列的極速版本,有著極低的延遲。值得一提的是,doubao-seed-1.6也是國內(nèi)首個支持256K上下文的思考模型,并且1.6的三個模型不論版本都支持256K上下文。
從1.5進(jìn)化到1.6的豆包,同樣拿出了出色的測評成績。譚待稱,在復(fù)雜推理、競賽級數(shù)學(xué)、多輪對話和指令遵循等測試集上,豆包1.6-thinking的表現(xiàn)已躋身全球前列。豆包還應(yīng)景地當(dāng)了一回“考生”,通過高考試卷測試了一次推理能力。譚待表示,今年高考前,在針對海淀區(qū)模擬全卷的測評中,豆包1.6相對去年的表現(xiàn),理科成績顯著提升了154分,文科提升了90分。
據(jù)介紹,豆包1.6系列模型支持多模態(tài)理解和圖形界面操作,能夠理解和處理真實(shí)世界問題。本次圖形界面操作能力的升級讓豆包1.6進(jìn)一步具備“行動力”。
演示案例顯示,豆包1.6可自動操作瀏覽器完成酒店預(yù)定,識別購物小票并整理成Excel表格等任務(wù)。這是豆包1.6的視覺深度思考能力和精準(zhǔn)的視覺定位能力在發(fā)揮作用,能夠讓智能體與瀏覽器及其他軟件進(jìn)行交互和操作,高效執(zhí)行各類任務(wù)。
除了豆包1.6之外,視頻生成模型Seedance 1.0 Pro同樣是本次大會的焦點(diǎn)。譚待在會上分享了第三方權(quán)威榜單Artificial Analysis的最新結(jié)果:“豆包視頻生成模型在文生視頻、圖生視頻兩個維度都超越了業(yè)界諸多主流模型,登頂全球競技場第一。”
Artificial Analysis文生視頻榜單 圖片來源:豆包公眾號
Seedance 1.0 Pro的特點(diǎn)在于無縫多鏡頭敘事、多動作的隨心運(yùn)鏡,以及穩(wěn)定運(yùn)動與真實(shí)美感?;谶@些技術(shù)突破,其已在電商內(nèi)容制作、游戲資產(chǎn)生成及影視預(yù)演等關(guān)鍵商業(yè)場景展開應(yīng)用探索。
價(jià)格方面,Seedance 1.0 pro是0.015元/千tokens,相當(dāng)于每生成一條5秒的1080P視頻只需3.67元。譚待在現(xiàn)場進(jìn)行了直觀地?fù)Q算:“假如你有1萬元預(yù)算,可以做多少條5秒的1080P視頻?通過Seedance 1.0 pro,你可以制作超過2700條視頻;而通過lite(豆包5月發(fā)布的視頻生成模型Seedance 1.0 lite),你可以完成9700多條視頻。”
譚待在后續(xù)采訪中補(bǔ)充道,Seedance 1.0 Pro除了生成效果好與價(jià)格低之外,還有速度快這一特點(diǎn),模型生成視頻僅需幾十秒。
字節(jié)跳動摁下Agent加速鍵
若說起AI(人工智能)領(lǐng)域的最大焦點(diǎn),Agent是繞不開的話題。譚待在會后接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體群訪時(shí)表示,做好Agent最重要的是底層模型一定是多模態(tài)深度思考的模型?!叭绻皇腔诙嗄B(tài)深度思考模型,基本上基于Agent能做出來的事情是很有限的,而且是很初級的?!?/p>
譚待認(rèn)為,技術(shù)主體經(jīng)歷了三個時(shí)代變化,AI時(shí)代會推動開發(fā)范式與技術(shù)架構(gòu)全面升級。他說:“PC(個人計(jì)算機(jī))時(shí)代主體是Web(網(wǎng)絡(luò)),移動時(shí)代是App(應(yīng)用程序),AI時(shí)代則是Agent。Agent能夠自主感知、規(guī)劃和反思,完成復(fù)雜任務(wù),從被動工具轉(zhuǎn)變?yōu)橹鲃訄?zhí)行者?!?/p>
但Agent的token消耗量,相對大模型“聊天”階段已經(jīng)是直線上升。譚待舉例稱,最初一個人跟模型聊一個小時(shí)才消耗20多萬的token,而Agent做一個任務(wù)可能就是同樣的消耗。所以需要模型使用成本降下來,才能推動Agent的規(guī)?;瘧?yīng)用。
為了把使用的價(jià)格打下來,豆包1.6首創(chuàng)按“輸入長度”區(qū)間定價(jià)。在企業(yè)使用量最大的0K-32K輸入?yún)^(qū)間,豆包1.6的輸入價(jià)格為0.8元/百萬tokens、輸出8元/百萬tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。
譚待在群訪中表示,豆包的宗旨是在技術(shù)取得一定成果后,最大限度釋放技術(shù)紅利,讓業(yè)界開發(fā)者和企業(yè)受益,以加速AI應(yīng)用發(fā)展。他舉例稱,去年推出豆包1.0時(shí),通過模型結(jié)構(gòu)與工程優(yōu)化將價(jià)格降低99%,帶動業(yè)界眾多公司跟進(jìn),推動了中國大模型的發(fā)展。
事實(shí)上,勢在模型性能和價(jià)格兩方面都做出突破的火山引擎已經(jīng)獲得了階段性的成績。譚待在大會上公布的最新數(shù)據(jù)顯示——到今年五月底,豆包大模型日均tokens使用量超過16.4萬億,較去年5月首次發(fā)布時(shí)增長達(dá)到了137倍。并且,根據(jù)國際數(shù)據(jù)公司(IDC)報(bào)告,豆包大模型在中國公有云大模型市場份額排名第一,占比高達(dá)46.4%。
Agent發(fā)展的洪流勢不可擋,豆包大模型的能力升級和價(jià)格降低,一方面進(jìn)一步促進(jìn)了生態(tài)繁榮,另一方面也快速地跑馬圈地,試圖逐漸成為產(chǎn)業(yè)智能化的“地基”。目前,在行業(yè)應(yīng)用上,豆包大模型服務(wù)著全球TOP 10手機(jī)廠商中的9家、8成主流汽車品牌、70%的系統(tǒng)重要性銀行及超5成985高校。
在譚待看來,目前豆包能得到的行業(yè)認(rèn)可訣竅就是心誠,“要讓更多人運(yùn)用AI創(chuàng)造價(jià)值,怎么做呢?就是三件事——把模型做好,把成本做低,把應(yīng)用性、落地性各種工具做好?!?/p>
知名經(jīng)濟(jì)學(xué)者、工信部信息通信經(jīng)濟(jì)專家委員會委員盤和林在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,tokens費(fèi)用的降價(jià)有利于銷售,主要是吸引企業(yè)用戶更多地使用豆包,嵌入豆包的API(應(yīng)用程序編程接口)接口,這樣會壯大豆包生態(tài)。但對于其他大模型廠商,可能會進(jìn)入新一輪“價(jià)格戰(zhàn)”。