證券時(shí)報(bào)網(wǎng)
黃翔
2025-01-21 18:53
證券時(shí)報(bào)網(wǎng)訊,國(guó)泰君安研報(bào)稱,1月20日,豆包實(shí)時(shí)語(yǔ)音大模型正式推出,并在豆包APP全量開放。1)該模型可理解輸入語(yǔ)言情緒、實(shí)時(shí)聯(lián)網(wǎng),在輸出時(shí)具備強(qiáng)大聲音控制能力,且高度近似人類、有超低延遲、可隨時(shí)打斷。2)豆包實(shí)時(shí)語(yǔ)音大模型的整體滿意度較GPT-4o有明顯優(yōu)勢(shì),特別是在語(yǔ)音語(yǔ)氣自然度和情緒飽滿度方面遠(yuǎn)高于后者。3)增加了情感的語(yǔ)音交互將顯著有利于AI的軟硬件應(yīng)用,能夠降低使用門檻、改進(jìn)效率、提升體驗(yàn),包括如下應(yīng)用場(chǎng)景:1)情感陪伴與智慧教育應(yīng)用,關(guān)注盛天網(wǎng)絡(luò)、昆侖萬維等;2)AI陪伴硬件如AI玩具、AI寵物,可幫助硬件生產(chǎn)商與IP方擴(kuò)大需求,關(guān)注上海電影、湯姆貓等;3)AI眼鏡、AI耳機(jī)、AI音箱等生活效率產(chǎn)品將受益于交互方式的改進(jìn),關(guān)注小米集團(tuán)等。
校對(duì):王蔚