手握400萬AI工程師,Turing靠給大模型投喂數(shù)據(jù)和添加代碼,成為“全球增長最快且盈利的AGI基礎(chǔ)設(shè)施公司”。
最近,一家來自美國硅谷的AI創(chuàng)業(yè)公司Turing宣布完成超額認購的1.11億美元E輪融資,投后估值達22億美元,累計融資額突破2.25億美元。這輪融資由馬來西亞主權(quán)財富基金Khazanah Nasional Berhad領(lǐng)投,WestBridge Capital、Sozo Ventures、UpHonest Capital等頂級機構(gòu)跟投。
Turing有何獨特之處?
Turing此輪融資,最引人注目的是其公布了公司的業(yè)績增長情況。據(jù)Turing創(chuàng)始人兼首席執(zhí)行官Jonathan Siddharth,公司2024年收入增長3倍,ARR(年度經(jīng)常性收入)突破了3億美元,已經(jīng)實現(xiàn)了盈利,成為“全球增長最快且盈利的AGI基礎(chǔ)設(shè)施公司”。
公開資料顯示,Turing成立于2018年,總部位于美國加利福尼亞州帕洛阿爾托,是一家擁有500多名員工的公司。2022年以前,Turing的主營業(yè)務(wù)是“人力外包”,即為客戶優(yōu)化人才匹配。公司早期的產(chǎn)品是一個審查和聘用遠程程序員的平臺,這項業(yè)務(wù)在新冠疫情期間迎來了爆發(fā),由于許多科技公司都在居家辦公,需要在線招聘人才,并在尋覓更好的工具來尋覓和管理遠程工作團隊,Turing因此大受歡迎。
參投了Turing的WestBridge Capital聯(lián)合創(chuàng)始人兼執(zhí)行合伙人Sumir Chadha曾表示,2018年第一次接觸Turing時,他就驚訝于該團隊顛覆了整個管理咨詢和離岸外包模式?!澳闵踔敛恍枰肆Y源人員,就可以用Turing和遠程工程師完成所有工作?!盨umir Chadha說。
Turing官網(wǎng)顯示,2022年5月時,有25萬名專業(yè)程序員與公司簽約。如今,這一數(shù)字已經(jīng)擴展至500萬。
但故事在2022年時迎來了轉(zhuǎn)折。彼時,Jonathan Siddharth被召集到OpenAI參加會議,他原以為會議討論的是為這家初創(chuàng)公司招募工程師,結(jié)果發(fā)現(xiàn)滿屋的AI研究員提出的需求完全聚焦于數(shù)據(jù)。
據(jù)悉,當(dāng)時OpenAI正在訓(xùn)練GPT-3的迭代版本(也即后來的GPT-4),研究人員發(fā)現(xiàn),將計算機代碼片段注入訓(xùn)練數(shù)據(jù)集能顯著提升模型推理能力,他們迫切希望獲取海量優(yōu)質(zhì)代碼,詢問Turing能否快速組建工程師團隊完成特定編程任務(wù)。
這場會議也成為Turing布局新業(yè)務(wù)的關(guān)鍵點。據(jù)知情前OpenAI員工透露,Turing提供的代碼數(shù)據(jù)為ChatGPT在2022年11月橫空出世時的"顛覆性跨越"作出重要貢獻。而除了OpenAI以外,據(jù)公司官網(wǎng),谷歌、Meta、Anthropic、Character AI等知名的科技巨頭及基礎(chǔ)模型創(chuàng)業(yè)公司,均為Turing的客戶。
目前,Turing大約60%的收入來自希望訓(xùn)練及提升AI模型能力的客戶,40%的收入來自為利用AI升級業(yè)務(wù)的客戶提供咨詢服務(wù)。Jonathan Siddharth表示,其獨特商業(yè)模式形成了雙向賦能:向上游,可通過數(shù)據(jù)工程與調(diào)優(yōu)技術(shù)直接提升大模型能力;向下游,可借助AGI技術(shù)進步反哺企業(yè)級應(yīng)用,在醫(yī)療診斷、工業(yè)質(zhì)檢等領(lǐng)域已部署超過120個商業(yè)案例。
高質(zhì)量數(shù)據(jù)依然是剛需
隨著人工智能迅猛發(fā)展,高質(zhì)量訓(xùn)練數(shù)據(jù)短缺逐漸成為制約行業(yè)進步的一大瓶頸。
事實上,在訓(xùn)練ChatGPT時,OpenAI就投入了大量資源用于數(shù)據(jù)標(biāo)注,其聘請的眾多幫助ChatGPT理解人類指令的“老師”,不僅有一般數(shù)據(jù)標(biāo)注人員,還有許多專業(yè)人士,甚至包括博士級別的專家。在海外,頭部的數(shù)據(jù)服務(wù)商Scale AI通過為OpenAI、微軟、Meta和谷歌在內(nèi)的科技巨頭提供數(shù)據(jù)服務(wù),年化收入也高達7.5億美元,目前估值已超百億美元。
Scale AI創(chuàng)始人Alexandr Wang曾在訪談中指出,人類已經(jīng)用盡了所有簡單的數(shù)據(jù)(即互聯(lián)網(wǎng)上的所有數(shù)據(jù)),而要想開發(fā)出越來越強大的AI,則迫切需要構(gòu)建前沿數(shù)據(jù),將AI能力的邊界推向復(fù)雜推理、代理、多模態(tài)等。
與Scale AI在海外大量雇用低成本勞工,直接提供大規(guī)模數(shù)據(jù)標(biāo)注服務(wù)不同,Turing提供的更多是基于高質(zhì)量數(shù)據(jù)的代碼輸入。Jonathan Siddharth認為,關(guān)鍵不在于讓模型記憶數(shù)據(jù),而是引導(dǎo)其實現(xiàn)“泛化”——領(lǐng)悟數(shù)據(jù)背后的底層邏輯。為此,Turing建立了一套工業(yè)化數(shù)據(jù)生產(chǎn)體系:當(dāng)客戶需要提升模型在特定領(lǐng)域的智能水平時,公司會招募數(shù)百名領(lǐng)域?qū)<遥◤纳窠?jīng)科學(xué)博士到銷售分析師),創(chuàng)建模擬人類思維過程的問答鏈。
例如,化學(xué)專家可能圍繞某個分子發(fā)起十輪遞進式問答,這類被AI界稱為“多輪對話數(shù)據(jù)”的素材,正是培養(yǎng)模型推理能力的核心養(yǎng)料。據(jù)悉,Turing目前擁有覆蓋140個國家、超400萬程序員貢獻的代碼,涵蓋金融、生物、制造等垂直領(lǐng)域,能夠形成差異化語料庫。在龐大資源的基礎(chǔ)上,Turing憑借算法能夠提升客戶跟工程師的匹配效率,降低撮合成本。
對于Turing的成功,問答平臺Quora首席執(zhí)行官亞當(dāng)·德安杰洛曾評價道:"Turing的轉(zhuǎn)型令人驚嘆。初期的人才管理能力恰好為其切入數(shù)據(jù)服務(wù)市場奠定基礎(chǔ),而這個新興市場的潛力遠超傳統(tǒng)外包業(yè)務(wù)。"
校對:彭其華