10月15日深夜,零一萬物的Yi-Lighting大模型在LMSYS盲測競技場的投票數(shù)超過1萬次,拿到了這個國際權威測試榜單的入場券,“出來的結果是,我們排在全球第六”,10月16日上午,零一萬物CEO李開復向媒體宣布時一字一頓。為了強調(diào),他還補充,“我們和馬斯克(特斯拉CEO)的xAI Grok打平,并列第六,按公司算零一萬物排在全球第四名。”
當天,他還向媒體公布并演示了to B戰(zhàn)略下的行業(yè)應用產(chǎn)品AI 2.0數(shù)字人,這一產(chǎn)品聚焦零售和電商等場景。“to B就做國內(nèi),做有利潤的解決方案”,李開復目標明確,面對國內(nèi)C(用戶)端市場,零一萬物則會非常謹慎,“先不推出中國本土新的to C的應用”。
預訓練成本只是對手的1%或2%
“任何一個新的模型要有1萬次投票才會進入這個榜單,昨天(10月15日)晚上,Yi-Lightning模型在LMSYS上終于達到了1萬次以上的投票”,李開復邀請媒體體驗LMSYS這個大模型擂臺。
作為一個公益項目,LMSYS被認為是“大模型最強盲測”,援引這一榜單的科技大佬不止Open AI的CEO山姆·奧特曼和谷歌首席科學家杰夫·迪恩。
根據(jù)李開復公布的總榜單,零一萬物的Yi-Lightning排在Open AI、Google和xAI的大模型之后,全球排名第六。具體到分榜,在中文分榜,Yi-Lightning與o1-mini 等模型并列排名世界第二;在多輪對話分榜,排名第三;數(shù)學、代碼分榜上,Yi-Lightning分獲第三、第四名;艱難提問、長提問榜,Yi-Lightning都取得第四名。
據(jù)了解,Yi-Lightning是零一萬物開發(fā)的Yi系列大語言模型,支持上下文16K,是零一萬物最新高性能模型。根據(jù)內(nèi)部評測數(shù)據(jù),在8xH100 算力基礎下,以同樣的任務規(guī)模進行測試,Yi-Lightning 的首包(從接收到任務請求到系統(tǒng)開始輸出響應結果之間的時間)時間是Yi-Large的一半,最高生成速度提升近四成。
李開復介紹時,則向媒體重復強調(diào)了成本。
“我們知道xAI在訓練Grok時是幾萬張的GPU(圖形處理器),現(xiàn)在囤了10萬張GPU。我們這次預訓練只用2000張GPU訓練一個半月,花了300多萬美元,做出來的預訓練模型跟Grok打平,卻只花了它1%或2%的成本”,李開復表示滿意。
他也再次重申,“零一萬物絕不放棄預訓練。做好預訓練是一個技術活,要非常多有才華的人在一起慢工出細活。如果一個公司有幸擁有懂芯片的、懂推理的、懂基礎架構的、懂模型的,有很多的做算法的人才能跨領域合作,我相信中國絕對可以做出世界排名前十的預訓練通用模型”。
把時間差保持在6個月就很好
“但做這件事的成本比較高,以后可能做預訓練的大模型公司會越來越少,”李開復話鋒一轉(zhuǎn),“據(jù)我所知,大模型‘六小虎’(包括零一萬物、百川智能等六家獨立大模型初創(chuàng)公司)的融資額都是夠的,我們做一次300萬美元,這個錢頭部公司也付得起。”
還是圍繞著榜單做對比。GPT-4o是Open AI在5月14日推出的大模型,在最新的LMSYS總榜中,排在Yi-Lightning之后。“我們在10月把GPT-4o打敗了,所以零一萬物和美國頂尖模型的時間差只有5個月”,李開復說。
時間差是個老話題,從2023年初國內(nèi)大模型扎堆上線,被一個又一個大佬回答過。這個問題重要與否見仁見智。不論得到的時間是多少,都證明了一點——差距依然存在。
“縮短時間差非常困難,畢竟人家10萬張GPU,我們2000張。能達到這個效果是因為團隊優(yōu)秀,再加上研發(fā)有特色,用這套方法把時間差保持在6個月左右,已經(jīng)是很好的結果了。如果要破局,可能需要一個前所未有的算法才有機會”,李開復同時告訴媒體,“千萬不要認為落后6個月是很羞恥的事情,如果用類似零一萬物的打法,我認為可能不止我們一家能把時間差控制在6個月,但難度不低。”
0.99元/100萬Tokens,不參與價格戰(zhàn)
另一個層面的控制體現(xiàn)在價格上。目前,Yi-Lightning已在Yi大模型開放平臺上線,0.99元/100萬Tokens。
一般來說,國內(nèi)大模型企業(yè)普遍用1000Tokens定價。以科技大廠阿里云為例,官網(wǎng)列舉的通義千問系列大模型qwen-turbo相對較低,營銷活動后的輸入價格是0.0003元/1000Tokens、輸出價格0.0006元/1000Tokens,即分別是0.3元/100萬Tokens、0.6元/100萬Tokens。
“這個定價確實具有顯著優(yōu)勢,在競爭激烈的AI市場中,價格優(yōu)勢往往能成為吸引用戶的關鍵因素”,北京市社會科學院副研究員王鵬向北京商報記者表示。
在和媒體溝通時,李開復三次提到這個價格,他承認這是白菜價,但也直言“零一萬物還是有利潤空間的,不參與價格戰(zhàn)”。
除了性能、價格,零一萬物對市場也有自己的堅持。
當天零一萬物推出to B新產(chǎn)品AI 2.0解決方案,把Yi Lightning 實踐于具體行業(yè)解決方案。基于以Yi Lightning模型為代表的Yi模型,零一萬物搭建起了包含角色大模型、直播聲音大模型、電商話術大模型在內(nèi)的一整套專用模型基座。
在回答to B、to C選擇的問題時,李開復告訴媒體,“一個大模型公司同時做to B、to C是很辛苦的,需要多元化的管理方式。選擇在國內(nèi)做to B,是因為我們找到了一些破局的空間,比如用數(shù)字人來做零售、餐飲等,能做一個完整的解決方案。我覺得這樣的to B只能在中國做,to B就做有利潤的解決方案,而不只是賣模型,不只是做項目制”。
對于to C,零一萬物的主要布局在海外。在他看來,流量成本是大模型to C的很大問題,“在這樣的挑戰(zhàn)環(huán)境里我們會非常謹慎,我們先不推出中國本土新的to C的應用,已有的產(chǎn)品還會繼續(xù)維護”。
零一萬物的思路適合整個大模型行業(yè)嗎?“C端用戶沒有很強的付費需求和意愿。想依靠他們來實現(xiàn)盈利,短期來看是不切實際的,”瑞達恒研究院經(jīng)理王清霖告訴北京商報記者,“B端市場為了提高效率、跟上時代步伐、吸引投資人的注意力,可能有一些是相對剛需的購買意愿。如真的能夠切入某一類或者某一個領域,了解他們的需求,是有可能搶占市場先機的。”
北京商報記者 魏蔚
本網(wǎng)站所有內(nèi)容屬北京商報社有限公司,未經(jīng)許可不得轉(zhuǎn)載。 商報總機:010-64101978 媒體合作:010-64101871
商報地址:北京市朝陽區(qū)和平里西街21號 郵編:100013 法律顧問:北京市中同律師事務所(010-82011988)
網(wǎng)上有害信息舉報 違法和不良信息舉報電話:010-84276691 舉報郵箱:bjsb@bbtnews.com.cn
ICP備案編號:京ICP備08003726號-1 京公網(wǎng)安備11010502045556號 互聯(lián)網(wǎng)新聞信息服務許可證11120220001號