擔(dān)任阿里云大數(shù)據(jù)&AI產(chǎn)品及解決方案總經(jīng)理時(shí),創(chuàng)業(yè)的念頭就“長”在高雪峰心里了,這次參加2024年中國國際服務(wù)貿(mào)易交易會(以下簡稱“2024服貿(mào)會”),他的身份已從大廠高管變成創(chuàng)業(yè)公司楓清科技(Fabarta)的創(chuàng)始人。
在大數(shù)據(jù)和人工智能領(lǐng)域待了20年,他清楚企業(yè)數(shù)智化轉(zhuǎn)型的需求,也知道怎樣解決當(dāng)下大模型落地的痛點(diǎn)。“要提升大模型推理能力”“增強(qiáng)基于數(shù)據(jù)關(guān)系的推理能力”“通過智能體平臺提供推理的思考路徑”,服貿(mào)會上,在與北京商報(bào)記者交流的一個多小時(shí)中,他反復(fù)強(qiáng)調(diào)。
楓清科技致力于通過融合圖、向量和AI的多模態(tài)智能引擎以及數(shù)據(jù)編織與智能體等技術(shù)的融合與探索,推動AI技術(shù)在企業(yè)級客戶中的應(yīng)用與落地,高雪峰給公司做了一個技術(shù)范的定位。簡單來說,就是通過各種技術(shù)、產(chǎn)品、平臺盡可能降低大模型“胡說八道”的幾率。不久前,楓清科技和中化信息達(dá)成合作,利用智能體服務(wù)具體的業(yè)務(wù)場景。同時(shí),公司的Pre-A+輪融資正在順利推進(jìn)中。
大模型的本質(zhì)還是基于“概率”的預(yù)測
“大模型有強(qiáng)大的能力,但落地時(shí)暴露出一系列問題,”大模型狂奔兩年,高雪峰說出了同行們的心聲,“比如‘幻覺’現(xiàn)象、推理能力不足、解釋性差。這些問題導(dǎo)致很多企業(yè)面臨大模型‘好玩不好用’的困境。”
問題明確,原因何在?他認(rèn)為與大模型的復(fù)雜性、多樣性以及企業(yè)應(yīng)用場景的精準(zhǔn)性要求有關(guān)。
“大模型主要依賴于概率統(tǒng)計(jì)方法,通過大量的數(shù)據(jù)來學(xué)習(xí)語言模式和統(tǒng)計(jì)規(guī)律,進(jìn)而預(yù)測下一個詞或序列。模型往往通過生成最可能的詞語序列來組成回答的內(nèi)容,而不是真正地思考或分析問題的內(nèi)在邏輯關(guān)系”,高雪峰解釋。
正因?yàn)槿绱?,大模型在回答?fù)雜邏輯問題時(shí),可能會基于常見的語料模式生成看似合理但并非正確的答案,這就是大模型的幻覺。
“現(xiàn)實(shí)世界中的許多復(fù)雜決策需要多步驟分解與推理,大模型缺乏有效的記憶機(jī)制來跟蹤和協(xié)調(diào)每一個推理步驟,或者是針對特定的復(fù)雜問題去拆解推理的步驟”,高雪峰向北京商報(bào)記者解釋,每一步推理的結(jié)果可能影響下一步的輸入,而大模型在內(nèi)容生成過程中的概率預(yù)測能力,在多復(fù)雜條件下未必準(zhǔn)確。
同樣是因?yàn)榇竽P瓦^于復(fù)雜,讓可解釋性變得更加困難,技術(shù)出身的高雪峰坦言,“專業(yè)研究人員也很難理解模型是如何得出某個結(jié)論的,普通用戶更難以理解模型為什么輸出這樣的內(nèi)容”。
“OpenAI剛剛推出了推理能力很強(qiáng)的o1模型,基本上也是在推理框架上面做了更深度的改進(jìn),比如思維鏈機(jī)制的改進(jìn)。在o1之前就有很多研究使用ToT(思維樹)、GoT(思維圖)等方式來改進(jìn)大模型的推理能力。這與我們在企業(yè)場景當(dāng)中落地的方向是一致的,只不過我們更多的推理是基于企業(yè)本地沉淀的精準(zhǔn)知識與邏輯,相比通用的推理能力或者范式,可能更加貼近行業(yè)的積累。”高雪峰表示。
數(shù)據(jù)還是數(shù)據(jù)
關(guān)于數(shù)據(jù),高雪峰談得更多。
“如果訓(xùn)練數(shù)據(jù)主要來自特定領(lǐng)域或文化背景,模型就可能在該領(lǐng)域內(nèi)的推理任務(wù)上表現(xiàn)較好,但在其他領(lǐng)域或文化背景下表現(xiàn)不佳,泛化能力將明顯不足。當(dāng)遇到不常見或沒有足夠數(shù)據(jù)支持的推理任務(wù)時(shí),可能會出現(xiàn)錯誤,”高雪峰向北京商報(bào)記者舉例,“缺乏對特定行業(yè)知識的深入理解,可能導(dǎo)致模型缺乏領(lǐng)域知識,生成不切實(shí)際的輸出。”
數(shù)據(jù)時(shí)效性和安全可控是另一個問題。他說,預(yù)訓(xùn)練當(dāng)中使用的數(shù)據(jù)就是模型做內(nèi)容生成時(shí)的所有依據(jù),但是在決策智能領(lǐng)域,大部分需求都對數(shù)據(jù)的時(shí)效性有很大要求。不同的數(shù)據(jù)全部拿來做大模型的預(yù)訓(xùn)練,很難在推理的過程當(dāng)中去控制什么樣的角色不能利用預(yù)訓(xùn)練階段當(dāng)中的哪部分?jǐn)?shù)據(jù),從而實(shí)現(xiàn)數(shù)據(jù)的安全可控。
回到解決方案,又要追溯到機(jī)器學(xué)習(xí)領(lǐng)域的架構(gòu)之爭:以模型為中心與以數(shù)據(jù)為中心。“爭論的焦點(diǎn)在于,為了提升模型的性能和效果,究竟是應(yīng)該鎖定訓(xùn)練數(shù)據(jù)并不斷迭代算法,還是應(yīng)該鎖定算法并不斷迭代用于訓(xùn)練的數(shù)據(jù),對其進(jìn)行清洗和噪音剔除等操作。”
具體到企業(yè)場景中,“為了實(shí)現(xiàn)更好的效果,應(yīng)該持續(xù)利用客戶本地?cái)?shù)據(jù)來優(yōu)化模型參數(shù)和質(zhì)量,還是應(yīng)該讓不同的模型能力服務(wù)于企業(yè)本地經(jīng)過組織的數(shù)據(jù)”,提到這一點(diǎn)時(shí),高雪峰回顧了人工智能的三大流派:符號主義、聯(lián)結(jié)主義和行為主義。“當(dāng)前AIGC(人工智能生成內(nèi)容)技術(shù)是聯(lián)結(jié)主義的巔峰,而大模型幻覺、可解釋性差、推理能力弱等問題,恰恰是符號主義流派的邏輯推理技術(shù)能解決的。”
讓模型服務(wù)于企業(yè)本地?cái)?shù)據(jù)
結(jié)合技術(shù)發(fā)展的客觀規(guī)律,高雪峰提出的解決方案是,讓不同的模型能力服務(wù)于企業(yè)本地經(jīng)過組織的數(shù)據(jù)和知識。
為了解釋清楚這些抽象的概念,他用了一個詞:編織,即通過圖與向量和文本數(shù)據(jù)的融合存儲與計(jì)算來聚合企業(yè)本地?cái)?shù)據(jù),利用數(shù)據(jù)編織平臺的能力將企業(yè)數(shù)據(jù)轉(zhuǎn)化為知識,并通過知識運(yùn)營與智能體平臺結(jié)合大模型中的泛化知識,來支持豐富的企業(yè)智能化場景。
簡單來說,就是通過各種技術(shù)手段,將企業(yè)本地?cái)?shù)據(jù)和大模型的泛化知識作為大模型判斷的基礎(chǔ)。
“這種組織架構(gòu)非常靈活,能夠根據(jù)場景的不同需求,選擇依賴大模型中的泛化知識或結(jié)合企業(yè)組織好的本地知識”,基于這一點(diǎn),高雪峰認(rèn)為,平臺建設(shè)是核心基礎(chǔ)。
這個平臺需要具備哪些核心能力,才能支撐不同的智能化場景?
在和合作的頭部企業(yè)交流、實(shí)踐后,他指出:最底層是基礎(chǔ)設(shè)施,其上是對多種大模型甚至傳統(tǒng)小模型的管理,同時(shí)需要整理行業(yè)所需的數(shù)據(jù)集。但是真正實(shí)現(xiàn)企業(yè)智能化場景的落地,還需提供知識運(yùn)維與管理等能力,以及將企業(yè)多模態(tài)的數(shù)據(jù)轉(zhuǎn)化為知識的能力,最后通過智能體平臺及向上的原生知識庫能力,賦能企業(yè)級場景。
楓清科技的產(chǎn)品就對應(yīng)著上述能力,楓清·天樞多模態(tài)智能引擎為企業(yè)AI智能應(yīng)用提供便捷的私有化記憶存儲服務(wù)及強(qiáng)大且可解釋的推理能力;楓清·錦書數(shù)據(jù)編織中臺將企業(yè)的多模態(tài)數(shù)據(jù)轉(zhuǎn)化為知識;楓清·瑤光企業(yè)知識中臺將錦書當(dāng)中的知識與不同大模型當(dāng)中的泛化知識進(jìn)行融合,并以智能體的方式賦能上層的豐富應(yīng)用。
在和北京商報(bào)記者的交流中,高雪峰以楓清科技與中化信息的深度合作為例介紹,中化信息通過引入楓清科技的“楓清·瑤光企業(yè)知識中臺”,針對企業(yè)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),驗(yàn)證和打造共創(chuàng)方案,將數(shù)據(jù)轉(zhuǎn)換為知識,利用平臺快速構(gòu)建智能應(yīng)用,發(fā)揮數(shù)據(jù)的價(jià)值,構(gòu)建企業(yè)智能化升級之路?;陔p方聯(lián)合打造的靈活自主可控核心服務(wù)矩陣,包括知識引擎和智能體引擎兩大關(guān)鍵組件,可通過文檔問答、智能問數(shù)以及智能體方式串聯(lián)大模型應(yīng)用與業(yè)務(wù)系統(tǒng),助力應(yīng)用的智能化,提升用戶與業(yè)務(wù)系統(tǒng)的交互效率以及工作和生產(chǎn)效率。
北京商報(bào)記者 魏蔚
本網(wǎng)站所有內(nèi)容屬北京商報(bào)社有限公司,未經(jīng)許可不得轉(zhuǎn)載。 商報(bào)總機(jī):010-64101978 媒體合作:010-64101871
商報(bào)地址:北京市朝陽區(qū)和平里西街21號 郵編:100013 法律顧問:北京市中同律師事務(wù)所(010-82011988)
網(wǎng)上有害信息舉報(bào) 違法和不良信息舉報(bào)電話:010-84276691 舉報(bào)郵箱:bjsb@bbtnews.com.cn
ICP備案編號:京ICP備08003726號-1 京公網(wǎng)安備11010502045556號 互聯(lián)網(wǎng)新聞信息服務(wù)許可證11120220001號