您的位置: 首頁 > 特刊

從通用大模型到金融大模型

出處:北京商報 網編:劉浩天 2023-12-07

“它不是一種新武器,而是一個新世界的開始。”今年8月,電影《奧本海默》上線。圍繞原子彈的爭議,影片曾出現這樣一句話。

一個月后的外灘大會上,這句話套用給了大模型。螞蟻集團董事長兼CEO井賢棟判斷,大模型的出現,“不是一個新技術,而是一個新世界”。

以ChatGPT發(fā)布為起點,以大模型席卷全球為標志,大模型重構了一個流量紅利觸頂后,以智能化主導經濟增長的新世界,一個可能改變社會關系以及生產關系的新世界。

科技的力量迅速傳導,壓力給到國產大模型這邊。上半年“卷”模型,下半年“卷”應用,國產大模型經歷了帶著些焦慮的狂熱,也經歷了些透過現象看本質般的冷靜。

規(guī)模、參數的近身肉搏之后,落地逐漸成為“百模大戰(zhàn)”的共識。得益于數據密集型的行業(yè)優(yōu)勢,輔以強勁的數字化基礎及行業(yè)本身對新技術的天然追逐,金融在一眾場景中脫穎而出。

也是因為這些優(yōu)勢,金融行業(yè)得以更快過渡到“冷靜期”,將重點調整至價值——應用的價值。如何調用大模型?用大模型做什么?又要實現怎樣的效果?遵循著這些問題的指引,金融大模型更容易找到落地的答案。

“金融行業(yè)將是大模型技術落地的最佳領域。”度小滿CEO朱光曾做出了這樣一個判斷。只不過,在應用的“星辰大海”面前,當下的金融大模型仍然面臨著復雜的多維挑戰(zhàn)。

第一波浪潮

2012年,深度學習領域“宗師”Geoffrey Hinton帶著他的兩個學生一舉拿下了當年ImageNet比賽的冠軍。那場比賽中,三人密切配合地創(chuàng)建了一個新的神經網絡用以進行圖像識別,最終的準確率達到了驚人的84%。

在后來的介紹中,Hinton提到,相比谷歌1.6萬顆CPU的累積,奪冠的AlexNet算法只用了4顆GPU。

當年的嘗試,開啟了用GPU訓練AI模型的序幕,亦開啟了OpenAI萬卡算力的“暴力美學”。

催生ChatGPT的歷史軌跡——Hinton的其中一個學生叫Ilya Sutskever,也就是后來OpenAI的聯合創(chuàng)始人和首席科學家、靈魂技術人物。

在近期全球科技圈矚目的OpenAI“逼宮”大戲中,秉持著對AI安全的恐懼和對技術發(fā)展的信念,Ilya亦承擔起了除CEO阿爾特曼外最重要的一個角色。

這十年里發(fā)生了什么?

Google收購DeepMind,后者于2016年推出了震驚全球的AlphaGo。同年,英偉達把全球第一臺AI超算送給了成立不足一年的OpenAI;三年后,微軟與OpenAI開啟合作,向OpenAI提供10億美元投資,并與其建立獨家云計算合作關系。

故事的另一條線索在大洋這邊。2013年初,百度成立深度學習研究院。2016年百度創(chuàng)始人李彥宏宣布,百度將徹底轉型為一家人工智能公司。

兩條線索在2023年交匯。2023年3月,百度率先推出“文心一言”,成為國內首個生成式AI產品。自此,也揭開了國產大模型的諸神之戰(zhàn)。

今年5月,中國科學技術信息研究所所長、科技部新一代人工智能發(fā)展研究中心主任趙志耕提到,根據不完全統計,當時中國已發(fā)布79個大模型。14個省市地區(qū)都有大模型研究,但北京和廣東非常突出,分別有38個大模型和20個大模型。

市場有最新消息稱,截至10月國內已經發(fā)布了238個大模型,如果按此數據推算,相當于不到半年時間就翻了3倍。

過去一年,國產大模型的發(fā)展可以看見一條清晰的界限。在11月11日的金融街論壇年會“金融科技創(chuàng)新與合規(guī)安全”平行論壇上,度小滿CTO許冬亮總結稱,底層的模型發(fā)展趨勢上,早期的ChatGPT和文心一言為代表的通用大模型是第一波浪潮。

而第二波可以稱之為“+AIGC”。許冬亮解釋稱,即在現有企業(yè)產品服務的基礎上,將生成式人工智能技術應用其中,以提供更好的產品服務。

2023年7月,華為盤古大模型3.0發(fā)布,“行業(yè)”成了關鍵詞。百度千帆大模型、騰訊云行業(yè)大模型、訊飛星火大模型、360智腦大模型等面向B端市場的落地行業(yè)大模型,在短時間內異軍突起。大模型競賽從通用大模型轉向行業(yè)大模型的趨勢越發(fā)明顯。

對于大模型在不同產業(yè)中產生的效果,企業(yè)增長咨詢公司弗若斯特沙利文發(fā)布的《2023年中國AI技術變革企業(yè)服務白皮書》曾做了一個簡單的歸類。比如在服務型產業(yè)中,AI能夠實現5.8%的顯著成本降低,主要集中在客戶營銷、客戶運營、客戶服務等獲取和轉化客戶的成本方面,具有高替代潛力。

國產大模型如火如荼,全球科技競賽的你追我趕也仍舊激烈。2023年11月,恰逢ChatGPT推出一年的時間節(jié)點,OpenAI舉辦首屆全球開發(fā)者大會,其中GPT-4升級為GPT-4 Turbo成為最重磅的“炸彈”。

第三方排行榜SuperCLUE基于SuperCLUE通用大模型綜合性中文測評基準,對GPT-4 Turbo進行了全方位測評。結果顯示,GPT-4 Turbo在10項基礎能力中有8項滿分,相比上一代GPT-4模型,GPT-4 Turbo有10.33分的巨大提升。

“對國內大模型而言,差距在進一步擴大。GPT-4 Turbo總分領先國內最強模型有30分以上。”最后一條結論中, SuperCLUE如此寫道。

中國大模型和美國距離多遠?半年前,出門問問CEO李志飛給出更“直觀”的計算答案是16個月。

他解釋,2022年1月,谷歌發(fā)布指令學習大模型FLAN,之后的2022年10月ChatGPT發(fā)布,2023年3月GPT-4發(fā)布。中國企業(yè)目前發(fā)布的一批大模型與FLAN水平相近,如此推算,中美大模型的差距為16個月。

當下的美國,由OpenAl、微軟和英偉達組建的軟硬件聯盟,正加速推動AI 2.0時代到來。與此同時,國產大模型也在遭遇芯片供應的不確定性風險。

10月,美國商務部工業(yè)與安全局(BIS)發(fā)布更新針對人工智能(AI)芯片的出口管制規(guī)定,芯片與半導體行業(yè)首當其沖。

國內GPU設計企業(yè)壁仞科技總裁徐凌杰預測稱,未來一年,中國絕大部分的算力需求將集中在大模型訓練上;此后,推理的場景會變得越來越多。

一個廣泛的共識是,中國的特點是應用豐富、落地更快,大部分企業(yè)并非靠技術取勝,而是靠在落地中挖掘新的生產力。

金融,AI優(yōu)等生

大模型落地探索過程中,存在一個很有意思的現象。

人們在談及大模型的場景結合時,通常會用到一個詞——市場教育,用以形容讓目標行業(yè)接受新技術的過程。唯獨一個行業(yè),其市場教育的成本幾乎為零已成為圈內共識,這個行業(yè)就是金融。

金融大模型的風暴,始于今年3月。當時外界還停留在大模型“涌現”的狂歡中,最多延伸到對底層算力的焦慮,彭博卻推出了為金融界量身定制的大型語言模型BloombergGPT,硬是把一眾注意力轉向了行業(yè)新賽道。

BloombergGPT至今仍被口口相傳的原因,不僅在于其全球首個金融大模型的光環(huán),更在于背后海量的金融數據優(yōu)勢。

據悉,作為一家全球商業(yè)、金融信息和新聞資訊提供商,彭博依托大量的金融數據優(yōu)勢,創(chuàng)建了一個包含3630億詞例的金融數據集,這些寶貴的垂直數據使其在執(zhí)行金融任務上的表現遠超當時的現有模型。

天風證券曾評價,BloombergGPT在部分金融場景中表現出強于通用大模型的能力,標志著金融領域的GPT革命或剛剛開始。

早在7月末,騰訊研究院發(fā)布的一項調研數據就顯示,國內參數在10億規(guī)模以上的大模型數量已由5月末的79個增加至116個,其中金融行業(yè)大模型18個。

數據規(guī)模大、數據類型多、數字化基礎強、市場規(guī)模大、客戶付費能力強、前中后臺都有廣泛被降本增效的空間……得天獨厚的優(yōu)勢累積,“金融+大模型”成了“王炸組合”。

據悉,目前國內金融大模型已經應用在金融資訊、產品介紹內容的文本自動生成,構建虛擬客服在線交互等方面,給用戶提供更人性的服務,提升金融機構內容運營的效率。

沿襲著互聯網金融時代的模式,國產金融大模型也已分出了明顯的兩個“流派”。

一派來自于傳統金融機構。以銀行為例,在2023年半年報中,就有包括工商銀行、農業(yè)銀行、中國銀行等在內的多家銀行明確提出在探索大模型的應用。

另一派來自于金融系科技企業(yè)或互聯網企業(yè)。今年5月,奇富科技率先宣布推出自研的金融行業(yè)通用大模型“奇富GPT”,也被業(yè)內稱為“國內首個金融行業(yè)通用大模型”。同月,度小滿推出國內首個千億級中文金融大模型“軒轅”。

6月,恒生電子發(fā)布金融行業(yè)大模型LightGPT,拓爾思發(fā)布包括金融行業(yè)大模型在內的產品;8月,馬上消費金融發(fā)布了首個零售金融大模型“天鏡”;9月,螞蟻集團正式發(fā)布工業(yè)級金融大模型AntFinGLM,華為發(fā)布三大類10個場景的金融大模型方案……

艾瑞咨詢曾測算,2021年AI+金融核心市場規(guī)模達到296億元,帶動相關產業(yè)規(guī)模677億元,到2026年,核心市場規(guī)模達到666億元,CAGR(復合年增長率)為17.6%,帶動相關產業(yè)規(guī)模1562億元,CAGR為18.2%。

華西證券也認為,隨著大模型技術與業(yè)務的深度融合,頭部金融科技企業(yè)有望實現產品和商業(yè)模式的革新,實現從產品+服務收費向SaaS訂閱收費、運營分潤收費的轉變。

金融科技細分領域眾多,各細分領域龍頭具備技術、行業(yè)Know-How等要素,與頭部金融機構的長期合作關系有利于補齊數據、場景等要素,相關產品有望率先落地。

落地的1%與99%

8月,波士頓咨詢發(fā)布了一份報告。以一家擁有約2萬名員工的區(qū)域性國際銀行為例,報告初步梳理了該銀行前中后臺相關部門應用生成式AI的潛力和效益,并預計生成式AI在首年即可為該銀行節(jié)省約1.5億美元的成本,占整體薪酬總包的7%左右。

但金融大模型也存在理想和現實之間的距離。許冬亮曾提到,人工智能在金融行業(yè)的應用潛力目前可能只發(fā)揮了不到1%。

金融大模型,既不是對通用大模型完全的“拿來主義”,也不是機械地完成大模型和金融的疊加過程。而是需要以金融行業(yè)本身的立場、特點為出發(fā)點,用基礎設施、模型算法、場景應用打造一套量身定制的系統化工程。

沿襲著這套系統化工程的思路,金融大模型的落地也難免遭遇模型選擇難、算力供應不足、應用成熟度不夠、資源數據壁壘等問題。

以算力為例,許冬亮曾提到,如果從底層開始訓練大模型,所需要投入的算力成本非常高,例如千億級別的通用大模型,訓練一次需要付出幾千萬元的成本。

因此,金融大模型的產業(yè)應用需要場景應用方(金融機構)、模型提供方、訓練工具提供方等多方共建,共同參與。

工商銀行首席技術官呂仲濤曾呼吁,當前國內外算力市場面臨著算力供給短缺、多廠商異構算力融合、國產AI生態(tài)不足、機房和網絡建設等復雜情況,金融機構需要深化與產界各方的合作,共同推動解決大規(guī)模算力部署和應用的難題。

而當不成熟的大模型遇上強監(jiān)管的金融業(yè),安全隱私、科技倫理、可信可解釋等方面的隱患也會被成倍放大。其中最典型的就是金融的低容錯率與大模型高幻覺幾乎成為技術上不可調和的矛盾。

風控是頗具代表性的一個場景。風控需要極致的嚴謹,大模型恰恰精通自圓其說之道,一旦無法有效捕捉其中的漏洞,就可能導致金融大模型出現理解或判斷上的偏差,直接影響風控效果。

此外,金融又是一個由數據高度驅動的市場。

過往大量數據從各個渠道涌入銀行、保險、交易所等金融機構,匯聚在一起,成為足以反映客戶需求、行業(yè)趨勢以及市場變化的黃金信息,及時有效地分析、利用這些數據,至關重要。

在數據利用方面,金融和大模型的結合有點“雙向奔赴”的意思。但金融行業(yè)本身對數據安全和隱私合規(guī)的嚴格要求,注定了金融大模型在采集、傳輸、加工及處理信息的各個環(huán)節(jié)都要比通用大模型乃至其他行業(yè)大模型多一分甚至十分的謹慎。

數據又是不同金融機構的核心生產力,關系著自身的護城河問題。大模型發(fā)展需要高質量數據集,就必然要說服不同業(yè)態(tài)完成數據共享,如何構建一個合理且安全的機制,考驗的是整個行業(yè)的智慧。

中國工程院院士、復旦大學金融科技研究院院長柴洪峰曾在演講中指出,從技術面看,金融數據和知識的私密性限制了共享和構建大規(guī)模數據集的能力,金融數據的多模態(tài)特性增加了模型處理和建模的復雜性。

就像是互聯網愛講生態(tài),金融大模型有過之而無不及——生態(tài)是金融大模型的必要條件,既包括數據的生態(tài)、算力的生態(tài),也包括行業(yè)的生態(tài)、監(jiān)管的生態(tài),而這些或許就是金融大模型落地所必須的那99%。

右側廣告

本網站所有內容屬北京商報社有限公司,未經許可不得轉載。 商報總機:010-64101978 媒體合作:010-64101871

商報地址:北京市朝陽區(qū)和平里西街21號 郵編:100013 法律顧問:北京市中同律師事務所(010-82011988)

網上有害信息舉報  違法和不良信息舉報電話:010-84276691 舉報郵箱:bjsb@bbtnews.com.cn

ICP備案編號:京ICP備08003726號-1  京公網安備11010502045556號  互聯網新聞信息服務許可證11120220001號