北京商報訊(記者魏蔚)9月20日,在2024云棲大會云棲通道開放期間,個人開發(fā)者、技術(shù)博主張子豪介紹了自己研發(fā)的人形機器人功能。“這款用Qwen2開發(fā)的人形機器人,基于幻爾TonyPi人形機器人,通過開源AI推理框架OpenVINO,在輕薄筆記本上本地部署端側(cè)AI開源大模型通義千問Qwen2-7B-Instruct,使用AI編程助手‘通義靈碼’輔助編程開發(fā)和文檔撰寫。”張子豪介紹,人類輸入模糊語音指令,智能體Agent就能自主思考,調(diào)用23種原子動作Function Call,編排生成依次執(zhí)行的動作列表及函數(shù)參數(shù)。
“之前的機器人,都是根據(jù)固定的指令去完成固定的動作,沒法實現(xiàn)泛化性、多樣性、通用性操作和對指令的理解”,張子豪解釋,“大模型的最大好處就是可以把任意指令翻譯成機器人的動作”。
他繼續(xù)舉例,之前讓機器人用機械臂把綠色方塊搬到印有小豬佩奇照片的指定處,要讓機器人認(rèn)識小豬佩奇,得專門訓(xùn)練一個模型,讓它先認(rèn)識小豬佩奇。但是現(xiàn)在借助多模態(tài)大模型,機器人天生就具備這個能力,它天生就知道小豬佩奇是誰。如此一來,人類可以跟機器人說任意的指令,它都可以理解,所以泛化性能是當(dāng)前具身智能大模型之后引爆的一個熱點。
本網(wǎng)站所有內(nèi)容屬北京商報社有限公司,未經(jīng)許可不得轉(zhuǎn)載。 商報總機:010-64101978 媒體合作:010-64101871
商報地址:北京市朝陽區(qū)和平里西街21號 郵編:100013 法律顧問:北京市中同律師事務(wù)所(010-82011988)
網(wǎng)上有害信息舉報 違法和不良信息舉報電話:010-84276691 舉報郵箱:bjsb@bbtnews.com.cn
ICP備案編號:京ICP備08003726號-1 京公網(wǎng)安備11010502045556號 互聯(lián)網(wǎng)新聞信息服務(wù)許可證11120220001號