北京智源人工智能研究院院長王仲遠:人形機器人攻關(guān)是生態(tài)工程

“具身智能是未來AI發(fā)展一個非常重要的方向,也是我們集中資源投入的方向。”王仲遠對《中國電子報》記者說。
2018年底成立的北京智源人工智能研究院(下文簡稱“智源研究院”)是國內(nèi)率先開展AI大模型的非營利性新型研究機構(gòu),其主辦的北京智源大會已經(jīng)成為AI領(lǐng)域的行業(yè)盛會。
本屆北京智源大會期間,智源研究院發(fā)布了一系列“具身智能”研究成果——能夠從失敗中重思考、再嘗試的鉸接物體操作大模型系統(tǒng)SAGE,全球首個能做到開放指令控制六自由度物體拿取放置的大模型系統(tǒng)Open6DOR,全球首個端到端基于視頻的多模態(tài)具身導航大模型NaVid,以及通用計算機控制框架Cradle。
王仲遠判斷,智能體(Agent)或?qū)⒊蔀锳I大模型的爆款應(yīng)用,成為人們真正意義上的智能助理。他表示:“如果智能體已經(jīng)到達足夠智能和好用的階段,那么相當于每個人都擁有了一個私人助理,這種科技會推動社會進步和產(chǎn)業(yè)變革。我們認為,智能體可以存在于手機或PC之中,也可以‘進入’機器人——具身智能應(yīng)運而生?!?/p>
王仲遠認為,具身智能技術(shù)尚處于發(fā)展初期。“其中一個重要原因是硬件的發(fā)展速度遠不如AI大模型的迭代速度快。當前AI大模型的迭代速度很快——每個月都會看到5-10個具有全球影響力的大模型發(fā)布,但是硬件的迭代周期和速度仍然以年為單位來計算?!蓖踔龠h說道。
王仲遠指出,當前具身智能發(fā)展有非常多亟待突破的問題,具身智能的大腦模型、小腦模型、場景應(yīng)用都處于非常零散的發(fā)展階段。對于大腦(AI大模型)來說,數(shù)據(jù)的缺失問題首當其沖?!按蠹叶贾?a href="http://www.xmqqs.cn/tag/%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd" style="color:#01579b">人工智能技術(shù)的突破是依靠ImageNet(用于視覺對象識別軟件研究的大型可視化數(shù)據(jù)庫)的支撐,但是當前具身智能還缺乏一個ImageNet這樣可以用來訓練的數(shù)據(jù)集。”王仲遠說道。
談到智源研究院對具身智能的未來規(guī)劃和布局,王仲遠表示:“我們將發(fā)揮智源在大模型,尤其是多模態(tài)大模型這方面的技術(shù)優(yōu)勢,去持續(xù)探索和演進具身智能大模型的能力?!?/p>
人形機器人產(chǎn)業(yè)是個生態(tài)工程
對于人形機器人與具身智能的關(guān)系,王仲遠給出了一個明確的解釋:“具身智能本身代表是人工智能的技術(shù)(尤其大模型的技術(shù))能夠走進物理世界,與不同的硬件體結(jié)合,這個硬件可以是一個機器手臂、四足機器人、六足機器人、輪式機器人,也可以是人形機器人?!?/p>
去年以來,聯(lián)合創(chuàng)新成為國內(nèi)人形機器人發(fā)展的普遍共識,北京、上海、浙江、廣東、成都等地相繼建立了人形機器人創(chuàng)新中心。
談到各省市采用聯(lián)合體去推動人形機器人發(fā)展,王仲遠表示非常贊同:“人形機器人是一個需要跨學科、跨科研機構(gòu)和企業(yè)去推動的產(chǎn)業(yè),因此(類似創(chuàng)新中心)這樣的聯(lián)合體或者說創(chuàng)新平臺的存在是非常重要的?!彼M一步解釋說,人形機器人攻關(guān)不是一個純學術(shù)研究問題,而是需要和硬件廠商、上下游供應(yīng)商、科研機構(gòu)、場景應(yīng)用聯(lián)合推進。收集數(shù)據(jù)、訓練模型、深耕場景應(yīng)用、降低硬件成本……這些事情注定人形機器人攻關(guān)是一個生態(tài)工程。
王仲遠對《中國電子報》記者表示,智源非常愿意打造具身智能的聯(lián)合創(chuàng)新平臺。“下半年以及明年,智源研究院在具身智能的重點工作就是聯(lián)合清華大學、北京大學、中國科學院大學等相關(guān)高校,銀河通用機器人、領(lǐng)視智遠這樣的人形機器人企業(yè),共同去搭建一個具身智能的創(chuàng)新平臺,聯(lián)合上下游供應(yīng)鏈的相關(guān)企業(yè)解決數(shù)據(jù)模型、場景應(yīng)用等問題?!?/p>
王仲遠判斷,人形機器人發(fā)展還處于非常早期,無論是進入工業(yè)化場景還是家庭生活還要很長一段時間,這個周期至少是3—5年起步。“智源研究院有信心和耐心去持續(xù)推進相關(guān)研究,直到它跨越真正的技術(shù)周期,迎來真正的產(chǎn)業(yè)爆發(fā)。否則,當人形機器人迎來‘ChatGPT時刻’時,人們又會重復那個問題‘為什么中國沒有孕育出OpenAI?’。
?津公網(wǎng)安備12011002023007號