“AI內(nèi)行頂級盛會”——北京智源大會在中關村展示中心開幕。智源研究院院長王仲遠:國產(chǎn)大模型未來要努力達到好用水平
6月14日,智源研究院主辦的“AI內(nèi)行頂級盛會”——北京智源大會在中關村展示中心開幕。智源研究院院長王仲遠匯報了智源研究院在語言、多模態(tài)、具身、生物計算大模型的前沿探索。在接受媒體采訪時,王仲遠表示,過去一年,國產(chǎn)大模型取得了長足進步。達到非常好用的水平,依然是國產(chǎn)大模型未來要努力的方向。
智源推出大模型全家桶
當天,智源推出大模型全家桶及全棧開源技術基座新版圖。
在語言大模型方面,針對大模型訓練算力消耗高的問題,智源研究院和中國電信人工智能研究院(TeleAI)基于模型生長和損失預測等關鍵技術,聯(lián)合研發(fā)并推出全球首個低碳單體稠密萬億語言模型Tele-FLM-1T。該模型與百億級的52B版本、千億級的102B版本共同構成Tele-FLM系列模型。
Tele-FLM系列模型實現(xiàn)了低碳生長,僅以業(yè)界普通訓練方案9%的算力資源,基于112臺A800服務器,用4個月完成3個模型總計2.3Ttokens的訓練,成功訓練出萬億稠密模型Tele-FLM-1T。
針對大模型幻覺等問題,智源研究院自主研發(fā)了通用語義向量模型BGE系列,基于檢索增強RAG技術,實現(xiàn)數(shù)據(jù)之間精準的語義匹配,支持大模型調(diào)用外部知識。目前,BGE模型系列下載總量位列國產(chǎn)AI模型首位。
在多模態(tài)大模型方面,行業(yè)現(xiàn)有的多模態(tài)大模型多為對于不同任務而訓練的專用模型,例如Stable Diffusion之于文生圖,sora之于文生視頻,GPT-4V之于圖生文。每類模型都有對應的架構和方法,例如對于視頻生成,行業(yè)普遍參照Sora選擇了DiT架構。但是現(xiàn)有模型的能力多為單一分散的能力組合,而不是原生的統(tǒng)一能力,例如目前Sora還做不到圖像和視頻的理解。
為了實現(xiàn)多模態(tài)、統(tǒng)一、端到端的下一代大模型,智源研究院推出了Emu3原生多模態(tài)世界模型。Emu3采用智源自研的多模態(tài)自回歸技術路徑,在圖像、視頻、文字上聯(lián)合訓練,使模型具備原生多模態(tài)能力,實現(xiàn)了圖像、視頻、文字的統(tǒng)一輸入和輸出。Emu3從模型訓練開始就是為統(tǒng)一的多模態(tài)生成和理解而設計的,目前具備生成高質(zhì)量圖片和視頻、續(xù)寫視頻、理解物理世界等多模態(tài)能力。簡單來說,Emu3既統(tǒng)一了視頻、圖像、文字,也統(tǒng)一了生成和理解。Emu3在持續(xù)訓練中,經(jīng)過安全評估之后將逐步開源。
為幫助全球開發(fā)者一站式啟動大模型開發(fā)和研究工作,智源研究院推出了面向異構芯片、支持多種框架的大模型全棧開源技術基座FlagOpen 2.0。FlagOpen 2.0可支持多種芯片和多種深度學習框架。
未來兩三年,將有大量人工智能應用產(chǎn)生
談及國產(chǎn)大模型所處的位置,王仲遠受訪時認為,國產(chǎn)大模型還處在追趕階段,未來的里程碑將是追趕上GPT-4?!按竽P椭阅軐Ξa(chǎn)業(yè)界產(chǎn)生重大影響,是因為它通用的理解推理能力和通用智能和潛力,追趕上GPT-4 是一個重要的關口。”
他說,過去一年,國產(chǎn)大模型取得了長足進步?!叭ツ?,國產(chǎn)大模型還在追逐 GPT -3.5,今年我們可以非常自豪地說,國產(chǎn)大模型平均水平應該已經(jīng)超過了GPT -3.5,正在無限逼近 GPT-4。在中文語境之下,國產(chǎn)大模型某些能力超過了GPT-4,但GPT-4也正在不斷迭代?!?/span>
在他看來,國產(chǎn)大模型趕超GPT-4后,意味著中國最擅長的場景優(yōu)勢、數(shù)據(jù)優(yōu)勢將發(fā)揮出來,大模型將真正變成賦能千行百業(yè)的新質(zhì)生產(chǎn)力?!斑^去一年,大模型在科技圈依然非?;馃幔胀ㄓ脩舾惺懿⒉幻黠@,很重要的原因是國產(chǎn)大模型的能力還不夠,另外,國內(nèi)大模型的To B生態(tài)底子較薄?,F(xiàn)在我們欣喜地看到國產(chǎn)大模型已經(jīng)達到了可用的水平。達到非常好用的水平,依然是國產(chǎn)大模型未來要努力的方向?!?/span>
何時才能出現(xiàn)爆款應用?他預測,隨著國產(chǎn)大模型已經(jīng)達到支撐應用的階段,未來兩三年可以看到大量應用的產(chǎn)生,包括B端應用和C端應用。



?津公網(wǎng)安備12011002023007號