亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

AI發(fā)展“撞墻”?普通人的致富機會來了 廠商卻在找第二條路

AIGC行業(yè)資訊12個月前發(fā)布 zhang
19 0

當百度創(chuàng)始人李彥宏激動地高呼:“一個只靠想法就能賺錢的時代來了!”普通人的機會到底在哪里?每個創(chuàng)業(yè)者都有自己的答案,但經(jīng)歷了幾代技術(shù)革命浪潮的李彥宏認為,智能體將最先引爆。

每個人、每個企業(yè)都有自己的“AI焦慮”:如果未來智能體成為主流,每個企業(yè)都將擁有自己的數(shù)字員工,那么人類員工會不會被AI替代?

過去24個月,AI行業(yè)最大的變化是大模型基本消除了幻覺,不再一本正經(jīng)地胡說八道。大模型一大弱點已經(jīng)被消除,比如,百度用檢索增強技術(shù)解決文生圖的幻覺,我們看到越來越多大模型生成的文字圖片不再“一眼假”“機器味兒”。

但是,普通人與大模型廠商之間存在天然信息差,“AI焦慮”自然也不同,當普通人焦慮自己會被AI替代,還是能抓住AI致富之時,大模型廠商在焦慮:到底大模型會不會是技術(shù)泡沫?因為比幻覺更大的問題正在到來。

近期,Scaling Law(尺度定律)撞墻的爭論甚囂塵上,國外知名科技媒體《The Information》爆料,OpenAI下一代旗艦?zāi)P蚈rion改進大幅放緩,與GPT-4相比,Orion性能提升微乎其微,合成數(shù)據(jù)越訓越像舊模型,編碼性能甚至還在退步。

當全球大模型摸著ChatGPT過河之際,大模型廠商必須要思考:下一代模型的方向在哪里?

智能體將最先爆發(fā)

當你走過家門口的連鎖理發(fā)店時,也許你不會意識到,櫥窗上精美的發(fā)型大片竟然是由智能體生成的;當你穿行于地鐵站時,也許你也不會意識到,站臺上的廣告大片竟然也是智能體生成的。以往這樣一張照片需要請模特、發(fā)型師、攝影師,還需要租場地,動輒數(shù)萬到數(shù)十萬的成本。

大模型生成的圖片正在接近于真實照片。從李彥宏在2024百度世界大會上展示的樣片來看,大模型已經(jīng)可以真實還原車型、車標、天壇、愛因斯坦等物體和真人。以前拍一組品牌宣傳海報花費的幾十萬成本,在“數(shù)字設(shè)計師”面前接近于0。

AI發(fā)展“撞墻”?普通人的致富機會來了 廠商卻在找第二條路

“數(shù)字設(shè)計師”是一類智能體,“農(nóng)民院士”又是一類智能體。在云南省普洱市瀾滄拉祜族自治縣,有幾十萬農(nóng)民急需學習農(nóng)業(yè)技術(shù),但一位農(nóng)民院士顯然分身乏術(shù),于是“農(nóng)民院士”智能體誕生了?!拔蚁雴栆幌潞档臼裁磿r候種最好?”“旱地稻受到病蟲害怎么辦?”面對潮水般涌來的農(nóng)業(yè)技術(shù)問題,它都能提供及時的幫助,幫農(nóng)民解決實際生產(chǎn)難題。

在百度文心智能體平臺上,已有15萬家企業(yè)和80萬名開發(fā)者參與創(chuàng)造智能體,其中甚至有11歲的小學生。李彥宏把智能體比作AI時代的新載體,就像PC時代的網(wǎng)站,移動時代的自媒體賬號,這給了普通人一個新的致富機會。

AI發(fā)展“撞墻”?普通人的致富機會來了 廠商卻在找第二條路

智能體的門檻似乎已經(jīng)降低到人人都能上手的程度,從百度展示的案例來看,目前智能體在代替?zhèn)鹘y(tǒng)PC官網(wǎng)、人工客服、咨詢律師等方面已經(jīng)較為成熟。

但是,智能體真的可以解決千行百業(yè)所有的實際問題嗎?傳神語聯(lián)創(chuàng)始人何恩培認為,今天企業(yè)還不敢完全依賴智能體干活,仍然需要人類監(jiān)督,但它們正在變得越來越自主。

大模型最擅長的還是處理數(shù)據(jù)、搬運語言和文字,但要真正深入企業(yè)的工作流,還需要解決一個難題:在企業(yè)不愿意拿出數(shù)據(jù)的情況下,如何快速訓練出一位足以應(yīng)對行業(yè)問題的“專家”智能體?

Scaling Law“撞墻”

雖然OpenAI高管多次怒斥Scaling Law“撞墻論”,但多種跡象表明,這將成為很多基礎(chǔ)大模型的共同難題。一直以來,Scaling Law被大模型業(yè)界公認為“大模型時代的牛頓定律”,大模型廠商都遵循這一定律并堅定相信“大力出奇跡”會持續(xù)奏效,不斷擴大預(yù)訓練數(shù)據(jù)、訓練算力,從而擴大模型參數(shù)規(guī)模。

AI發(fā)展“撞墻”?普通人的致富機會來了 廠商卻在找第二條路

據(jù)不完全統(tǒng)計,宣布擁有千卡規(guī)模的中國算力集群已不少于100個?!皬?024年開始,AI模型訓練的主戰(zhàn)場,萬卡是標配?!蹦柧€程創(chuàng)始人兼CEO張建中曾在今年7月表示。2024年,模型參數(shù)量從千億邁向萬億,很多創(chuàng)業(yè)公司都沒有資本實力訓練基礎(chǔ)大模型,畢竟GPT-4已經(jīng)使用約2萬多張GPU,未來模型算力需求可能達數(shù)十萬甚至上百萬張GPU,這造成大量成本支出。

許多大型基礎(chǔ)實驗室都遇到了預(yù)訓練的瓶頸,另一大原因是高質(zhì)量文本數(shù)據(jù)越來越少。有研究預(yù)計,在2028年左右,已有的數(shù)據(jù)儲量將全部用完,基于大數(shù)據(jù)的大模型發(fā)展可能放緩甚至陷入停滯。

“大模型的核心競爭,將是高質(zhì)量數(shù)據(jù)的競爭?!币荒昵埃_觀數(shù)據(jù)CEO陳運文在接受《IT時報》記者采訪時就曾表示,我們應(yīng)該意識到,中文教科書只有英文的十分之一,知識密度高的文檔資料才是大模型訓練的優(yōu)質(zhì)數(shù)據(jù),包括教科書、論文、報告,以及經(jīng)過治理的企業(yè)數(shù)據(jù)等,但是微信聊天記錄、淘寶聊天記錄等數(shù)據(jù)有效性弱。

大模型落地最大的阻礙在于,如果企業(yè)不愿意拿出數(shù)據(jù),大模型就很難有效學習并成為專家。如果將數(shù)據(jù)提供給大模型服務(wù)商進行訓練,數(shù)據(jù)安全又難以保障;而如果企業(yè)自行訓練,不僅算力和人才成本高昂浪費,微調(diào)模式還可能削弱大模型通用能力。

在“不可能三角”的相互拉扯下,產(chǎn)業(yè)發(fā)展似乎又回到了智能體落地的兩難境地。

數(shù)推分離? 將成下一代模型方向

如何走出這片技術(shù)沙漠?OpenAI正在改變策略謀求出路。早在今年5月,OpenAI首席執(zhí)行官薩姆·奧特曼在對話麻省理工學院校長莎莉·科恩布魯斯時提到,GPT-4有推理速度慢、成本高昂等副作用,GPT-5或?qū)?shù)據(jù)與推理引擎分離。

“大模型正在從Scaling Law時代邁向?qū)崟r學習時代,數(shù)據(jù)分離是我們當下走通的另一條路?!焙味髋嘁矊Α禝T時報》記者表示。

傳神的任度大模型主要切入的行業(yè)是航天、醫(yī)療、金融等對數(shù)據(jù)安全極為重視的行業(yè),企業(yè)不愿意拿出數(shù)據(jù)怎么辦?遇到的難題是基于向量檢索、數(shù)據(jù)仿真等模式都難以保證輸出結(jié)果的準確性,在算力和數(shù)據(jù)不可能無限擴大時,改進算法成為新出路,而且基于高效算法和架構(gòu)的小參數(shù)模型更適合商業(yè)落地。但是,目前國內(nèi)走通數(shù)推分離模式的大模型廠商并不多,走這條路仿佛穿越沙漠,沒有前路可借鑒。

“數(shù)推分離更像人類學習知識的方式,人類只需要閱讀幾百本書就能獲得一定的智慧來解決各種各樣的問題?!焙味髋嗵岬剑瑐魃竦娜味却竽P途褪且噪p網(wǎng)架構(gòu)實現(xiàn)客戶數(shù)據(jù)學習網(wǎng)絡(luò)與推理網(wǎng)絡(luò)分離??蛻魯?shù)據(jù)學習網(wǎng)絡(luò)如同人類左腦,在企業(yè)端實時學習歷史數(shù)據(jù)和業(yè)務(wù)運營中的新數(shù)據(jù),讓企業(yè)數(shù)據(jù)為模型注入知識養(yǎng)分,卻不需要離開企業(yè)上傳至公有云;推理網(wǎng)絡(luò)如同人類右腦,經(jīng)過適量數(shù)據(jù)預(yù)訓練可以達到不錯的推理和泛化能力。

“雙腦模式”的確降低了訓練成本和數(shù)據(jù)安全的擔憂,但能否保證大模型“聰明”?何恩培表示,數(shù)推分離突破了常規(guī)大模型技術(shù)架構(gòu)限制,上下文輸入長度不受限,能將1億字乃至更大量多模態(tài)數(shù)據(jù)壓縮到神經(jīng)網(wǎng)絡(luò)中實現(xiàn)深度知識理解,等同于大模型和數(shù)據(jù)重新訓練的效果,同時企業(yè)運營實時數(shù)據(jù),也能快速學習,訓練時間可縮短至分鐘級。

為了完全打消企業(yè)對數(shù)據(jù)不出域的疑慮,何恩培將雙網(wǎng)絡(luò)架構(gòu)的數(shù)推分離大模型植入自研的任度“雙腦”大模型一體機中,就像一臺專屬電腦配置在企業(yè)端,讓企業(yè)可以清楚看到,數(shù)據(jù)在物理上無法出企業(yè),也不上傳公有云,只在本地訓練。

國產(chǎn)原創(chuàng)? 給世界第二種選擇

高端GPU芯片禁售后,國內(nèi)大模型行業(yè)已經(jīng)意識到,只有國產(chǎn)原創(chuàng)才有出路。“只有在真正自主可控的平臺上,才有真正的中國人工智能大未來,才能給世界第二種選擇。”科大訊飛董事長劉慶峰多次強調(diào)。

今年10月,劉慶峰曬出成績單:截至2024年10月,科大訊飛已與各頭部企業(yè)共建20多個行業(yè)大模型,300多個應(yīng)用場景,所覆蓋行業(yè)和場景數(shù)都是第一。

訊飛星火大模型能成為眾多央國企的選擇,主要歸因于全國產(chǎn)化的算力平臺。2023年10月,科大訊飛與華為聯(lián)合發(fā)布首個國產(chǎn)萬卡算力集群“飛星一號”。今年10月,科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運營有限公司三方聯(lián)合打造的國產(chǎn)超大規(guī)模智算平臺“飛星二號”正式啟動。

“一年以來我們一起攻克了很多疑難雜癥,解決了500多次基礎(chǔ)軟硬件問題和模型適配問題?!眲c峰說道。

在無人區(qū)的探索無比艱難,但是中國大模型廠商終究要走國產(chǎn)原創(chuàng)之路,算力國產(chǎn)化之后,底層算法框架的根原創(chuàng)依舊難走。

在一次內(nèi)部研討會上,一位行業(yè)專家語重心長地對何恩培說:“為什么國內(nèi)外大廠都不走?你們的技術(shù)路線是不是選錯了?”何恩培也曾懷疑過自己公司走的技術(shù)路線,直到自家大模型評測進入第一梯隊,也看到在實際場景落地中得到了認可,才僥幸走通了這條“根原創(chuàng)”的技術(shù)路線。

任度大模型2.1B參數(shù)版本在2024年9月的MMLU評估中,綜合評分超越了gemma-7B、LLaMA2-34B等知名大模型,性參比(大模型能力分數(shù)/大模型參數(shù))更是超越了包括GPT-4o、Phi-3、Qwen2-7B、Llama3.1等國際頂尖大模型。這意味著,訓練推理過程中消耗的算力成本大大降低,僅為同等大型模型的1/5—1/10以及1/2—1/4。

傳神的任度大模型通過了中國信息通信研究院的“0開源依賴”的評測,未使用任何開源代碼和框架?!霸趪鴥?nèi)外,能做到根原創(chuàng)的企業(yè)為數(shù)不多?!焙味髋鄰娬{(diào),這也解釋了為何任度大模型能夠不受限地實踐數(shù)推分離雙網(wǎng)絡(luò)架構(gòu)。

“我也僥幸走通了國產(chǎn)原創(chuàng)之路。我們沒有從主流大模型發(fā)展遇到的問題中找突破機會,而是從公司誕生起就走在這條路上,走了20多年,也曾感到孤獨和不自信,但看到大家都向這個方向走來,才確信自己走的沒錯?!焙味髋嗾f道。

? 版權(quán)聲明

相關(guān)文章