6月28日,2023火山引擎V-Tech體驗(yàn)創(chuàng)新科技峰會上,火山引擎正式發(fā)布“火山方舟”大模型服務(wù)平臺。
火山引擎智能算法負(fù)責(zé)人、火山方舟負(fù)責(zé)人吳迪以《綻放·共贏,“火山方舟”大模型平臺啟航》為主題進(jìn)行演講,深度闡釋了火山引擎大模型理念,解讀“火山方舟”的功能特點(diǎn),為模型提供方以及模型使用方帶來全新價(jià)值。
01
大模型百花齊放,“火山方舟”啟航
這一輪由大模型、大算力帶來的技術(shù)變革,讓更多人看到了無限可能。這種變革的影響是巨大的,大模型將滲透到千行百業(yè),變革人機(jī)交互界面,影響人們獲取和處理信息、學(xué)習(xí)和掌握知識的習(xí)慣,最終深刻影響行業(yè)格局。同時(shí),B端大模型供給將長期呈現(xiàn)百花齊放的面貌,創(chuàng)造大量的商業(yè)價(jià)值。第一部分是大模型的提供商和研究機(jī)構(gòu),將為各行業(yè)提供極具競爭力的通用基座模型或垂直模型;第二部分是大量頗具技術(shù)能力的公司,一方面會保持自研自用的模型訓(xùn)練投入,另一方面也會調(diào)用若干商用模型,落地到業(yè)務(wù)的不同場景;第三部分是以大模型應(yīng)用為主的各行各業(yè),他們會把大模型能力深入到諸多細(xì)分場景,在提升自身經(jīng)營效率的同時(shí),把大模型的能力滲透到我們生活的方方面面。
大模型即將出現(xiàn)第二條增長曲線(勘誤:模型訓(xùn)練為紫色,模型應(yīng)用為藍(lán)色)
上面的曲線圖體現(xiàn)了對未來趨勢的判斷,橫坐標(biāo)是時(shí)間,從今天開始向后展望2-3年,縱坐標(biāo)是國內(nèi)的機(jī)器學(xué)習(xí)算力消耗。今天,以預(yù)訓(xùn)練為代表的第一條增長曲線快速攀升,代表了大模型創(chuàng)業(yè)者勇攀高峰的決心和對前景的期待,這條曲線需要通過第二條曲線的持續(xù)攀升來轉(zhuǎn)化現(xiàn)實(shí)。我們暢想一下,也許到了2024年的秋天之后,以推理為主的大模型應(yīng)用消耗將超過屆時(shí)預(yù)訓(xùn)練消耗60%,并且在2025年某個(gè)時(shí)刻超過預(yù)訓(xùn)練的整體算力消耗。
“火山方舟”加速大模型市場正向循環(huán)
大模型市場生機(jī)勃勃,火山引擎希望能夠加速這個(gè)進(jìn)程,推動(dòng)大模型在千行百業(yè)更快形成生產(chǎn)力。火山引擎推出大模型服務(wù)平臺“火山方舟”,致力于幫助千行百業(yè)更容易地獲取模型,更放心地使用模型,更高效地打造應(yīng)用,在模型提供方和模型使用方之間促進(jìn)研究、訓(xùn)練、應(yīng)用、變現(xiàn)、反哺研究地正向循環(huán)。模型提供方可以通過平臺以更低的成本觸達(dá)海量客戶,用更小的代價(jià)在ToB市場規(guī)模化。基于嚴(yán)謹(jǐn)?shù)陌踩バ艡C(jī)制,兼顧靈活性和安全性。同時(shí),火山引擎技術(shù)團(tuán)隊(duì)將持續(xù)提供性能優(yōu)化的方案,帶來最具競爭力的性價(jià)比。模型使用方可以通過統(tǒng)一的工作流對接多家模型提供方,為不同業(yè)務(wù)場景選擇最合適的模型。此外,“火山方舟”和火山引擎機(jī)器學(xué)習(xí)平臺是一個(gè)有機(jī)的整體,數(shù)據(jù)集管理、模型訓(xùn)練、模型迭代與大基座模型的應(yīng)用被緊密融合和銜接在一起?;鹕揭娴乃惴?、解決方案和交付團(tuán)隊(duì)也將持續(xù)協(xié)助客戶,把平臺用好,做好大模型落地。“火山方舟”由多個(gè)核心部分構(gòu)成,平臺的行動(dòng)路線設(shè)計(jì)符合大模型應(yīng)用的工作習(xí)慣,并融入了火山引擎對用好大模型的理解。模型廣場,模型提供方提供了不同版本、不同尺寸的模型,客戶可以直接與其交互,獲得直觀體驗(yàn)。也可直接調(diào)用推理API,接入生產(chǎn)環(huán)境。這是一條敏捷的短鏈路,適合進(jìn)行快速分析和業(yè)務(wù)A/B實(shí)驗(yàn),讓算法工程師和業(yè)務(wù)團(tuán)隊(duì)不斷縮短從新想法到試一試的距離。模型評估,用好大模型首先要確定業(yè)務(wù)需求,并為之設(shè)計(jì)一套可量化的評估指標(biāo)。在不斷對比、評估、試驗(yàn)的過程中,積累評估數(shù)據(jù)。快速迭代,為多樣化的業(yè)務(wù)場景挑選不同的、最合適的模型。模型精調(diào),對于一些要求較高的垂直場景,客戶可能需要利用自有數(shù)據(jù)或領(lǐng)域的非公開數(shù)據(jù)進(jìn)行持續(xù)訓(xùn)練,并且建設(shè)和積累自己的精調(diào)數(shù)據(jù)集,同一條精調(diào)數(shù)據(jù)集對多個(gè)基座模型同時(shí)發(fā)起精調(diào)任務(wù),同時(shí)進(jìn)行自動(dòng)化評估,精調(diào)的效果和運(yùn)行指標(biāo)均能在平臺實(shí)時(shí)跟蹤。對于精調(diào)良好的運(yùn)用,小模型在特定工作上的表現(xiàn)可能接近通用大模型的水平,由此也可以進(jìn)一步降低推理成本。02
三類互信技術(shù),促進(jìn)互信共贏
大模型實(shí)踐的模型提供方和使用方有可能是分離的,之前的CV/NLP模型以企業(yè)自產(chǎn)自銷為主,但大的基座模型,包括語言、視頻、音頻模型等,并非每一個(gè)客戶都能憑借自身力量做到最好,且由于大模型的訓(xùn)練成本高昂,對模型資產(chǎn)的保護(hù)變得迫切和重要。此外,模型客戶與大模型的一切交互都需要進(jìn)行嚴(yán)格保護(hù)。火山引擎對數(shù)據(jù)資產(chǎn)的處理原則,是在雙方數(shù)據(jù)資產(chǎn)匯聚的地方滿足嚴(yán)格的可用、不可見要求,包括模型的查詢服務(wù)和利用客戶數(shù)據(jù)精調(diào)后的模型,當(dāng)雙方合作關(guān)系告一段落之后,這些將被就地銷毀?;鹕揭嬖诖龠M(jìn)雙方互信共贏過程中發(fā)揮重要作用,并通過三類互信技術(shù)推動(dòng)大模型進(jìn)一步發(fā)展。“火山方舟”三類互信技術(shù)推動(dòng)大模型落地安全沙箱,通過計(jì)算隔離、存儲隔離、加密、私有的邏輯通信鏈路以及共同的流量審計(jì),確保安全沙箱只能向模型使用方傳遞response,杜絕任何人進(jìn)入沙箱或從沙箱中向外泄露數(shù)據(jù)的可能性。硬件支持,未來將基于硬件的可信計(jì)算環(huán)境進(jìn)行方案加固,其中既有結(jié)合CPU的TEE技術(shù),也有基于英偉達(dá)H800、H100的可信計(jì)算技術(shù)。聯(lián)邦學(xué)習(xí),經(jīng)過多年發(fā)展的聯(lián)邦學(xué)習(xí)技術(shù)將在大模型領(lǐng)域發(fā)揮重要價(jià)值,其主要通過對數(shù)據(jù)資產(chǎn)的拆分來獲取大模型提供方和使用方的信任。模型使用方和提供方之間,傳遞的是機(jī)器學(xué)習(xí)的中間結(jié)果。這一技術(shù)火山引擎還在與合作伙伴進(jìn)行進(jìn)一步的研究。 ? 版權(quán)聲明
本文轉(zhuǎn)載自互聯(lián)網(wǎng)、僅供學(xué)習(xí)交流,內(nèi)容版權(quán)歸原作者所有,如涉作品、版權(quán)或其它疑問請聯(lián)系
AIGC工具導(dǎo)航或
點(diǎn)擊刪除。