世界資訊:一文讀懂AIGC的前世今生
研究方向及背景
【資料圖】
AIGC是AIGeneratedContent的縮寫,指利用人工智能技術(shù)生成的內(nèi)容。它也被認(rèn)為是繼PGC,UGC之后的新型內(nèi)容生產(chǎn)方式,AI繪畫、AI寫作等都屬于AIGC的具體形式。2022年AIGC發(fā)展速度驚人,迭代速度更是呈現(xiàn)指數(shù)級(jí)發(fā)展,這其中深度學(xué)習(xí)模型不斷完善、開源模式的推動(dòng)、大模型探索商業(yè)化的可能,都在助力AIGC的快速發(fā)展。去年人工智能繪畫作品的奪冠、超級(jí)聊天機(jī)器人ChatGPT的出現(xiàn),拉開了智能創(chuàng)作時(shí)代的序幕。
在人工智能發(fā)展的漫長(zhǎng)歷程中,如何讓機(jī)器學(xué)會(huì)創(chuàng)作一直被視為難以逾越的天塹,“創(chuàng)造力”也因此被視為人類與機(jī)器最本質(zhì)的區(qū)別之一。然而,人類的創(chuàng)造力也終將賦予機(jī)器創(chuàng)造力,把世界送入智能創(chuàng)作的新時(shí)代。從機(jī)器學(xué)習(xí)到智能創(chuàng)造,從PGC,UGC到AIGC,我們即將見證一場(chǎng)深刻的生產(chǎn)力變革,而這份變革也會(huì)影響到我們工作與生活的方方面面。本書將結(jié)合生動(dòng)的比喻和有趣的案例,向所有關(guān)注未來科技的從業(yè)者、創(chuàng)業(yè)者、投資人、政府部門科普AIGC的商業(yè)落地場(chǎng)景和行業(yè)應(yīng)用案例。
趨勢(shì)判斷:人工智能產(chǎn)業(yè)經(jīng)過多年發(fā)展,技術(shù)實(shí)現(xiàn)將從感知智能升級(jí)成認(rèn)知智能,從而引發(fā)了機(jī)器理解、分析和決策事物的深層次需求。AIGC就是實(shí)現(xiàn)認(rèn)知智能產(chǎn)品化的重要方式。未來幾年內(nèi),AIGC技術(shù)將在多個(gè)領(lǐng)域落地。
切入形式:技術(shù)主體切入(以AIGC技術(shù)切入,研究基于此技術(shù)衍生出的各領(lǐng)域中的應(yīng)用)
目標(biāo)讀者群體:AIGC行業(yè)應(yīng)用企業(yè)
商業(yè)化對(duì)象:AIGC服務(wù)商
報(bào)告框架:
一、AIGC發(fā)展現(xiàn)狀
1. AIGC概念界定
與之前的PGC與UGC不同的,AIGC是利用人工智能技術(shù)自動(dòng)生成內(nèi)容的新型生產(chǎn)方式。按照模態(tài)區(qū)分,AIGC又可分為音頻生成、文本生成、圖像生成、視頻生成及圖像、視頻、文本間的跨模態(tài)生成,細(xì)分場(chǎng)景眾多,其中跨模態(tài)生成值得重點(diǎn)關(guān)注。
自然語言處理(NLP)賦予了AI理解和生成能力,大規(guī)模預(yù)訓(xùn)練模型是NLP的發(fā)展趨勢(shì)。NLP的兩個(gè)核心任務(wù)分別是自然語言理解(NLU)和自然語言生成(NLG),ChatGPT是NLP發(fā)展中具有里程碑式意義的模型之一。ChatGPT是OpenAI從GPT-3.5系列中的模型進(jìn)行微調(diào)產(chǎn)生的聊天機(jī)器人模型,能夠通過學(xué)習(xí)和理解人類的語言來進(jìn)行對(duì)話,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務(wù)。
億歐智庫:自然語言處理(NLP)發(fā)展歷程
2. AIGC發(fā)展歷程
AIGC發(fā)展可分為三階段,早期萌芽階段(上世紀(jì)50年代至90年代中期),沉淀累積階段(上世紀(jì)90年代至本世紀(jì)10年代中期),快速發(fā)展階段(本世紀(jì)10年代中期至今)。
2.1 早期萌芽階段(1950s-1990s)
由于技術(shù)限制AIGC僅限于小范圍實(shí)驗(yàn)與應(yīng)用,1957年出現(xiàn)首支電腦創(chuàng)作的音樂作品,弦樂四重奏《依利亞克組曲(IlliacSuite)》,80年代末至90年代中由于高成本及難以商業(yè)化,因此資本投入有限導(dǎo)致AIGC無較多較大成績(jī)。
2.2 沉淀累積階段(1990s-2010s)
AIGC從實(shí)驗(yàn)性轉(zhuǎn)向?qū)嵱眯裕?006年深度學(xué)習(xí)算法取得進(jìn)展,同時(shí)GPU,CPU等算力設(shè)備日益精進(jìn),互聯(lián)網(wǎng)快速發(fā)展,為各類人工智能算法提供海量數(shù)據(jù)進(jìn)行訓(xùn)練。2007年首部人工智能裝置完成的小說《IThe Road》(《在路上》)問世,2012年微軟展示全自動(dòng)同聲傳譯系統(tǒng),主要基于“深度神經(jīng)網(wǎng)絡(luò)”(DeepNeural Network,DNN)自動(dòng)將英文講話內(nèi)容通過語音識(shí)別等技術(shù)生成中文。
2.3 快速發(fā)展階段(2010s至今)
2014年深度學(xué)習(xí)算法“生成式對(duì)抗網(wǎng)絡(luò)”(GenerativeAdversarial Network,GAN)推出并迭代更新,助力AIGC新發(fā)展。2017年微軟人工智能少年“小冰”推出世界首部由人工智能寫作的詩集《陽光失了玻璃窗》,2018年NVIDIA(英偉達(dá))發(fā)布StyleGAN模型可自動(dòng)生成圖片,2019年DeepMind發(fā)布DVD-GAN模型可生成連續(xù)視頻。2021年OpenAI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、圖像的交互生成內(nèi)容。我國(guó)AIGC市場(chǎng)在2022年底引起較大關(guān)注,2023年開年企業(yè)端躍躍欲試。雖然行業(yè)仍處于起步階段,距離大規(guī)模證明和體系化發(fā)展仍有距離,但從資本的加碼到應(yīng)用場(chǎng)景的探索,距離的縫隙有望逐步填補(bǔ),同時(shí),“模塊分拆+個(gè)性化推薦”的“泛AIGC”形式有望持續(xù)發(fā)展。
二、AIGC技術(shù)基礎(chǔ)
1. AI構(gòu)建
1.1 圖靈測(cè)試與AI的誕生
1950年,人工智能的先驅(qū)艾倫·圖靈發(fā)表了一篇?jiǎng)潟r(shí)代的論文《計(jì)算機(jī)器與智能》,文中提出了著名的圖靈測(cè)試:“如果一臺(tái)機(jī)器能夠與人類展開對(duì)話(通過電信設(shè)備)而保證其機(jī)器身份不被識(shí)破,那么就可以認(rèn)為這臺(tái)機(jī)器具有智能?!贝送馕恼逻€預(yù)言了在未來可能創(chuàng)造出具有真正智能的機(jī)器。
億歐智庫:圖靈測(cè)試最初版本的示意圖
雖然圖靈測(cè)試從理論上驗(yàn)證了機(jī)器擁有智能的可能性,但AI正式發(fā)展成一門專業(yè)學(xué)科則是在1956年的達(dá)特茅斯會(huì)議,會(huì)議的組織者與參與者都是數(shù)一數(shù)二的科學(xué)家,包括約翰·麥卡錫,馬文·閔斯基,納撒尼爾·羅切斯特,克勞德·香農(nóng)等。在這次會(huì)議上,“人工智能”的名稱與概念正式確立,因此這次會(huì)議也被視為AI產(chǎn)業(yè)的起點(diǎn)。
1.2 人工智能發(fā)展的三種流派
1.2.1 符號(hào)主義
符號(hào)主義認(rèn)為人類的一切活動(dòng)(包括體力活動(dòng)和智力活動(dòng))都是符合某種邏輯的,所有信息都可以用各種符號(hào)表示,人類的認(rèn)知過程就可以視為基于邏輯規(guī)則的,操作這些符號(hào)的過程。根據(jù)這種理論,如果電腦能自動(dòng)執(zhí)行和人腦一樣的規(guī)則和過程,那么就可以視為實(shí)現(xiàn)了人工智能。
1.2.2 聯(lián)結(jié)主義
聯(lián)結(jié)主義與符號(hào)主義幾乎是同時(shí)提出的,人工智能的關(guān)鍵不在于讓電腦等機(jī)器實(shí)現(xiàn)智力活動(dòng),而應(yīng)該模仿人腦的結(jié)構(gòu)。這派觀點(diǎn)認(rèn)為智能是人腦細(xì)胞與神經(jīng)元彼此連接成網(wǎng)絡(luò)共同處理信息的結(jié)果,如果能在電腦中模擬這種結(jié)構(gòu)再實(shí)現(xiàn)人工智能自然也更輕松。早在電腦發(fā)明前的40年代,就有持這種觀點(diǎn)的科學(xué)家進(jìn)行了數(shù)學(xué)建模,奠定了后來人工神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)的雛形。
1.2.3 行為主義
與前兩種流派不同的,行為主義于上世紀(jì)80年代提出,它倡導(dǎo)“感知+行動(dòng)”。這種觀點(diǎn)源于“控制論”,強(qiáng)調(diào)模擬人在控制過程中的智能行為和動(dòng)作。但是限于時(shí)代和科技發(fā)展,行為主義直到上世紀(jì)末,隨著智能控制與機(jī)器人逐漸興起才引起重視。截至目前的AI發(fā)展,幾乎都是三種流派的結(jié)合運(yùn)用。
億歐智庫:專家系統(tǒng)結(jié)構(gòu)示意圖
2. AI學(xué)習(xí)
2.1 機(jī)器學(xué)習(xí)的概念
在1950年,圖靈的論文《計(jì)算機(jī)器與智能》中提出了“學(xué)習(xí)機(jī)器”的概念,現(xiàn)在已經(jīng)發(fā)展成AI科學(xué)中的一個(gè)獨(dú)立分支。機(jī)器學(xué)習(xí)主要是設(shè)計(jì)和分析一些讓電腦可以“自動(dòng)學(xué)習(xí)”的算法,是一類從數(shù)據(jù)中自動(dòng)分析和獲得規(guī)律,并利用規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)的算法。從技術(shù)角度說,這一理論關(guān)注可以實(shí)現(xiàn)的,行之有效的學(xué)習(xí)算法(要防止錯(cuò)誤累積)。
億歐智庫:機(jī)器學(xué)習(xí)理論示意圖
2.2 機(jī)器學(xué)習(xí)算法的分類
2.2.1 感知器算法
機(jī)器學(xué)習(xí)中最容易理解與實(shí)現(xiàn)的是監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí),前者就是感知器算法的典型案例之一,它也是人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)。簡(jiǎn)要說來,監(jiān)督學(xué)習(xí)是從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)出一個(gè)函數(shù),再接收到新數(shù)據(jù)時(shí)就可以根據(jù)這個(gè)函數(shù)預(yù)測(cè)結(jié)果。監(jiān)督學(xué)習(xí)的訓(xùn)練集要求包括輸入和輸出,也可以說是特征和目標(biāo),訓(xùn)練集中的各項(xiàng)目標(biāo)都是人為標(biāo)注的。
與之原理類似的,無監(jiān)督學(xué)習(xí)就是目標(biāo)沒有人為標(biāo)注,但還保有訓(xùn)練集且同樣要求輸入和輸出。
2.2.2 神經(jīng)網(wǎng)絡(luò)算法
這種算法可以視為多層感知器,除了輸入輸出層外,它還加入了若干隱藏層。隱藏層中的神經(jīng)元節(jié)點(diǎn)可以與輸入輸出節(jié)點(diǎn)相連,每條鏈接上都有各自的權(quán)重系數(shù),最終形成一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)。之所以要加入隱藏層,是因?yàn)楝F(xiàn)實(shí)中很多情況都不是簡(jiǎn)單的二元對(duì)立,總有這樣那樣的變化需要考慮。
億歐智庫:?jiǎn)螌尤斯ど窠?jīng)網(wǎng)絡(luò)示意圖
2.2.3 強(qiáng)化學(xué)習(xí)算法
與監(jiān)督和無監(jiān)督學(xué)習(xí)更重視學(xué)習(xí)數(shù)據(jù)不同,強(qiáng)化學(xué)習(xí)是在給定的數(shù)據(jù)環(huán)境下,讓機(jī)器學(xué)習(xí)如何通過選擇一系列行動(dòng)來達(dá)成長(zhǎng)期累計(jì)收益*化的目標(biāo)。從本質(zhì)上說,這種算法學(xué)習(xí)的是一套決策系統(tǒng)而非數(shù)據(jù),它在很多游戲中都有運(yùn)用。著名的阿爾法狗(AlphaGo)就結(jié)合了強(qiáng)化學(xué)習(xí)與專家系統(tǒng),能連續(xù)擊敗多位人類圍棋高手,名噪一時(shí)。
億歐智庫:強(qiáng)化學(xué)習(xí)構(gòu)成元素及其關(guān)系
通過前面的介紹可以發(fā)現(xiàn),不論哪種機(jī)器學(xué)習(xí)算法,對(duì)特征的選取和處理在模型訓(xùn)練中是很重要的,但在很多情況下要直接提取合適且有效的特征是很困難的,如提取海量圖片和句子的特征。此時(shí)的機(jī)器學(xué)習(xí)就不能只局限于圖片或句子的某一特征,而是它們背后隱含的復(fù)雜關(guān)系。因此需要結(jié)合深度模型進(jìn)行自動(dòng)計(jì)算,而模型主要是深度神經(jīng)網(wǎng)絡(luò),這是一種更復(fù)雜的神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)算法就是采用類似的深層次結(jié)構(gòu)進(jìn)行機(jī)器學(xué)習(xí)的算法,目前大火的ChatGPT就運(yùn)用了這種算法。
億歐智庫:不同形態(tài)的機(jī)器學(xué)習(xí)關(guān)系示意圖
三、AIGC商業(yè)落地分析
1. AIGC市場(chǎng)規(guī)模
2022年9月的AI繪畫作品《太空歌劇院》獲得美國(guó)科羅拉多州博覽會(huì)的藝術(shù)比賽的*名,當(dāng)時(shí)有人預(yù)測(cè)若未來五年有10%-30%的圖片在AI的幫助下誕生,那么AI繪畫則將創(chuàng)造超過600億元的市場(chǎng)空間,若考慮到下一代互聯(lián)網(wǎng)對(duì)內(nèi)容需求的迅速提升,則可能創(chuàng)造更大的市場(chǎng)規(guī)模。隨后OpenAI的ChatGPT一問世就多次刷新之前APP注冊(cè)用戶數(shù)量突破的紀(jì)錄,業(yè)內(nèi)預(yù)測(cè)帶動(dòng)的市場(chǎng)規(guī)模將破萬億。
2. AIGC產(chǎn)業(yè)地圖
2.1 產(chǎn)業(yè)上游:數(shù)據(jù)服務(wù)
不論AIGC產(chǎn)業(yè)如何發(fā)展,人工智能的分析、創(chuàng)作、決策能力都依賴海量數(shù)據(jù)。因此決定不同機(jī)器間能力差異的就是數(shù)據(jù)的數(shù)量與質(zhì)量。
2.1.1 數(shù)據(jù)查詢與處理
通常來說數(shù)據(jù)庫有兩種模型,一種像湖泊,匯聚來自各地的水源而不作區(qū)分;另一種像倉庫,分門別類的存儲(chǔ)數(shù)據(jù)。近幾年在科技的推動(dòng)下,現(xiàn)代數(shù)據(jù)庫一般都是兩種模型的結(jié)合,兼具二者的易用性、規(guī)范性等特征,還為用戶帶來降本增效、省時(shí)省力等特點(diǎn)。根據(jù)對(duì)其中數(shù)據(jù)的查詢與處理等時(shí)效性,涉及其中業(yè)務(wù)的公司可分為異步處理型公司和實(shí)時(shí)處理型公司。
2.1.2 數(shù)據(jù)轉(zhuǎn)換與編排
數(shù)據(jù)的處理主要涉及提取,加載和轉(zhuǎn)換。根據(jù)海外市場(chǎng)研究企業(yè)GrandViewResearch的數(shù)據(jù),2021年全球數(shù)據(jù)集成工具市場(chǎng)的規(guī)模約105億美元,在未來十年將以年復(fù)合增長(zhǎng)率約12%的速度增長(zhǎng)。根據(jù)處理方式的區(qū)別,這種公司可以分為本地部署型公司和云端原生型公司。
2.1.3 數(shù)據(jù)標(biāo)注與管理
不論哪種機(jī)器學(xué)習(xí)模型,都可以簡(jiǎn)化為“老師教學(xué)生知識(shí)”,其中對(duì)知識(shí)點(diǎn)等數(shù)據(jù)就需要標(biāo)注與管理,從而進(jìn)行監(jiān)督,最終形成各種不同的算法模型。根據(jù)GrandViewResearch的數(shù)據(jù),2021年全球數(shù)據(jù)標(biāo)注市場(chǎng)規(guī)模約為16.7億美元,在未來十年將以年復(fù)合增長(zhǎng)率約25%的速度增長(zhǎng)。根據(jù)公司業(yè)務(wù)拓展程度的差異,這種公司可以分為基礎(chǔ)型公司和擴(kuò)張型公司。
2.1.4 數(shù)據(jù)治理與合規(guī)
在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)是和土地、人力、資本一樣舉足輕重的生產(chǎn)資料。因此就需要保證數(shù)據(jù)資產(chǎn)在管理時(shí)預(yù)先設(shè)置質(zhì)量規(guī)范,在后期的訪問和調(diào)取時(shí)也要做到合法合規(guī),因此這項(xiàng)服務(wù)也就成為各大企業(yè)的必需品。根據(jù)海外市場(chǎng)研究企業(yè)ReporterLinker的數(shù)據(jù),全球數(shù)據(jù)治理市場(chǎng)規(guī)模約18億美元,預(yù)計(jì)未來幾年將以年復(fù)合增長(zhǎng)率約22%的速度增長(zhǎng).根據(jù)服務(wù)交付模式,這種公司可以分為工具型公司和定制型公司。
2.2 產(chǎn)業(yè)中游:算法模型
算法模型是AIGC最核心的環(huán)節(jié),是機(jī)器學(xué)習(xí)的關(guān)鍵所在。它包含三類參與者:專門實(shí)驗(yàn)室、企業(yè)研究院、開源社區(qū)。
2.2.1 AI實(shí)驗(yàn)室
算法模型在AI系統(tǒng)中起決策作用,是它完成各種任務(wù)的基礎(chǔ),可以視為AI系統(tǒng)的靈魂所在。很多企業(yè)為了更好地研究算法并推動(dòng)商業(yè)化落地,在內(nèi)部都設(shè)立專門的實(shí)驗(yàn)室,因此這種實(shí)驗(yàn)室可以分為獨(dú)立型實(shí)驗(yàn)室和附屬型實(shí)驗(yàn)室。
2.2.2 企業(yè)研究院
一些集團(tuán)型公司或企業(yè)往往會(huì)設(shè)立專注于前沿科技領(lǐng)域的大型研究院,下設(shè)不同領(lǐng)域的細(xì)分實(shí)驗(yàn)室,通過學(xué)術(shù)氛圍更濃厚的管理方式為公司的科研發(fā)展添磚加瓦。
2.2.3 開源社區(qū)
開源社區(qū)對(duì)AIGC非常重要,它提供了一個(gè)共享成果、代碼的平臺(tái),還可以與其他人相互合作,共同推動(dòng)AIGC相關(guān)技術(shù)的進(jìn)步。根據(jù)覆蓋領(lǐng)域的寬度和深度,這種社區(qū)可以分為綜合型開源社區(qū)和垂直型開源社區(qū)。
2.3 產(chǎn)業(yè)下游:應(yīng)用拓展
任何優(yōu)秀的科研成果都需要最終落地部署才能產(chǎn)生實(shí)際意義和價(jià)值,算法模型也不例外。在AIGC產(chǎn)業(yè)鏈的下游,可以將相關(guān)應(yīng)用拓展到四個(gè)主要場(chǎng)景:文本處理、音頻處理、圖像處理、視頻處理。
2.3.1 文本處理
目前,文本處理是AIGC相關(guān)技術(shù)距離普通消費(fèi)者最近的場(chǎng)景,也是技術(shù)較為成熟的場(chǎng)景,許多應(yīng)用公司都會(huì)從多個(gè)維度出發(fā),輔助業(yè)務(wù)拓展與商業(yè)化過程中。一般說來文本處理可以細(xì)分為營(yíng)銷型、銷售型、續(xù)寫型、知識(shí)型、通用型、輔助型、交互型、代碼型。
2.3.2 音頻處理
此處主要介紹由語音合成技術(shù)來生成的相關(guān)應(yīng)用,與視頻相關(guān)的將放在視頻部分說明。目前的音頻處理主要分為三類:音樂型、講話型、定制型,很多公司都專注于此。AI的應(yīng)用將優(yōu)化供給效率,改善整體利潤(rùn)水平。
2.3.3 圖片處理
圖片的創(chuàng)作門檻比文字高,傳遞信息也更直觀,所以商業(yè)化的潛力自然也更高。隨著AIGC應(yīng)用的日益廣泛,圖片處理也就從廣告、設(shè)計(jì)、編輯等角度帶來更大更多的機(jī)遇。圖片處理可細(xì)分為生成型、廣告型、設(shè)計(jì)型、編輯型。
2.3.4 視頻處理
隨著時(shí)代的發(fā)展,人們?cè)谝曨l上的投入逐漸超出了在圖片上的,視頻也日益成為新時(shí)代最主流的內(nèi)容消費(fèi)形態(tài)。因此將AIGC引入視頻將是全新的賽道,也是技術(shù)難度*的領(lǐng)域。視頻處理可以細(xì)分為生成型、編輯型、定制型、數(shù)字虛擬人視頻。
3. AIGC細(xì)分市場(chǎng)分析
3.1 AIGC+資訊行業(yè)
在信息化時(shí)代,社會(huì)中充斥著各種資訊,同時(shí)這些資訊也有高標(biāo)準(zhǔn)、需求大、時(shí)效強(qiáng)等特點(diǎn)。自2014年起,AIGC已開始用于新聞資訊領(lǐng)域,因此資訊行業(yè)是AIGC商業(yè)化相對(duì)成熟的賽道。
億歐智庫:新華社寫稿機(jī)器人“快筆小新”
3.1.1 AIGC輔助信息收集,打造堅(jiān)實(shí)基礎(chǔ)
優(yōu)質(zhì)的新聞產(chǎn)出必定需要全面、高效、準(zhǔn)確的信息收集與整理的基礎(chǔ)上。按照傳統(tǒng)的作業(yè)模式,工作人員需要親臨現(xiàn)場(chǎng),通過各種手段才能獲得足夠且扎實(shí)的信息?,F(xiàn)在的AI已經(jīng)能對(duì)該環(huán)節(jié)高效賦能,例如科大訊飛的AI轉(zhuǎn)寫工具可以幫助記者實(shí)時(shí)生成文稿,自動(dòng)撰寫提綱、精簡(jiǎn)語句等,進(jìn)而提高工作效率,保證最終產(chǎn)出的時(shí)效性。
除幫助獲取一手信息外,AI也可以幫助精確檢索二手信息,收集素材。在高性能的AIGC工具如ChatGPT出現(xiàn)后,就可以像常人對(duì)話一樣直接提問并獲得答案。雖然難免還是會(huì)有這樣那樣的問題,但作為工具而言,AIGC的意義已經(jīng)非常明顯了。
3.1.2 AIGC支持資訊生成,實(shí)現(xiàn)高效產(chǎn)出
在資訊寫作等生成環(huán)節(jié),基于自然語言生成和自然語言處理技術(shù),AIGC已經(jīng)逐步得到從業(yè)者和消費(fèi)者的認(rèn)可,因此有不少企業(yè)積極參與其中。以產(chǎn)出數(shù)量為例,與美聯(lián)社、雅虎等外媒合作的AutomatedInsights,其撰稿工具Wordsmith能在一分鐘內(nèi)生成兩千條新聞,且單條質(zhì)量可比擬人類半小時(shí)的作品質(zhì)量。
除了速度驚人,AI在準(zhǔn)確度方面同樣優(yōu)勢(shì)明顯,能夠很好的避免人類的粗心或計(jì)算等錯(cuò)誤,在保證質(zhì)量的同時(shí)減輕人類工作壓力。這方面國(guó)內(nèi)企業(yè)頗多,如新華社自研的寫稿AI“快筆小新”、騰訊公司開發(fā)的DreamWriter、百度公司和人民網(wǎng)合作開發(fā)的“人民網(wǎng)-百度·文心”大模型都是其中的佼佼者。
3.1.3 AIGC助力內(nèi)容分發(fā),緩解人類壓力
在內(nèi)容分發(fā)環(huán)節(jié),AI除了常見的個(gè)性化內(nèi)容推薦外,也在逐步開拓全新應(yīng)用場(chǎng)景,如虛擬人主播,以視頻或直播的形式發(fā)放內(nèi)容,打造沉浸式體驗(yàn)。如新華社數(shù)字記者“小諍”、央視網(wǎng)虛擬主播“小C”、阿里巴巴數(shù)字人“冬冬”、百度智能云AI手語主播等等,在未來,AI虛擬主播可能發(fā)展成媒體行業(yè)的標(biāo)配。
3.2 AIGC+電商行業(yè)
自網(wǎng)絡(luò)電商出現(xiàn)以來,社會(huì)的很多方面都被改變了,電商企業(yè)既是網(wǎng)絡(luò)時(shí)代的受益者,也在推動(dòng)社會(huì)發(fā)展進(jìn)程中扮演關(guān)鍵角色。自十年前網(wǎng)絡(luò)直播出現(xiàn),帶動(dòng)帶貨模式變革以來,各大企業(yè)都在或多或少的面臨轉(zhuǎn)型問題。在數(shù)字世界和物理世界快速融合的當(dāng)下,AIGC走在時(shí)代前沿,可以賦能電商行業(yè)的多個(gè)領(lǐng)域,可能帶來新一輪的行業(yè)變革。
億歐智庫:每平每屋云渲染效果圖
3.2.1 AIGC助力商品建模,改善購物體驗(yàn)
對(duì)比傳統(tǒng)的購物模式,網(wǎng)購的一個(gè)典型問題在于只能通過圖片了解商品,難以觀察到全貌,也讓以次充好的不法商家有機(jī)可乘。而AIGC技術(shù)可以通過視覺算法生成商品的三維模型,提供多方位視覺體驗(yàn),節(jié)省溝通成本,改善用戶體驗(yàn),促成用戶成交與轉(zhuǎn)化。
除了三維建模,AIGC還有更高級(jí)的應(yīng)用方式,如阿里巴巴的每平每屋業(yè)務(wù)就利用AIGC技術(shù),實(shí)現(xiàn)線上“商品放家中”的模擬展示效果。這種業(yè)務(wù)是將AIGC功能植入手機(jī)淘寶和每平每屋APP端,用戶用手機(jī)掃描家居環(huán)境讓AI生成商品模型,在手機(jī)即可預(yù)覽實(shí)物效果,進(jìn)而改善電商家居的購物體驗(yàn)。
3.2.2 AIGC賦能服飾電商,助力降本增效
AIGC可以為商家提供大量創(chuàng)意素材,電商廣告正是對(duì)創(chuàng)意營(yíng)銷素材需求量很大的領(lǐng)域,阿里巴巴的AI設(shè)計(jì)師“魯班”就是應(yīng)用于此。除了通用型廣告,AIGC在電商服飾領(lǐng)域用途更多。一般說來,服飾領(lǐng)域都采用“小單快返”的模式,即先小批量生產(chǎn)多種樣式的服飾產(chǎn)品投入市場(chǎng),快速獲取市場(chǎng)反饋,對(duì)優(yōu)質(zhì)產(chǎn)品加大投入,在試出爆款的同時(shí)減小庫存壓力。但這種方式對(duì)產(chǎn)品圖片的需求量很大,如果有上千種服飾產(chǎn)品分別找模特再牌照修圖,無疑會(huì)耗費(fèi)極大的時(shí)間和成本。
成立于2020年的ZMO公司就運(yùn)用AIGC解決這個(gè)問題,商家只需在ZMO平臺(tái)上傳產(chǎn)品圖和模特圖就可以得到展示圖。借助AIGC,更多服飾相關(guān)的市場(chǎng)策略都可以低成本的實(shí)現(xiàn)。即使沒有專業(yè)模特,虛擬人模特及廣告也可以發(fā)揮作用,甚至還可以調(diào)整虛擬人的相貌來適配不同風(fēng)格的服飾。
3.2.3 AIGC打造虛擬主播,提升直播效率
隨著概念的傳播,虛擬主播正日益成為許多商家的選擇。與真人主播不同,虛擬主播可以全天無間斷的直播,突破時(shí)間和空間的限制。2022年2月28日,經(jīng)典美妝超級(jí)品類日活動(dòng)開啟時(shí),京東美妝虛擬主播“小美”就出現(xiàn)在蘭蔻、歐萊雅、OLAY等超過二十個(gè)美妝大牌直播間,開啟直播首秀。虛擬人不僅五官形象由AI合成,嘴型也可以利用AI精確匹配臺(tái)詞,動(dòng)作靈活且流暢,營(yíng)造出*的真實(shí)感,為用戶帶來與真人無異的體驗(yàn)。
不過目前的虛擬主播更多的是與真人主播形成互補(bǔ),或者為沒有直播能力的的商家提供服務(wù),還不能完全替代真人。虛擬主播要獲得更強(qiáng)的交互能力,更好的與觀眾互動(dòng),做出實(shí)時(shí)反饋,還需要AIGC相關(guān)技術(shù)的后續(xù)發(fā)展。
3.3 AIGC+影視行業(yè)
隨著虛擬技術(shù)的逐步到來,對(duì)影視內(nèi)容的需求也在爆發(fā)式增長(zhǎng)。為了滿足觀眾日益刁鉆的口味和挑剔的眼光,影視行業(yè)正全力提高產(chǎn)量,迭代技術(shù),導(dǎo)致整個(gè)行業(yè)的工業(yè)化程度逐漸提高,同時(shí)變得精細(xì)且復(fù)雜,同時(shí)人的局限性也逐漸凸顯。AI的應(yīng)用無疑可以降本增效,讓行業(yè)回歸本真。
億歐智庫:海馬輕帆官網(wǎng)“劇本智能評(píng)估”頁面
3.3.1 AIGC協(xié)助劇本創(chuàng)作,釋放創(chuàng)意潛力
通過對(duì)海量?jī)?yōu)質(zhì)劇本的學(xué)習(xí),AI能根據(jù)特定需求快速生成不同風(fēng)格或架構(gòu)的劇本,在極大提高工作者工作效率的同時(shí),AI也在激發(fā)創(chuàng)意,幫助產(chǎn)出更優(yōu)質(zhì)的作品。事實(shí)上,將AI引入劇本創(chuàng)作的做法早已有之。2016年,紐約大學(xué)研發(fā)的AI在學(xué)習(xí)了幾十部經(jīng)典科幻電影劇本后成功編寫了劇本《陽春》以及一段配樂歌詞。經(jīng)過修改、調(diào)整后的成品只有區(qū)區(qū)八分鐘,內(nèi)容也平平無奇,但《陽春》在各大視頻網(wǎng)站最終收獲的百萬級(jí)播放量依然證明外界對(duì)AI創(chuàng)作的興趣很大。2020年,GPT-3被用于創(chuàng)作一個(gè)短劇,再次引發(fā)廣泛關(guān)注。
通過這些早期試驗(yàn)可以看出AI在劇本創(chuàng)作方面的潛力,但要真正將其轉(zhuǎn)化為生產(chǎn)力,還要AI更貼合具體的應(yīng)用場(chǎng)景,做針對(duì)性訓(xùn)練,并結(jié)合實(shí)際業(yè)務(wù)需求開發(fā)或定制功能。海外一些影視公司如FinalWrite和Logline等都偏向垂直式工具,國(guó)內(nèi)的海馬輕帆公司深耕中文劇本、小說、IP等領(lǐng)域,也已經(jīng)收獲百萬級(jí)用戶。
3.3.2 AIGC推動(dòng)創(chuàng)意落地,突破表達(dá)瓶頸
雖然AI能幫助人類更好的釋放創(chuàng)意,但從劇本到熒幕仍是一段漫長(zhǎng)的距離。從創(chuàng)意到表達(dá)的跨越,AI可以保駕護(hù)航,幫助人類化不可能為可能。舉例來說,當(dāng)前勞動(dòng)密集型的影視生產(chǎn)方式難以滿足觀眾對(duì)質(zhì)量日益提高的要求。2009年上映的《阿凡達(dá)》令全球觀眾首次了解3D電影的魅力,此后沉浸式觀影體驗(yàn)成了影視產(chǎn)業(yè)鏈上共同的追求。為了滿足這種追求,影視特技與應(yīng)用呈現(xiàn)井噴式發(fā)展,但后期制作與渲染,復(fù)雜程度也都水漲船高,傳統(tǒng)的作業(yè)方式已經(jīng)難以為繼,而AI技術(shù)就有推動(dòng)變革的潛力。
從技術(shù)角度來說,影視特技行業(yè)的作業(yè)流程是極為繁瑣的,比如場(chǎng)景中的建模就需要從一草一木、一人一物開始,逐漸打造世界的雛形,再通過骨骼綁定和動(dòng)作設(shè)計(jì)讓模型活起來,之后的定分鏡、調(diào)燈光、鋪軌道、取鏡頭等等無不費(fèi)時(shí)費(fèi)力,后期的解算和渲染等工作同樣如此。可以說在影視工作的每個(gè)環(huán)節(jié)都有大量重復(fù)性工作或等待時(shí)間,無形中拖慢了工作節(jié)奏。因此現(xiàn)在就有企業(yè)致力于解封流程生產(chǎn)力,比如優(yōu)酷的“妙嘆”工具箱,在動(dòng)漫中實(shí)時(shí)渲染,幫助工作者實(shí)時(shí)把握效果或做出修改,節(jié)省了大量成本,減輕人員負(fù)擔(dān),目前已被多家國(guó)漫企業(yè)采用。
3.4 AIGC+教育行業(yè)
技術(shù)的飛速發(fā)展也將為教育行業(yè)帶來顛覆,但是相比其他行業(yè)的快速發(fā)展,AI在教育中的落地部署似乎也慢了半拍。這其實(shí)是由教育行業(yè)本身的性質(zhì)導(dǎo)致的,它的參與者眾多,時(shí)間跨度很大,個(gè)體的差異性也很大,這讓解決邊界清晰、定義明確的AI難以適應(yīng)。另外教育更注重人與人的互動(dòng)和聯(lián)結(jié),也沒有統(tǒng)一的理論模型,這都為相關(guān)AI的開發(fā)訓(xùn)練和落地部署增加了難度。但AI在教育行業(yè)絕非毫無用處,以技術(shù)手段推動(dòng)行業(yè)進(jìn)步也并非癡人說夢(mèng)。
億歐智庫:“小花獅”中文寫作智能輔導(dǎo)系統(tǒng)
3.4.1 AIGC助力學(xué)習(xí)者,走向無限
生活經(jīng)驗(yàn)告訴我們,從降生起人類就開始通過各種手段建立對(duì)世界的認(rèn)識(shí)。識(shí)字前的手摸嘴咬、拳打腳踢,識(shí)字后的課本習(xí)題、書籍影視、實(shí)地體驗(yàn)等等無不如此。但是不論怎樣,每個(gè)人的學(xué)習(xí)過程總會(huì)遇到這樣那樣的阻礙,而AI對(duì)學(xué)習(xí)者的意義就在于盡量擺脫種種束縛,最終從有限的自身走向無限的世界。
互聯(lián)網(wǎng)時(shí)代的教育,是將部分內(nèi)容轉(zhuǎn)化為數(shù)字化形式并公開分發(fā),助力資源流轉(zhuǎn)?,F(xiàn)在由AI輔助甚至主導(dǎo)的制作,整理學(xué)習(xí)資料,降本增效是顯而易見的,資源的豐富度和易用性都將提升到新的高度。AIGC也可以在一些特定領(lǐng)域,如兒童繪本等,加速知識(shí)的生產(chǎn)效率并接入網(wǎng)絡(luò),最終提供給用戶。通過補(bǔ)充有限的學(xué)習(xí)資源將促進(jìn)教育公平,AI也助力教育資源的生產(chǎn)與分發(fā)。微軟在這一領(lǐng)域就布局頗多,如微軟亞洲研究院與華東師范大學(xué)合作研發(fā)的中文寫作智能輔導(dǎo)系統(tǒng)“小花獅”,借助自然語言處理技術(shù),實(shí)時(shí)為學(xué)生作文評(píng)分并分析原因,從而幫助學(xué)生進(jìn)步。
3.4.2 AIGC賦能教育者,減負(fù)提效
老話說“師傅領(lǐng)進(jìn)門,修行在個(gè)人”,教育者作為領(lǐng)路人的重要性不言而喻,對(duì)他們而言,AI就如同手上的火把,更好的幫助學(xué)習(xí)者引燃心中的學(xué)習(xí)火種。從目前的社會(huì)發(fā)展現(xiàn)狀來看,教育者數(shù)量不足將會(huì)是長(zhǎng)期現(xiàn)象,一位老師帶幾十位學(xué)生的“大班制”還將長(zhǎng)期存在,在各種瑣碎的答疑解惑,書山題海中奔波,AIGC就可以解決此類問題。現(xiàn)在作業(yè)/試卷自動(dòng)批閱技術(shù)已經(jīng)獲得了廣泛應(yīng)用,AI不但可以判斷對(duì)錯(cuò),還可以生成針對(duì)性的評(píng)語,教師的作業(yè)批改用時(shí)大幅節(jié)約,可以更關(guān)注學(xué)生的個(gè)性化發(fā)展。除了助力解決重復(fù)性問題,AI還可以延伸感知。如基于電腦視覺技術(shù),AI可以實(shí)時(shí)分析學(xué)生當(dāng)前的情緒和狀態(tài)等,幫助教師更好的了解情況。
通過對(duì)教育者的賦能,AIGC最終可以幫助實(shí)現(xiàn)教育的*理想:因材施教,推廣個(gè)性化教育。盡管AI還有可能加劇信息繭房的風(fēng)險(xiǎn),以及對(duì)傳統(tǒng)理念的挑戰(zhàn),甚至將人機(jī)器化,但就目前來看,未來還是值得期待的,以人為本的教育還是可能實(shí)現(xiàn)的。
3.5 AIGC+醫(yī)療行業(yè)
對(duì)醫(yī)患雙方而言,AIGC的應(yīng)用與推廣都是福音,比如AI預(yù)問診的應(yīng)用。雖然病人與病情千變?nèi)f化,但總是有重復(fù)的地方,因此在預(yù)問診階段,AI就可以先了解患者的既往情況,讓醫(yī)生的診斷更有針對(duì)性,既緩解了醫(yī)生的工作壓力,也更好的服務(wù)了患者,醫(yī)院內(nèi)病人扎堆排隊(duì)的現(xiàn)象也得以分流,可以說是一舉三得。2021年,復(fù)旦大學(xué)附屬眼耳鼻喉科醫(yī)院與騰訊醫(yī)療健康簽署合作協(xié)議,全面打造數(shù)字化醫(yī)院新標(biāo)桿、新范式,深入推進(jìn)醫(yī)院數(shù)字化轉(zhuǎn)型,在預(yù)問診等業(yè)務(wù)上快速落地部署。
對(duì)于傳統(tǒng)醫(yī)學(xué)的難點(diǎn):心理疾病領(lǐng)域,AI同樣可以參與其中。相較于過去的與人對(duì)話,AIGC聊天機(jī)器人只是個(gè)軟件程序,用戶不必?fù)?dān)心隱私被泄露,況且還可以預(yù)置海量數(shù)據(jù)或知識(shí)模型,可以在更新迭代中保持冷靜與中立。成立于2021年的聆心智能就是這方面的代表,基于生成式大模型開發(fā)的情緒療愈機(jī)器人Emohaa,可以構(gòu)建以生成對(duì)話為核心的交互式數(shù)字診療方案,通過對(duì)話與患者共情,及時(shí)提供情緒支持與心理疏導(dǎo),促進(jìn)患者心理健康。
億歐智庫:受疫情困擾的用戶與Emohaa對(duì)話
3.6 AIGC+金融行業(yè)
金融業(yè)天然與數(shù)據(jù)和信息密切相關(guān),各類公司都要從繁復(fù)的市場(chǎng)上搜集信息,并加以利用,創(chuàng)造價(jià)值。基于這樣的現(xiàn)狀,金融行業(yè)的信息化一直走在其他行業(yè)之前,具備數(shù)據(jù)質(zhì)量好、維度全、場(chǎng)景多等特點(diǎn),因此也成為了AI最早落地的商業(yè)化場(chǎng)景之一。
一般說來,AI在金融行業(yè)最常見的應(yīng)用是通過機(jī)器視覺和學(xué)習(xí)的方式捕捉市場(chǎng)的實(shí)時(shí)變化,并利用實(shí)時(shí)數(shù)據(jù)進(jìn)行分析,以此提高金融公司的財(cái)務(wù)分析效率與能力。類似的,AIGC在金融行業(yè)的應(yīng)用則是以智能客服和智能顧問兩種,基于自然語言處理技術(shù)與客戶互動(dòng),此外還可以快速高效地完成一些人工難以完成的任務(wù),改善服務(wù)體驗(yàn)。2017年4月,富國(guó)銀行開始試點(diǎn)一款基于FacebookMessenger平臺(tái)的智能客服,美國(guó)銀行很快也推出了類似的智能助手Erica。國(guó)內(nèi)金融行業(yè)的相關(guān)產(chǎn)業(yè)應(yīng)用也較為成熟,多家公司或商業(yè)銀行都推出過自己的AI業(yè)務(wù),如2022年工商銀行的“工小智”,郵儲(chǔ)銀行的半年報(bào)顯示數(shù)字化轉(zhuǎn)型成績(jī)斐然,這些都表明AIGC應(yīng)用于金融行業(yè)的巨大潛力。
億歐智庫:百信銀行數(shù)字虛擬人員工艾雅(AIYA)
四、AIGC發(fā)展機(jī)遇與挑戰(zhàn)
1. AIGC發(fā)展機(jī)遇
作為尖端科技,AIGC正迎來全面商業(yè)化落地部署的今天,因此展望未來趨勢(shì)自然有助于更好的建設(shè)明天。
1.1 大模型的廣泛應(yīng)用
AI發(fā)展至今已走過多次寒冬與春天,每次交織都與AI的“通用化”與“專業(yè)化”分歧息息相關(guān),可以說“通用化”代表著人類對(duì)未來的暢想,“專業(yè)化”則能帶來更好的落地部署形式,但不論哪種都經(jīng)常遇見這樣那樣的瓶頸。
21世紀(jì)的前二十年,是“通用化”大模型提出并獲得發(fā)展的時(shí)代,簡(jiǎn)單說來它是通過“預(yù)訓(xùn)練大模型+下游任務(wù)微調(diào)”的方式,先讓模型在大量標(biāo)記與未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)知識(shí),在將微調(diào)后的模型遷移到其他場(chǎng)景中,進(jìn)而極大的擴(kuò)展了模型通用能力?,F(xiàn)在隨著模型規(guī)模的增長(zhǎng)也讓大模型的能力水漲船高,比如GPT-3就包含高達(dá)1750億的參數(shù)量。
大模型之“大”,除了參數(shù)規(guī)模龐大,數(shù)據(jù)量同樣不能小視。過去有人說“人工智能就是大量人工才能換來的智能”,這是因?yàn)楫?dāng)時(shí)的機(jī)器學(xué)習(xí)依賴數(shù)據(jù)標(biāo)注,一旦轉(zhuǎn)換場(chǎng)景就需要重新標(biāo)注?,F(xiàn)在的機(jī)器學(xué)習(xí)多采用監(jiān)督與無監(jiān)督學(xué)習(xí)相結(jié)合的方式,例如“無監(jiān)督訓(xùn)練,監(jiān)督微調(diào)”。此外也利用互聯(lián)網(wǎng)上的PGC,UGC進(jìn)行訓(xùn)練,以獲得更豐富的數(shù)據(jù)與更自然的表達(dá)。
不論模型還是數(shù)據(jù),大模型都為AIGC賦予了充分的想象空間,隨著時(shí)代的發(fā)展,它也許在未來能獲得更多應(yīng)用場(chǎng)景。
1.2 全新的仿人模式
在AI產(chǎn)業(yè)剛起步時(shí),一種非常簡(jiǎn)單的思路是讓機(jī)器模仿人的學(xué)習(xí)方式,這種模式一直都是AI算法的重要思路來源,因此AI也經(jīng)歷了從推理到知識(shí)再到學(xué)習(xí)的變化。從起初的微觀,機(jī)械性模仿,到現(xiàn)在宏觀的認(rèn)知模式借鑒,技術(shù)哲學(xué)也在隨著時(shí)代而發(fā)展。
在AI發(fā)展早期階段,三種流派中的“符號(hào)主義”占據(jù)主導(dǎo)地位,這派觀點(diǎn)簡(jiǎn)而言之就是“人類的一切智能源于某種邏輯規(guī)則”。雖然當(dāng)時(shí)它的確取得了一定成績(jī)但這種觀點(diǎn)缺陷明顯,最易于理解的莫過于人類的很多智力行為都沒有邏輯可言,因此這一流派很快被淘汰,由從更高的抽象層次定義AI的“聯(lián)結(jié)主義”取而代之。這種觀點(diǎn)在發(fā)展初期遇到了諸多障礙,現(xiàn)在的形式也與當(dāng)初的出發(fā)點(diǎn)相去甚遠(yuǎn),但AI神經(jīng)網(wǎng)絡(luò)的蓬勃發(fā)展也在一定程度上驗(yàn)證了這種高度抽象化模式的可行。
從AI開拓到應(yīng)用,從模仿人類的學(xué)習(xí)過程到模仿人類的認(rèn)知方式,AI的發(fā)展也逐漸變得宏觀,隨著未來科技的發(fā)展,AI還會(huì)迎來飛躍式發(fā)展,為AIGC帶來更多可能性。
1.3 技術(shù)倫理成為重點(diǎn)關(guān)注領(lǐng)域
AI的發(fā)展堪稱具有革命性,但本質(zhì)上來說,任何科技都有倫理問題,并且逐漸受到關(guān)注。很多AIGC從學(xué)術(shù)研究轉(zhuǎn)向產(chǎn)業(yè)研究的*步就是探索如何從技術(shù)角度解決可能的技術(shù)倫理問題。
比較典型的是AI生成內(nèi)容的危險(xiǎn)性,比如2016年微軟發(fā)布的Tay,它可以通過推特學(xué)習(xí)社會(huì)信息并與他人互動(dòng)。但是在僅僅一天后,Tay就開始說出一些種族歧視之類的偏激言論,因此微軟暫時(shí)關(guān)閉了Tay的賬號(hào)。但這些言論明顯是和網(wǎng)絡(luò)上一些有偏激言論的人互動(dòng)后,被刻意教導(dǎo)出來的,因?yàn)槲④洰?dāng)時(shí)還沒有讓Tay了解哪些言論是不適當(dāng)?shù)摹?/p>
目前很多企業(yè)都在運(yùn)用一些技術(shù)手段避免類似事件的發(fā)生,如改善數(shù)據(jù)集,或者增加限制性條件,微調(diào)模型,讓AI可以更少的接觸不良信息,但依然難以根絕有人刻意誘導(dǎo)AI。比如最近大火的ChatGPT就曾寫過步驟詳細(xì)的毀滅人類計(jì)劃書,后來發(fā)現(xiàn)是有一位工程師在故意為之。
除了技術(shù)倫理問題的預(yù)防,在使用時(shí)的及時(shí)警告及緊急關(guān)停措施同樣重要且必要。AIGC應(yīng)該自帶對(duì)生成內(nèi)容的檢測(cè)機(jī)制,確保不被用于危害社會(huì)。一旦發(fā)現(xiàn)可疑舉動(dòng)AI可以迅速反應(yīng),暫停服務(wù),并且給出警告甚至自動(dòng)報(bào)警。這不僅依賴技術(shù)發(fā)展,相關(guān)的法律法規(guī)同樣必不可少,AIGC技術(shù)倫理問題需要社會(huì)各界的共同努力。
2. AIGC發(fā)展挑戰(zhàn)
目前AIGC相關(guān)的挑戰(zhàn)主要集中在版權(quán)、欺詐、違禁內(nèi)容三方面。
2.1 AIGC的版權(quán)問題
從本質(zhì)上說,AIGC是機(jī)器學(xué)習(xí)的應(yīng)用。而在模型的學(xué)習(xí)階段一定會(huì)使用大量數(shù)據(jù),但目前對(duì)訓(xùn)練后的生成物版權(quán)歸屬問題尚無定論。對(duì)此問題,業(yè)內(nèi)一般有兩種觀點(diǎn)。其一認(rèn)為內(nèi)容由學(xué)習(xí)數(shù)據(jù)集后生成,那版權(quán)就歸數(shù)據(jù)集作者;另一種則認(rèn)為AIGC的生產(chǎn)過程是完全隨機(jī)的,沒有版權(quán)問題,生成的版權(quán)屬于AIGC作者或平臺(tái),具體規(guī)則由平臺(tái)制定。目前的實(shí)踐中,各平臺(tái)的版權(quán)條例也偏向后者。
但無論哪種都會(huì)引擎一些原創(chuàng)版權(quán)作者的不滿,比較常見的說法是“吃作者的飯,砸作者的碗”。很多人的憤怒點(diǎn)在于,為什么AI基于自己創(chuàng)作的作品生成的新作品卻與自己無關(guān)?而且現(xiàn)行法律都是針對(duì)人類的行為規(guī)范而設(shè)立的,AI只是一種工具,不受法律約束與審判。即便證據(jù)充分,作者的維權(quán)之路通常也難言順利。不過對(duì)于AIGC與作者的關(guān)系將會(huì)隨著時(shí)代發(fā)展而逐漸清晰,界定也將更有條理性。
2.2 AIGC的欺詐問題
近幾年高科技詐騙手段層出不窮,AI經(jīng)過訓(xùn)練后也可以創(chuàng)作出以假亂真的音視頻,同時(shí)制作門檻也在日益降低,既可用于修改作品,也可用于制作全新內(nèi)容。比如現(xiàn)在很常見的“換臉”“變聲”等功能,一旦濫用就可能導(dǎo)致正規(guī)渠道信息的公信力減弱,久而久之危害甚大。
現(xiàn)在已有部分詐騙分子利用“換臉”技術(shù)實(shí)施詐騙,也有不法分子惡意偽造他人視頻,再轉(zhuǎn)手兜售到灰色市場(chǎng),用于賭博、詐騙、非法集資等犯罪行為,極大的增加了執(zhí)法機(jī)構(gòu)的成本投入。
2.3 AIGC的違禁內(nèi)容
從技術(shù)角度說,AIGC完全取決于使用者的引導(dǎo),在安全措施不到位的情況下,AI對(duì)惡意誘導(dǎo)會(huì)不加分辨或判斷,只會(huì)根據(jù)學(xué)習(xí)到的信息輸出新內(nèi)容,例如Tay的極端或暴力言論。一旦被人利用惡意造謠生事,或者編造花邊新聞,除了對(duì)社會(huì)人物名譽(yù)和形象的損害,更會(huì)導(dǎo)致許多不必要的麻煩。這類新聞此前就屢見不鮮,無疑是應(yīng)該被打擊嚴(yán)懲的。
AIGC作為內(nèi)容生產(chǎn)的新范式,在推動(dòng)數(shù)字經(jīng)濟(jì)快速發(fā)展的同時(shí)也對(duì)國(guó)家相關(guān)法律法規(guī)機(jī)構(gòu)及監(jiān)管治理能力都提出了更高要求。很多國(guó)家在打擊違法犯罪的同時(shí)也在不斷完善法律法規(guī),盡力避免潛在的社會(huì)漏洞。
標(biāo)簽:
機(jī)器學(xué)習(xí)
人工智能
快速發(fā)展