AIGC為什么會火和生成模型如何演進
所謂AIGC即基于人工智能技術(shù)自動生成內(nèi)容的新型生產(chǎn)范式,其中,兩大核心關(guān)鍵詞是AI+新型內(nèi)容生成方式。
對于計算機來說,內(nèi)容=信息(數(shù)據(jù))+載體(音頻,視頻,文字等),只要輸入信息,選好載體,AIGC就能自動生成與之對應(yīng)的內(nèi)容。
典型場景即目前大火的AI作畫,用戶可以通過簡短的文字描述(prompt)來生成與之相應(yīng)的圖像,而且隨著文字描述的顆粒度不斷細化,生成的圖像也會越來越精準。
除了文字轉(zhuǎn)圖片之外,目前AIGC已經(jīng)可以勝任圖像,視頻,文本間的跨載體生成,而基于AIGC,內(nèi)容生產(chǎn)的門檻顯著降低(比如,毫無繪畫基礎(chǔ)的用戶,也可以通過AI作畫,畫出高質(zhì)量的作品),內(nèi)容生產(chǎn)的效率顯著提升(可以快速批量生產(chǎn)大量內(nèi)容),將有望引領(lǐng)內(nèi)容產(chǎn)業(yè)的新一輪工業(yè)革命。
而AIGC背后用的AI技術(shù)則是生成式AI(GenerativeAI),不再只是分析,而是開始嘗試創(chuàng)造新的東西,如果把AI比作小孩學習的話,基于生成式AI技術(shù)的成熟意味著AI不僅是會模仿,更可以在學習的基礎(chǔ)上創(chuàng)造出新的東西。
AI發(fā)展多年,過去解決的多是模態(tài)識別的問題,比如較成功的案例就是圖像識別了,采用CNN算法,把信息與圖能夠通過AI訓練的方式給訓練出來,教會了AI去識別某個模態(tài),在教科書里,被稱為判別式模型(DiscriminantModel),抽象來看,就是訓練一個巨大的神經(jīng)網(wǎng)絡(luò)(多層多參數(shù))來實現(xiàn)輸入和輸出的映射關(guān)系,從數(shù)學來看,就是學習輸入輸出的條件概率分布,類似于因果關(guān)系,算法的本質(zhì)是想更準確的控制映射關(guān)系。
然而,除此之外,還有一種叫生成式模型(GenerativeModel),是學習數(shù)據(jù)中的聯(lián)合概率分布,類似于相關(guān)性,算法的本質(zhì)并不是準確控制映射關(guān)系,而是在有相關(guān)性的基礎(chǔ)上學習一個分布,而生成模型的發(fā)展,使得AI變得更多多元,不僅僅可以用于圖像識別聲音識別這類模態(tài)識別問題,還可以實現(xiàn)更多創(chuàng)造性的工作。