亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

AIGC:不!我不是元宇宙的附屬品!

AIGC行業(yè)資訊2年前 (2023)發(fā)布 管理員
2.2K 0

“你們是從什么時(shí)候開(kāi)始注意到人類的?”

“當(dāng)?shù)谝粋€(gè)原始人開(kāi)始仰望星空的時(shí)候。”

AI 的類人猿,早已開(kāi)始仰望人類。

01 來(lái)自機(jī)器的審視

在過(guò)去短短的兩年間,算法從業(yè)者王超岳有過(guò)兩次被 AI 震撼住的時(shí)刻。

一次是去年 3 月 OpenAI 祭出人工智能繪畫(huà)產(chǎn)品 DALL·E 時(shí)。只需要在計(jì)算機(jī)上輸入一句話,DALL·E 就能夠理解這句話、然后自動(dòng)生成一幅意思相應(yīng)的圖像,且該圖像是全網(wǎng)首發(fā)、獨(dú)一無(wú)二。

所有跨越“族群”的交流都是一次文明的突變,來(lái)自未明機(jī)器系統(tǒng)的回應(yīng)也讓人類感到猶遇 UFO 的震驚與好奇。在人與人的距離越來(lái)越遠(yuǎn)的現(xiàn)代社會(huì),機(jī)器卻好像能夠讀懂一個(gè)人的內(nèi)心。

“你能明顯感覺(jué)到它相比 GAN(2014 年出現(xiàn)的一個(gè) AI 生成網(wǎng)絡(luò))的進(jìn)步。DALL·E 的技術(shù)是革命性的?!蓖醭栏嬖V小編。小編

第二次是今年 4 月谷歌發(fā)布 5400 億參數(shù)大模型 PaLM 的時(shí)候。隨著參數(shù)的變大,PaLM 的文本理解能力與邏輯推理能力大幅提升,甚至可以用文本解釋笑話,告訴讀者為什么這個(gè)笑話好笑。小編

在這之前,人們嘲諷 AI 最常用的一句話就是:這個(gè) AI 模型的推理能力很弱,像 3 歲小朋友。但大模型發(fā)展至今,已經(jīng)能做算術(shù)、能做邏輯推理,心智已經(jīng)接近甚至在某些角度超過(guò)人類?!氨确秸f(shuō),”王超岳舉例:“有很多笑話我一時(shí)不能理解,但它能給我解釋,說(shuō)明在一些語(yǔ)言理解任務(wù)上、它比我還懂。”

王超岳是生成式 AI 的資深研究者,從 2014 年 GAN 發(fā)布后就開(kāi)始關(guān)注 AIGC 相關(guān)研究,當(dāng)時(shí) GAN 就是深度生成網(wǎng)絡(luò)的研究熱點(diǎn),但熱度也遠(yuǎn)遠(yuǎn)不及 AIGC 這兩年的重大突破。上述提到的兩項(xiàng)技術(shù),也成為點(diǎn)燃今年下半年 AI 圈狂歡的“導(dǎo)火索”:小編

DALL·E 背后的關(guān)鍵技術(shù) CLIP 讓文字與圖片兩個(gè)模態(tài)找到能夠?qū)υ挼慕唤琰c(diǎn),成為 DALL·E、DALL·E 2.0、Stable Diffusion 等突破性 AI 成果的基石;而像 PaLM 這樣的語(yǔ)言大模型,雖然燒錢(qián),但其對(duì)人類語(yǔ)言的理解能力突飛猛進(jìn),是 AI 能讀懂人的前提。

“這兩年的 AI 技術(shù)突破真的非常快?!毙某娇萍迹ūI夢(mèng)師團(tuán)隊(duì))創(chuàng)始人藍(lán)振忠也說(shuō)道。他讀論文經(jīng)常讀到很興奮、很激動(dòng):“CLIP 出來(lái)一段時(shí)間后,MAE(何愷明團(tuán)隊(duì)提出的一種AI范式,可以將在語(yǔ)言任務(wù)上表現(xiàn)優(yōu)秀的能力遷移到視覺(jué)任務(wù)的處理上)又跟著出來(lái),然后又有 Stable Diffusion……”

今年 8 月 Stable Diffusion 推出以來(lái),藍(lán)振忠與團(tuán)隊(duì)很快就跟上、只用了不到一個(gè)月的時(shí)間就上線 AI 作畫(huà)產(chǎn)品“盜夢(mèng)師”,并迅速在國(guó)內(nèi)火起來(lái),出圖速度短至 1 秒,而且繪畫(huà)質(zhì)量非常高,日留存率接近50%(高于 90% 的小程序),不到兩個(gè)月就接到了 To B 的大訂單。

AIGC:不!我不是元宇宙的附屬品!

“盜夢(mèng)師”生成的圖像作品

在盜夢(mèng)師上線的第二天(9 月 1 日),國(guó)內(nèi)第一本《 AIGC 白皮書(shū)》在上海世界人工智能大會(huì)(WAIC)發(fā)布。王超岳參與了這本白皮書(shū)的撰寫(xiě),并主導(dǎo)了 AIGC 技術(shù)體系的梳理和展望。

AIGC 白皮書(shū)的發(fā)布引來(lái)大批參會(huì)同行的關(guān)注。不僅是人工智能領(lǐng)域的研究者,還有元宇宙領(lǐng)域的從業(yè)者:

“當(dāng)時(shí)紅杉資本那篇關(guān)于生成式 AI 的文章還沒(méi)有出來(lái),大家都還不知道 AIGC 是什么。這說(shuō)明數(shù)字內(nèi)容生成的重要性是行業(yè)共識(shí)?!?/p>

再緊接著,一切都很快:技術(shù)的突破帶來(lái)應(yīng)用的繁榮,Midjourney 在海外火起,文生圖的熱潮又讓人們看到更多原先冷門(mén)的 AIGC 分支,如文本生成、視頻生成、音樂(lè)生成,業(yè)內(nèi)人士才驚覺(jué),原來(lái)海外像 Jasper.ai 這樣的公司已經(jīng)在商業(yè)化落地上有成功的驗(yàn)證。繼上一代以識(shí)別與檢測(cè)為主的感知智能之后,用于生成與編輯的“創(chuàng)造智能”成為資本的新寵。

更意外的是,這一波 AIGC 的熱潮還引起了廣大圈外人士的關(guān)注,如自媒體 KOL、插畫(huà)師群體與圖文創(chuàng)作者。人們有恐慌,檄文不斷;也有歡喜,希望擁抱前沿的技術(shù)。但無(wú)論人們接受與否,一個(gè)不可逆轉(zhuǎn)的趨勢(shì)已經(jīng)在發(fā)生。

02 AIGC 的大航海時(shí)代已開(kāi)啟

1519 年,一支探險(xiǎn)船隊(duì)從西班牙駛出,由西而去,人類文明的大航海時(shí)代開(kāi)啟。

后來(lái),全球化歷史學(xué)家記載文明,總要提到一個(gè)叫麥哲倫的探險(xiǎn)家,以及他最初航海的好奇心:地球是方的,還是圓的?——麥哲倫是地圓說(shuō)的倡導(dǎo)者;如果地球是方的,就證明航海無(wú)法成功;而如果地球是圓的,那么他最終會(huì)回到原點(diǎn)。

1950 年,另一位叫艾倫·圖靈的科學(xué)探險(xiǎn)家也有相似的好奇:機(jī)器能否根據(jù)人的行為作出有意識(shí)的反應(yīng)?——他提出了一個(gè)著名的檢測(cè)方法,叫“圖靈測(cè)試”,開(kāi)啟了人工智能的研究時(shí)代。

如今,AI 領(lǐng)域的研究者,在 AIGC 的技術(shù)探索中似乎也獲得了相似的探索欲望與熱情。他們想知道:機(jī)器是否能讀懂人的思想與邏輯,從 0 到 1 進(jìn)行創(chuàng)造?

答案是:經(jīng)過(guò)近十年的技術(shù)發(fā)展,他們認(rèn)為可以,并且相信當(dāng)前的 AIGC 探索已經(jīng)到了工程化的階段。

猶如麥哲倫航海,目的已經(jīng)明確,航海的地圖(理論與框架)也已初具雛形,接下來(lái)是要驗(yàn)證技術(shù)路線是否可以到達(dá)目的地。

文生圖為例。雖然 AI 根據(jù)文本描述畫(huà)畫(huà)的能力還不夠完美,例如基于不同的文本提示(prompt)會(huì)輸出質(zhì)量不一的圖像,對(duì)長(zhǎng)文本的理解能力不足、會(huì)漏讀關(guān)鍵詞匯導(dǎo)致生成的圖像不完成等等,但這些都是一個(gè)個(gè)具體的研究問(wèn)題,被解決只是時(shí)間問(wèn)題。

為什么說(shuō) AIGC 的地圖已勾勒完成?這主要?dú)w功于三方面:大模型、多模態(tài)與可控制。

2020 年,OpenAI 推出 1750 億參數(shù)的預(yù)訓(xùn)練語(yǔ)言大模型 GPT-3,在國(guó)內(nèi)外掀起千億參數(shù)大模型的研究浪潮。那時(shí)開(kāi)始,AI 的語(yǔ)言表達(dá)和理解能力開(kāi)始突飛猛進(jìn)。也是從那時(shí)起,AI 開(kāi)始能在很短的時(shí)間內(nèi)寫(xiě)出不錯(cuò)的文章。

實(shí)際上,那時(shí)候海外就出現(xiàn)了一波專做文字生成的商業(yè)公司,如 Jasper.ai 與 Copy.ai。這些公司開(kāi)發(fā)了機(jī)器自動(dòng)寫(xiě)作平臺(tái),用戶輸入關(guān)鍵字、AI 只需幾分鐘就能寫(xiě)成一篇邏輯與表達(dá)不輸人類的長(zhǎng)文,用于替代寫(xiě)作過(guò)程中的大量勞動(dòng),并能兌換出商業(yè)價(jià)值。

但由于 OpenAI 不對(duì)大陸和香港開(kāi)放 GPT-3 接口,所以國(guó)內(nèi)的 AI 研究人員很難用起來(lái),文字生成的相關(guān)應(yīng)用也沒(méi)能在國(guó)內(nèi)火起。這兩年,雖然國(guó)內(nèi)也有許多大廠與高校下場(chǎng)研究中文大模型,但在開(kāi)源上仍進(jìn)展緩慢,導(dǎo)致大量的 AI 開(kāi)發(fā)者止步于高昂的訓(xùn)練成本,限制了基于中文語(yǔ)言的 AI 應(yīng)用開(kāi)發(fā)。

在這一波 AIGC 中,AI 大模型在理解人類語(yǔ)言的能力上發(fā)揮了關(guān)鍵作用。歸功于大模型的發(fā)展,不僅文本生成的效果不錯(cuò),基于文本的圖像生成也較 GAN 時(shí)代有了極大的進(jìn)步。

王超岳就告訴小編,在撰寫(xiě)《 AIGC 白皮書(shū)》時(shí),其實(shí)他們內(nèi)部有過(guò)糾結(jié):標(biāo)題是要寫(xiě)成“AIGC”(AI-Generated Content),還是寫(xiě)成“生成式AI”(Generative AI)?最后,王超岳把票投給了AIGC,因?yàn)?generative model(生成模型)是一個(gè)專有的學(xué)術(shù)名詞,一般是描述模型對(duì)一個(gè)具體的分布進(jìn)行擬合,比如 GAN。但 DALL·E 2.0 所做的在某種程度上已經(jīng)超出了對(duì)某一種數(shù)據(jù)分布的擬合,展現(xiàn)出了通用的圖像生成能力。

舉個(gè)例子,GAN 最知名的應(yīng)用是人臉生成:模型去看海量的人臉照片,知道人臉是一種分布,然后學(xué)習(xí)到人臉的特征。在 2014 年還沒(méi)有能夠生成高維數(shù)據(jù)圖像的方法時(shí),GAN 是一種很強(qiáng)的生成方法,但局限性也是本質(zhì)的:

首先,它需要一個(gè)特定的數(shù)據(jù)集(比如人臉),泛化能力差。比如,GAN 發(fā)布后被用于訓(xùn)練各種各樣的人臉特效,但一個(gè) GAN 無(wú)法訓(xùn)練出多種人臉特效,換另一種特效就要新訓(xùn)練一個(gè) GAN;其次,GAN 在通過(guò)文本描述控制圖像生成上做的并不盡如人意,這很大程度限制了它成為一個(gè)可控的通用式結(jié)構(gòu)。

而 OpenAI 發(fā)布的 DALL·E(和之后 DALL·E 2)是使用了通用模型:能夠同時(shí)處理多項(xiàng)語(yǔ)言任務(wù)的語(yǔ)言大模型,加打通文字與圖像兩種模態(tài)的 CLIP 模型,控制圖像生成的擴(kuò)散模型,能夠在保證真實(shí)性的基礎(chǔ)上進(jìn)一步產(chǎn)生概念與元素的組合,生成更加復(fù)雜的場(chǎng)景。

一個(gè)例子是 AI 能夠根據(jù)文字的描述對(duì)圖像進(jìn)行編輯,在添加或移動(dòng)圖片元素時(shí)將陰影、投影與物理表面紋理等因素都考慮進(jìn)去。比如,人類制定要下圖 3 的位置生成火烈鳥(niǎo),AI 就真的在室外的玻璃邊生成兩只火烈鳥(niǎo)、并且有影子投映下來(lái):

AIGC:不!我不是元宇宙的附屬品!

當(dāng)指定在上圖 2 的位置(游泳池中間)生成火烈鳥(niǎo)時(shí),AI 會(huì)自動(dòng)生成一個(gè)適應(yīng)泳池環(huán)境的形象——火烈鳥(niǎo)游泳圈:

AIGC:不!我不是元宇宙的附屬品!

文字與圖像的多模態(tài)研究大體可以分為三個(gè)階段:1、圖文描述(讓計(jì)算機(jī)描述畫(huà)中的事情);2、圖文問(wèn)答(給一張圖片,問(wèn)這個(gè)圖片里的桌子上都有什么東西。機(jī)器人需要理解問(wèn)題,再了解圖片里都是些什么東西);3、用一句話生成圖片(讓機(jī)器人通過(guò)一句話的描述作畫(huà))。

多模態(tài)的一個(gè)重要貢獻(xiàn)在于數(shù)據(jù)源:它很好地提供了文本與圖像成對(duì)的訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)也是幫助 AIGC 模型學(xué)習(xí)到認(rèn)知的重要素材。

此前階段一、二的代表應(yīng)用分別有短視頻平臺(tái)上的 AI 生成電影解說(shuō)、智能對(duì)話機(jī)器人,而到第三階段,機(jī)器系統(tǒng)則必須理解人類語(yǔ)言與常識(shí)、物理世界運(yùn)行法則等,否則無(wú)法進(jìn)行由人控制的跨模態(tài)創(chuàng)作。但 DALL·E、Midjourney 與盜夢(mèng)師等產(chǎn)品都已經(jīng)體現(xiàn)出理解人類與世界的突破。

大量的研究實(shí)驗(yàn)都表明,當(dāng)模型足夠大,訓(xùn)練的數(shù)據(jù)足夠多,AI 能夠逐步理解人類語(yǔ)言的抽象概念(如常識(shí)與規(guī)則)。王超岳在讀博時(shí)師從陶大程,他們團(tuán)隊(duì)就從深度學(xué)習(xí)理論出發(fā),不止一次通過(guò)模型的容量分析證明,大模型在學(xué)習(xí)通用知識(shí)和理解泛化上有更好的表現(xiàn)。這是之前的生成模型沒(méi)有體現(xiàn)出來(lái)的能力。

這也決定了AIGC 不光是生成,而是建立在認(rèn)知與理解上的模型的應(yīng)用生態(tài)。當(dāng) AI 具備基礎(chǔ)認(rèn)知與理解,機(jī)器像人一樣思考與創(chuàng)作,就不再是海市蜃樓的傳說(shuō),而是一個(gè)正在發(fā)生的現(xiàn)實(shí)。

03 商業(yè)化:在沉默中爆發(fā)

現(xiàn)代社會(huì)的活動(dòng)構(gòu)成,本質(zhì)是一串串的數(shù)字內(nèi)容:語(yǔ)音、文本、圖像、視頻…而 AIGC 可以為創(chuàng)造這些內(nèi)容提供了一個(gè)個(gè)基礎(chǔ)元素。

實(shí)際上,AIGC(人工智能生成內(nèi)容)一直存在,但直到今年才被國(guó)內(nèi)的資本熱捧,一是技術(shù)的成熟,二是原先專注于視覺(jué) AI 商業(yè)化的資本扭頭才發(fā)現(xiàn),類似 Jasper.ai 這樣的海外 NLP 公司開(kāi)始大幅盈利了。

由于創(chuàng)造數(shù)字內(nèi)容的優(yōu)勢(shì),AIGC 技術(shù)在備受矚目后也被過(guò)去一年追隨元宇宙的狂熱者們列為打造未來(lái)元宇宙的工具。但噱頭背后,更多 AIGC 的從業(yè)者相信,AIGC 能比元宇宙更快打造出下一代數(shù)字世界,一個(gè)完全屬于 AIGC 的新賽道。

這背后的原因,是 AIGC 與當(dāng)前元宇宙所倚技術(shù)的本質(zhì)差異:以圖形學(xué)(打造數(shù)字人的關(guān)鍵技術(shù))為例,圖形學(xué)在內(nèi)容生成上側(cè)重仿真、復(fù)刻,而 AIGC 側(cè)重原創(chuàng)、創(chuàng)造。從圖形學(xué)出發(fā)打造數(shù)字人是需要有一個(gè)真人作參考的,但 AIGC 在語(yǔ)音、文字與圖像的生成上是從 0 到 1、前所未有。

以電影《無(wú)雙》為例。AIGC 是張靜初,圖形學(xué)則是郭富城。

由于 AIGC 在寫(xiě)作與畫(huà)畫(huà)上,每個(gè)字、每個(gè)像素都是精心計(jì)算出來(lái)的,所以用戶基于 AIGC 模型創(chuàng)作的圖像與文章全都是世上獨(dú)一無(wú)二的,絕對(duì)的原創(chuàng)選手。

數(shù)字內(nèi)容的本質(zhì)+獨(dú)一無(wú)二的原創(chuàng)特性,決定了 AIGC 的賽道容量足夠大,前者暗示它可以被打造成像互聯(lián)網(wǎng)內(nèi)容平臺(tái)或產(chǎn)品這樣的標(biāo)準(zhǔn)品,后者意味著它能獲得與人類創(chuàng)作者相媲美的市場(chǎng)認(rèn)可度。

以文本生成為例。類似 Jasper.ai 這樣的 NLP 公司在海外孵化了一種新職業(yè),叫“ AI 靈魂寫(xiě)手”:

人類用戶在 AI 文字生成平臺(tái)上輸入標(biāo)題與關(guān)鍵字,AI 就會(huì)生成一篇很長(zhǎng)的文章,然后人們?cè)僭趯?xiě)好的文章上進(jìn)行修改,將修改后的文章賣(mài)給需要大量高質(zhì)量的文章來(lái)做搜索引擎優(yōu)化的公司,賺取作品出售與訂閱 AI 產(chǎn)品的會(huì)員費(fèi)之間的差價(jià)。

圖像生成的盈利模式也如此:比如在海外,用戶訂閱了 Midjourney 的會(huì)員,用 AI 生成精美的圖像后再將圖片賣(mài)給類似 iStock 這樣的圖庫(kù),從中賺取差價(jià)。

由于谷歌搜索向原創(chuàng)文傾斜,而 AI 寫(xiě)的文章又是全網(wǎng)絕無(wú)僅有的原創(chuàng)文章、非信息拼湊,所以谷歌會(huì)給這類文章更多流量,提高搜索排名。

這也使 Jasper.ai 等公司能夠迅速獲得市場(chǎng)份額。據(jù) Jasper.ai 宣稱,截至今年 9 月,他們?nèi)ツ甑氖杖氤^(guò)了 4000 萬(wàn)美金,今年預(yù)計(jì)會(huì)翻一倍,目前付費(fèi)用戶也達(dá)到了 7 萬(wàn),估值 15 億美元。而距離 Jasper ai 成立,才不過(guò) 18 個(gè)月。

藍(lán)振忠告訴小編,現(xiàn)在 AI 寫(xiě)出來(lái)的文章是具備很高的可讀性的。他們?cè)_(kāi)了一個(gè)微信公眾號(hào)、用中文大模型寫(xiě)星座運(yùn)勢(shì),也收獲了一定的閱讀量,甚至有讀者在后臺(tái)評(píng)論說(shuō):“小編你一定是摩羯座的,這么懂我?!?除了盜夢(mèng)師之后,他們的一款文字生成工具“HeyFriday”雖然推出時(shí)間沒(méi)多久,但在海外也已經(jīng)有幾千個(gè)付費(fèi)用戶。

高速的增長(zhǎng)也出現(xiàn)在圖像生成領(lǐng)域。數(shù)據(jù)顯示,海外 AI 作畫(huà)產(chǎn)品 Midjourney 推出不過(guò)三個(gè)月,注冊(cè)用戶已經(jīng)超過(guò) 300 萬(wàn)。而據(jù)小編獨(dú)家了解,盜夢(mèng)師推出不到兩個(gè)月,生成的圖像數(shù)量已經(jīng)達(dá)到 1 千萬(wàn)張。

多位行業(yè)人士談道:“說(shuō)白了,互聯(lián)網(wǎng)的核心是流量,流量的核心是內(nèi)容。而 AIGC 的本質(zhì),就是一項(xiàng)生產(chǎn)內(nèi)容的技術(shù)?!?/p>

這也意味著,相比上一代要與終端硬件相結(jié)合的視覺(jué) AI,或世界觀龐大的元宇宙,AIGC 的商業(yè)化落地更具體,投入成本更低、盈利更快。甚至一個(gè)更激進(jìn)的觀點(diǎn)是:AIGC 能夠跑出背靠流量的、與現(xiàn)有互聯(lián)網(wǎng)內(nèi)容平臺(tái)(如小紅書(shū)、抖音)的體量相媲美甚至超越的“內(nèi)容生成平臺(tái)”。

AIGC:不!我不是元宇宙的附屬品!

“盜夢(mèng)師”根據(jù)用戶描述生成的圖像作品

在內(nèi)容需求旺盛的當(dāng)下,AIGC 所帶來(lái)的內(nèi)容生產(chǎn)方式變革也開(kāi)始引起了內(nèi)容消費(fèi)模式的變化。尊重原創(chuàng)的市場(chǎng),開(kāi)始敬畏 AIGC。

最新作出反應(yīng)的是圖庫(kù)類企業(yè):

10月底,海外知名圖庫(kù) Shutterstock 就公布了他們與 OpenAI 建立了合作,讓用戶可以輸入文字即時(shí)生成滿足需求的原創(chuàng)圖片。(實(shí)際上,許多行業(yè)人士也認(rèn)為,在 AIGC 的浪潮中,素材庫(kù)與P圖軟件是最先被淘汰或替代掉的行業(yè)。)

這項(xiàng)合作不僅是一個(gè)傳統(tǒng)行業(yè)的及時(shí)反映,實(shí)際上還意味著AIGC 商業(yè)化變現(xiàn)的一個(gè)想象似乎開(kāi)始落地:打造一個(gè)基于生成的全新內(nèi)容平臺(tái)。

許多人并不知道這意味著什么,但在一些人的眼中,AIGC 的影響力已經(jīng)開(kāi)始從服務(wù)個(gè)人用戶到服務(wù)實(shí)際行業(yè)——當(dāng)前的內(nèi)容平臺(tái)主要是基于關(guān)鍵詞搜索、推薦,而引入 AIGC 后,用戶所消費(fèi)的內(nèi)容就來(lái)源于 AI 對(duì)用戶的理解?;谕扑]的內(nèi)容是來(lái)源于有限的素材庫(kù),而基于生成的內(nèi)容是源源不斷的……

AIGC 的當(dāng)局者們,雖然他們是這個(gè)賽道的締造者,但在見(jiàn)證 AIGC 的一次次魔力中,他們還是被機(jī)器堪比人類、甚至超越人類的創(chuàng)造速度與創(chuàng)造能力給嚇到。

ZMO.AI 的創(chuàng)始人張?jiān)姮撜f(shuō):“例如現(xiàn)在的短視頻平臺(tái)。推薦是將創(chuàng)作者創(chuàng)造出來(lái)的有限內(nèi)容推薦給你,但生成是每一個(gè)消費(fèi)內(nèi)容的人都是創(chuàng)作者。消費(fèi)者對(duì)內(nèi)容的反饋可以讓 AI 更了解你要什么,你喜歡什么、AI 就生成什么,這將是實(shí)時(shí)更新并且無(wú)限的?!?/p>

ZMO.AI 是國(guó)內(nèi)最早成立的 AIGC 公司之一。與 Stable Diffusion 等擅長(zhǎng)藝術(shù)像生成的產(chǎn)品不同,ZMO.AI 選擇的賽道是真實(shí)世界的圖像生成,如設(shè)計(jì)。他們最開(kāi)始專注于出海,在海外推出的 imgcreator.ai 達(dá)到了 32 萬(wàn)月活的高速增長(zhǎng)。

他們認(rèn)為,AIGC 不僅是數(shù)字娛樂(lè)內(nèi)容的生產(chǎn)工具,對(duì)許多實(shí)際行業(yè)也有非常大的幫助影響。這個(gè)賽道足夠大,研究者與創(chuàng)業(yè)者能夠做的事情也足夠多。(Stability.AI 的創(chuàng)始人 Emad Mostaque 也說(shuō)過(guò)類似的話,認(rèn)為 AIGC 的賽道比新能源還大。)

單就圖像而言,當(dāng)前的素材主要靠拍攝,既低效又昂貴。比如電商平臺(tái)的服裝上新,目前的模式是線下拍攝,需要化妝師、服裝師、攝影師、模特等等,而在未來(lái)的 AIGC 世界中,他們希望用 AI 直接生成能展示服裝的模特圖像?,F(xiàn)在,他們的 AIGC 產(chǎn)品“ YUAN 初”小程序已經(jīng)在圖像編輯上取得驚人的效果。

AIGC:不!我不是元宇宙的附屬品!

ZMO.AI 的圖像生成器所生成的圖片

相比藝術(shù)類的風(fēng)格生成來(lái)說(shuō),真實(shí)的、攝影風(fēng)格的圖像生成難度更高,但對(duì)實(shí)際的生產(chǎn)與生活有巨大影響。比如設(shè)計(jì)行業(yè),小到海報(bào)、PPT、網(wǎng)頁(yè),大到所有商品的外包裝、插畫(huà)等對(duì)原創(chuàng)素材要求高的應(yīng)用,都有 AIGC 的用武之地。

先不談取代,目前就有大量的設(shè)計(jì)師會(huì)使用 AIGC 產(chǎn)品來(lái)簡(jiǎn)化設(shè)計(jì)前草稿階段的工作。張?jiān)姮撝v了一個(gè)建筑設(shè)計(jì)的例子:他們與一個(gè)建筑師合作設(shè)計(jì)了一座層高大約 25 米的交響音樂(lè)廳——

AIGC:不!我不是元宇宙的附屬品!

在沒(méi)有 AIGC 之前,建筑設(shè)計(jì)師是先用鉛筆畫(huà)草圖,畫(huà)完之后覺(jué)得好看再弄成彩鉛,彩鉛版本滿意后再做一個(gè) 3D 的視覺(jué)效果圖給甲方客戶看,甲方滿意再設(shè)計(jì)建筑里面的工程結(jié)構(gòu)等等。而有了 AIGC 之后,他們從第一步就極大地節(jié)省了時(shí)間,快速將設(shè)計(jì)師腦海中的方案用 AI 生成出來(lái),發(fā)給甲方看。

“在 AI 寫(xiě)幾句話、P 個(gè)圖時(shí),你可能覺(jué)得沒(méi)什么。但如果有一天,AI 開(kāi)始設(shè)計(jì)建筑,你就要重新思考它的價(jià)值了。”

04 一切只是時(shí)間問(wèn)題

劉慈欣在小說(shuō)《朝聞道》里借用外星人“排險(xiǎn)者”之口道出了技術(shù)發(fā)展的真理:

“人類獲得宇宙終極奧秘的起點(diǎn),始于第一只猿猴對(duì)星空的仰望?!?/p>

如同人對(duì)宇宙的探索,AI 也在不斷探索人類。如今的 AI 類人猿(AIGC)已看到廣闊的星空。當(dāng)下越來(lái)越多研究者參與到 AIGC 的探索中,AIGC 距離更高層級(jí)的思維創(chuàng)作也越來(lái)越近。征服,似乎只是時(shí)間問(wèn)題。

過(guò)去的十年,是 AI 騰飛的十年。十年的風(fēng)起云涌中,有趣的技術(shù)點(diǎn)層出不窮,有的成為一個(gè)新的賽道(如識(shí)別之于安防),有的則在商業(yè)化落地的過(guò)程中“胎死腹中”、曇花一現(xiàn)。

大浪淘沙中,人們對(duì)于AIGC既期待,也謹(jǐn)慎。

比如,關(guān)于 AIGC 能否在國(guó)內(nèi)的商業(yè)落地中有所收成,一部分投資者是擔(dān)憂的。

以文本生成為例,AIGC 的商業(yè)變現(xiàn)實(shí)際十分依賴用戶驅(qū)動(dòng)。但目前國(guó)內(nèi)的中文語(yǔ)言大模型在開(kāi)源一塊缺少高質(zhì)量的語(yǔ)料數(shù)據(jù),導(dǎo)致中文版的 AI 在不同話題的寫(xiě)作質(zhì)量上參差不齊;同時(shí),國(guó)內(nèi)的文字從業(yè)者在人力成本上普遍低于海外歐美發(fā)達(dá)國(guó)家,AIGC 在內(nèi)容生成一塊替代人力的節(jié)約成本也明顯低于海外市場(chǎng)。

落地的 AI 在涉及與人博弈的場(chǎng)景中,AI 所提供的服務(wù)成本必須在相較于人力成本上有明顯優(yōu)勢(shì),才會(huì)被現(xiàn)有行業(yè)所接受——這幾乎是一個(gè)心照不宣的定律。工業(yè)質(zhì)檢就是一個(gè)很好的參考例子:傳統(tǒng)工廠在質(zhì)檢環(huán)節(jié)優(yōu)先考慮的就是成本,當(dāng)一個(gè)質(zhì)檢員工的月薪普遍是6-7k、而一個(gè)視覺(jué) AI 解決方案在成本無(wú)法媲美、精度又無(wú)法實(shí)現(xiàn)高準(zhǔn)確率時(shí),就難以說(shuō)服行業(yè)。

心辰科技向小編坦言,他們的文本生成工具目前定價(jià)是 Jasper.AI 的十分之一,但國(guó)內(nèi)用戶的接受程度仍在爬坡期,這也需要中文大模型(GPT-3、PaLM 等均為英語(yǔ)大模型)的不斷進(jìn)步。

但更多的人相信,AIGC 會(huì)改變現(xiàn)代生產(chǎn)與生活的方方面面,因?yàn)?AIGC 所解決的問(wèn)題是現(xiàn)存的、而非假設(shè)的。這些問(wèn)題很具體,并且在大部分的場(chǎng)景中,它能部分取代或完全取代繁重的人力,不僅降本增效,而且降低內(nèi)容的創(chuàng)作門(mén)檻、激發(fā)人的創(chuàng)造力與想象力。

比如畫(huà)畫(huà)。過(guò)去需要接受十多年訓(xùn)練來(lái)獲取的技能,如今零基礎(chǔ)的人也以使用 AI 來(lái)創(chuàng)作,且作品的質(zhì)量不輸專業(yè)人員手繪而成的作品。這也讓人們進(jìn)一步看到創(chuàng)作的本質(zhì):思想與觀點(diǎn),從來(lái)是創(chuàng)作中的靈魂,而非方式與工具。

盡管近日來(lái)有許多公司在產(chǎn)品的宣傳與定位上掛了 AIGC 的頭銜,據(jù)了解,目前無(wú)論是文字生成還是圖像創(chuàng)作,AIGC 的技術(shù)壁壘還是存在的。

此外,算法與數(shù)據(jù)的選擇也決定了各個(gè)企業(yè)后續(xù)在不同場(chǎng)景中的表現(xiàn)高低。目前,在商業(yè)化中,選擇技術(shù)壁壘高、護(hù)城河足夠安全的落地場(chǎng)景,成為各個(gè) AIGC 從業(yè)者的當(dāng)務(wù)之急。

AIGC 的創(chuàng)業(yè)者們告訴小編,他們相信,未來(lái) AI 的技術(shù)也許能改變權(quán)游的結(jié)局,未來(lái)很大可能會(huì)出現(xiàn)一個(gè)完全基于生成的內(nèi)容消費(fèi)平臺(tái),未來(lái) AIGC 會(huì)在元宇宙、Web 3.0 中成為關(guān)鍵的技術(shù),但在奔赴未來(lái)之前,他們?nèi)砸缭揭蛔忠蛔角稹?/p>

但至少,他們已經(jīng)知道山丘的位置。

? 版權(quán)聲明

相關(guān)文章