亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

游戲中的生成人工智能(Generative AI)革命,都有哪些應(yīng)用市場

游戲中的生成人工智能(Generative AI)革命,都有哪些應(yīng)用市場要了解生成式 AI 將如何徹底改變游戲,只需看看 @emmanuel_2 m 最近發(fā)布的這篇 Twitter 帖子。在這篇文章中,他探討了使用 Stable Diffusion + Dreambooth(流行的 2 D 生成 AI 模型)為假設(shè)的游戲生成藥水圖像。

這項工作的變革性不僅在于它節(jié)省了時間和金錢,同時還提供了質(zhì)量——從而打破了經(jīng)典的“成本、質(zhì)量或速度同時只能擁有兩個”的三角關(guān)系。藝術(shù)家們現(xiàn)在可以在幾個小時內(nèi)創(chuàng)作出高質(zhì)量的圖像,而手工生成這些圖像需要數(shù)周時間。真正具有變革性的是:

現(xiàn)在,任何可以學習一些簡單工具的人都可以獲得這種創(chuàng)造力。

這些工具可以以高度迭代的方式創(chuàng)建無數(shù)的變體。

一旦經(jīng)過訓練,這個過程就是實時的——結(jié)果幾乎是即時可用的。

自實時 3D 以來,還沒有出現(xiàn)過對游戲具有如此革命性意義的技術(shù)?;ㄈ魏螘r間與游戲創(chuàng)作者交談,興奮和驚奇的感覺是顯而易見的。那么這項技術(shù)將走向何方?它將如何改變游戲?不過,首先,讓我們回顧一下什么是生成人工智能(Generative AI)?

 

什么是生成人工智能

生成 AI 是機器學習的一種,計算機可以根據(jù)用戶的提示生成原創(chuàng)的新內(nèi)容。今天,文本和圖像是這項技術(shù)最成熟的應(yīng)用,但幾乎每個創(chuàng)意領(lǐng)域都在開展工作,從動畫到音效,再到音樂,甚至創(chuàng)建具有完全充實個性的虛擬角色。

當然,人工智能在游戲中的應(yīng)用并不是什么新鮮事。即使是早期的游戲,如 Atari 的 Pong,也有計算機控制的對手來挑戰(zhàn)玩家。然而,這些虛擬敵人并沒有像我們今天所知道的那樣運行人工智能。它們只是游戲設(shè)計師編寫的腳本程序。他們模擬了一個人工智能對手,但他們無法學習,他們只能和建造他們的程序員一樣好。

由于更快的微處理器和云計算,現(xiàn)在的不同之處在于可用的計算能力。有了這種能力,就可以構(gòu)建大型神經(jīng)網(wǎng)絡(luò)來識別高度復(fù)雜領(lǐng)域中的模式和表征。

這篇博文分為兩部分:

  • 第一部分包含我們對游戲生成 AI 領(lǐng)域的觀察和預(yù)測。
  • 第二部分是我們?yōu)檫@個領(lǐng)域制作的市場地圖,概述了各個細分市場并確定了每個細分市場中的關(guān)鍵公司。

 

第一部分——觀察和預(yù)測

假設(shè)

首先,讓我們探討一下這篇博文其余部分的一些假設(shè):

1. 通用人工智能的研究量將繼續(xù)增長,創(chuàng)造出更有效的技術(shù)

考慮一下 arXiv 檔案中每月發(fā)表的關(guān)于機器學習或人工智能的學術(shù)論文數(shù)量圖表:

如您所見,論文數(shù)量呈指數(shù)級增長,絲毫沒有放緩的跡象。這僅包括已發(fā)表的論文——許多研究甚至從未發(fā)表過,直接用于開源模型或產(chǎn)品研發(fā)。結(jié)果是興趣和創(chuàng)新的爆炸式增長。

2. 在所有娛樂中,游戲?qū)⑹苌扇斯ぶ悄艿挠绊懽畲?/h4>

就涉及的資產(chǎn)類型(2 D 藝術(shù)、3 D 藝術(shù)、音效、音樂、對話等)的數(shù)量而言,游戲是最復(fù)雜的娛樂形式。游戲也是最具互動性的,非常強調(diào)實時體驗。這為新游戲開發(fā)者創(chuàng)造了一個陡峭的進入壁壘,同時也為制作一款現(xiàn)代的、排行榜首的游戲付出了高昂的成本。它還為生成 AI 的顛覆創(chuàng)造了巨大的機會。

想想像 Red Dead Redemption 2 這樣的游戲,它是有史以來最昂貴的游戲之一,制作成本接近 5 億美元。原因很容易理解——它擁有市場上所有游戲中最美麗、最真實的虛擬世界之一。它還花費了將近 8 年的時間打造,擁有超過 1,000 個不可玩的角色(每個角色都有自己的個性、藝術(shù)作品和配音演員),一個近 30 平方英里的世界,超過 100 個任務(wù)分為 6 個章節(jié),以及由 100 多位音樂家創(chuàng)作的近 60 小時的音樂。這個游戲的一切都很大。

現(xiàn)在將 Red Dead Redemption 2 與 Microsoft Flight Simulator 進行比較,后者不僅大,而且非常龐大。Microsoft Flight Simulator 使玩家能夠在整個地球上飛行,包括 1.97 億平方英里的地球。微軟是如何打造如此龐大的游戲的?通過讓人工智能來做。微軟與 blackshark.ai 合作,訓練人工智能從 2 D 衛(wèi)星圖像生成逼真的 3 D 世界。

這是一個游戲的例子,如果不使用 AI,實際上是不可能構(gòu)建的,而且,從這些模型可以隨著時間的推移不斷改進這一事實中獲益。例如,他們可以增強“高速公路三葉草立交橋”模型,重新運行整個構(gòu)建過程,突然間整個星球上的所有高速公路立交橋都得到了改進。

3. 游戲制作中涉及的每一項資產(chǎn)都會有一個生成 AI 模型

到目前為止,像 Stable DiffusionMidjourney 這樣的 2 D 圖像生成器已經(jīng)抓住了生成 AI 的大部分流行興奮,因為它們可以生成具有引人注目的特性的圖像。但是,已經(jīng)存在適用于游戲中幾乎所有資產(chǎn)的生成式 AI 模型,從 3 D 模型到角色動畫,再到對話和音樂。這篇博文的后半部分包括一張市場地圖,突出顯示了一些專注于每種類型內(nèi)容的公司。

4. 內(nèi)容價格將大幅下降,在某些情況下實際上會降為零。

在與正在嘗試將生成 AI 集成到他們的生產(chǎn)流程中的游戲開發(fā)人員交談時,最令人興奮的是時間和成本的大幅減少。一位開發(fā)人員告訴我們,他們?yōu)閱蝹€圖像生成概念藝術(shù)的時間從開始到完成已從 3 周減少到一個小時。我們相信在整個生產(chǎn)流程中也可能實現(xiàn)類似的節(jié)省。

需要明確的是,藝術(shù)家沒有被取代的危險。這確實意味著藝術(shù)家不再需要自己完成所有工作:他們現(xiàn)在可以設(shè)定最初的創(chuàng)意方向,然后將大部分耗時和技術(shù)執(zhí)行交給人工智能。在這方面,他們就像手繪動畫早期的賽璐珞畫家,技藝高超的“墨水工”畫出動畫的輪廓,然后成本較低的“畫家”大軍會完成耗時的繪畫工作。動畫 cels,填充線條。它是游戲創(chuàng)建的“自動完成”。

5. 我們還處于這場革命的初級階段,很多實踐還需要完善

盡管最近很興奮,但我們?nèi)蕴幱谄鹋芫€上。在我們弄清楚如何將這項新技術(shù)用于游戲的過程中,還有大量的工作要做,并且將為迅速進入這一新領(lǐng)域的公司創(chuàng)造巨大的機會。

預(yù)測

鑒于這些假設(shè),以下是對游戲行業(yè)如何轉(zhuǎn)變的一些預(yù)測:

1. 學習如何有效地使用生成人工智能將成為一種有市場價值的技能

我們已經(jīng)看到一些實驗者比其他人更有效地使用生成人工智能。要充分利用這項新技術(shù),需要使用各種工具和技術(shù),并了解如何在它們之間靈活運用。我們預(yù)測這將成為一種適銷對路的技能,將藝術(shù)家的創(chuàng)意視野與程序員的技術(shù)技能相結(jié)合。

克里斯?安德森 (Chris Anderson) 有句名言:“每一次豐富都會造成新的稀缺?!彪S著內(nèi)容變得豐富,我們相信最短缺的是知道如何使用 AI 工具最有效地協(xié)作和工作的藝術(shù)家。

例如,將生成 AI 用于制作藝術(shù)品面臨著特殊的挑戰(zhàn),包括:

  • 連貫性。對于任何生產(chǎn)資產(chǎn),您都需要能夠在以后對資產(chǎn)進行更改或編輯。使用 AI 工具,這意味著需要能夠使用相同的提示重現(xiàn)資產(chǎn),這樣您就可以進行更改。這可能很棘手,因為相同的提示可能會產(chǎn)生截然不同的結(jié)果。
  • 風格。給定游戲中的所有藝術(shù)都具有一致的風格很重要——這意味著您的工具需要根據(jù)您給定的風格進行培訓或以其他方式綁定。

2. 降低壁壘將帶來更多的冒險精神和創(chuàng)造性探索

我們可能很快就會進入游戲開發(fā)的新“黃金時代”,在這個時代,較低的進入門檻會導(dǎo)致更多創(chuàng)新和創(chuàng)意游戲的爆發(fā)。不僅因為較低的制作成本導(dǎo)致較低的風險,還因為這些工具釋放了為更廣泛的受眾創(chuàng)建高質(zhì)量內(nèi)容的能力。這導(dǎo)致下一個預(yù)測……

3. 人工智能輔助的“微游戲工作室”興起

有了生成 AI 工具和服務(wù),我們將開始看到由只有 1 或 2 名員工的“微型工作室”制作出更多可行的商業(yè)游戲。小型獨立游戲工作室的想法并不新鮮——熱門游戲 Among Us 是由 Innersloth 工作室創(chuàng)建的,當時只有 5 名員工——但這些小型工作室可以創(chuàng)建的游戲的規(guī)模和規(guī)模將會增長。這將導(dǎo)致……

4. 每年發(fā)行的游戲數(shù)量增加

Unity 和 Roblox 的成功表明,提供強大的創(chuàng)意工具可以打造更多游戲。生成 AI 將進一步降低門檻,創(chuàng)造更多的游戲。該行業(yè)已經(jīng)面臨發(fā)現(xiàn)挑戰(zhàn)——僅去年一年就有超過 10,000 款游戲被添加到 Steam——這將給發(fā)現(xiàn)帶來更大的壓力。然而,我們也會看到……

5. 生成 AI 之前不可能創(chuàng)建的新游戲類型

我們將看到新的游戲類型的發(fā)明,如果沒有生成 AI,這些游戲類型根本不可能實現(xiàn)。我們已經(jīng)談到了微軟的飛行模擬器,但將會有全新的類型被發(fā)明出來,這些類型依賴于實時生成的新內(nèi)容。

考慮一下 Spellbrush 的 Arrowmancer。這是一款角色扮演游戲,以 AI 創(chuàng)建的角色為特色,提供幾乎無限的新游戲玩法。

我們還知道另一家游戲開發(fā)商正在使用 AI 讓玩家創(chuàng)建自己的游戲內(nèi)頭像。以前他們有一組手繪的頭像圖像,玩家可以混合搭配這些圖像來創(chuàng)建他們的頭像——現(xiàn)在他們完全拋棄了這一點,只是簡單地根據(jù)玩家的描述生成頭像圖像。讓玩家通過 AI 生成內(nèi)容比讓玩家從頭開始上傳自己的內(nèi)容更安全,因為可以訓練 AI 避免創(chuàng)建令人反感的內(nèi)容,同時仍然給玩家更大的主人翁感。

6. 價值將歸于行業(yè)特定的人工智能工具,而不僅僅是基礎(chǔ)模型

圍繞 Stable Diffusion 和 Midjourney 等基礎(chǔ)模型的興奮和熱議正在產(chǎn)生令人瞠目結(jié)舌的估值,但新研究的持續(xù)涌入確保了隨著新技術(shù)的改進,新模型將會出現(xiàn)和消失??紤] 3 種流行的生成 AI 模型的網(wǎng)站搜索流量:Dall-E、Midjourney 和 Stable Diffusion。每個新模型都會成為人們關(guān)注的焦點

另一種方法可能是構(gòu)建行業(yè)一致的工具套件,專注于特定行業(yè)的生成 AI 需求,深入了解特定受眾,并充分集成到現(xiàn)有的生產(chǎn)管道(例如 Unity 或 Unreal 游戲)。

一個很好的例子是 Runway,它通過視頻編輯、綠屏移除、修復(fù)和運動跟蹤等人工智能輔助工具來滿足視頻創(chuàng)作者的需求。像這樣的工具可以建立特定的受眾并從中獲利,隨著時間的推移添加新的模型。我們還沒有看到像 Runway 這樣的游戲套件出現(xiàn),但我們知道這是一個積極發(fā)展的空間。

7. 法律挑戰(zhàn)要來了

所有這些生成 AI 模型的共同點是它們是使用海量內(nèi)容數(shù)據(jù)集進行訓練的,這些數(shù)據(jù)集通常是通過抓取互聯(lián)網(wǎng)本身創(chuàng)建的。例如,Stable Diffusion 接受了超過 50 億個圖像/標題對的訓練,這些圖像/標題對是從網(wǎng)絡(luò)上抓取的。

目前這些模型聲稱在“合理使用”版權(quán)原則下運作,但這一論點尚未在法庭上得到明確檢驗。很明顯,法律挑戰(zhàn)即將到來,這可能會改變生成人工智能的格局。

大型工作室可能會通過建立基于他們擁有明確權(quán)利和所有權(quán)的內(nèi)部內(nèi)容的專有模型來尋求競爭優(yōu)勢。例如,微軟在這方面的地位尤其有利,目前擁有 23 個第一方工作室,在收購 Activision 后還有另外 7 個。

8. 編程不會像藝術(shù)內(nèi)容那樣受到嚴重破壞——至少現(xiàn)在還沒有

軟件工程是游戲開發(fā)的另一項主要成本,但正如我們 a16 z Enterprise 團隊的同事在他們最近的博客文章中分享的那樣,藝術(shù)并沒有死,它只是變成了機器生成的,使用 AI 模型生成代碼需要更多測試和驗證,因此與生成創(chuàng)意資產(chǎn)相比,生產(chǎn)力的提高較小。像 Copilot 這樣的編碼工具可能會為工程師提供適度的性能改進,但不會產(chǎn)生同樣的影響……至少在短期內(nèi)不會。

建議

基于這些預(yù)測,我們提出以下建議:

1. 現(xiàn)在開始探索生成式 AI

需要一段時間才能弄清楚如何充分利用即將到來的生成 AI 革命的力量?,F(xiàn)在開始的公司以后會有優(yōu)勢。我們知道有幾家工作室正在進行內(nèi)部實驗項目,以探索這些技術(shù)如何影響制作。

2. 尋找市場地圖機會

我們市場地圖的某些部分已經(jīng)非常擁擠,例如動畫或語音與對話,但其他領(lǐng)域則非常開放。我們鼓勵對這一領(lǐng)域感興趣的企業(yè)家將精力集中在尚未探索的領(lǐng)域,例如“游戲跑道”。

 

第二部分——市場地圖

市場現(xiàn)狀

我們已經(jīng)創(chuàng)建了一個市場地圖來捕獲我們在每個類別中發(fā)現(xiàn)的公司列表,我們在這些類別中看到生成 AI 影響游戲。這篇博文逐一介紹了這些類別,對其進行了更詳細的解釋,并重點介紹了每個類別中最令人興奮的公司。

2D 圖像

根據(jù)文本提示生成 2D 圖像已經(jīng)是生成人工智能應(yīng)用最廣泛的領(lǐng)域之一。Midjourney、Stable Diffusion 和 Dall-E 2 等工具可以從文本生成高質(zhì)量的 2D 圖像,并且已經(jīng)在游戲生命周期的多個階段進入游戲制作。

概念藝術(shù)

生成 AI 工具擅長“構(gòu)思”或幫助非藝術(shù)家(如游戲設(shè)計師)快速探索概念和想法以生成概念圖,這是制作過程的關(guān)鍵部分。例如,一個工作室(保持匿名)正在使用其中的幾個工具來從根本上加快他們的概念藝術(shù)過程,只需要一天就可以創(chuàng)建一個圖像,而以前需要長達 3 周的時間。

  • 首先,他們的游戲設(shè)計師使用 Midjourney 探索不同的想法并生成他們覺得鼓舞人心的圖像。
  • 這些被移交給專業(yè)的概念藝術(shù)家,他們將它們組裝在一起并在結(jié)果上繪畫以創(chuàng)建一個單一的連貫圖像——然后將其輸入到 Stable Diffusion 中以創(chuàng)建一系列變化。
  • 他們討論這些變化,選擇一個,手動繪制一些編輯——然后重復(fù)這個過程,直到他們對結(jié)果滿意為止。
  • 在那個階段,最后一次將此圖像傳回 Stable Diffusion 以“升級”它以創(chuàng)建最終的藝術(shù)作品。

2D 制作藝術(shù)

一些工作室已經(jīng)在嘗試使用相同的工具來制作游戲中的藝術(shù)品。例如,這里有一篇來自 Albert Bozesan 的精彩教程,介紹如何使用 Stable Diffusion 創(chuàng)建游戲中的 2 D 資產(chǎn)。

3D 藝術(shù)品

3D 資產(chǎn)是所有現(xiàn)代游戲以及即將到來的元宇宙的基石。虛擬世界或游戲關(guān)卡本質(zhì)上只是 3D 資產(chǎn)的集合,經(jīng)過放置和修改以填充環(huán)境。然而,創(chuàng)建 3D 資產(chǎn)比創(chuàng)建 2D 圖像更復(fù)雜,并且涉及多個步驟,包括創(chuàng)建 3D 模型和添加紋理和效果。對于動畫角色,它還涉及創(chuàng)建內(nèi)部“骨架”,然后在該骨架之上創(chuàng)建動畫。

我們看到幾家不同的初創(chuàng)公司在這個 3D 資產(chǎn)創(chuàng)建過程的每個階段都在努力,包括模型創(chuàng)建、角色動畫和關(guān)卡構(gòu)建。然而,這還不是一個已解決的問題——還沒有任何解決方案準備好完全集成到生產(chǎn)中。

3D 資產(chǎn)

試圖解決 3 D 模型創(chuàng)建問題的初創(chuàng)公司包括 Kaedim、Mirage 和 Hypothetic。更大的公司也在關(guān)注這個問題,包括 Nvidia 的 Get3 D 和 Autodesk 的 ClipForge。Kaedim 和 Get3 d 專注于圖像到 3 D(image-to-3 D);ClipForge 和 Mirage 專注于文本到 3 D(text-to-3 D),而 Hypothetic 對文本到 3 D(text-to-3 D)搜索以及圖像到 3 D(image-to-3 D)都感興趣。

3D 紋理

3D 模型的逼真度取決于應(yīng)用于網(wǎng)格的紋理或材料。決定將哪種長滿苔蘚、風化的石頭紋理應(yīng)用于中世紀城堡模型可以完全改變場景的外觀和感覺。紋理包含關(guān)于光如何對材料做出反應(yīng)的元數(shù)據(jù)(即粗糙度、光澤度等)。允許藝術(shù)家根據(jù)文本或圖像提示輕松生成紋理對于提高創(chuàng)作過程中的迭代速度非常有價值。幾個團隊正在尋求這個機會,包括 BariumAI、Ponzu 和 ArmorLab。

動畫

創(chuàng)建出色的動畫是游戲創(chuàng)建過程中最耗時、最昂貴且最需要技巧的部分之一。降低成本并創(chuàng)建更逼真的動畫的一種方法是使用動作捕捉,您可以讓演員或舞者穿上動作捕捉服,并記錄他們在配備特殊儀器的動作捕捉舞臺上的移動。

我們現(xiàn)在看到了可以直接從視頻中捕捉動畫的生成 AI 模型。這樣效率更高,既因為它消除了對昂貴的動作捕捉裝備的需求,也因為這意味著您可以從現(xiàn)有視頻中捕捉動畫。這些模型的另一個令人興奮的方面是,它們還可以用于對現(xiàn)有動畫應(yīng)用過濾器,例如讓它們看起來喝醉了、老了或開心了。進入這一領(lǐng)域的公司包括 Kinetix、DeepMotion、RADiCAL、Move Ai 和 Plask。

關(guān)卡設(shè)計和世界建設(shè)

游戲創(chuàng)作中最耗時的一個方面是構(gòu)建游戲世界,生成 AI 應(yīng)該非常適合這項任務(wù)。Minecraft、No Man’s Sky 和 ??Diablo 等游戲已經(jīng)以使用程序技術(shù)生成關(guān)卡而聞名,其中關(guān)卡是隨機創(chuàng)建的,每次都不同,但遵循關(guān)卡設(shè)計師制定的規(guī)則。新的 Unreal 5 游戲引擎的一大賣點是其用于開放世界設(shè)計的程序工具集,例如植被放置。

我們已經(jīng)看到該領(lǐng)域的一些舉措,例如 Promethean、MLXAR 或 Meta 的 Builder Bot,并且認為生成技術(shù)在很大程度上取代程序技術(shù)只是時間問題。該領(lǐng)域的學術(shù)研究已經(jīng)有一段時間了,包括 Minecraft 的生成技術(shù)或 Doom 的關(guān)卡設(shè)計。

期待用于關(guān)卡設(shè)計的生成式 AI 工具的另一個令人信服的理由是能夠創(chuàng)建不同風格的關(guān)卡和世界。你可以想象在 1920 年的紐約拍板時代要求工具生成一個世界,對比反烏托邦的銀翼殺手式未來,對比托爾金式的幻想世界。

以下概念是由 Midjourney 使用“一個游戲級別……風格”這個提示生成的。

 

音頻

聲音和音樂是游戲體驗的重要組成部分。我們開始看到公司使用 Generative AI 來生成音頻,以補充圖形方面已經(jīng)發(fā)生的工作。

聲音特效

音效是 AI 極具吸引力的開放領(lǐng)域。已有學術(shù)論文探索使用 AI 在電影中生成“foley”(例如腳步聲)的想法,但游戲中的商業(yè)產(chǎn)品還很少。

我們認為這只是時間問題,因為游戲的交互性使其成為生成 AI 的明顯應(yīng)用,既可以在制作過程中創(chuàng)建靜態(tài)音效(“激光槍聲,星球大戰(zhàn)風格”),又在運行時創(chuàng)建實時交互式音效。

考慮為玩家角色生成腳步聲這樣簡單的事情。大多數(shù)游戲通過包含少量預(yù)先錄制的腳步聲來解決這個問題:在草地上行走、在礫石上行走、在草地上奔跑、在礫石上奔跑等。生成和管理這些聲音很乏味,并且在運行時聽起來重復(fù)且不真實。

更好的方法是實時生成擬音效果的 AI 模型,它可以動態(tài)生成適當?shù)囊粜?,每次都略有不同,對游戲中的參?shù)(如地面、角色體重、步態(tài)、鞋類等

音樂

音樂一直是游戲的挑戰(zhàn)。這很重要,因為它可以像在電影或電視中一樣幫助設(shè)定情感基調(diào),但由于游戲可以持續(xù)數(shù)百甚至數(shù)千小時,它很快就會變得重復(fù)或煩人。此外,由于游戲的互動性,音樂可能很難在任何給定時間精確匹配屏幕上發(fā)生的事情。

二十多年來,自適應(yīng)音樂一直是游戲音頻領(lǐng)域的一個話題,一直追溯到微軟用于創(chuàng)建互動音樂的“DirectMusic”系統(tǒng)。DirectMusic 從未被廣泛采用,主要是因為以這種格式進行創(chuàng)作很困難。只有少數(shù)游戲,如 Monolith 的 No One Lives Forever,創(chuàng)造了真正的互動配樂。

現(xiàn)在我們看到許多公司正在嘗試創(chuàng)建 AI 生成的音樂,例如 Soundful、Musico、Harmonai、Infinite Album 和 Aiva。雖然今天的一些工具,如 Open AI 的 Jukebox,計算密集度很高,不能實時運行,但大多數(shù)都可以在初始模型構(gòu)建后實時運行。

語音和對話

有大量公司試圖為游戲中的角色創(chuàng)造逼真的聲音??紤]到嘗試通過語音合成為計算機提供聲音的悠久歷史,這并不奇怪。這些公司包括 Sonantic、Coqui、Replica Studios、Resemble.ai、Readspeaker.ai 等等。

使用生成 AI 進行語音有多種優(yōu)勢,這在一定程度上解釋了為什么這個領(lǐng)域如此擁擠。

即時生成對話。通常游戲中的語音是由配音演員預(yù)先錄制的,但這些僅限于預(yù)先錄制的錄音語音。通過生成 AI 對話,角色可以說任何話——這意味著他們可以對玩家的行為做出充分的反應(yīng)。結(jié)合用于 NPC 的更智能的 AI 模型(不在本博客的范圍內(nèi),但現(xiàn)在是一個同樣令人興奮的創(chuàng)新領(lǐng)域),對玩家完全反應(yīng)的游戲的承諾即將到來。

  • 角色扮演。許多玩家想扮演與他們在現(xiàn)實世界中的身份幾乎沒有相似之處的奇幻角色。然而,一旦玩家用自己的聲音說話,這種幻想就會破滅。使用與玩家頭像相匹配的生成聲音可以保持這種錯覺。
  • 控制。生成語音時,您可以控制聲音的細微差別,如音色、音調(diào)變化、情感共鳴、音素長度、重音等。
  • 本土化。允許將對話翻譯成任何語言并以相同的聲音說出來。像 Deepdub 這樣的公司專門專注于這個利基市場。

NPC 或玩家角色

許多初創(chuàng)公司正在考慮使用生成式 AI 來創(chuàng)建可以與之互動的可信角色,部分原因是這是一個在游戲之外具有如此廣泛適用性的市場,例如虛擬助理或接待員。

創(chuàng)造可信角色的努力可以追溯到 AI 研究的開端。事實上,經(jīng)典的人工智能“圖靈測試”的定義是,人類應(yīng)該無法區(qū)分與人工智能和人類的聊天對話。

目前,有數(shù)百家公司在構(gòu)建通用聊天機器人,其中許多由類似 GPT-3 的語言模型提供支持。少數(shù)人專門嘗試構(gòu)建以娛樂為目的的聊天機器人,例如試圖構(gòu)建虛擬朋友的 Replika 和 Anima。正如電影《她》中探討的那樣,與虛擬女友約會的概念可能比您想象的更接近。

我們現(xiàn)在看到了這些聊天機器人平臺的下一次迭代,例如 Charisma.ai、Convai.com 或 Inworld.ai,旨在為完全渲染的 3 D 角色提供動力、情感和代理,并提供工具讓創(chuàng)作者提供這些人物目標。如果他們要融入游戲或在推進情節(jié)中有一個敘事位置,而不是純粹的門面裝飾,這一點很重要。

多合一平臺

Runwayml.com 是最成功的生成 AI 工具之一,因為它在一個軟件包中匯集了廣泛的創(chuàng)作者工具套件。目前還沒有這樣的視頻游戲平臺,我們認為這是一個被忽視的機會。我們很樂意投資具有以下特點的解決方案:

  • 涵蓋整個生產(chǎn)過程的全套人工智能生成工具。(代碼、資產(chǎn)生成、紋理、音頻、描述等)
  • 與 Unreal 和 Unity 等流行游戲引擎緊密集成。
  • 旨在適應(yīng)典型的游戲制作流程。

 

結(jié)論

對于游戲創(chuàng)作者來說,這是一個不可思議的時刻!部分歸功于這篇博文中描述的工具,生成構(gòu)建游戲所需的內(nèi)容從未如此簡單——即使您的游戲與整個地球一樣大!

甚至有一天可以想象一款完全個性化的游戲,完全根據(jù)玩家的需求為玩家打造。這在科幻小說中已經(jīng)存在很長時間了——比如《安德的游戲》中的“AI 智力游戲”,或者《星際迷航》中的全息甲板。但是隨著這篇博文中描述的工具發(fā)展得如此之快,不難想象這一現(xiàn)實指日可待。

? 版權(quán)聲明

相關(guān)文章