騰訊發(fā)布AI智能創(chuàng)作助手 “騰訊智影” AIGC時(shí)代加速到來
21世紀(jì)經(jīng)濟(jì)報(bào)道記者白楊 北京報(bào)道
3月30日,騰訊內(nèi)容平臺(tái)部副總經(jīng)理姚天恒在2023新榜大會(huì)上對(duì)外發(fā)布了騰訊AI智能創(chuàng)作助手“騰訊智影”。
姚天恒表示,“在內(nèi)容創(chuàng)作中,PGC的工業(yè)化規(guī)模產(chǎn)出和UGC的創(chuàng)意轉(zhuǎn)化一直是困擾創(chuàng)作者的核心難題,但AIGC的發(fā)展極大地提升了創(chuàng)作者的生產(chǎn)效率,從而對(duì)解決以上難題提供了可行的解決路徑。結(jié)合AI能力與人類創(chuàng)意,AIGC可以實(shí)現(xiàn)全鏈路閉環(huán)的人機(jī)協(xié)作,包括內(nèi)容創(chuàng)意、觀點(diǎn)確立、素材生成、內(nèi)容潤色和制作等”。

騰訊智影提供的創(chuàng)作工具 圖自騰訊智影官網(wǎng)
據(jù)其介紹,騰訊智影主要提供“人”“聲”“影”三個(gè)方面的能力。其中在“人”的方面,“智影數(shù)字人”是騰訊智影最核心的功能。用戶可通過輸入文本或音頻內(nèi)容,即可生成數(shù)字人播報(bào)視頻。
除了使用騰訊智影開放的數(shù)十款風(fēng)格多元的數(shù)字人,智影數(shù)字人還能實(shí)現(xiàn)“形象克隆”,用戶通過上傳少量圖片、視頻素材,就能得到自己的數(shù)字人分身。
在“聲”的方面,騰訊智影則提供了文本配音、音色定制、智能變聲等功能。據(jù)姚天恒介紹,騰訊智影文本配音功能提供了上百種音色可供選擇,輸入文本即可生成自然語音,適用于新聞播報(bào)、短視頻創(chuàng)作、有聲小說各種場景。
通過語音識(shí)別和文本順滑能力,騰訊智影能夠?qū)崿F(xiàn)自動(dòng)化去除冗余詞;在音頻改寫方面,通過聲音克隆和音頻訓(xùn)練等技術(shù),騰訊智影可以把原視頻中的部分語句進(jìn)行修改。另外創(chuàng)作者還可以通過騰訊智影的變聲技術(shù),在保留原始韻律的情況下,將音頻轉(zhuǎn)換為指定人聲。
在“影”的方面,姚天恒指出,AIGC的文本自動(dòng)生成視頻技術(shù),是一項(xiàng)革命性的技術(shù)創(chuàng)新,為視頻產(chǎn)業(yè)帶來了前所未有的機(jī)遇和挑戰(zhàn)。與傳統(tǒng)視頻制作方式相比,AIGC技術(shù)大幅提升了視頻內(nèi)容的生產(chǎn)效率和質(zhì)量,同時(shí)也為創(chuàng)作者提供了更多的創(chuàng)意空間和自由度。
比如,通過騰訊智影文章轉(zhuǎn)視頻能力,創(chuàng)作者可以直接將自己撰寫的文字轉(zhuǎn)化為視頻內(nèi)容,無需進(jìn)行繁瑣的素材收集和處理;此外,騰訊智影分段式的素材呈現(xiàn)方式,讓創(chuàng)作者可以快速處理分鏡、添加卡點(diǎn)、濾鏡、特效等,從而大大縮短視頻制作的周期和成本。
21世紀(jì)經(jīng)濟(jì)報(bào)道記者通過騰訊智影官網(wǎng)了解到,該平臺(tái)目前只開放了部分AI創(chuàng)作功能供用戶免費(fèi)使用,其余大部分功能都需要付費(fèi)。

騰訊智影的會(huì)員服務(wù) 圖自騰訊智影官網(wǎng)
比如免費(fèi)版,可以獲得每個(gè)月5分鐘的免費(fèi)數(shù)字人生成視頻時(shí)長,每天3次的智能工具使用等;398元一的年高級(jí)會(huì)員是每個(gè)月10分鐘的數(shù)字人生成視頻時(shí)長或高級(jí)+專業(yè)音色的文本配音服務(wù)二選一,以及每天50次的智能工具等。
而在數(shù)字人定制上,目前照片定制數(shù)字人形象的價(jià)格為首年3999元,視頻定制數(shù)字人形象的價(jià)格為首年7999元。
記者通過免費(fèi)版賬號(hào)測試了部分功能,包括數(shù)字人播報(bào)、文章轉(zhuǎn)視頻等。在時(shí)長較短的情況下,數(shù)字人內(nèi)容的生成速度還比較快,數(shù)字人的表達(dá)也比較自然。不過文章轉(zhuǎn)視頻生成的內(nèi)容,和文字描述有較大的差異,需要人工進(jìn)一步調(diào)整。
對(duì)于未來的發(fā)展計(jì)劃,姚天恒表示,騰訊智影將進(jìn)一步加強(qiáng)對(duì)AIGC技術(shù)的研究和探索,不斷挖掘其潛在的應(yīng)用價(jià)值和可能性,在價(jià)格與易用性上降低數(shù)字人及聲音定制等產(chǎn)品的使用門檻。