亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

中國公司又把:數(shù)字人開源了,1張照片即可生成高清視頻

AIGC行業(yè)資訊4個(gè)月前發(fā)布 管理員
39 0
AI開源的風(fēng),又刮到了數(shù)字人領(lǐng)域。
3月9日,硅基智能旗下數(shù)字人模型HeyGem.AI宣布開源,截至目前,該模型在GitHub上已獲得超過1.3k Stars。
中國公司又把:數(shù)字人開源了,1張照片即可生成高清視頻
作為當(dāng)下AI行業(yè)為數(shù)不多能夠找到PMF(產(chǎn)品市場匹配)的領(lǐng)域,數(shù)字人已經(jīng)讓很多企業(yè)賺到大錢。例如專注海外市場的中國數(shù)字人企業(yè)HeyGen,在去年年中就宣布實(shí)現(xiàn)ARR(年度經(jīng)常性收入)3500萬美元。
因此,市面上好用的數(shù)字人產(chǎn)品基本都是付費(fèi),開源產(chǎn)品效果相對不佳。
但是HeyGem作為一個(gè)非常輕量化的開源免費(fèi)產(chǎn)品,從演示視頻來看效果非常不錯(cuò),其官方簡介也將自己稱為HeyGen平替。
此次開源的HeyGem.AI模型,通過“1秒視頻或1張照片”的輸入,可以實(shí)現(xiàn)30秒克隆形象與聲音、60秒生成4K超清視頻,并在復(fù)雜場景下仍能保持100%口型匹配及多表情動(dòng)作輸出,性能達(dá)全球TOP級水平。
技術(shù)層面,該模型的推理速度達(dá)1:0.5,32幀/秒超高清4K輸出,超越電影級標(biāo)準(zhǔn)。
同時(shí),模型支持Docker一鍵部署,最低Nvidia 1080Ti顯卡即可運(yùn)行。可一鍵安裝于Windows和Linux系統(tǒng),在本地實(shí)現(xiàn)完整的數(shù)字人克隆和視頻合成,無需額外的算力投入。
值得注意的是,此次硅基智能在GitHub開源硅基數(shù)字人克隆模型的同時(shí),特別提供了硅基數(shù)字人克隆同名軟件安裝包,使得即便是缺乏編程經(jīng)驗(yàn)的用戶,也能在本地環(huán)境中一鍵安裝并直接使用,實(shí)現(xiàn)了零代碼門檻。
正是由于這種高質(zhì)量、低門檻的表現(xiàn),HeyGem.ai被視為首個(gè)開源免費(fèi)的商用級別克隆數(shù)字人模型。對于規(guī)模巨大的電商行業(yè)來說,這無疑是一個(gè)新的營銷利器。
那么HeyGem.ai開源且好用的原因何在?
值得注意的是,硅基智能在底層技術(shù)路線上與其它產(chǎn)品有所區(qū)別。
硅基智能成立于2017年8月,總部位于中國南京,早在生成式AI技術(shù)火爆之前就已經(jīng)布局?jǐn)?shù)字人技術(shù),其底層模型專為數(shù)字人打造,并非sora這類通用視頻生成模型,在成本端擁有天然優(yōu)勢。
而硅基智能方面也向觀察者網(wǎng)透露,既然選擇開源,就代表了技術(shù)上的自信,意味著公司將來還能夠不斷拿出更好的產(chǎn)品。
硅基智能創(chuàng)始人司馬華鵬表示,硅基智能成立之初就確立了為世界造出1億硅基生命的使命,這次開源就是為了加速這個(gè)使命的達(dá)成。
事實(shí)上,HeyGem.ai并非憑空出現(xiàn),早在2024年5月硅基智能就已率先開源了全球首個(gè)2D真人級別、支持AIGC實(shí)時(shí)渲染的數(shù)字人模型代碼——duix.ai。在GitHub上線以來,已獲得超過4.5k Stars。同年8月,硅基智能推出高保真、實(shí)時(shí)Face swap算法ReHiFace-S,只需一張照片,無需任何數(shù)據(jù)訓(xùn)練,一鍵即可將視頻中的部替換為你選擇的人物形象。
在實(shí)際應(yīng)用中,硅基數(shù)字人克隆能夠通過語音文字輸入驅(qū)動(dòng),克隆后的數(shù)字人音色支持英、日、韓、中、法、德、阿拉伯和西班牙語這8種語言輸出,為跨國企業(yè)、在線教育、影視制作、直播營銷等多場景提供了高效、低成本的解決方案。
但在技術(shù)之外,面對由字節(jié)跳動(dòng)等大公司推出的即夢、剪映等產(chǎn)品的競爭,對于硅基智能這類垂直企業(yè),以開源方式盡快搶占市場并搭建開發(fā)者生態(tài),或許也是商業(yè)層面必須要做出的選擇。
? 版權(quán)聲明

相關(guān)文章