支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

AIGC行業(yè)資訊1年前 (2024)發(fā)布 zhang

潞晨 Open-sora 團(tuán)隊(duì)在?720p 高清文生視頻質(zhì)量和生成時(shí)長上實(shí)現(xiàn)了突破性進(jìn)展，支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，令人驚喜的是，他們選擇再給開源社區(qū)帶來億點(diǎn)點(diǎn)震撼，繼續(xù)全部開源。

開源地址：https://github.com/hpcAItech/Open-Sora

通過他們的模型權(quán)重，能夠生成各種酷炫的短片，比如海浪和海螺的親密接觸，還有那些深不可測的森林秘境。

支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

人物肖像的渲染也相當(dāng)逼真。

還能精準(zhǔn)渲染賽博朋克風(fēng)，讓短片瞬間充滿強(qiáng)烈的未來感和科技感。

^{? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖片經(jīng)過壓縮。}

也能生成有趣生動的動畫鏡頭，帶來極具表現(xiàn)力的視覺體驗(yàn)。

^{? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖片經(jīng)過壓縮。}

即使是電影級別的鏡頭制作，也能輕松應(yīng)對。

例如，實(shí)現(xiàn)流暢的變焦效果，為影片增添專業(yè)級的視覺效果。支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

^{? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖片經(jīng)過壓縮。}

還能幫助電影制作人員創(chuàng)造出逼真的電影鏡頭。支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

^{? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖片經(jīng)過壓縮。}

潞晨的 Open-Sora 模型以其卓越的性能揭示了視頻生成領(lǐng)域的廣闊前景，而他們的模型權(quán)重和訓(xùn)練代碼已經(jīng)全面開源，感興趣的朋友可以訪問他們的 GitHub 地址：https://github.com/hpcaitech/Open-Sora

文生視頻界的開源戰(zhàn)士

LambdaLabs，美國科技界獨(dú)角獸，基于潞晨團(tuán)隊(duì)先前開源的 Open-Sora 模型權(quán)重打造了一個數(shù)字樂高宇宙，樂高迷們在這里找到了極致的創(chuàng)意體驗(yàn)。

潞晨團(tuán)隊(duì)深諳開源對于文生視頻技術(shù)突破的加速度，他們不僅持續(xù)開源模型權(quán)重，還在 Github 上曬出了技術(shù)路線，讓每個玩家都能成為文生視頻大模型的掌控者，不再是單純的圍觀群眾。報(bào)告一出爐，我們就火速進(jìn)行了深度挖掘和解析，試圖捕捉文生視頻技術(shù)的最新動向。（報(bào)告地址：https://github.com/hpcaitech/Open-Sora/blob/main/docs/report_03.md）

技術(shù)深度解碼

在潞晨 OpenSora 團(tuán)隊(duì)發(fā)布的這份技術(shù)報(bào)告中，他們深度剖析了本次模型訓(xùn)練的核心和關(guān)鍵。在上一個版本基礎(chǔ)上，引入了視頻壓縮網(wǎng)絡(luò)（Video Compression Network）、更優(yōu)的擴(kuò)散模型算法、更多的可控性，并利用更多的數(shù)據(jù)訓(xùn)練出了 1.1B 的擴(kuò)散生成模型。

在這個 “算力為王” 的時(shí)代，我們深知視頻模型訓(xùn)練的兩大痛點(diǎn)：計(jì)算資源的巨大消耗與模型輸出質(zhì)量的高標(biāo)準(zhǔn)。潞晨 Open-Sora 團(tuán)隊(duì)以一種極簡而有效的方案，成功地在成本和質(zhì)量之間找到了平衡點(diǎn)。

OpenSora 團(tuán)隊(duì)提出了一個創(chuàng)新的視頻壓縮網(wǎng)絡(luò)（VAE），該網(wǎng)絡(luò)在空間和時(shí)間兩個維度上分別進(jìn)行壓縮。具體來說，他們首先在空間維度上進(jìn)行了 8×8 倍的壓縮，接著在時(shí)間維度上進(jìn)一步壓縮了 4 倍。通過這種創(chuàng)新的壓縮策略，既避免了因抽幀而犧牲視頻流暢度的弊端，又大幅降低了訓(xùn)練成本，實(shí)現(xiàn)了成本與質(zhì)量的雙重優(yōu)化。支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

^{? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?視頻壓縮網(wǎng)絡(luò)結(jié)構(gòu)}

Stable Diffusion 3，最新的擴(kuò)散模型，通過采用了 rectified flow 技術(shù)替代 DDPM，顯著提升了圖片和視頻生成的質(zhì)量。盡管 SD3 的 rectified flow 訓(xùn)練代碼尚未公開，但潞晨 Open-Sora 團(tuán)隊(duì)已經(jīng)基于 SD3 的研究成果，提供了一套完整的訓(xùn)練解決方案，包括：

簡單易用的整流（rectified flow）訓(xùn)練
用于訓(xùn)練加速的 Logit-norm 時(shí)間步長采樣
基于分辨率和視頻長度的時(shí)間步長采樣

通過這些技術(shù)的整合，我們不僅能夠加快模型的訓(xùn)練速度，還能顯著減少推理階段的等待時(shí)間，確保用戶體驗(yàn)的流暢性。此外，這套訓(xùn)練方案還支持在推理過程中輸出多種視頻寬高比，滿足了多樣化場景下的視頻素材需求，為視頻內(nèi)容創(chuàng)作者提供了更加豐富的創(chuàng)作工具。

他們在報(bào)告中也透露了更多關(guān)于模型訓(xùn)練的核心細(xì)節(jié)，包括數(shù)據(jù)清洗和模型調(diào)優(yōu)的實(shí)用技巧，以及構(gòu)建了更完善的模型評估體系，保障模型的穩(wěn)健性和泛化能力。他們還提供了可以自行一鍵部署的 Gradio 應(yīng)用，并支持調(diào)節(jié)輸出的運(yùn)動分?jǐn)?shù)、美學(xué)分?jǐn)?shù)和鏡頭移動方式等參數(shù)，甚至可以一鍵通過 GPT-4o 自動修改指令并支持中文輸入。要忍不住 get hands dirty 了，詳情請戳 https://github.com/hpcaitech/Open-Sora/blob/main/docs/report_03.md

打破閉環(huán)，開源賦能

自 OpenAI Sora 發(fā)布以來，業(yè)界對 Sora 的開放性期待值爆表，但現(xiàn)實(shí)卻是持續(xù)的等待游戲。潞晨 Open-Sora 的開源，為文生視頻的創(chuàng)新和發(fā)展注入了強(qiáng)勁的活力?！笆谌艘贼~不如授人以漁”，訪問他們的 github 地址，即可零門檻免費(fèi)獲得模型權(quán)重和全套訓(xùn)練代碼，這使用戶從被動的內(nèi)容消費(fèi)者轉(zhuǎn)變?yōu)榉e極的內(nèi)容創(chuàng)造者。這一轉(zhuǎn)型為企業(yè)用戶解鎖了自主開發(fā)文生視頻應(yīng)用的新技能，無論是打造沉浸式游戲、創(chuàng)意廣告還是制作影視大片，文生視頻技術(shù)的應(yīng)用場景得到了指數(shù)級擴(kuò)展。支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

我們期待這股星星之火，能夠點(diǎn)燃整個文生視頻領(lǐng)域的創(chuàng)新激情，實(shí)現(xiàn)從點(diǎn)到面的燎原之勢。

最后附上潞晨 OpenSora 開源鏈接：https://github.com/hpcaitech/Open-Sora

^{參考鏈接：}

^{https://wandb.ai/lambdalabs/lego/reports/Text2Bricks-Fine-tuning-Open-Sora-in-1-000-GPU-Hours–Vmlldzo4MDE3MTky}

^{https://hpc-ai.com/blog/open-sora-from-hpc-ai-tech-team-continues-open-source-generate-any-16-second-720p-hd-video-with-one-click-model-weights-ready-to-use}

# AIGC行業(yè)資訊 # AI # Diffusion # GPT # GPU # OpenAI # sora # VAE # 代碼 # 創(chuàng)新 # 圖片 # 大模型 # 宇宙 # 工具 # 技術(shù)突破 # 文生視頻 # 最新 # 生成模型 # 研究成果 # 自動 # 視頻 # 視頻生成

? 版權(quán)聲明

本文轉(zhuǎn)載自互聯(lián)網(wǎng)、僅供學(xué)習(xí)交流，內(nèi)容版權(quán)歸原作者所有，如涉作品、版權(quán)或其它疑問請聯(lián)系AIGC工具導(dǎo)航或點(diǎn)擊刪除。

亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

2024北京養(yǎng)老服務(wù)行業(yè)發(fā)展四季青論壇將發(fā)布全國首個養(yǎng)老行業(yè)千億大模型

AI視頻老牌選手Runway出手了，深夜發(fā)布Gen-3，畫面細(xì)節(jié)直接到達(dá)了電影級畫質(zhì)

相關(guān)文章

領(lǐng)新人體驗(yàn)大禮包

熱門文章

熱門網(wǎng)址

亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

2024北京養(yǎng)老服務(wù)行業(yè)發(fā)展四季青論壇將發(fā)布全國首個養(yǎng)老行業(yè)千億大模型

AI視頻老牌選手Runway出手了，深夜發(fā)布Gen-3，畫面細(xì)節(jié)直接到達(dá)了電影級畫質(zhì)

相關(guān)文章

領(lǐng)新人體驗(yàn)大禮包

熱門文章

熱門網(wǎng)址

支持無縫產(chǎn)出任意風(fēng)格的高質(zhì)量短片，并且全部開源。

AI視頻老牌選手Runway出手了，深夜發(fā)布Gen-3，畫面細(xì)節(jié)直接到達(dá)了電影級畫質(zhì)