【原】OpenAI發(fā)布首個文生視頻模型Sora，顛覆AI視頻生成市場格局

新用戶11015852 2024-02-16 發(fā)布于廣東

展開全文

OpenAI發(fā)布首個文生視頻模型Sora，顛覆AI視頻生成市場格局

在2月16日凌晨，沒有任何預兆和消息透露的情況下，OpenAI突然發(fā)布了自己的首個文生視頻模型：Sora。這一重大突破不僅大幅刷新了行業(yè)多個指標，更是重新定義了AI文生視頻在現(xiàn)階段的技術(shù)極限，顛覆了生成式AI在視頻領(lǐng)域的全球市場格局。

Sora的發(fā)布，標志著OpenAI在AI視頻生成領(lǐng)域的一大突破。該模型使用Transformer架構(gòu)，建立在DALL·E 3和GPT模型之上，可以生成長達一分鐘的有運動、多機位視頻。相比業(yè)界水平，Sora將視頻生成的時長一次性提升了15倍，直接邁過了市面上所有短視頻的時長要求。

更令人驚嘆的是，Sora還帶有世界模型的特質(zhì)。世界模型不是AI視頻生成的必須要素，卻是這個領(lǐng)域較為高端的一個研究方向。所謂世界模型，是要對真實的物理世界進行建模，讓機器像人類一樣，對世界有一個全面而準確的認知。視頻與文字不同，大多數(shù)是在描繪一個主體，在一個真實或虛構(gòu)的物理世界中的動作，因此，世界模型會讓AI視頻生成更流暢、更符合邏輯，降低視頻模型的訓練成本，提升訓練效率。同時，世界模型也為生成式AI真正進入自動駕駛行業(yè)鋪好了路。

此次，Sora的世界模型，已經(jīng)能幫助它還原一輛越野車在山區(qū)小路上的行駛情況，在視頻中添加逼近真實的傾斜和顛簸感。然而，Sora的世界模型仍有非常多的問題，比如，一塊餅干被咬過之后，卻沒有留下咬痕。OpenAI非常實在，把這些問題都寫在了官網(wǎng)上。

目前，Sora僅開放給了少部分人進行內(nèi)測，據(jù)稱是一些視覺藝術(shù)家、設(shè)計師和電影制作人。同時，OpenAI內(nèi)部仍在進行模型倫理側(cè)的對抗性測試，比如錯誤信息、仇恨內(nèi)容、偏見內(nèi)容，至于色情暴力，則會在文本輸入時，就被拒絕掉。

對于Sora，今天的我們，必須注意到幾個顯而易見的推論：

首先，OpenAI一拳打在了所有人的肝上：全球的AI視頻生成賽道投資邏輯，乃至相關(guān)企業(yè)的生存邏輯，在此刻都已經(jīng)改變了。未來一個季度內(nèi)，如果該企業(yè)的視頻生成能力，仍然停留在4s，或?qū)е轮苯映鼍郑?/p>

其次，AI已經(jīng)快速邁過文生文、Chatbot時期，大步進軍視頻生成領(lǐng)域：當下最火的短視頻、短劇，將迎接AI的到來；那些卡在瓶頸上的領(lǐng)域，比如自動駕駛、智慧城市，或?qū)⒂瓉硗黄啤?/p>

最后，我們不應過度神話Sora或其他AI視頻生成工具，當下仍有巨量的技術(shù)、產(chǎn)品、商業(yè)問題等待解決；但也不要低估AI技術(shù)的進步速度，那個凝固在未來時光中、讓人看不清面貌的AGI（通用人工智能），正在向我們邁步。

總結(jié)來說，OpenAI發(fā)布的首個文生視頻模型Sora，無疑是AI視頻生成領(lǐng)域的一次重大突破。它的出現(xiàn)，不僅顛覆了現(xiàn)有的市場格局，更為未來的AI發(fā)展打開了新的可能。

贊賞

共11人贊賞

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：新用戶11015852 > 《待分類》

舉報/認領(lǐng)

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

新用戶11015852

生活領(lǐng)域優(yōu)質(zhì)作者

關(guān)注對話

TA的最新館藏

? 被自己寫的十倍回購代碼轟成渣
倉庫
《鯨落法則：當我的數(shù)字藏品背叛我之后》
?深海燈塔：云鯨西楓與共享紅利的浪潮
消費指數(shù)基金ETF研究報告：掘金“超級黃金坑”，把握復蘇輪動脈搏
《千萬女性選擇獨身：是解放還是危機？當代婚戀市場的殘酷真相》

喜歡該文的人也喜歡更多

熱門閱讀換一換