OpenAI發(fā)布首個文生視頻模型Sora,顛覆AI視頻生成市場格局 在2月16日凌晨,沒有任何預兆和消息透露的情況下,OpenAI突然發(fā)布了自己的首個文生視頻模型:Sora。這一重大突破不僅大幅刷新了行業(yè)多個指標,更是重新定義了AI文生視頻在現(xiàn)階段的技術(shù)極限,顛覆了生成式AI在視頻領(lǐng)域的全球市場格局。 Sora的發(fā)布,標志著OpenAI在AI視頻生成領(lǐng)域的一大突破。該模型使用Transformer架構(gòu),建立在DALL·E 3和GPT模型之上,可以生成長達一分鐘的有運動、多機位視頻。相比業(yè)界水平,Sora將視頻生成的時長一次性提升了15倍,直接邁過了市面上所有短視頻的時長要求。 更令人驚嘆的是,Sora還帶有世界模型的特質(zhì)。世界模型不是AI視頻生成的必須要素,卻是這個領(lǐng)域較為高端的一個研究方向。所謂世界模型,是要對真實的物理世界進行建模,讓機器像人類一樣,對世界有一個全面而準確的認知。視頻與文字不同,大多數(shù)是在描繪一個主體,在一個真實或虛構(gòu)的物理世界中的動作,因此,世界模型會讓AI視頻生成更流暢、更符合邏輯,降低視頻模型的訓練成本,提升訓練效率。同時,世界模型也為生成式AI真正進入自動駕駛行業(yè)鋪好了路。 此次,Sora的世界模型,已經(jīng)能幫助它還原一輛越野車在山區(qū)小路上的行駛情況,在視頻中添加逼近真實的傾斜和顛簸感。然而,Sora的世界模型仍有非常多的問題,比如,一塊餅干被咬過之后,卻沒有留下咬痕。OpenAI非常實在,把這些問題都寫在了官網(wǎng)上。 目前,Sora僅開放給了少部分人進行內(nèi)測,據(jù)稱是一些視覺藝術(shù)家、設(shè)計師和電影制作人。同時,OpenAI內(nèi)部仍在進行模型倫理側(cè)的對抗性測試,比如錯誤信息、仇恨內(nèi)容、偏見內(nèi)容,至于色情暴力,則會在文本輸入時,就被拒絕掉。 對于Sora,今天的我們,必須注意到幾個顯而易見的推論: 首先,OpenAI一拳打在了所有人的肝上:全球的AI視頻生成賽道投資邏輯,乃至相關(guān)企業(yè)的生存邏輯,在此刻都已經(jīng)改變了。未來一個季度內(nèi),如果該企業(yè)的視頻生成能力,仍然停留在4s,或?qū)е轮苯映鼍郑?/p> 其次,AI已經(jīng)快速邁過文生文、Chatbot時期,大步進軍視頻生成領(lǐng)域:當下最火的短視頻、短劇,將迎接AI的到來;那些卡在瓶頸上的領(lǐng)域,比如自動駕駛、智慧城市,或?qū)⒂瓉硗黄啤?/p> 最后,我們不應過度神話Sora或其他AI視頻生成工具,當下仍有巨量的技術(shù)、產(chǎn)品、商業(yè)問題等待解決;但也不要低估AI技術(shù)的進步速度,那個凝固在未來時光中、讓人看不清面貌的AGI(通用人工智能),正在向我們邁步。 總結(jié)來說,OpenAI發(fā)布的首個文生視頻模型Sora,無疑是AI視頻生成領(lǐng)域的一次重大突破。它的出現(xiàn),不僅顛覆了現(xiàn)有的市場格局,更為未來的AI發(fā)展打開了新的可能。 |
|
來自: 新用戶11015852 > 《待分類》