自從 Sora 畫了個大餅之后,似乎就再沒聽到什么新動靜,就像那個在朋友圈曬了張健身卡照片后,就再也沒見他去過健身房的哥們。 可別人都沒閑著,繼快手可靈前陣子發布之后,就在今天,智譜 AI 突然來了個大招——發布了文生視頻大模型 CogVideoX ,以及基于這一模型推出了 AI 視頻應用清影,這消息就像突然在朋友圈冒出的健身成果照,讓人眼前一亮。 Sora 的套路,就像是那個只會說“下次請你吃飯”但從沒兌現的朋友,而智譜這次可是來真的,上線就是全量開放,所有用戶都能用,同時支持網頁版和手機端,只要你把智譜清言更新到最新版本,人人開箱即可使用。 你所需要做的,就只是提供一個畫面描述,最快 30 秒,就能得到一個 6 秒的視頻,這操作,簡直就是請全城的人吃飯,你說誰受得了? 立馬翻身下床來玩一波,看看到底是個什么水平。 玩法主要分兩種,一種是就是圖生視頻,在圖片基礎上生成連貫的畫面。 還有一種文生視頻,這個玩法就是純念咒語,玩過 AI 繪圖的都知道。 圖生視頻 先說圖生視頻吧,這個功能最開始網友們就用來修復老照片,用 AI 技術把靜止的瞬間變得生動起來。 這個功能估計很多人都會感興趣,畢竟這類視頻在短視頻平臺上出了太多爆款,本來只是親人的一張靜止的老照片,可照片上的人突然沖你微微一笑,這回憶更加動感真切。 對了,這個讓老照片動起來的功能還有微信小程序版,只要你有手機,就能 0 門檻體驗這個玩法。 在微信里面搜索小程序:智譜清言,或者直接點右邊的鏈接智譜清言上傳老照片就能直接生成視頻。 來看看這些效果吧: 提示詞:圖中男子站起來,風吹起他的頭發 原本靜止的人,突然就緩緩站了起來,頭發被吹起來的細節也很精致。 提示詞:圖中的老奶奶戴起了耳機 奶奶戴耳機后還添加了搖頭晃腦的動作,莫名有一種喜感。 提示詞:老人掏出一個蘋果手機拍照。 這個手看著有一點瑕疵,不過大家注意人物的眼球,本來是看著畫面正前方,手機掏出來后,明顯把目光轉向了手機攝像頭,這細節就很合理。 提示詞:男人轉身離開 這個轉身還應該配上一句:男人轉身,消失在黑暗之中,是不是有點諜戰大片的意思了。 除了老照片,還有更多腦洞大開的玩法,最近很火的容嬤嬤喂紫薇吃東西、爾康戴墨鏡就是這么玩的。 提示詞:唐僧戴墨鏡 提示詞:爾康喝咖啡 提示詞:兩個女人跨屏擁抱 提示詞:女人戴墨鏡 玩了一番下來,我給大家總結了 2 個技巧。 1.選用盡可能清晰的圖片,如果原圖不夠清晰,會影響模型對圖片中角色的識別。 2.提示詞要簡單清晰,比如按照模板來寫:「主體」+「主題運動」+「背景」+「背景運動」。 這個主體就是你想動起來的人物,如果沒有主體, 就會出現崩壞的景象。 如果你不明確大模型如何理解你的圖片,你可以將照片發送到清言對話框進行識圖,明確你的【主體】該如何描述。 如果實在不知道在提示詞上怎么發揮,沒關系,智譜還有專門幫寫圖生視頻提示詞的智能體,把你的圖像主體甩給它,就能幫你寫出一個詳細的提示詞。 文生視頻 相比于圖生視頻來說,文生視頻的提示詞更加重要,玩過 AI 繪圖的都知道,這就是純念咒語,你只需要提供一些創意性的提示詞,清影就能根據這些詞生成視頻。 提示詞:末日來臨,穿著宇航服的航天員緩緩朝著飛船走去,眼神中透露著對地球的不舍,注意細節刻畫,廢土風 提示詞:低角度向上推進,緩緩抬頭,冰山上突然出現一條惡龍,然后惡龍發現你,沖向你。好萊塢電影風 提示詞:蘑菇變成小熊 提示詞:兩只小熊貓坐在竹林里吃蘋果,超近景,紀實風格 提示詞:兩只猴子在電腦前打工 提示詞:由移動的七彩魚。 發現了嗎,文生視頻咒語要比圖生視頻多了很多描述,這個不難理解,簡單的提示詞雖然也能生成視頻,但未必是你想要的效果。 比如你可以用這樣的提示詞:小男孩喝咖啡。 如果你對這個畫面的效果不滿意,那么就需要進階版的提示詞來約束 AI 往哪方面去使勁。 比如,來看看白金段位的高級提示詞:[鏡頭語言]+[光影]+[主體(主體描述)]+[主體運動]+[場景(場景描述)] +[情緒/氛圍風格] 還是小男孩喝咖啡這個例子,但是提示詞就要詳細多了: 攝影機平移(鏡頭移動),一個小男孩坐在公園的長椅上(主體描述),手里拿著一杯熱氣騰騰的咖啡(主體動作)。他穿著一件藍色的襯衫,看起來很愉快(主體細節描述),背景是綠樹成蔭的公園,陽光透過樹葉灑在男孩身上(所處環境描述)。 最后的視頻場景也更加真實,細節也更加豐富,不管是冒著熱氣的咖啡和還是斑駁的陽光,和實拍也沒什么差別。 最重要的是,這樣生成的視頻是最符合你要求的,也就是說,想要生成高質量的視頻,你得需要一個足夠詳細的分鏡腳本。 說到這里,你可能會覺得門檻太高,大可不必,說好的“人人都能用”,那就必須安排。 這次智譜還配套發布了清影智能體,你只需要一句話,就會給你一段細節豐富到極致的視覺大片腳本。 比如我就直接只輸入鋼鐵俠和天空兩個詞。 就能給你生成3個不同風格的提示詞。 所以說,有了這個智能體的加持,高級提示詞也沒有什么門檻,有手你就會。 玩了半天,總的感受是,清影在風景、動物、科幻、人文歷史等類型的視頻內容上生成的表現較好; 擅長生成的視頻風格包括皮克斯風格、卡通風格、攝影風格、動漫風格等; 鏡頭畫面實現效果最好的是近景,也就是特寫鏡頭。 實體類型呈現效果上看,動物 > 植物 > 物品 > 建筑 > 人物。 當然,現階段 AI 生成視頻都是需要多次抽卡的,如果生成的視頻不夠理想,那就從上面的這些小建議里去修改提示詞,多次調教后就會得到你滿意的效果。 畢竟這是發布的第一版產品,按照目前的進度,相信后續優化已經在路上了。 對了,都知道,沒有 BGM 的視頻是沒有靈魂的,單純的視頻無疑會少了很多氛圍感,清影生成視頻后還配有曲庫,你可以直接從中挑選適合的配樂和視頻一起導出,這個功能對于短視頻創作者相當友好。 結語 隨著「清影」的上線,視頻生成賽道又加入了智譜 AI 這位重磅玩家。 總體用下來,給我的感覺是,國產 AI 的追趕在加速,不管是在文字生成、圖像生成還是視頻生成上,這個差距是肉眼可見在縮小。 當然,這個清影也會存在視頻生成模型中普遍的瑕疵,但是比起其他還在畫餅的大模型來說,上線就能用,而且免費不限量,就沖這種誠意,不點贊說不過去。 在我測試的這段時間內,明顯感覺到服務器壓力在增大,從一開始的等待1分鐘左右,到下午的4分鐘左右,說明涌來的用戶越來越多,所以趁內測免費階段,大家多上手玩玩吧。 PC 端訪問鏈接:https:/// 移動端訪問鏈接: https:///download?fr=web_home |
|