AI行業(yè)的競爭自Sora發(fā)布之后“開掛”般升級,強大的視頻生成能力對內(nèi)容創(chuàng)作和生產(chǎn)效率進行賦能和顛覆性重構(gòu)。我們見證了AI帶來的文生圖像、文生音頻、圖生視頻等領(lǐng)域的飛速迭代,文生視頻已成為爭相競逐的下一個賽點。 營銷被認為是能夠最早實現(xiàn)AIGC商業(yè)化落地的行業(yè)之一,億歐TE智庫認為, 在AI 2.0時代,AIGC將站在數(shù)智營銷舞臺的中央。在近期多家智庫及咨詢機構(gòu)發(fā)布的AIGC行業(yè)報告中,多次出現(xiàn)因賽集團及其自研的營銷AIGC應(yīng)用模型InsightGPT的身影。 作為A股營銷行業(yè)上市公司及品牌營銷龍頭企業(yè),因賽集團(300781)近日對外發(fā)布已突破文生視頻技術(shù)路徑,正在上線文生視頻應(yīng)用產(chǎn)品【AI營銷視頻】,InsightGPT的商業(yè)化進程正在加快。 圖注:36氪研究院丨2024年AIGC行業(yè)研究:多模態(tài)大模型與商業(yè)應(yīng)用 圖注:艾瑞咨詢丨2023年中國營銷領(lǐng)域AIGC技術(shù)應(yīng)用研究報告 ![]() 圖注:億歐智庫丨2024中國百模大戰(zhàn)競爭格局分析報告 圖注:賽迪四川丨2024中國人工智能多模態(tài)大模型企業(yè)綜合競爭力20強榜單 定位行業(yè)解決方案 提升創(chuàng)作效率與空間 與Sora等文生視頻創(chuàng)意類工具的定位不同,InsightGPT「AI營銷視頻」致力于為品牌提供完整的營銷行業(yè)應(yīng)用型文生視頻解決方案。在各類營銷場景下,大消費行業(yè)企業(yè)對營銷素材的需求更加強烈,視頻類腳本、社群運營、“種草標題 筆記”,以及公眾號推文撰寫是高頻使用的環(huán)節(jié)。InsightGPT「AI營銷視頻」功能針對這類需求和場景,解決品牌運營方、內(nèi)容創(chuàng)作者在品牌/服務(wù)/產(chǎn)品宣傳、內(nèi)容運營等方面的難題,可生成數(shù)十秒甚至1分鐘以上視頻內(nèi)容,為AIGC營銷領(lǐng)域帶來新的數(shù)智化解決方案。 此次,InsightGPT能洞察用戶輸入的文字信息,自動生成多個視頻創(chuàng)意主題,并根據(jù)用戶指定主題先自動生成具有完整故事感的創(chuàng)意腳本,再根據(jù)腳本自動生成創(chuàng)意視頻,以及同步完成音樂生成、人聲生成及字幕生成等子任務(wù),最終輸出完整度較高的營銷創(chuàng)意視頻。 【案例1】 用戶輸入: InsightGPT生成腳本大綱: 『深邃的星空下,一只卡通兔眺望著神秘的遠方。卡通兔穿著宇航服,駕駛小型太空船探索宇宙。卡通兔走出飛船,驚喜地發(fā)現(xiàn)了形態(tài)各異的發(fā)光植物和夢幻般的熒光森林。卡通兔遇見了幾只友善的外星兔,一起種下植物。更多奇異的風(fēng)景出現(xiàn),卡通兔眼里充滿好奇,它眺望著遠處,暮色降臨,星球上舉行了一場盛大的星際音樂會,卡通兔和朋友們一起歡快地唱歌跳舞。卡通兔戴上VR眼鏡,繼續(xù)探索這個星球的城市風(fēng)景。最后,結(jié)束探險的卡通兔站在高高的山峰上,俯瞰這個奇妙的星球,浩瀚的宇宙繼續(xù)轉(zhuǎn)動。』 InsightGPT生成視頻: 【案例2】 用戶輸入: InsightGPT生成腳本大綱: 『鏡頭穿越色彩斑斕的星云,揭示一顆紅色的神秘星球,汽車飛馳在連綿沙丘之上,揚起壯觀沙塵。一雙腳踏上星球,繼而出現(xiàn)一位身穿科技感服飾的亞洲男士背影,鏡頭多角度展示停在星球上的汽車外觀,特寫他目光堅定專注,展示車燈及車身線條。隨后,汽車懸浮并降落至另一顆藍綠色星球,鏡頭特寫車內(nèi)智能屏,駕駛員凝視前方星云變幻,緊握方向盤,繼續(xù)在星際探索神秘深邃的宇宙。』 InsightGPT生成視頻: 【案例3】 用戶輸入: InsightGPT生成腳本大綱: 『陽光透過薄霧,灑落在清晨的荷花池畔,荷花盛開,水面泛起漣漪。溫柔的雙手捧著荷花,荷花上的水珠隨之輕輕搖晃。一個年輕的東方女士臉上綻放著自然的光彩,一瓶菡萏護膚品如出水芙蓉般浮在水面。她置身荷花之中,享受自然的美麗滋養(yǎng)。荷花與荷葉的掩映之間,出現(xiàn)菡萏護膚品瓶身。』 InsightGPT生成視頻: 文生視頻帶給行業(yè)的震撼不僅在于畫面的精美,還在于逼真程度和想象空間,背后恰恰反映出大模型數(shù)據(jù)與算法融合之后的學(xué)習(xí)能力及進步速度。通過文字描述自動生成腳本,再生成場景切換流暢、細節(jié)呈現(xiàn)清晰、情感表達準確的高清視頻內(nèi)容,AI生成視頻的能力在各維度均有了質(zhì)的提升。 通過因賽集團此次發(fā)布的視頻生成案例可以看出,AIGC文生視頻在營銷場景有了更清晰的應(yīng)用路徑,也有了更高效的實現(xiàn)方式。三個案例基于不同行業(yè)屬性,結(jié)合品牌特點及內(nèi)涵,生成具有營銷特色的內(nèi)容,對品牌方而言不僅帶來更多驚喜,也讓從業(yè)者看到更多可能性。 AIGC多模態(tài)加持助力視頻生成 打通并賦能營銷全鏈路 InsightGPT「AI營銷視頻」是一個整合了AIGC多模態(tài)的營銷應(yīng)用,其背后蘊含的是因賽集團營銷智慧資產(chǎn)以及多模態(tài)算法應(yīng)用,涵蓋文本生成、視頻鏡頭生成、視頻質(zhì)量優(yōu)化、音視頻合成等多個子任務(wù),并為每個子任務(wù)指派專門的智能體,以完成一系列視頻生成任務(wù)。 (1)文本生成: 用戶輸入提示詞,通過智能關(guān)聯(lián)自建知識庫及大語言模型創(chuàng)作升級等一系列模型和策略結(jié)合,豐富化描述,并生成有效提示詞。 (2)視頻鏡頭生成: 采用了先進的擴散模型架構(gòu),使用時序生成模塊和文本控制模塊來生成圖像元素,并對圖像中元素隨提示詞的描述以及時間的推進進行相應(yīng)的運動和變化,最終生成動態(tài)的視頻幀序列。模型訓(xùn)練采用三層訓(xùn)練架構(gòu),讓模型更好地生成高保真視頻,保證了生成內(nèi)容的品質(zhì)與美感。 (3)視頻質(zhì)量優(yōu)化: 1)通過基于深度學(xué)習(xí)的插幀技術(shù),模型學(xué)習(xí)和理解視頻內(nèi)容的位置、運動方向、速度,預(yù)測并生成中間幀,實現(xiàn)視頻流暢度提升。 2)為了增強視頻的細節(jié)和清晰度,利用視頻超分技術(shù),對視頻幀的高頻信息進行提取與重新合成。 (4)音視頻合成: 1)利用音頻指紋(分析音樂文件,提取其特征如節(jié)奏、旋律、和聲等,生成獨特的“指紋”)和視頻內(nèi)容分析(分析視頻畫面的內(nèi)容、情感和節(jié)奏,轉(zhuǎn)換為可比較的嵌入向量)技術(shù),自動為視頻選取較匹配的背景音樂,并根據(jù)視頻內(nèi)容的關(guān)鍵點(如場景轉(zhuǎn)換、重要動作等)調(diào)整音樂的播放節(jié)奏,實現(xiàn)音樂與視頻內(nèi)容的協(xié)調(diào)。 2)關(guān)于視頻人聲,使用先進的VITS(對抗性學(xué)習(xí)端到端文本到語音條件變分自動編碼器)模型技術(shù),使生成的旁白更具逼真的擬人相似度。 ![]() 在過去一年多的時間里,AI正以快速的學(xué)習(xí)能力和超強的理解能力重構(gòu)不同行業(yè)的服務(wù)流程,營銷、影視、游戲、教育、醫(yī)療、金融、零售、制造等行業(yè)一定數(shù)量的企業(yè)已公開宣布將擁抱AI。從實際應(yīng)用來看,AIGC在營銷行業(yè)中的落地較為直觀和明顯,更高質(zhì)量、更有創(chuàng)意、更具專業(yè)水準的文生視頻功能和產(chǎn)品,將開啟一個全新的商業(yè)時代。 InsightGPT文生視頻應(yīng)用產(chǎn)品發(fā)布后,相信商業(yè)化的步伐也會越來越快。未來,InsightGPT會繼續(xù)提升市場洞察力、創(chuàng)意表現(xiàn)多樣化、視頻角色一致性、文案匹配度以及音樂渲染等方面的產(chǎn)品能力,拓展營銷業(yè)務(wù)場景,滿足各類品牌與中小商戶多場景下的營銷需求,以AIGC的創(chuàng)新驅(qū)動力,為用戶全面提升營銷效率及效果。 |
|