2024.03.30 
本文字數(shù):4883,閱讀時長大約8分鐘
導讀:現(xiàn)實中被認為天花板的音樂人,也會比不過?引發(fā)全球音樂創(chuàng)作風暴的Suno水平到底如何? 即使你完全不懂任何樂理知識,只需要輸入簡單的提示詞,比如音樂風格、流派、音色以及歌詞內容等,僅需幾十秒的時間,Suno就能快速生成一首長達2分鐘的完整音樂。而引發(fā)這場全球音樂創(chuàng)作風暴的SunoAI公司,目前只有12名員工。“我和團隊已經在想辦法改行了。”音樂人Ferry對第一財經記者開了個玩笑。Ferry畢業(yè)于伯克利音樂學院,此前是香港交響樂團作曲家,現(xiàn)在是上海音樂工作室的音樂總監(jiān),主要工作內容是音樂制作和游戲配樂。他說,自己做了15年音樂,經歷了很多不同風格的洗禮,有了很多經驗。但對Suno而言,只是幾秒鐘的事情。如果換算一下,Suno寫十首Demo的時間只需5分鐘,換音樂人可能要一個月。他預計,“AI音樂對音樂制作人是毀滅性的(打擊),發(fā)展成熟后,在音樂制作這一塊會取代90%的音樂人,也會有大量音樂人失業(yè)。”但AI并非全能。音樂的精髓遠超過技術的堆砌和算法的編織,它是情感的表達和創(chuàng)造力的展現(xiàn)。這種源于內心深處的情感和獨特的創(chuàng)造力,是人工智能目前難以觸及和全然復制的。第一財經記者采訪的多名音樂人也認為,目前AI仍然是一個需要人類引導的工具,代替不了10%的頂尖音樂人。記者實測:幾十秒至1分鐘內生成流暢歌曲 Suno水平到底如何?記者在Suno AI網站進行了實測。記者輸入的歌曲描述為:“創(chuàng)作一首關于旅行的歌曲,曲風明快,由吉他、鋼琴、小提琴、鼓演奏。表達旅行的輕松愉快,以及對人生的感悟”。幾十秒后Suno就生成了歌曲并可播放,該歌曲標注的關鍵詞是“piano(鋼琴)、violin(小提琴)、folk(民間音樂)、joyful(快樂的)、guitar(吉他)、drums(鼓)”。該歌曲使用鋼琴和鼓伴奏,但記者并未聽到小提琴的聲音,歌詞則出現(xiàn)了鋼琴、小提琴、吉他、鼓點的字眼。歌曲時長1分40秒,由兩段主歌和一段副歌組成,女聲歌唱,流行樂風格,十分流暢,但歌詞還是有些許生硬。記者隨后讓通義千問生成一段關于“失戀后自己旅行并表述旅行感受和人生思考”的歌詞,將歌詞輸入Suno,音樂風格輸入“粵語,流行,哀傷”,大約一分鐘生成歌曲并可播放。此次生成的歌曲曲風依然流暢,但仍是用普通話演唱。記者將提示詞改為英語,并輸入《再別康橋》作為歌詞,這次AI終于在前幾句用粵語歌唱,但馬上又變成了普通話演唱。這三次Suno生成的歌曲都很流暢,可以發(fā)現(xiàn)它對流行、搖滾風格的把握也比較精準,但記者可以感受到Suno對于中文的理解不如英語,Suno對提示詞的理解也有限,要生成方言歌曲不太順利。Suno自己生成的歌詞有些許生硬,結合其他大語言模型生成歌詞效果會更好。在Suno的“每日推薦”榜單中,有更多生成效果更好的歌曲,歌詞包含各國語言。記者點進去試聽,發(fā)現(xiàn)排名前列的歌曲人聲都非常清晰,歌曲流暢且風格鮮明,歌曲自成一體。中文歌曲中,兒歌《讓我們蕩起雙槳》被“改”成重金屬風格,《春天在哪里》“改”成爵士藍調曲風,《蜀道難》變成搖滾風,宋詞《聲聲慢·尋尋覓覓》則以古風呈現(xiàn)。還有網友做了AI工具“全家桶”,用OpenAI創(chuàng)作歌詞,Midjourney生圖、Runway讓其動起來,最后再讓Suno配樂。記者看到,在Suno AI網站上,注冊新賬號每天可獲50個積分,共可用于10次生成歌曲(50 credits renew daily /10 songs),隨后要繼續(xù)使用就要充值,1個月內生成500首歌曲需要8美元,每個月內生成2000首歌需要24美元。
Suno AI滲透音樂圈 Roro 去年剛畢業(yè),目前在一家唱片公司當練習生,她向記者感慨,最近Suno太火了,身邊好多音樂人朋友都在用這個軟件。“剛接觸這個軟件時覺得'哇’太嚇人了,因為大家只要在這個軟件點點我們想要的要求,作詞、作曲、編曲就能馬上出來,而這些我們創(chuàng)作人是需要花很漫長的時間去學習、累積練習才能做出來。”“這個地球上任何的風格Suno都能實現(xiàn), 在這個意義上,現(xiàn)實中被認為天花板的音樂人,也會比不過Suno。”在Suno半年前開始公測的時候,F(xiàn)erry就已經開始體驗和使用, 在強大的生成能力背后,他認為,Suno或許學習了幾十億首曲子這樣的數(shù)據(jù)庫。作為伯克利音樂學院的學生,王鈺初次接觸到AI音樂生成工具則是在2024年初受同學推薦。“一開始大家覺得比較好玩,但其實也不是非常新奇,人工智能在圖像生成領域之前就有一些軟件出來,我們之前也預測,AI用于音樂創(chuàng)作是遲早的事。用了幾次之后發(fā)現(xiàn),對我們日常編曲和創(chuàng)作靈感的激發(fā)都有幫助,所以一直在使用來協(xié)助創(chuàng)作。”王鈺告訴記者,雖然他所在專業(yè)的教授禁止學生用AI做作業(yè),但允許利用AI進行輔助作曲。除Suno外,記者了解到,AI對于音樂領域的其他工具也正在滲透,音樂創(chuàng)作者越來越難以忽視AI帶來的改變。王鈺告訴記者,現(xiàn)在有很多編曲混音軟件正向半AI模式發(fā)展。“比如一些做音樂母帶的軟件,你可以直接告訴軟件需要什么風格和場景,軟件會自動幫你做參數(shù),本來這是混音師的工作,但現(xiàn)在看下來,人工智能生成的效果確實不錯。”“此外,AI音樂制作軟件更大的作用在于可以生成音樂最終的樣本,比如當作者寫完某段音樂,希望做一個預混,模擬一下做完所有后期之后的錄音室效果。這個時候就可以套一個AI插件,讓AI幫助模擬各種風格效果,就類似修圖軟件可以套濾鏡一樣。”王鈺稱。AI此前在美術領域,已替代了部分人類畫師,在音樂領域會不會重現(xiàn)這一過程?不少音樂界人士對第一財經表示,目前AI音樂工具、可以取代簡單的音樂創(chuàng)作。聽到Suno AI創(chuàng)作的音樂后,就匠音樂創(chuàng)始人張昭軼對第一財經記者評價,“完成度很高,質量也很好。”他認為,那些功能性音樂和快餐類音樂,可以被AI低成本量產。他提到,國內做同質化歌曲的人不少,尤其是一些所謂資本加持下的音樂工作室,甚至“抄襲”量產再賽跑,這些“簡單算法”的詞曲,很容易被AI取代,因為AI厲害之處在于詞曲能夠根據(jù)訴求,大量提供水準不低的作品。熟悉娛樂經紀和音樂版權領域的袁原告訴記者,據(jù)她所知,Suno的上一個版本在行業(yè)里已經有人用于商業(yè)場景如發(fā)布會上的使用。她對記者解釋道,因為版權原因,過去行業(yè)做墊樂、配樂的價格不比做音樂便宜,還有各種情緒上的要求,但又沒有足夠的商業(yè)價值,很難有優(yōu)秀的音樂人專門為此創(chuàng)作。“Suno3.0版本我聽到的片段,用在場景音樂上已經完全沒有問題。”袁原還透露,圍繞Suno3.0的商業(yè)化,業(yè)內已經有音樂公司考慮利用AI創(chuàng)作、真人演唱的方式來進行音樂直播了。音樂制作人、鋼琴老師余亮(化名)最近也在與同行交流AI工具的影響。“很多獨立音樂人認為低端編曲作曲已經沒有生存空間了。Suno創(chuàng)作的作品雖然音質不怎么樣,但只要向Suno投入的數(shù)據(jù)量足夠多,創(chuàng)意還是不錯的,可以滿足低層次編曲作曲的需要。音樂人只要參考Suno的創(chuàng)意,再加入一些自己的想法,重新編曲混音,就可以完成部分低水平商業(yè)作品創(chuàng)作。”余亮解釋,低端作曲編曲的范圍包括為作詞愛好者提供編曲服務、為企業(yè)團建合唱編曲、為學校創(chuàng)作校歌、為大中小學藝術節(jié)比賽編曲等。在電商和社交平臺上,這種編曲單很多,一單的價格可低至100元左右,這是編曲者的收入來源之一。Roro認為,AI對于一部分音樂人會有一定威脅。如果作品不夠好,AI完全可以取代。“你寫的東西AI也能寫,那作為客戶,一樣的作品我為什么要花更多錢讓你寫?”Roro覺得市場會淘汰一些粗制濫造的音樂人和音樂作品,但會留下能寫出好的作品的音樂人。王鈺則表示,類似Suno的AI音樂制作軟件可以替代一些需求下的人工音樂創(chuàng)作,“比如廣告配樂,游戲配樂,還有像抖音配樂,網紅熱曲等商業(yè)性、功能性較強的音樂在未來都有可能利用AI直接生成。”與音樂相關的影視界也在關注AI音樂生成工具。一名影視制片人告訴記者,AI對音樂配樂有幫助,主要對效率提升作用明顯。如生成demo(樣本唱片)參考,可以非常快創(chuàng)作出一些作品。“我們與作曲供應商對接比較多,有AI輔助也方便出demo,需求對接會更順暢。”AI制作的音樂與人類制作的音樂能“以假亂真”嗎?Roro 告訴記者,AI其實是學習以往很多人寫歌的模式和套路。她能聽出部分AI唱歌的作品,“能聽出那個聲音可能是做的,因為唱歌斷斷續(xù)續(xù),有一點電流聲。相比人為制作出的類似效果,AI唱得不是很流暢,聽得很難受。”但是她補充表示,有一些歌如果制作比較好的話,可能也不太會分辨出來。王鈺則告訴記者,對專業(yè)音樂學生而言,一開始聽到AI音樂,如果有人聲存在,還是能分辨出人為創(chuàng)作還是AI生成,但如果是純音樂,就要仔細聽曲調和構成,如果音樂句段比較簡單,或者是單一的歌曲伴奏,有的時候分不清。Ferry表示,目前AI生成的音樂在音質上還是能分出來, 因為后期的處理還不太完整,但如果這部分AI繼續(xù)迭代解決后, 就不太能分辨了。雖然當前AI生成的音樂從音色到背景還有些粗糙,但他認為,AI已經優(yōu)先把最難的部分處理好了,未來解決粗糙的音色等細節(jié)只是時間問題。
10%的人難以替代 “AI音樂創(chuàng)作服務人容易,打動人難。”袁原對記者說,有時聽起來AI唱得比人好,但所有藝術作品是因為不完美才成為好作品,“那些需要情緒化的、引起大共鳴的音樂,往往都是有足夠大的特點或者缺點。”她對記者舉個例子,《滄海一聲笑》是徐克、黃霑和羅大佑三人醉意朦朧間在錄音棚即興錄成的作品,它不僅僅是旋律與歌詞的結合,更是人類情感深度與創(chuàng)造力的生動體現(xiàn)。這種源自心靈深處的情感和靈感的火花,目前的AI難以企及。“這就好比有了青龍偃月刀,就不需要關羽了么?”在音樂領域,一首能夠觸動人心的歌曲,往往源自于它與人性、社會現(xiàn)實的深刻聯(lián)系。這正是為何人們在聆聽某些旋律時,會感受到強烈的情感共鳴,或是激動振奮,或是黯然神傷。這樣的情感體驗,源自于音樂創(chuàng)作背后的人文關懷和對生活的細膩觀察。一位樂迷對記者說:相比之下,盡管AI音樂技術取得了顯著進步,能夠創(chuàng)作出旋律優(yōu)美、結構完整的作品,但它目前仍難以復制人類創(chuàng)作中的情感深度和社會洞察力。'因此在現(xiàn)階段,我傾向于將AI音樂視為一個高效而精準的創(chuàng)作工具,而非一個能夠傳遞情感和故事的藝術家。'此外,在專業(yè)的游戲音樂制作、學術音樂創(chuàng)作等方面,AI作用還有限。“AI變革音樂行業(yè)的前提仍然是使用者的認知。”Ferry對第一財經表示,AI生成也有音樂人輸入指令的部分,如果音樂人知道自己想要的風格和格式,是可以通過文字去傳達給Suno,而Suno也會很聰明地從音樂去理解文字,“這個人工智能最強的點在于它對音樂的理解程度、概念和創(chuàng)新。”在這個基礎上,音樂人可以大量制作自己想要的曲子,也可以調整參數(shù)達到自己滿意的。Ferry認為,發(fā)展成熟后,估計音樂制作這一塊會取代90%的音樂人,但還有10%的人是使用者,“可能那10%就是音樂總監(jiān)能留下來。”張昭軼認為,AI解決的只是流行音樂中被神秘化的東西,跟流行音樂工業(yè)和偶像市場關系不大。況且,一首歌能不能火起來,除了離不開表演者的演繹,還有兩個重要因素,一是運氣,二是資本(包括造神、包裝和媒體傳播等),這幾方面因素的重要程度不亞于詞曲創(chuàng)作。事實上這兩年高度同質化的抖音神曲,也要百萬元起步的推廣費買量費,這些都是資源基礎。“在學術音樂領域,例如交響樂作品,Suno現(xiàn)在還無法勝任,Suno現(xiàn)在還只模仿創(chuàng)作出幾分鐘以內的商業(yè)音樂,比如R&B、POP、Funk、Jazz等。”余亮表示。一名游戲音樂制作人員則告訴記者,目前AI音樂生成模型在工作中還沒有發(fā)揮太高的實用性,他比較期待后續(xù)谷歌的MusicLM迭代后輔助更多音樂制作,但也只是輔助參考,很難期望能直接產出符合需求的內容。王鈺表示,隨著AI音樂制作軟件功能變得強大,可以取代很大一部分功能性音樂的人工創(chuàng)作,但對于獨立音樂創(chuàng)作,AI目前無法取代人工,最多起到輔助作用。而像電影配樂這種依賴作曲人的感知和判斷的場景,AI音樂制作軟件是否能夠替代人還不好說。對于AI在電影配樂這種場景下的應用,Roro認為AI或許能做到表面的東西,但若要做到感知畫面、感知電影,通過音樂表達情緒,是否具備此能力還未可知。“要說AI缺少什么,應該是人感性的一面,人類比AI更占優(yōu)勢的一點是,比AI音樂更有人性、更有感情。”Ferry表示,單純的音樂制作、音樂內容產出, “都沒人類的事了”,反而實體、藝人、演唱會這些會變得更罕有,或者是文化方面。在這個意義上來說,與人類有關的表演仍然無可替代。
|