《電子技術(shù)應用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 在AI面前,Rapper要率先失業(yè)了?

在AI面前,Rapper要率先失業(yè)了?

2020-03-05
來源:網(wǎng)易科技
關(guān)鍵詞: AI Space150 TravisBott

1.jpeg

  文|音樂先聲(ID:nakedmusic),作者|柳成枝,編輯|范志輝

  近期,美國數(shù)字研究機構(gòu)Space150進行了一項有趣的試驗:基于人工智能(Artificial Intelligence,簡稱AI)技術(shù),模仿知名說唱歌手Travis Scott的人聲和音樂風格,做出了一個說唱機器人"Travis Bott"。

  這個試驗的目的是為了看AI到底能夠持續(xù)創(chuàng)造出什么。

  事實上,"Travis Bott"真的創(chuàng)作了一首歌《Jack Park Canny Dope Man》,且歌詞和旋律均由自己完成。同時,Space150還使用基于AI的人體圖像合成技術(shù)"Deepfake",為這首歌拍攝了MV。

  說實話,與以往的AI歌曲不同,這首AI歌曲在對真人繼續(xù)學習后,近乎到底了真人的聽感。國外網(wǎng)友在MV下面留言道。"better than real trvis(比真人還好)""Pretty amazing, this is only the beginning(太棒了,這僅僅是個開始)",甚至開始擔心AI會奴役人類,但自己還是會買票去看。

  原理上,Space150采用附加神經(jīng)網(wǎng)絡(luò)技術(shù)(Additional Neural Network)創(chuàng)造出旋律和打擊樂伴奏,再將Travis Scott的歌詞輸入"文本生成器模型(Text Generator Model)",兩周后,AI"Travis Bott"開始創(chuàng)建了歌詞的韻腳(rhymes)。

  從效果來看,Travis Bott模仿Travis Scott幾乎達到了以假亂真的地步,完全融匯了Travis Scott作品以及人物魅力的最主要的外顯特征,以至于被調(diào)侃可以加入Spotify的說唱熱門歌單《Rap Caviar》。

  與此同時,該項目也進一步驗證了人工神經(jīng)網(wǎng)絡(luò)技術(shù)(Artificial Neural Networks)的進步,有助于探索未來AI在音樂中的應用價值。

  不可否認的是,AI已經(jīng)漸漸地嵌入到我們的日常生活中。在"互聯(lián)網(wǎng)+"以及"工業(yè)制造4.0"的新時代背景下,具備通信、網(wǎng)絡(luò)與人機交互功能的AI作曲覆蓋到教育科普、藝術(shù)表演和娛樂服務等領(lǐng)域已是大勢所趨。而面對AI音樂的優(yōu)異表現(xiàn),也讓我們思考:音樂人在與AI音樂的共生中,是否會遭遇到AlphaGo式的碾壓?

  如何克隆 Travis Scott?

  事實上,AI作曲(Algorithmic Composition,也稱"算法作曲")并不稀奇,復制Travis Scott也并非難事。

  早在2016年,索尼旗下的計算機科學實驗室(Computer Science Laboratories ,簡稱Sony CSL)研究人員哈杰里斯和帕切特就曾開發(fā)了一個名為"DeepBach (深度巴赫) "的神經(jīng)網(wǎng)絡(luò)。他們利用巴赫創(chuàng)作的352部作品目來訓練DeepBach,創(chuàng)作出了2503首贊美詩。

  而第一個正式獲得世界地位的AI虛擬作曲家則是由2016年誕生的初創(chuàng)公司Aiva Technologies推出的AIVA(Artificial Intelligence Virtual Artist)。它的創(chuàng)作方向主要是古典音樂、影視配樂,發(fā)展到現(xiàn)在也逐漸有了其他類型的作品,例如搖滾樂、流行樂等。作為虛擬音樂人,它通過了法國和盧森堡作者權(quán)利協(xié)會(SACEM)的合法注冊,并擁有自己的署名版權(quán)。在AI領(lǐng)域而言,復制一位或多位音樂人的音樂風格的工作也許早已在進行中。

  

2.jpeg

  目前來看,無論是DeepBach、AIVA抑或是Travis Bott,AI作曲背后都是一種基于人工神經(jīng)網(wǎng)絡(luò)的深度學習(Deep Learning)技術(shù)。在這種深度學習中,程序員必須搭建一個多層"神經(jīng)網(wǎng)絡(luò)",并在多層的結(jié)構(gòu)中分別加以編程,從而可以處理各種輸入和輸出點之間的信息。

  

3.jpeg

  來源于:2017·菠蘿科學獎,人工智能主題解讀

  譬如說,DeepBach被輸入的是巴赫的362部作品,AIVA被輸入的信息是以巴赫、貝多芬、莫扎特等為代表的古典作曲家作品的大數(shù)據(jù)庫,而Travis Bott被輸入的則是Travis Scott的作品、人聲以及音效。

  在數(shù)據(jù)輸入后,人工神經(jīng)網(wǎng)絡(luò)會找到眾多被輸入作品之間存在的規(guī)律,繼而形成對音樂風格的理解。但這個音樂風格并不是最終的產(chǎn)物,其主要目的是用來預測,AI程序會帶著它對音樂風格的預測繼續(xù)運行,而在前方將會遇到下一個驗證數(shù)據(jù)集。這個數(shù)據(jù)集會告訴它預測的正確與否,正確與錯誤的回饋都將被AI記住,在不斷的高速學習中,AI的預測能力就會越來越強,最終掌握程序員大數(shù)據(jù)中歸總后的曲風,進而能編寫出自己的曲子。

  而AI創(chuàng)作者"Travis Bott"的突破,則在于其不止是輸入了Travis Scott的作品,更輸入了人聲及音效,文本與聲音的輸入與輸出在深度學習上又更上了一個臺階。

  

4.jpeg

  來源于《I am AI 》系列短紀錄片

  這種深度學習,看似只是基于人類大腦的神經(jīng)結(jié)構(gòu)簡單模式,但在某種程度上已經(jīng)可以像人類一般"思考"了。這也使得AI能夠在數(shù)據(jù)中理解并塑造高度抽象化的模型,例如旋律中的模型,或者人臉的特征。

  但從人工智能音樂的發(fā)展沿革而言,人工神經(jīng)網(wǎng)絡(luò)只是AI作曲的主要技術(shù)之一,與其他算法相比,有其優(yōu)點也有其劣勢。就優(yōu)勢而言,具有自學能力、聯(lián)想存儲功能、高速尋找優(yōu)化解的能力是人工神經(jīng)網(wǎng)絡(luò)較其他算法最卓越的地方。

  

5.jpeg

  來源于:2017·菠蘿科學獎,人工智能主題解讀

  但其劣勢也較為明顯:1. 著名的"黑匣子"問題,意味著你不知道神經(jīng)網(wǎng)絡(luò)將會如何產(chǎn)出結(jié)果,更不知道為什么會產(chǎn)生這種結(jié)果;2.與認知不同,作曲是更高層次的智能活動;3. 耗時耗力;4. 數(shù)據(jù)饕餮,相較于傳統(tǒng)的機器學習算法,需要更多的數(shù)據(jù);5.算力成本較為昂貴。

  

6.jpeg

  在實踐中,即便是最先進的深度學習算法,要實現(xiàn)真正深度神經(jīng)網(wǎng)絡(luò)的成功訓練,仍需要數(shù)周才能完全訓練完畢。而目前AI作曲在主要技術(shù)上尚不存在最優(yōu)解,大多采用混合型算法(Hybrid Algorithm)。

  如何避免AI作曲的版權(quán)風險?

  與此同時,AI作曲的整體不足也較為顯化。正如前文所言,AI作曲本質(zhì)上就是大數(shù)據(jù)和云計算,AI音樂產(chǎn)生的過程就是機器根據(jù)程序員輸入的要素或者是模式,在龐大的資料庫中總結(jié)提取與之相匹配的特征,而后根據(jù)這些特征提取各種資料元素進行新的組合或者是延展。

  這里面必然存在一個問題是:這個巨大的數(shù)據(jù)庫如何區(qū)分哪些數(shù)據(jù)是有版權(quán)保護的?哪些是公共數(shù)據(jù)?數(shù)據(jù)庫的搭建者如何保障具有版權(quán)數(shù)據(jù)的權(quán)益?使用數(shù)據(jù)庫的主體如何做到不侵權(quán)?

  很顯然,目前的AI作曲在某種程度上仍舊無法完成或者說無法自主完成這一任務,版權(quán)的規(guī)避大多來自于程序員的有意為之。

  2017年,Aiva Technologies對AIVA選擇專注古典音樂的解釋也正好回應了程序員對于AI作曲版權(quán)的刻意設(shè)計:"用來訓練Aiva的古典音樂數(shù)據(jù)庫不涉及版權(quán)問題,因為版權(quán)都過期了。"

  對于開頭的Travis Bott而言,其對于Travis Scott的學習中,作品庫、人物形象的采樣必然也要先取得Travis Scott的授權(quán),但其學習后生產(chǎn)出的作品又如何避免對Travis Scott形成抄襲呢?

  這一情況,也是造成目前市場上AI作曲質(zhì)量參差不齊的原因之一,某種程度上來說,抄襲或許很難避免。查重工具 (Plagiarism Checker)以及查重的尺度在這里就顯得尤為重要了,但就目前的實踐來看,人類音樂人歌曲抄襲判斷標準都還在尋求統(tǒng)一化中,何論AI作曲?

  而即便AI作曲經(jīng)歷千辛萬苦后終于生產(chǎn)出一個純原創(chuàng)、不涉及任何侵權(quán)的作品,他(她)又將面臨到版權(quán)認證的問題。

  根據(jù)我國《著作權(quán)法》對于著作權(quán)的定義,"著作權(quán)是著作權(quán)法賦予民事主體對作品及相關(guān)客體所享有的權(quán)利。"其中,民事主體指公民、法人或非法人組織。AI在主體身份上就無法獲得認可,權(quán)利的獲得與放棄都變得尤為復雜。如果產(chǎn)生侵權(quán)糾紛,將難以解決。

  比如,微軟小冰獨立創(chuàng)作的詩集《陽光失了玻璃窗》,作品一經(jīng)發(fā)布后就出現(xiàn)了很多的盜版以及很多不規(guī)范引用。這種通常意義上的侵權(quán),卻因為缺失法律規(guī)定的缺失,版權(quán)的歸屬也就誰都說不清,侵權(quán)也就聽之任之了。

  7.jpeg

  但值得一提的是,相較于國內(nèi)的空白,國外對于AI作品的放寬與認可已然成為一種常態(tài),英國、南非、新西蘭屬于第一批明確認可AI版權(quán)的國家。而美國、日本、澳大利亞雖然在成文法上并未有明確規(guī)定,但在司法實踐中都進行了不同程度的嘗試。這也是為什么美國在成文法上未對AI作品進行認可,但在司法實踐中卻有勝訴的案例。

  但中國因為是成文法國家,判例法并不是法的正式淵源,無法與普通法系(或英美法系)形成法官造法的司法實踐,所以從制度上明確AI作品才是最根本的。

  

8.jpeg

  不可否認的是,受制于多國在AI領(lǐng)域以及法律操作上的水平差異,要獲得大范圍的認可或許仍有待時日。當然,在其中取巧也較為簡單,在AI生成的作品加入人類藝術(shù)家的名字就可以突破這一桎梏。

  2018年9月7日,AIVA的純音樂專輯《艾媧(Vol.3 from artificial composer Aiva)》的做法是:專輯還是AIVA的,但每首曲子都會標注"feat. Aiva Sinfonietta Orchestra, Brad Frey",表明那位音樂監(jiān)督在"演奏"中的貢獻,團隊成員就可以將作品進行商用。

  

9.jpeg

  總的來說,復制Travis Scott對于AI來說并非難事,但要處理其中的版權(quán)糾紛以及進一步將AI技術(shù)提升卻并非一日之功。

  AI音樂的商業(yè)探索

  AI音樂無疑是一個歷時已久,但在這幾年蓬勃發(fā)展的朝陽產(chǎn)業(yè)。

  1974年,Rader系統(tǒng)的出現(xiàn)是帶有AI作曲系統(tǒng)真正的開始。與現(xiàn)在意義上的AI有所不同,其運用了AI中可運用規(guī)則的部分,使得機器根據(jù)旋律、和聲生成的規(guī)則進行權(quán)衡,并且對音符與和聲搭配的合適比重進行選擇。此后隨著對音樂生成系統(tǒng)研究的不斷深入,出現(xiàn)了可完成自動低音和聲生成的Snobol系統(tǒng),以及可用來生成巴赫風格和聲的Choral系統(tǒng)(Ebciogln產(chǎn)品,專家系統(tǒng))。

  1993年,出現(xiàn)了運用人工神經(jīng)網(wǎng)絡(luò)學習模式進行和聲生成的Musact系統(tǒng),以及基于人工神經(jīng)網(wǎng)絡(luò)和"限制滿意度技術(shù)"相結(jié)合方式,可根據(jù)旋律進行巴洛克風格和聲生成的Harmonet系統(tǒng)。這些都是現(xiàn)代AI作曲系統(tǒng)的鼻祖,具有里程碑意義。

  當代AI作曲系統(tǒng)的開發(fā),大多從Google的Magenta開始萌芽。Magenta是Google于2015年底開源,并用TensorFlow機器引擎學習的一種人工智能技術(shù),該項目旨在開發(fā)AI技術(shù)創(chuàng)作出音樂以及其他藝術(shù)形式,主要子項目有NSynth Super、Onsets and Frames以及MusicVAE。

  此后,各類AI系統(tǒng)、產(chǎn)品開始迅速發(fā)展。其中,較為有代表性的程序開發(fā)有:2017年Taryn Southern專輯《I Am AI》采用的Amper Music應用、2018年Skygge錄制發(fā)行《Hello World》使用的Flow Machines(Sony旗下產(chǎn)品)工具,以及2019年OpenAI開發(fā)的一種用于生成音樂作品的深層神經(jīng)網(wǎng)絡(luò)MuseNet。

  

10.jpeg

  目前,國外較為成熟的AI音樂公司,除了Google、Sony、Amper Music外,還包括洛杉磯的Popgun、倫敦的Jukedeck和AI Musical、舊金山的Humtap、柏林的Melodrive、Google總部山景城的Groov.A、盧森堡的AIVA、非盈利性研究公司OpenAI以及自稱為 "首個建立在人工智能音樂發(fā)現(xiàn)基礎(chǔ)上的全方位服務唱片公司"Snafu Records等。其中,Jukedeck已于2019年7月被字節(jié)跳動收購。

  

11.jpeg

  而在國內(nèi),AI音樂也有不少的行業(yè)實踐。

  除了百度、騰訊、阿里、網(wǎng)易云等音樂平臺都在不同程度上對AI音樂有布局外,高校以及大中型企業(yè)也逐漸加入到AI音樂的教育、研發(fā)中。例如,貌似和音樂搭不上邊的平安科技有限公司,接連與中央民族大學、四川音樂學院等高校展開了合作,并在2018年EPFL瑞士聯(lián)邦理工學院舉辦的AI作曲國際挑戰(zhàn)賽中,贏得了智能作曲領(lǐng)域內(nèi)首次的AI世界作曲大賽冠軍。

  而由微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能創(chuàng)造力團隊負責研發(fā)的AI音樂技術(shù),已經(jīng)能夠基于和弦、節(jié)奏、旋律交叉等多項音樂元素進行內(nèi)容創(chuàng)作,集作曲、作詞、編曲、演唱等多項音樂創(chuàng)作力于一體,相當于一支完整樂隊。如今,此項技術(shù)已在央視及各省市綜藝節(jié)目中多次驗證,并成功實現(xiàn)了商業(yè)化與產(chǎn)業(yè)化輸出。2018年5月,微軟宣布公司旗下人工智能小冰已經(jīng)掌握了歌詞創(chuàng)作和譜曲能力。

  另外,2018年4月,嗨翻屋發(fā)布的音樂AI創(chuàng)作助手"小嗨"在目前已經(jīng)創(chuàng)作了數(shù)張專輯,除了作詞作曲,還具備"識曲"功能。

  而2019年2月、3月分別在 IOS 和安卓上線的"鯨鳴"APP,則是一款可以讓普通人的"在線合唱"變?yōu)榭赡艿囊魳奉悜谩?quot;鯨鳴"APP使用的是 AI 歌聲合成技術(shù),用戶只需要錄入自己的聲音,APP便可自動修音,并利用 AI 技術(shù)將錄音者的聲音與原唱或者是其他使用者的音色相結(jié)合,最終達成合唱效果。

  不難發(fā)現(xiàn),AI在音樂領(lǐng)域的運用已經(jīng)是各國文化產(chǎn)業(yè)的一大重點。在快速發(fā)展的同時雖然也存在一定的困境。當然,主要還是圍繞算法、版權(quán)兩個方面。但隨著AI整體技術(shù)水平的提升,用戶對作曲系統(tǒng)智能化程度要求的提高,AI在音樂領(lǐng)域的運用正逐步走出困境,國內(nèi)發(fā)展的趨勢也逐漸與國際接軌。

  首先,在算法技術(shù)層面,混合型算法以及個性化智能音樂定制依然是主流。一方面,由于各種算法在人工智能作曲的使用中都有其自身的優(yōu)勢和不足,目前人工智能作曲的音樂作品風格和體裁比較單一,且可聽性不強。在混合型的算法作曲中,各種算法將揚長避短,這些問題能夠得到有效解決。

  另一方面,由于AI作曲從大數(shù)據(jù)中抽取規(guī)則,多產(chǎn)但很容易造成歌曲同質(zhì)性較高的問題。但個性化智能音樂定制以聽眾的私人喜好為前提,通過大數(shù)據(jù)和算法運作后生產(chǎn)出的作品也因個體的差異,更具有原創(chuàng)性。

  其次,在版權(quán)方面,受制于無法破除的法律困境,AI技術(shù)轉(zhuǎn)向與人類音樂人合作將是短期內(nèi)突破版權(quán)的最直接手段;同時,人類音樂人也會在其中獲利,AI技術(shù)對于人類創(chuàng)造力以及音樂人靈感的激發(fā)作用會越發(fā)凸顯。

  有報道稱,人機配合的創(chuàng)作方式是人類音樂家創(chuàng)作速度的20倍。某種程度來說,在提升音樂人的工作效率、降低音樂人與制作方的溝通成本方面,AI作曲都有著人類協(xié)作難以企及的優(yōu)勢。

  2018年9月,阿里音樂首席科學家堯問(花名)曾在阿里音樂專場論壇上說道:"我覺得任何一個藝術(shù)家,總有創(chuàng)意枯竭的時候,他們需要靈感。AI創(chuàng)作的音樂可能不是整段歌都好聽,但中間恰好有一小段和這些藝術(shù)家的情緒相符,藝術(shù)家就能參考借鑒,作為靈感的迸發(fā)點,把這個啟發(fā)轉(zhuǎn)化到自己的作品里面去,我覺得這對于他們是非常好的幫助。"

  隨著AI技術(shù)在深度學習的逐漸深化,對于人類情緒掌握的逐漸熟練,以及法律逐漸完善對計算機作品以及主體的定義,AI作為人類音樂家的輔助工具這一現(xiàn)狀或許也不會持續(xù)太久,畢竟技術(shù)以及法律都并非是一塵不變的。

  結(jié)語

  從流媒體利用AI進行智能推薦去引導聽眾音樂品味,到科學家基于AI打造出AI作曲家再一次顛覆音樂行業(yè),人們對于AI的發(fā)展有些喜憂參半。一方面,AI的加入能夠讓音樂行業(yè)更加完善,讓這個行業(yè)的運作更加有效率;另一方面,作為人類制造出來的機器,AI作曲的銷量和品質(zhì)也許會讓很多音樂人汗顏。

  長遠來看,AI與人類的音樂人、電臺DJ的關(guān)系或許也不是非此即彼,就像現(xiàn)在的數(shù)字音樂與黑膠的對決一樣,黑膠的沒落是有目共睹,但其價值仍然被大眾認可,甚至被小部分人追捧。換句話說,技術(shù)的進步以及行業(yè)的綜合性推進,最大可能會使得AI音樂成為音樂創(chuàng)作的一種標準配置。當然,人們對人類音樂人在音樂上的原創(chuàng)性、審美性要求也會越高。

  但無論是AI音樂或者是人類創(chuàng)作的音樂,從音樂誕生到現(xiàn)在花樣百出的音樂產(chǎn)品,其最核心的仍然是提供服務,這個核心不改變,人和音樂的關(guān)系也不會被改變。

  歸根結(jié)底,人工智能仍來源于人類智慧,與其說讓音樂人失業(yè)或者是被遭遇到AlphaGo式的碾壓,不如說是技術(shù)帶來的行業(yè)變遷,而在作品或音樂服務的選擇上,聽眾也有了更多元化的選擇。

  參考資料:

  1.《ARTIFICIAL INTELLIGENCE MADE A SONG IN THE STYLE OF TRAVIS SCOTT. IT SOUNDS UNNERVINGLY LIKE TRAVIS SCOTT.》,《Music Business Worldwide》,2020年2月16日

  2.《藝術(shù)家們是如何看待虛擬現(xiàn)實這一未來大勢的?》,《SIZE潮流生活》,2020年2月16日

  3.《第一個世界正式的AI作曲家AIVA是怎樣創(chuàng)作音樂的?》,《雷克世界》,2017年3月17日

  4.《什么是人工神經(jīng)網(wǎng)絡(luò)(ANN)》,《知乎專欄:人工智能圖像識別技術(shù)與計算機視覺(CV)》,發(fā)布于2018年8月30日

  5.李景平:《人工智能深度介入文化產(chǎn)業(yè)的問題及風險防范》,《深圳大學學報(人文社會科學版)》,2019年9月第5期

  6. 貳叁叁 :《AI寫的歌,應該受到版權(quán)保護嗎?》,《音樂先聲》,2019年6月14日

  7. 肖欣:《人工智能生成內(nèi)容版權(quán)問題的國際比較研究》,華東政法大學碩士論文,2019年

  8.《神經(jīng)網(wǎng)絡(luò)最大的優(yōu)點,以及最嚴重的缺陷》,《csdn人工智能頭條》,2018年10月12日

  9. 王鉉、雷沁穎:《人工智能對中國音樂產(chǎn)業(yè)鏈的滲透與革新》,《現(xiàn)代傳播(中國傳媒大學學報)》,2019年12期

  10. 《博覽會 | AI音樂家會像阿法狗那樣碾壓人類嗎?》,《中國音樂財經(jīng)網(wǎng)》,2018年4月24日

  11. 田梅、黃智興、張友剛:《算法作曲中的人工智能技術(shù)》,《四川教育學院學報》,2006年12月


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。