《渴望現(xiàn)場(chǎng)》節(jié)目中,機(jī)器人“小渴”正在為選手演唱打分。

前不久,央視一檔歌唱類節(jié)目《渴望現(xiàn)場(chǎng)》請(qǐng)來(lái)了一位客觀公正的音樂(lè)評(píng)審——機(jī)器人“小渴”。這臺(tái)由中科院自動(dòng)化研究所研制的機(jī)器人首次從音準(zhǔn)、音域、調(diào)性、節(jié)奏、語(yǔ)感、樂(lè)感6個(gè)維度對(duì)演唱進(jìn)行客觀評(píng)分,兼顧了音樂(lè)欣賞的維度和量化的難度,真正實(shí)現(xiàn)了用科技評(píng)價(jià)藝術(shù)
近年來(lái),音樂(lè)選秀類節(jié)目層出不窮,無(wú)論是歌手蒙面還是導(dǎo)師轉(zhuǎn)身,其目的都在于尋找一種能夠排除其他因素、回歸音樂(lè)本身的評(píng)價(jià)方法。前不久,央視的一檔歌唱類節(jié)目《渴望現(xiàn)場(chǎng)》就請(qǐng)來(lái)了這樣一位客觀公正的音樂(lè)評(píng)審——機(jī)器人“小渴”。
這臺(tái)由中科院自動(dòng)化研究所研制的機(jī)器人會(huì)對(duì)每位走進(jìn)“歌詠亭”選手的演唱評(píng)分,只有分?jǐn)?shù)超過(guò)80分才算得到了“小渴”老師的青睞,有機(jī)會(huì)走出“歌詠亭”與觀眾見(jiàn)面。
給歌唱者打分這聽(tīng)起來(lái)早已不是什么新鮮事,KTV里的評(píng)分系統(tǒng)甚至能夠列舉出與演唱者音色相近的歌星,那么“小渴”又有什么獨(dú)門(mén)秘訣呢?“傳統(tǒng)的音樂(lè)評(píng)分軟件一般只是簡(jiǎn)單地把演唱者的音準(zhǔn)和標(biāo)準(zhǔn)音做相似性對(duì)比,說(shuō)白了就是看你有沒(méi)有跑調(diào),這種單一的評(píng)價(jià)標(biāo)準(zhǔn)并不能全面衡量音樂(lè)的好壞,更難以理解歌唱者所要傳達(dá)的情感信息。”中科院自動(dòng)化研究所研究員王金橋解釋說(shuō),相比之下“小渴”復(fù)雜多了,它首次從音準(zhǔn)、音域、調(diào)性、節(jié)奏、語(yǔ)感、樂(lè)感6個(gè)維度對(duì)演唱進(jìn)行客觀評(píng)判,兼顧了音樂(lè)欣賞的維度和量化的難度,是用科技在評(píng)價(jià)藝術(shù)。
“機(jī)器人評(píng)價(jià)藝術(shù)其實(shí)是一件非常困難的事情,最大的難點(diǎn)在于如何讓機(jī)器人去自動(dòng)發(fā)現(xiàn)音樂(lè)中美的元素。”王金橋告訴經(jīng)濟(jì)日?qǐng)?bào)記者,他們邀請(qǐng)了大批音樂(lè)專家從多個(gè)維度對(duì)演唱進(jìn)行評(píng)分,在此基礎(chǔ)上,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)的層級(jí)式結(jié)構(gòu)對(duì)音樂(lè)頻譜進(jìn)行層級(jí)式抽象和凝練,自動(dòng)發(fā)現(xiàn)音樂(lè)中每一句里蘊(yùn)含樂(lè)符的共性之美,從而分別學(xué)習(xí)音樂(lè)中音準(zhǔn)、音高、顫音振幅和顫音頻率等規(guī)律,完成整段音樂(lè)的美學(xué)量化。
同時(shí),神經(jīng)網(wǎng)絡(luò)的逐層信息抽象特性能夠幫助機(jī)器人從音階傳遞到演唱技巧再到情感表達(dá),進(jìn)行逐層量化和分析,進(jìn)而讓機(jī)器人能夠相對(duì)客觀地學(xué)習(xí)專家對(duì)音樂(lè)的評(píng)判,最終實(shí)現(xiàn)對(duì)音符“美”的“理解”。
由于各位歌手在演唱方式、曲風(fēng)等方面有所不同,歌聲間會(huì)呈現(xiàn)出較大差異,但當(dāng)海量音樂(lè)專家評(píng)分?jǐn)?shù)據(jù)匯總在一起時(shí),基本能夠代表當(dāng)前主流音樂(lè)評(píng)審專家對(duì)音樂(lè)的評(píng)價(jià)。因此,基于人工智能技術(shù)的音樂(lè)評(píng)判系統(tǒng)就是根據(jù)這些數(shù)據(jù),讓“小渴”對(duì)音樂(lè)進(jìn)行較為客觀和科學(xué)的評(píng)判。
此外,“小渴”的順風(fēng)耳——卷積神經(jīng)網(wǎng)絡(luò)所抽取到的多維語(yǔ)音特征具有精確量化的特性,在對(duì)音準(zhǔn)信息量化區(qū)分時(shí),精度能夠達(dá)到1‰。在此基礎(chǔ)上,再配合專家對(duì)歌聲音準(zhǔn)表現(xiàn)的經(jīng)驗(yàn)打分作為監(jiān)督信息,神經(jīng)網(wǎng)絡(luò)模型就能夠?qū)σ魷?zhǔn)信息建立準(zhǔn)確的數(shù)學(xué)表達(dá)模型,從而進(jìn)行量化的音準(zhǔn)打分。
而聽(tīng)起來(lái)最縹緲的“樂(lè)感”,也具有特定的數(shù)學(xué)模型支撐。音樂(lè)作為一種藝術(shù),需要傳達(dá)某種情感,樂(lè)感就是人們了解這種感覺(jué)的感官能力。在具體演唱中,表現(xiàn)力是歌手的綜合表現(xiàn),目前的評(píng)判標(biāo)準(zhǔn)更多是依賴于音樂(lè)專家的權(quán)威判別。“專家用1到10個(gè)分?jǐn)?shù)給表現(xiàn)力打分,我們通過(guò)卷積網(wǎng)絡(luò)、雙向長(zhǎng)短期記憶模型提取音樂(lè)表現(xiàn)力的特征,該特征能對(duì)音樂(lè)在時(shí)間維度上的表現(xiàn)力進(jìn)行充分分析,從而模擬專家對(duì)音樂(lè)表現(xiàn)力的評(píng)判。”王金橋說(shuō)。
從已經(jīng)播出的多期節(jié)目來(lái)看,“小渴”對(duì)多種音樂(lè)唱法都能給出公正的評(píng)價(jià),如秦腔、說(shuō)唱、英文歌曲等。在現(xiàn)場(chǎng),“小渴”是與歌手的麥克風(fēng)直接相連的,任何一點(diǎn)小小的瑕疵都能被它捕捉到。“在具體打分過(guò)程中,機(jī)器人是聽(tīng)一句給一句的分?jǐn)?shù),專家可能偶爾走神沒(méi)聽(tīng)見(jiàn),但機(jī)器人不存在這種情況,并且不會(huì)受到現(xiàn)場(chǎng)氣氛和環(huán)境的影響。”王金橋說(shuō),“小渴”對(duì)歌手的一視同仁、對(duì)打分的公正合理也同樣得到了觀眾的認(rèn)可,大家都親切地稱它為“史上最冷靜的評(píng)審”。
“‘小渴’目前還是初級(jí)版本,我們會(huì)引入更多的算法和更多元的維度來(lái)評(píng)價(jià)音樂(lè),也會(huì)嘗試讓它學(xué)著創(chuàng)造音樂(lè),使一個(gè)個(gè)動(dòng)人的音符完成美妙的組合。”談及“小渴”的未來(lái),王金橋希望把它推廣到各種音樂(lè)評(píng)分系統(tǒng)中,比如唱吧、KTV等。唱歌愛(ài)好者們可以結(jié)合“小渴”的評(píng)價(jià),不斷改進(jìn)自己的唱法。有朝一日,說(shuō)不定“小渴”也會(huì)從“音樂(lè)評(píng)審”升級(jí)為“夢(mèng)想導(dǎo)師”。