網(wǎng)易雷火自研智能編曲系統(tǒng) 15秒生成萬元級編曲具備批量生產(chǎn)能力

發(fā)布時間:2020-12-23 13:52:13  |  來源:IT之家  

在 “2020 網(wǎng)易未來大會”上,由網(wǎng)易伏羲、網(wǎng)易雷火音頻部提供作詞、編曲、演唱的全鏈路 AI 技術(shù)支持的歌曲《醒來》正式發(fā)布,這也是網(wǎng)易首次完成由人工智能完全生成的歌曲。

在作詞方面,為讓學(xué)會人類語言組織的基本邏輯,網(wǎng)易伏羲利用大規(guī)模小說、文章、詩歌等語料預(yù)訓(xùn)練海量語言模型,并在歌詞語料上訓(xùn)練端到端的歌詞生成模型,并通過自研的方法控制不同參數(shù)情況下的歌詞生成。

在編曲方面,網(wǎng)易雷火自研的編曲算法能夠完成從大量歌曲中提取大眾審美,覆蓋華語樂壇主流風(fēng)格,率先于行業(yè)部署工業(yè)出版級智能編曲系統(tǒng),能在 15-30 秒內(nèi)生成一首對標(biāo)人編 1-1.5 萬元左右的出版級編曲,已具有工業(yè)化大批量生產(chǎn)的能力。

IT之家獲悉,官方介紹,在歌唱合成方面,網(wǎng)易伏羲依托音頻部龐大的歌聲資源,自建高音素、音高、風(fēng)格覆蓋度的合成庫,自研端到端歌聲合成引擎,可在沒有人工干預(yù)的情況下,實時根據(jù)曲譜生成歌聲。網(wǎng)易自研算法還可確保歌曲發(fā)音人在不同 BPM、風(fēng)格歌譜上音高、節(jié)奏的穩(wěn)定性。

值得注意的是,“主唱”聲音完全能夠以假亂真,瞞過人類。這位由神經(jīng)網(wǎng)絡(luò)聲學(xué)模型和神經(jīng)聲碼器完成人聲合成的 “主唱”,可以確保歌曲發(fā)音人在不同 BPM、風(fēng)格歌譜上音高、節(jié)奏的絕對穩(wěn)定性。

在旋律方面,整首歌節(jié)奏輕快,未來感十足,配上歌詞十分有畫面感也很觸動人心,既有虛擬人剛剛覺醒的孤獨悲愴,對待未來不確定性的迷茫彷徨,更有最后主動創(chuàng)造新世界的的熱情勇敢,以音樂帶入人類與 AI 是否能夠和諧共生的話題,供人思考。

關(guān)鍵詞: 網(wǎng)易雷火 智能

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com