更多

    難以區別的 AI 合成歌聲 日英中文歌手隨時扮到

    Mickey Chan
    Mickey Chan
    愛模擬飛行、希望終有一日回到單車上的宅,眼鏡娘控。座右銘: 1.膽固醇跟美味是成正比的; 2.所有人都可以騙,但絕對不能騙自己; 3.賣掉的貨才是錢,不賣的收藏品不值一文; 4.踩單車,是為了吃更多美食! 5.正義的話語,不一定出自正義之人的口;

    初音未來發表多年,相信大家都聽過合成歌聲,只要輸入樂譜和歌詞就可以讓電腦歌手唱歌。不過說實在,至今的合成歌聲仍然擺脫不了電腦合成的感覺。最近日本名古屋工業大學就與一間開發合成語音技術的公司 Techno-Speech 合作發表一套運用 AI 來學習真人歌手歌聲的技術,令到合成出來的歌聲與真人接近至難以分辨的地步。

    過去 Techno-Speech 所推出的聲音創作軟件《 CeVIO Creative Studio 》是使用舊技術,合成出來的聲音難免有「電子感」。
    過去 Techno-Speech 所推出的聲音創作軟件《 CeVIO Creative Studio 》是使用舊技術,合成出來的聲音難免有「電子感」。

    其實名古屋工業大學這支團隊過去已經開發過不少人工合成語音技術,例如 Open JTalk ,他們運用一套名為「隱藏式馬可夫模型」的統計模型來從真人聲音資料中學習。而 Techno-Speech 過去就利用這支團隊所開發的技術來製作出《 CeVIO Creative Studio 》等聲音創作軟件。虛擬偶像如「 IA -ARIA ON THE PLANETES-(源聲是歌手 Lia )」和「佐藤莎莎拉(源聲是聲優水瀨祈)」,以至 2016 年利用已故演歌歌手三波春夫的資料來製作的虛擬藝人「 HAL-O-ROID 」,都是使用這套技術的。

    2016 年曾推出過以已故歌手三波春夫的唱歌錄音來製作的合成語音
    2016 年曾推出過以已故歌手三波春夫的唱歌錄音來製作的合成語音

    而這次發表的高精密度歌聲合成技術,就是將深層學習等 AI 技術應用在特定歌手約兩小時的歌聲資料庫上,讓電腦學習到歌手的聲質、習性、歌唱方法。在使用時,只要輸入任何附有歌詞的樂譜,就能合成出仿如真人的歌聲。

    在 Techno-Speech 的發表網站上,貼出了多首運用新舊兩代技術來合成的歌曲作比對,當中包括日語、英語,還有陳奕迅《富士山下》的國語版《愛情轉移》,聲音資料庫則是《 CeVIO Creative Studio 》裡提供的佐藤莎莎拉和 IA ,可以聽得出新技術有明顯的進步,配上配樂的話,實在難以分辨是合成出來的。

    在新聞發表網頁上貼出了多首日英中歌曲以新舊合成技術作比較,當中包括陳奕迅《富士山下》的國語版《愛情轉移》。
    在新聞發表網頁上貼出了多首日英中歌曲以新舊合成技術作比較,當中包括陳奕迅《富士山下》的國語版《愛情轉移》。

    這項研究成果將會在 2019 年 3 月舉行的「日本音響學會 2019 春季研究發表會」上正式發表,由於 Techno-Speech 過去一直都有採用這研究團隊的技術來推出合成語音產品,所以估計將來《 CeVIO Creative Studio 》將會引入這技術,到時大家就可以一試。

    合成歌聲比較:按此

    您會感興趣的內容

    相關文章