[閒聊]新的歌聲合成系統「Sinsy」

看板Vocaloid作者Artx1 (Eji.Warp)時間16年前 (2009/12/26 04:17)推噓3(3推 0噓 1→)

留言4則, 4人參與討論串1/2 (看更多)

內容為個人blog轉載與增補，還請包涵。 http://www.nicovideo.jp/watch/sm9190295 【Sinsy】耳のあるロボットの唄【歌わせてみた】號稱是HMM-based的歌聲合成系統，主打免調教。應該與上回的技術講習会「音声・歌唱合成の現状と将来」上出現的德田惠一先生（名古屋工業大學)有關。 http://www.asj-tokai.jp/lecture 技術講習会「音声・歌唱合成の現状と将来」原始開發者是酒向慎司先生，不過他已經轉到東大了，所以先前聽說03年之後就沒什麼進展....VOCALOID真的刺激到不少東西。 http://hil.t.u-tokyo.ac.jp/~sako/doc/rencon.pdf HMM-based Singing-Voice Synthesizer HMM-based最大的優點就是全靠語料庫自行搜尋，幾乎不需要人手介入就可以生成歌聲，合成過程是一種最短路徑搜尋而不是音源合成，所以可資調整的參數和音色的相關性似乎會很低，操作起來與現有的VOCALOID、UTAU都有很大的差異，而和前一段時間 release出來的VOICEROID語音生成軟體會很像。（應該說，HMM-based語料庫式合成在語音合成領域現在已經是主流） HMM-based最大的問題在於與音源不同，幾乎沒有調整空間這點。 (所以與其說不需調教不如說沒辦法調教）、只能用類似對人聲wav進行調整的工具來作業、還有收錄雖然有自動化的空間卻非常冗長這點。好處則是多語言支援、可以同時進行歌聲與語音的合成等等部份，以及有機會做到加入情感表現的部份。（和sampling比起來比較容易作multi-layer) 控制介面也有很大的機會做得很單純，而不是像現在VOCALOID一樣很貼近MIDI參數，會很適合初學者使用。因為收錄是對收錄者的一般歌唱作手動的字母標記，然後透過累積相當數量，來訓練、達到統計規模，後半的自動化程度會越來越高，但是數量可能要上百首，這點會遠大於現有的這幾種音源合成系統。所以Sinsy(已經快被叫做「紳士」了？！）到底有多少能耐還蠻有待觀察的。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.204.43.10 ※ 編輯: Artx1 來自: 123.204.43.10 (12/26 04:18)