[閒聊]新的歌聲合成系統「Sinsy」
內容為個人blog轉載與增補,還請包涵。
http://www.nicovideo.jp/watch/sm9190295
【Sinsy】耳のあるロボットの唄【歌わせてみた】
號稱是HMM-based的歌聲合成系統,主打免調教。
應該與上回的技術講習会「音声・歌唱合成の現状と将来」上出現的
德田惠一先生(名古屋工業大學)有關。
http://www.asj-tokai.jp/lecture
技術講習会「音声・歌唱合成の現状と将来」
原始開發者是酒向慎司先生,不過他已經轉到東大了,
所以先前聽說03年之後就沒什麼進展....VOCALOID真的刺激到不少東西。
http://hil.t.u-tokyo.ac.jp/~sako/doc/rencon.pdf
HMM-based Singing-Voice Synthesizer
HMM-based最大的優點就是全靠語料庫自行搜尋,幾乎不需要人手介入就可以生成歌聲,
合成過程是一種最短路徑搜尋而不是音源合成,所以可資調整的參數和音色的相關性
似乎會很低,操作起來與現有的VOCALOID、UTAU都有很大的差異,而和前一段時間
release出來的VOICEROID語音生成軟體會很像。
(應該說,HMM-based語料庫式合成在語音合成領域現在已經是主流)
HMM-based最大的問題在於與音源不同,幾乎沒有調整空間這點。
(所以與其說不需調教不如說沒辦法調教)、只能用類似對人聲wav進行調整的工具
來作業、還有收錄雖然有自動化的空間卻非常冗長這點。
好處則是多語言支援、可以同時進行歌聲與語音的合成等等部份,
以及有機會做到加入情感表現的部份。(和sampling比起來比較容易作multi-layer)
控制介面也有很大的機會做得很單純,而不是像現在VOCALOID一樣很貼近MIDI參數,
會很適合初學者使用。
因為收錄是對收錄者的一般歌唱作手動的字母標記,然後透過累積相當數量,
來訓練、達到統計規模,後半的自動化程度會越來越高,但是數量可能要上百首,
這點會遠大於現有的這幾種音源合成系統。
所以Sinsy(已經快被叫做「紳士」了?!)到底有多少能耐還蠻有待觀察的。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.204.43.10
※ 編輯: Artx1 來自: 123.204.43.10 (12/26 04:18)
推
12/26 04:39, , 1F
12/26 04:39, 1F
→
12/26 11:54, , 2F
12/26 11:54, 2F
推
12/27 15:10, , 3F
12/27 15:10, 3F
推
12/28 23:16, , 4F
12/28 23:16, 4F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
Vocaloid 近期熱門文章
PTT動漫區 即時熱門文章