[閒聊]新的歌聲合成系統「Sinsy」

看板Vocaloid作者 (Eji.Warp)時間15年前 (2009/12/26 04:17), 編輯推噓3(301)
留言4則, 4人參與, 最新討論串1/2 (看更多)
內容為個人blog轉載與增補,還請包涵。 http://www.nicovideo.jp/watch/sm9190295 【Sinsy】耳のあるロボットの唄【歌わせてみた】 號稱是HMM-based的歌聲合成系統,主打免調教。 應該與上回的技術講習会「音声・歌唱合成の現状と将来」上出現的 德田惠一先生(名古屋工業大學)有關。 http://www.asj-tokai.jp/lecture 技術講習会「音声・歌唱合成の現状と将来」 原始開發者是酒向慎司先生,不過他已經轉到東大了, 所以先前聽說03年之後就沒什麼進展....VOCALOID真的刺激到不少東西。 http://hil.t.u-tokyo.ac.jp/~sako/doc/rencon.pdf HMM-based Singing-Voice Synthesizer HMM-based最大的優點就是全靠語料庫自行搜尋,幾乎不需要人手介入就可以生成歌聲, 合成過程是一種最短路徑搜尋而不是音源合成,所以可資調整的參數和音色的相關性 似乎會很低,操作起來與現有的VOCALOID、UTAU都有很大的差異,而和前一段時間 release出來的VOICEROID語音生成軟體會很像。 (應該說,HMM-based語料庫式合成在語音合成領域現在已經是主流) HMM-based最大的問題在於與音源不同,幾乎沒有調整空間這點。 (所以與其說不需調教不如說沒辦法調教)、只能用類似對人聲wav進行調整的工具 來作業、還有收錄雖然有自動化的空間卻非常冗長這點。 好處則是多語言支援、可以同時進行歌聲與語音的合成等等部份, 以及有機會做到加入情感表現的部份。(和sampling比起來比較容易作multi-layer) 控制介面也有很大的機會做得很單純,而不是像現在VOCALOID一樣很貼近MIDI參數, 會很適合初學者使用。 因為收錄是對收錄者的一般歌唱作手動的字母標記,然後透過累積相當數量, 來訓練、達到統計規模,後半的自動化程度會越來越高,但是數量可能要上百首, 這點會遠大於現有的這幾種音源合成系統。 所以Sinsy(已經快被叫做「紳士」了?!)到底有多少能耐還蠻有待觀察的。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.204.43.10 ※ 編輯: Artx1 來自: 123.204.43.10 (12/26 04:18)

12/26 04:39, , 1F
Ejiさん介紹乙-(正好在找相關資料
12/26 04:39, 1F

12/26 11:54, , 2F
http://hil.t.u-tokyo.ac.jp/~sako/ 上面有DEMO曲耶@_@
12/26 11:54, 2F

12/27 15:10, , 3F
被叫做"紳士"也太慘了吧XD 感謝介紹~
12/27 15:10, 3F

12/28 23:16, , 4F
名稱叫起來已經很"紳士"了,這也沒辨法啊 = w ="
12/28 23:16, 4F
文章代碼(AID): #1BDHt4qd (Vocaloid)
文章代碼(AID): #1BDHt4qd (Vocaloid)