Re: [分享] VocaListener paper 讀後心得

看板Vocaloid作者 (Eji.Warp)時間16年前 (2008/06/02 19:38), 編輯推噓3(305)
留言8則, 5人參與, 最新討論串2/7 (看更多)
(續前文) 話說上面應該會有一個問題:ぼかりす怎麼去判斷你唱歌到底是唱得好還是唱得差? 方法是和ミク的一個設定值一樣:ぺントの深さ/長さ。 這個值指的是你在唱準一個音前的變動程度大小與時間, 理論上越專業的人會唱得越準,但是又不可能完全沒有延遲地唱準,那就會變成機器音。 (大家都知道ミク這個值預設是20%,不改的話是天大的音癡XD) 比方說,如果從低音到高音,通常會稍微拉高過一點點音準再拉回來, 這個部份就是圖上的オーバーシュート。 後面ビブラート則是抖音; 中間的微細變動則是在"唱準的時候"能不能穩定保持在準確的音上。 所以答案就出來了: 1. 在某個延遲之內唱準一個音 2. 唱準之後的音維持得好 3. 長音抖音的有無 這些參數就可以決定所謂的"專業級與否"。 ----- 也就是說,只要是"現實派"的唱法,ぼかりす就可以利用這些參數來判定出 合理的歌唱能力。當然在判定音高的時候會先做曲線的平滑化、還有動態變化 的分離等等,所以這都是做成參數用的判定準則。 還包括了這個音本身和歌詞的判別(用來判定歌詞輸入內容、node音高)。 說起來因為是現實派,所以ぼかりす是個很不容易判定價值高低的技術。 它綜合了太多東西,本身是希望實現幾乎傻瓜的歌唱回應調節技術, 同時可以滿足人聲的調節與Vocaloid的操作技術。 但是,說起來直接把輸入的歌聲"被調教過"後產生的資料拿出來, 就應該會是某個程度上頗為漂亮的歌聲,為什麼還是要用Vocaloid呢? 說起來,這個對輸入資料進行調教的功能,就和一般DAW軟體的Auto-tune軟體一樣。 [大部分的偶像歌手通常都用這種東西來產生"聽起來很漂亮"的CD, 依賴久了上現場就會爆掉。XD 不過Auto-tune最近已經快到連現場的麥克風輸入都來得及做校正了, 所以即使是唱現場其實也能開外掛的意思XD] 而經過這種"偶像歌手級的對待",其實大部分的人唱出來的聲音都可以到達 某個相當的境界,那麼何必要用Vocaloid呢? 其實這就已經要牽扯到角色市場的奧秘了XD 說穿了就是萌上了,所以非要ミク唱不可對吧! 總之,以目前在nico上對ぼかりす、ぼかんないです><會有一點反感的人, 這種人通常都會有所謂的「ボカロ耳」,聽習慣介於機械聲、但卻又沒有 真人一樣自然,稍微有點デフォルメ的ミク聲,這其實就和寫實畫風比起來, 通常漫畫是採用沒那麼寫實,有點變形的畫風一樣。 所以ぼかりす和ぼかんないです>< (從這篇論文來說,VocaListener所做的調教和職人等級的調教並沒有什麼差異, 過程都是反覆聽、比對、然後朝某個"目標"去調教)這一類的波形追隨手法, 都是朝現實派的努力方向,只是音樂的其中一個範疇而已。 這就是VocaListener會以目前這個形式出現的最主要原因: 真的是因為她現在是流行,所以很多技術與話題性都是為了她而被提出來的, 包含這個原本可能會被埋葬的非主流技術。 所以如果要以輔助目前的流行為前提的話,可能還是要考慮以某些特定的方式釋出 (比方說以搭配Vocaloid為前提),而不能用傳統的付費軟體工具來販賣; 畢竟這裡面又有一些和現行工具功能重疊的部分,而現行工具大多是要賣錢的, 比方說Auto-tune5本身就要價399美金,那麼你如果免費釋出, 那不就代表Auto-tune的廠商就要來找上門理論了? ---- 所以因為品質太好結果太像人、不夠萌(?!)所以不受現行的ミク愛好者族群喜愛、 然後做好人做得太徹底又會被其他人盯上,只能說中野倫靖先生這篇神論文真的 是個大燙手山芋XD 不過以產品本身來推測,由於VocaListener內建VSTHost (用來和ミク連接來以即時輸出),應該會是個單獨運作的軟體, 輸出的檔案可能只有VSQ和WAV,其餘參數和控制介面可能都會封在內部, 以避免和其他軟體互相衝突;不過這時候就只有最低程度的功能, 只是個調教工具+變聲器而已。 由於VocaListener本身可以從一個Vocaloid的VSQ匯入生成其他Vocaloid的參數, 其實某種意味上存成VSQ意義不大,最好是存成自己的參數變化格式才方便; 比較好的狀況是VocaListener-plus的情感參數可以用資料庫的方式拉出來, 彼此交換存檔,參數本身可以拿來定義"歌手的風格", 長期下來就會有很多很有趣的資料累積起來。(就像MMD的舞步資料一樣) 然後盡量不要輸出"使用者自己唱出來的聲音被工具調教過的結果", 這樣就不會和現行的高價工具定位衝突,不然可能會被迫要訂在很高的價位, 或者是與特定的產品包在一起(如最後變成卡拉OK伴唱機的功能, 讓卡拉OK伴唱機裡面內建Vocaloid等等), 當然這就是用來打進一般user的市場,就與nico目前的狀況與需求漸行漸遠了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.204.3.179

06/02 21:16, , 1F
推精心研究文+口+ 不過...看得到吃不到w只能乖乖用MMV了
06/02 21:16, 1F

06/03 09:23, , 2F
推EJI大的研究文^ ^)b
06/03 09:23, 2F

06/04 00:58, , 3F
既然如此,還是需要『再調教』嘛…以為可以完全取代人工
06/04 00:58, 3F

06/04 00:59, , 4F
過至少是有草稿去修 是從頭自己來
06/04 00:59, 4F

06/05 00:22, , 5F
算是完全取代了老實說,因為人工只剩下"哪邊聽起來不對"
06/05 00:22, 5F

06/05 00:22, , 6F
這個動作,然後引擎會自己調出幾個不同的候補,讓user聽
06/05 00:22, 6F

06/05 00:22, , 7F
這樣的話調教過程就沒有"職人技"了,代表只要知道
06/05 00:22, 7F

06/05 00:23, , 8F
聽起來長什麼樣子,第一次摸的人都可以做到調教
06/05 00:23, 8F
文章代碼(AID): #18GzkTb1 (Vocaloid)
文章代碼(AID): #18GzkTb1 (Vocaloid)