注意
歌声データベースの制作、及びAI歌声合成ソフトは現在も研究や開発が進んでいるため、情報が古くなったり状況が変わる可能性があります。
最新の情報はご自身で確認をお願いします。
最新の情報はご自身で確認をお願いします。
歌声データベースとは
歌声データベースとは、歌唱データとそれに対応した音素ラベルデータのデータセットです。
AI歌声合成の研究のために公開された 東北きりたん歌唱データベース などが発端となり、
NNSVS によって一般のユーザーも歌声データベースを制作して歌唱モデルを作成できるようになりました。
AI歌声合成の研究のために公開された 東北きりたん歌唱データベース などが発端となり、
NNSVS によって一般のユーザーも歌声データベースを制作して歌唱モデルを作成できるようになりました。
NNSVS/ENUNU
NNSVSとは、Ryuichi Yamamoto氏が開発を進めているオープンソースのAI歌声合成ツールです。
NNSVS: Pytorchベースの研究用歌声合成ライブラリ
歌声データベースから歌唱モデルを作成できます。
NNSVS: Pytorchベースの研究用歌声合成ライブラリ
歌声データベースから歌唱モデルを作成できます。
ENUNUは、NNSVS歌唱モデルをUTAUで使えるようにしたUTAUプラグインです。
UTAUでNNSVSモデルを使おう!(ENUNU)
UTAUでNNSVSモデルを使おう!(ENUNU)
歌声データベース制作手順
制作関連資料
歌声DB製作資料
ちていこ氏による歌声データベースを制作するための情報を網羅した資料
ちていこ氏による歌声データベースを制作するための情報を網羅した資料
制作支援ツール
oto2lab
setParamで歌唱ラベリングするための、UST→INI→LAB 変換ソフト
setParamで歌唱ラベリングするための、UST→INI→LAB 変換ソフト
LongWavOtoHelper
NNSVSのラベリング作業において長いwavをsetParamで扱うとき、動作が遅いなどの問題があるため、wavの分割に合わせてotoを編集するツール
NNSVSのラベリング作業において長いwavをsetParamで扱うとき、動作が遅いなどの問題があるため、wavの分割に合わせてotoを編集するツール