UTAU音源制作wiki

歌声データベース

最終更新:

vbmaker

- view
だれでも歓迎! 編集

注意

歌声データベースの制作、及びAI歌声合成ソフトは現在も研究や開発が進んでいるため、情報が古くなったり状況が変わる可能性があります。
最新の情報はご自身で確認をお願いします。


歌声データベースとは

歌声データベースとは、歌唱データとそれに対応した音素ラベルデータのデータセットです。
AI歌声合成の研究のために公開された 東北きりたん歌唱データベース などが発端となり、
NNSVS によって一般のユーザーも歌声データベースを制作して歌唱モデルを作成できるようになりました。


NNSVS/ENUNU

NNSVSとは、Ryuichi Yamamoto氏が開発を進めているオープンソースのAI歌声合成ツールです。
NNSVS: Pytorchベースの研究用歌声合成ライブラリ
歌声データベースから歌唱モデルを作成できます。

ENUNUは、NNSVS歌唱モデルをUTAUで使えるようにしたUTAUプラグインです。
UTAUでNNSVSモデルを使おう!(ENUNU)


歌声データベース制作手順



制作関連資料

歌声DB製作資料
ちていこ氏による歌声データベースを制作するための情報を網羅した資料


制作支援ツール

oto2lab
setParamで歌唱ラベリングするための、UST→INI→LAB 変換ソフト

LongWavOtoHelper
NNSVSのラベリング作業において長いwavをsetParamで扱うとき、動作が遅いなどの問題があるため、wavの分割に合わせてotoを編集するツール

タグ:

+ タグ編集
  • タグ:

このサイトはreCAPTCHAによって保護されており、Googleの プライバシーポリシー利用規約 が適用されます。

目安箱バナー