Open JTalk で音声を学習する方法

Open JTalk を使って音声を学習させて好きな声を喋らせられる環境を構築したので、その備忘録を投稿しておきます。

目次

Open JTalk とは

OpenJtalkとは、名古屋工業大学によって開発された、日本語のテキストを音声に変換するソフトウェアです。音声合成の歴史としては比較的古い時代に作られたソフトウェアであることもあり、非常に軽量で、組み込みなどの低性能な機械しかない環境でも動かせる音声合成エンジンとして、Voicevoxなどの合成エンジンが登場した現在でも多岐にわたって使用されています。

音声合成

音声を学習させる前に、まずは、音声合成の方法について解説します。

以下では Debian 系 OS についてのみ、インストール方法を取り扱います。

インストール

以下のコマンドを実行してインストールします

$ sudo apt-get install -y open-jtalk open-jtalk-mecab-naist-jdic hts-voice-nitech-jp-atr503-m001
$ open_jtalk -h

ヘルプメッセージが表示されたらインストールは正常に完了しています。

音声合成

以下のコマンドを実行することで、「おはようございます」の音声がvoice.wavに出力されます。

$ echo "おはようございます" | 
  open_jtalk \
  -x /var/lib/mecab/dic/open-jtalk/naist-jdic \
  -m /usr/share/hts-voice/nitech-jp-atr503-m001/nitech_jp_atr503_m001.htsvoice \
  -ow voice.wav

引数の意味について

-x

辞書のパスを指定します。基本的に上のパスを使用します。

-m

使用モデルのパスを指定します。上のパスではインストールコマンドで導入したデフォルト音声を使用しています。

-ow

出力先のパスを指定します。

インストールできたことが確認出来たら、いよいよ学習環境をセットアップします。

学習環境の構築

セットアップ

HTK 及び HDecode のダウンロードにはユーザー登録が必要です。

STEP
HDecode をダウンロード

以下のサイトの HDecode Download Stable Release (3.4.1) > Linux/Unix downloads から HDecode-3.4.1.tar.gz をダウンロードしてください。
http://htk.eng.cam.ac.uk/prot-docs/hdecode.shtml

STEP
HTK をダウンロード

以下のサイトの Stable release (3.4.1) > Linux/Unix downloads > HTK source code から HTK-3.4.1.tar.gz をダウンロードしてください。
http://htk.eng.cam.ac.uk/download.shtml

STEP
リポジトリをクローン

以下のコマンドを実行します。

$ git clone https://github.com/neodyland/jtalk-learn && cd jtalk-learn
STEP
HTK、HDecode を配置

先ほどダウンロードしたファイルをhdecode.tar.gzhtk.tar.gzとして配置します。

STEP
init.sh を実行

以下のコードを実行して必要なものをインストールします。(5-10分ほどかかります)

$ sh init.sh

学習データの用意

voice/{あなたの名前}を作成し、中に音声ファイルとテキストファイルを配置します

以下のようなファイル配置になっていれば動作します。

推奨される文章量は300文ほどです。

$ tree ./voice/googlefan
./voice/googlefan
├── 1.m4a
├── 1.txt
├── 2.m4a
└── 2.txt

学習

以下のコードを実行して学習を開始します。

$ cd gen && sh run.sh {あなたの名前}

6時間ほど後に、学習が完了し、out/{あなたの名前}.htsvoiceに結果が出力されます。

使用

以下のコードから実際に使用することができます。

$ echo "おはようございます" | 
  open_jtalk \
  -x /var/lib/mecab/dic/open-jtalk/naist-jdic \
  -m ./out/{あなたの名前}.htsvoice \
  -ow voice.wav

いろいろな音声を出力してみて、楽しみましょう。

最後に

最後までお読みいただき、ありがとうございました。

ネットにほとんど参考記事がなかったので、誰かの参考になれば幸いです。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする


目次