atabii

ボクセルとかモデリングとか

julius導入メモ

juliusの導入メモです。Homebrewでも入れられるみたいですが、手動でいきます。

juliusは汎用大語彙連続音声認識エンジンです。詳しいことはサイトを見てください、私には難しくてわかりません_(⌒(_´-ω-`)_

必要なものと準備

こちらが必要なものサイト
julius(本体とディクテーションキット) 
PortAudio

環境は以下の通りです。
Mac OS X ElCapitan (10.11.6)
・iTerm2 (3.0.12)
Xcodeコマンドラインが入っていないとCFLAGSがエラーになるっぽい?

 

juliusとディクテーションキット

juliusは[ダウンロード]->[最新版]->[開発版スナップショット]->[GitHub]から最新版をダウンロード。
ディクテーションキットは[ダウンロード]->[ディクテーション]からダウンロード。
GitHubとzipがあります。GitHubのほうは最新版を常に公開しているみたいですが、今回はzipのほうを使います。

一応、GitHubでのダウンロード方法はこちらのブログをどうぞ。
http://pineplanter.moo.jp/non-it-salaryman/2016/02/13/github-download-files/

PortAudioは[Download]->[Stable Releases]->[pa_stable_v190600_20161030.tgz(最新版をどうぞ)]からダウンロード。

インストール

coreaduioは使えないのでPortAudioを使います。
ということで、juliusより先にPortAduioをサクッといれましょう。

PortAudio

$ tar xvzf pa_stable_v190600_20161030.tgz
$ cd portaudio
$ ./configure
checking build system type... i386-apple-darwin15.6.0
checking host system type... i386-apple-darwin15.6.0
checking target system type... i386-apple-darwin15.6.0
checking for gcc... gcc
checking whether the C compiler works... no
configure: error: in `/Users/chikizero/Desktop/portaudio':
configure: error: C compiler cannot create executables
See `config.log' for more details

あ、エラー。
config.log見てみたらgcc関連ぽい。
調べてみたらgccがないとか指定してやれとかありました。
でもgcc入ってるんですよねー。
gccのバージョンかと思って、Homebrewでいれてみました。

$brew install gcc

それから再度「./configure」を実行。
そうするとスッキリ上手くいきました。わーい。

次はmakeですね。

$ make
$ sudo make install

f:id:chikizero:20161104141331p:plain

いけました。いえーい。

juliusとディクテーションキット

こっちが公式ドキュメント
公式ドキュメント - http://julius.osdn.jp/juliusbook/ja/
で、インストール方法 - http://julius.osdn.jp/juliusbook/ja/desc_install.html

julius

zipを解凍して以下のように実行。

./configure --enable-words-int --with-mictype=portaudio

「--enable-words-int」
これはデフォルトではjuliusは6万語程度までしか扱えないんですが、その上限を取り払おうっていうやつです。
「--with-mictype=portaudio」
マイクはPortAduio使いますよってこと。

↓結果
f:id:chikizero:20161104141335p:plain
micがcoreaudioになってますね。これをPortAduioにしてやらないといけないです。
とりあえずそれはおいといて続き。

$ make
$ sudo make install

これで入ったはずです。juliusコマンドを打ってみましょう。

$ julius

f:id:chikizero:20161104141327p:plain
julius本体はこれでOKです。

ディクテーション

ダウンロードしてきたディクテーションキットのzipを解凍します。
そのディレクトリの中にはいって以下のシェルスクリプトを実行します。

$ ./run-osx-gmm.sh

これで実行できました。
please speakがでたらあとはマイクに向かってこんにちは!
ちょっとした言葉なら一応認識できますよ。
f:id:chikizero:20161104142658p:plain

 

注意

マイクの[環境ノイズリダクション]のチェックは外しててください。
チェックが入ってたら認識率がガクッと下がります。
f:id:chikizero:20161104142903p:plain

色々やってましたけど、気づきました。あれ?juliusって32bitだけじゃなかったっけ?
そのへんは追々……。
わかってないけど勢いでやってる部分があるので、あれ?と思ったら検索してみてください(放り投げ)