2014年9月26日金曜日

Julius 孤立単語認識について 自分用メモ

自分で書いたJuliusに関するメモノートがあまりにも汚かったので、再確認を行うと同時にメモを残すためにここで書き直す。

認識の方法は孤立単語認識(「はい」など決められた単語の認識を行う)

使用したJuliusのバージョン4.3.1
OS Ubuntu 12.04

一部参考サイト
git:OpenQbo/qbo_listen
https://github.com/OpenQbo/qbo_listen/blob/master/src/julius.cpp

Juliusの解凍、インストールは公式参照

JuliusのメインのプログラムはSampleを基本としたソースコードを書けば問題がない。
また、MakeファイルやConfigurationファイルもサンプルや公式ドキュメントを参照しながら書けば問題はない。

問題は辞書ファイルの作成、辞書ファイルは文字コードがeuc-jpで書かないといけないので文字コードが違う場合、辞書ファイルは作られない。そこで文字コードを合わせるために以下のコマンドを実行した。

iconv -f utf8 -t eucjp ファイル名 | ./yomi2voca.pl > 辞書ファイル名

ファイル名、辞書ファイル名は各々が決める。
上のコマンドは、ファイルの文字コードをUTF-8からeucjpに変換するコマンドとのこと
これによって、辞書ファイルを作成することができた。

後、自分は実行の際、引数を渡すのがめんどくさかったのでgitで公開しているqbo_listenを参考にして自動で特定の場所のConfigurationファイルを読みこませるようにした。

(雑記)
時間があれば、参考サイトとか、ソースとか詳しく読み直してこのメモを詳しくしていきたいかなぁ・・・

0 件のコメント:

コメントを投稿