ITエンジニア/デザイナ向けにオープンソースを毎日紹介

コンピュータは生活する上でなくてはならないものになってきている。健常者はもちろんのこと、むしろ何らかのハンディキャップを負われている方にとってみれば、さらに役立つ道具になり得る。


3dsearch11.png

設定画面

 

だが現時点での入力インタフェースにはキーボードやマウスが不可欠になってしまっている。そのような状況を変えるには、音声からの入力というのが一つの大きな課題になってくるだろう。

今回紹介するオープンソース・ソフトウェアはsimon、音声入力によってパソコンを操作するためのソフトウェアだ。

simonはsimondというデーモンと、入力を転送するフロントエンドの二つで構成される。また、それぞれLinux版とWndows版の二つが提供されている。クライアントからはサーバを指定して接続し、利用が可能になる。


3dsearch12.png

アクション設定

 

音声を送るとそれを単語として認識し、そのマッチした単語に合わせたアクションを実行する。予め登録されているものはなく、一から自分で構築する必要があるのが若干不便ではある。なお、ベースになっているのが恐らくドイツ語のようで、単語の登録などが不便かも知れない。

音声を単語として登録するので、個々人の発音に合わせた認識が可能だ。一般的な音声をテキストに変換するソフトウェアの場合、声質によっては認識率が著しく悪いこともある。だがsimonの場合は適切に登録すれば正しく認識してくれるだろう。利用ケースは限定されるが、社会的にも有意義なソフトウェアだ。


3dsearch13.png

トレーニングウィザード

 

simon listens: Home

 http://simon-listens.org/

SourceForge.net: simon

 http://sourceforge.net/projects/speech2text/

 

MOONGIFTの関連記事

コメント

  • DevRel
  • Com2