ITエンジニア/デザイナ向けにオープンソースを毎日紹介

MMDAgentは音声認識、応対を行う3Dオブジェクトによる音声インタラクションシステム。

[/s2If]

MMDAgentはWindows用のオープンソース・ソフトウェア。コンピュータ技術の進歩もあって、個人のPCでさえリアルなオブジェクトを容易に動かせるようになっている。さらに初音ミクのように滑らかに言葉を発したり、逆に言葉を認識するシステムもできている。


起動した所

音声認識システムとして注目が集まっているのが名古屋工業大学国際音声技術研究所で開発されているMMDAgentだ。マイクを通して音声を認識し、それにあった返答をしたり情報を返却する。そんな未来型の入力デバイスが自分のパソコンで実現する。

MMDAgent(サンプルデータも必要)を立ち上げるとメイと言う秘書のような3Dキャラクターが表示される。矢印キーで視点を入れ替えたり、マウスを追うように動かすこともできる。マウス操作も可能だ。そして1〜4キーであらかじめ指定された音声を発する。


対話中

さらにマイクを通して言葉を入力すると、その内容にあった返答をするようになっている。認識精度は話し手の声質によって変わると思われるが、dキーでログ画面を出しておけばどのように発音すればより認識されやすいか分かることだろう。非常に未来的で楽しいソフトウェアだ。


マウスを追いかけるようにした所(プレミアム限定)

[/s2If]

MOONGIFTはこう見る

初音ミクやKinectなど、コンピュータ空間を楽しむための技術が次々と登場している。そこに加えてこのMMDAgentだ。コンピュータがエージェント化した未来が見えてくるようだ。音声には感情表現も付加されているとのことで、よりリアルな応対を可能にしている。

今後、さらにこの手の技術は人気を集めるだろう。今はまだ試験レベルだが使い道は数多く考えられる。注目しておきたい技術だ。

MMDAgent - Toolkit for Building Voice Interaction Systems

[/s2If]

MMDAgent | Download MMDAgent software for free at SourceForge.net

 

MOONGIFTの関連記事

コメント

  • DevRel
  • Com2