ITエンジニア/デザイナ向けにオープンソースを毎日紹介

会議室にあるホワイトボード。印刷する仕組みがあれば良いが、そうでない場合は携帯電話のカメラで撮影していく事がある。後で見返すと会議の内容が思い出せるのは便利だが、画像データのままと言うのがいただけない。テキストデータに落とし込む仕組みはないだろうか。

スキャナなどがあれば、OCRと言う手がある。これは大抵スキャナ付属、または有料だ。だがこちらはオープンソースで提供されている。

今回紹介するオープンソース・ソフトウェアはWeOCR Project、Web上で利用できるOCRソフトウェアだ。

Web上で、と言っても実際はCGIベースで動作しているので、インタフェースとしてWebを介しているに過ぎない。だが、ブラウザベースで利用できれば便利な事も多そうだ。

利用できる画像の種類はBMPやJPEGなど。圧縮されていても利用できる。画面のスクリーンショットをアップしてみた限りでは、60~70%くらいの認識率といった所だろうか。

出力はHTML上、またはXMLとなっている。将来的にはWeb APIとして提供される事があるかも知れない。

右上の画像は上記画像を解析した結果。今回はデモサーバーで試してみた。

識字率の低さや日本語の認識はできないとあって、実用性はまだ低いかも知れない。だが、OCRというアナログとデジタルをつなぐ技術は今後さらに活用されていく事が予想される。それだけに今後に期待がかかるソフトウェアだ。

WeOCR Project Home

http://weocr.ocrgrid.org/

 

MOONGIFTの関連記事

コメント

  • DevRel
  • Com2