海外発のニュースを扱っているメディアやブログを読んでいると、現地の新聞を撮影した画像などが出てくることがあります。

しかし、翻訳されている内容に疑問を感じる時など、本当にその新聞が正しく訳されているのかどうか、確認したいときがあるでしょう。

ウェブのテキストであれば、機械翻訳にかけることもできますが、画像となるとそうもいきません。そんな時は、オンラインで使える無料のOCRサイト『Online OCR』を試してみましょう。20160320_onlineocr_012.jpg

【 Online OCRとは 】

・文章を含む画像をアップロードすると、テキストデータとして抽出するサービス

・対応言語は46カ国語

大抵の場合、ウェブにアップされている画像はサイズが大きくないので、小さく潰れた文字までは認識できないことが多いです。が、見出しなどの重要な文言については、かなりの高確率でテキストデータ起こしに成功します。

上の画像は、Flickrにアップされている大英博物館の資料(下図)を使って読み取りテストしたものです。

20160320_onlineocr_011.jpg

いくつかの読み取りミスが散見されますが、問題なく実用できることが分かるでしょう。

海外の雑誌を購入した時などにも、活躍してくれるはず。画像編集ソフトを使って、訳したい箇所だけをトリミング(クロップ)して読み込ませると、精度が上がります。

Online OCR

(田中宏和)

Photo via Pixabay, The British Library/Flickr