海外の記事などを検索していると、画像ファイルしかなく、そのままでは自動翻訳に突っ込めないことがたまにあります。 最悪、自分で地道に打ち起こす方法もありますが、長文の場合現実的ではありません。キリル文字とか完全にお手上げです。
そんな時はOCRで機械に文字起こししてしまえばいいということで、ネット上にフリーのOCRサイトがあったので使って見ようと思います。
Free Online OCR - convert scanned PDF and images to Word, JPEG to Word
テスト用に複数のフォントで同じ文字列を打ったpngファイルを作ってみました。
- をクリックして文字起こししたいファイルを選びます。ファイルは5mbまで。PDFの他、JPG、BMP、TIFF、GIFに対応しているようですが、PNGも行けました。
- で言語を選びます。大抵の言語はあります。もちろん日本語も。今回は英語なのでENGLISHを選択。
- 出力形式を選びます。ワード、エクセル、テキストの3種類から選べます。
画像を選ぶと青い進行バーとファイル名が表示されて文字起こしがはじまります。
1.1に表示されている文字列を
2.2のフォームに打ち込んで、
3.そのままエンターキーを押すか3のコンバートボタンを押します。
- をクリックするとファイルがダウンロードできます。
- に読み取られたテキストが表示されます。コピペもできるので普通はこれで十分でしょう。
3つ目はフォントが特徴的すぎたためか、きちんと文字に起こせていませんが、一般的なフォントであれば問題なく文字起こしができそうですね。
困った際のお役に立てば幸いです。