OCRの活用

皆さんはOCRという言葉をご存じですか?今回は身近にあり、日常業務にも活用できるツールをご紹介します!

OCRとは

OCR(オーシーアール / Optical Character Recognition / 光学文字認識)とは写真や印刷物に記載された文字を文字データに変換するソフトウェアのことを言います。
写真やデータをスキャンして画像として保管するのではなく、その中に記載されている文字をテキストデータとして保管しておけるので後々の編集も可能ですし重要な部分だけを抜き出して共有することもできるので大変便利なツールです。

活用事例


「印刷物のデータが無く、実物からデータを作ってほしいんだけど・・・」
このような事はしばしばあるかと思います。※もちろん弊社でも承りますよ!
簡単な表示ラベル等であれば文字打ちも苦ではないですが、文字数が膨大であったり、外国語であった場合に全て手入力するのは時間も掛かるし、大変ですよね。そんな時にOCRは役立ちます。

身近なOCRツール

①LINE
スマートフォン等のトークアプリである「LINE」。実はこの中にOCRツールが実装されているのです!
トーク画面のカメラボタンをタップしてみると、「写真」の並びに「文字認識」の項目があります。これこそ、LINEで使用できるOCRツールなのです。
使用方法もとても簡単!
①トーク画面のカメラマークを押して、カメラを起動
②写真モードから文字認識モードに切り替えて撮影するだけです。

認識した文字が緑色の枠で囲まれ、全てテキストデータ化してくれます。一部分だけデータ化したい場合は、該当箇所を指でなぞることで選択可能です。

また、LINEを使用した文字認識機能は、現在カメラフォルダにある写真データでも使用可能です。
②Google
グーグルのアカウントを持っていると誰でも使用可能な「Google ドライブ」。その中にテキストデータ化したい画像データを保管し、「Google ドキュメントで開く」を選択すると、読取り可能だった部分を全てテキストデータ化してくれます。(今回は弊社会社案内の一部分で行います)

テキストデータ化したい画像を右クリックして「Googleドキュメント」を選ぶと・・・

文字認識できた箇所が全てテキストデータ化されます。
実際にこれだけの文字量を手打ちしていくと、それなりに時間が掛かってしまいますよね。しかし、OCRツールを活用することでその作業時間をかなり短縮することができるのです!

実際に作ってみよう!

今回は、「Googleドライブ」を使用して表示ラベルの現物から版下データを作成します。
ラベルはこちら(社名等を修正して当社オンデマンド機にて作製したものです)

先ほどと同じ要領で、グーグルドライブに撮影したラベルの画像をインポートし、Googleドキュメントで開きます。

すると、

このような形で画像の中からテキストデータを読み込んでくれました!これで文字入力の手間が一気に解消されたので、

イラストレーターで版下を作成すれば・・・
完成です!

テキストの改行位置が少し分かりづらかったり、スペース部分は手入力しなくてはいけないので全ての手間が解消されるわけではありませんが、想定していた版下作成時間の半分程度の時間で作業が完了できました!

便利ですが万能ではありません。

今回ご紹介させて頂いた無料ツール。大変便利で使い勝手も良いのですが、
・対象の画像が粗いと文字が認識しづらい(出来ない)
・Iとl、oと0などの識別が難しい
といったこともありますので、全て頼り切るのはまだ難しいかと思います。
しかし、英語や中国語も問題なくテキストデータ化してくれるので、かなり魅力的ではあります。

これら以外にも多くの会社からOCRソフトやOCR機能のあるソフトを販売・提供しているので、気になる方は是非調べてみてください。