AI-OCRのよくある事例をご紹介!
AI-OCR導入ガイド

OCRは、紙帳票をスキャナー等で画像データ(PDFなど)に記載する文字を、デジタル上で扱える文字データに変換する技術のことです。
海外はもとより、日本ならではの文字を読み取るために多くの企業や自治体で導入されてきた仕組みです。
一方、過去の10年以上前にOCRを利用し「思ったより識字率が出ずに結局手直しが多かった」といった記憶をもたれている方も多いかもしれま。
実は、近年はchat GPTで話題にもなっていますが、AIの技術が進歩しています。
従来のイメージであるOCRの識字率が低い点が解消されつつあることをご存じでしょうか?
今回の記事では、OCRの最新事情を事例や詳しい機能など含めて解説します。
AI-OCRのよくある事例をご紹介!
AI-OCR導入ガイド
Index

OCRはを導入される方は、どのような悩みを抱えているのでしょうか?
まずは、OCRを導入前の方が感じている課題感や、OCRで実現できることを紹介します。
OCRの導入を検討する方よりよく耳にする課題としては、以下の4つを聞くことが多いです。
デジタル化が進む現在でも、紙業務の問題・課題は増えているのが実情です。
OCRの技術を利用する形態として、2つのケースに分かれます。
OCR導入には以下の環境を準備することが必要になります。
スキャナを見極めるコツは、処理データ量・対応している紙の種類などさまざまな検討要素がありますので、自分の要件にあった選定が必要です。

帳票・文書などの書類をスキャナやカメラを通して画像データに変換します。変換する時は、書類の表面に汚れがないように気をつけえると、精度が高まります。
画像データの配置を確認します。文字や罫線、写真などをもとに、構成を把握していき、文字として読み取るところを確認します。
配置が都度変わる請求書などは非定型書類と呼びますが、毎回レイアウトの指定をしていかなければならず、非定型に対応した機能が必要です。
行や列、見出しなどを判別し、文字が文章としてどのような構造になっているかを判別していきます。
OCRは一般的には1つ1つ文字を見ていく場合が多いですが、AI-OCRでは文字列というグループで認識し、判別していくことが多いです。
文字列を切り分けたものをみていき、文字の特徴点を個別に判別していきます。
カラー文字が入っていたり、文字がかすれていると、精度が下がる原因になるので注意が必要です。また、OCRで読み取ったデータは全てを信用してはいけません。なぜなら、記入した方が誤った情報を記載している場面もあるからです。
そのため、最後に人の目で確認することが正確なデータを作るためには必要です。

OCRは一般的な文字は読み取ることができます。
ただし、100パーセントの確率で文字が認識されるわけではありません。
OCRで読み取りをする際に、一般的に読取精度が下がる紙書類は以下の3つに代表されます。
それぞれ、解説します。


表などの罫線があると、うまく読み取りができないことが多いです。
例えば、縦棒を「1」とか「|」とかで読み取ってしまうと、それをエクセルで確認して修正するのもひと手間。やっぱり自分で入力した方が早い!ってなってしまいます。

読み取りがうまくいかない場合は、解像度を修正するのがポイントです。200、300dpiですと、精度を高く読み取れる可能性が高まります。
カラー原稿も、モノクロコピーや変換をすることで、よりOCRに適した画像データになります。
これまで、OCRを紹介してきましたが、過去にうまく読み取りができず、苦悩された方も多いのではないでしょうか?
ここから、現代のAIを使ったOCR(AI-OCR)で試しに検証してみたいと思います。

上記の注文書で読み取りを試してみました。文字も人の目でも読み取ることが難しく、帳票も90度に曲がっています。罫線もいっぱいあって、とてもOCR読み込めるとは思えないものです。
ですが、この帳票、実は全て間違いなく読み取れたのです。読み取れた文字の一部をご紹介します。

いかがでしょうか?人の目で見ても一見読むことが難しそうな、ひと癖ある文字ばかりですが、今回の実験でしっかりと読み込むことができました。
では、なぜこのような手書き文字を読み取ることができたのか?その裏側を解説していきます。
読み取りができた理由について、ポイントを絞って解説します。

これにより、文字の特徴を大量に学習したデータから導き出し、正確に文字を出力することができるようになっています。

元の帳票の正しい向きを事前にインプットしていると、おかしい向きの場合自動で補正する機能が、今回試したAI-OCRでは実装されています。イメージとしては、以下のような動画のイメージですね。
この機能があると、ちょっとしたFAXのずれなどは自動補正してくれるので安心です。


OCRは文書をデータ化して保管すること以外にも、活用できるアイデアがあります。ここでは、その一例を紹介します。きるOCRの技術をビジネスで活用している例を紹介します。
いままでOCRの話をしてきましたが、RPAを組み合わせることで、業務効率化を成功した事例がいくつもあります。
今回は3つの事例を解説します。
課題としては、大量にある紙書類の転記によるリソース不足が課題でしたが、それを変えるきっかけは会社の移転でした。移転先のスペースの問題で、約8トンもあった紙の処分を行う必要性があり、紙のデータ化に踏み切りました。
その実現のために、AI-OCRの導入して業務フローを見直しました。AI-OCRとRPAを組み合わせることで、通帳が一冊につき約54分の作業時間を約10分に大幅短縮を実現しました。
さらに、紙を保管する必要がなくなり、管理・処分する際のコストも軽減しました。
参考・出典:税理士法人における転記業務の効率化
業務量としては、月に約350件もの新規の賃貸申し込みがあり、書類をエクセルと基幹システムの2つに入力していたとのことです。
AI-OCRの読取精度は94.73パーセントと高く、稼働時間を約55パーセント削減することに成功しました。
参考・出典:数千枚に及ぶ手書き書類の処理にAI-OCRを活用し業務の効率化、働き方改革を実現する
業務の多くを占める作業が、主にFAXでくる出荷情報のデータ入力。通常期で1日約4~5,000件、お彼岸や年末の繁忙期で約7,000件をひたすら手作業で入力している状況でした。
参考・出典:文字の自動読み取りで、スタッフの負担を軽減 AI-OCRで業務負担の削減!
紙書類は過去からあり、働き方改革を始める一歩の施策としてOCR導入はわかりやすく効果がでるソリューションのひとつです。
NTT東日本では、AI-OCRとRPAを組み合わせたソリューションを幅広い業種業態の企業や自治体に提供しています。導入時の設定や運用時のサポートなども万全。お気軽にお問い合わせください。



お好きな方法で読み取り制度を実感できます。
是非、気軽にお申し込みください。
AI-OCR読み取りデモ


手書き文字をデータ化するための8つのチェックポイント/AIよみと~る総合リーフレット
手書き文字のデータ化に必要なチェックポイント、AIよみと~るのご利用イメージや料金プランをご確認いただけます。

【事例5選】AI-OCRとは? 基本から導入メリット、成功事例まで徹底解説!

【事例あり】AI-OCRはどう活用できる?RPAとの連携や導入事例について紹介

【徹底解説】無料で使えるAI-OCRの機能や使い方を徹底紹介

【2023最新】AI-OCRの相場は?価格などの種類を解説

【保存版】AI-OCRが使えない?陥りがちな3つの落とし穴

【わかりやすく】OCRを活用した文字認識とは何か?メリットや活用方法、業務での活用事例を紹介
お気軽にお問い合わせください。