【検証結果あり】OCRとは?事例を交えてわかりやすく解説
-
2023.4.17 (月)Posted by 北森 雅雄
OCRは、紙帳票をスキャナー等で画像データ(PDFなど)に記載する文字を、デジタル上で扱える文字データに変換する技術のことです。
海外はもとより、日本ならではの文字を読み取るために多くの企業や自治体で導入されてきた仕組みです。
一方、過去の10年以上前にOCRを利用し「思ったより識字率が出ずに結局手直しが多かった」といった記憶をもたれている方も多いかもしれま。
実は、近年はchat GPTで話題にもなっていますが、AIの技術が進歩しています。
従来のイメージであるOCRの識字率が低い点が解消されつつあることをご存じでしょうか?
今回の記事では、OCRの最新事情を事例や詳しい機能など含めて解説します。
目次:
1.OCR(光学文字認識)とは
OCRはを導入される方は、どのような悩みを抱えているのでしょうか?
まずは、OCRを導入前の方が感じている課題感や、OCRで実現できることを紹介します。
1
よくある紙書類が抱える課題
OCRの導入を検討する方よりよく耳にする課題としては、以下の4つを聞くことが多いです。
- ・オフィスの省スペース化
- ・入力作業の膨大な作業量
- ・入力作業の誤りの増加・品質向上
- ・情報の検索性が悪い
デジタル化が進む現在でも、紙業務の問題・課題は増えているのが実情です。
2
OCRが紙書類の課題を解決
OCRは文字が入っている画像・PDFを解析して、文字データに変換するしてくれる仕組みをもっています。OCRの価値は以下の4つです。
(1)保管スペースや管理コスト圧縮
伝票や帳票類、企画書などの紙文書は、OCRで電子化することで、スペースや管理に秘湯ような稼働費を大幅に削減できます。また、紙の経年劣化による破損などのリスクも回避できます。
(2)データ入力業務の削減
取引先の企業や従業員が受け取る請求書・納品書などの大量の帳票を、パソコンに入力する作業を効率化できます。また、入力ミスが飛躍的になくなる効果もあります。
(3)検索性の向上や共同作業を実現
最近では、AIを活用したAI-OCRの登場によって、従来型のOCRでは難しかった、手書きの帳票などの識字率が大幅にアップしています。
3
OCR導入にむけの準備事項
OCRの技術を利用する形態として、2つのケースに分かれます。
- ●「クラウド型」:インターネット経由
- ●「オンプレミス型」:企業のネットワーク内経由
OCR導入には以下の環境を準備することが必要になります。
- ●OCRへ画像を送るためのパソコン
- ●スキャナ (専用のリーダーの場合もあります。)
- ●インターネット環境(クラウド型に限る)
スキャナを見極めるコツは、処理データ量・対応している紙の種類などさまざまな検討要素がありますので、自分の要件にあった選定が必要です。
2.OCRで文字がデータ化されるまでの仕組み
帳票などの画像をスキャンしてから、OCRが文字をデータ化するまでの流れを説明します。
1
書類の画像化
帳票・文書などの書類をスキャナやカメラを通して画像データに変換します。変換する時は、書類の表面に汚れがないように気をつけえると、精度が高まります。
2
レイアウト確認
画像データの配置を確認します。文字や罫線、写真などをもとに、構成を把握していき、文字として読み取るところを確認します。
配置が都度変わる請求書などは非定型書類と呼びますが、毎回レイアウトの指定をしていかなければならず、非定型に対応した機能が必要です。
3
文字列の認識
行や列、見出しなどを判別し、文字が文章としてどのような構造になっているかを判別していきます。
OCRは一般的には1つ1つ文字を見ていく場合が多いですが、AI-OCRでは文字列というグループで認識し、判別していくことが多いです。
4
文字の認識
文字列を切り分けたものをみていき、文字の特徴点を個別に判別していきます。
カラー文字が入っていたり、文字がかすれていると、精度が下がる原因になるので注意が必要です。また、OCRで読み取ったデータは全てを信用してはいけません。なぜなら、記入した方が誤った情報を記載している場面もあるからです。
そのため、最後に人の目で確認することが正確なデータを作るためには必要です。
5
フォーマット出力
OCRはデータに変換した書類をファイルにして出力することができます。エクセルでの出力が多い印象ですが、テキストデータやPDFなど、色々な出力形態があります。
3.OCRがデータ化可能な文字や記号
OCRは一般的な文字は読み取ることができます。
- ●ひらがな
- ●カタカナ
- ●漢字
- ●数字
- ●アルファベットや記号など
ただし、100パーセントの確率で文字が認識されるわけではありません。
1
OCRの精度の分かれ目
OCRの文字認識率は、紙資料の画像データの精度により左右されやすいです。主な理由は、画像精度、裏面の文字透けなどが多いですが、グラフや図などは文字と罫線の判別がつきづらくなり、精度が下がるので注意が必要です。
2
OCRが苦手な紙書類
OCRで読み取りをする際に、一般的に読取精度が下がる紙書類は以下の3つに代表されます。
- ●手書き文字が書かれている
- ●罫線が多い
- ●傾いている紙書類
それぞれ、解説します。
(1)手書き文字
下の『手書き文字』という文字は私が書いてみた文字ですが、我ながらお世辞にも万人が読める文字ではないかなと思ってます。これでも綺麗に書いた方かもしれません。
(2)罫線が多い
表などの罫線があると、うまく読み取りができないことが多いです。
例えば、縦棒を「1」とか「|」とかで読み取ってしまうと、それをエクセルで確認して修正するのもひと手間。やっぱり自分で入力した方が早い!ってなってしまいます。
(3)傾いている紙書類
頭の向きを変えながらパソコンの画面をみて入力するのも、かなりのストレスになります。
3
OCRの識字率向上のコツ
読み取りがうまくいかない場合は、解像度を修正するのがポイントです。200、300dpiですと、精度を高く読み取れる可能性が高まります。
カラー原稿も、モノクロコピーや変換をすることで、よりOCRに適した画像データになります。
4.OCRにAIを組み合わせ読取精度を検証
これまで、OCRを紹介してきましたが、過去にうまく読み取りができず、苦悩された方も多いのではないでしょうか?
ここから、現代のAIを使ったOCR(AI-OCR)で試しに検証してみたいと思います。
1
AI-OCRで読み取りを試した帳票
上記の注文書で読み取りを試してみました。文字も人の目でも読み取ることが難しく、帳票も90度に曲がっています。罫線もいっぱいあって、とてもOCR読み込めるとは思えないものです。
ですが、この帳票、実は全て間違いなく読み取れたのです。読み取れた文字の一部をご紹介します。
いかがでしょうか?人の目で見ても一見読むことが難しそうな、ひと癖ある文字ばかりですが、今回の実験でしっかりと読み込むことができました。
では、なぜこのような手書き文字を読み取ることができたのか?その裏側を解説していきます。
2何故読み取りができたのか?
読み取りができた理由について、ポイントを絞って解説します。
(1)AIを使って色々なケースの手書きを学習(AI-OCR)
これにより、文字の特徴を大量に学習したデータから導き出し、正確に文字を出力することができるようになっています。
(2)画像の傾きを自動補正する機能がある
元の帳票の正しい向きを事前にインプットしていると、おかしい向きの場合自動で補正する機能が、今回試したAI-OCRでは実装されています。イメージとしては、以下のような動画のイメージですね。
この機能があると、ちょっとしたFAXのずれなどは自動補正してくれるので安心です。
(3)罫線は枠として捉えてくれる
下の画面は、AI-OCRの設定画面になります。実は、事前に読み取るべきところを枠で囲んでいます。こうすることで、過去のOCRでは難しかった、枠を認識するということが可能になっています。
5.OCRの活用アイデア
OCRは文書をデータ化して保管すること以外にも、活用できるアイデアがあります。ここでは、その一例を紹介します。
1情報検索を簡素化
これにより、大量な資料の中からキーワードで必要な文書を見つけ出すことが可能です。
2
データのリサイクル
データ化すると、それを活用した資料を作成できます。表組で構成された紙資料をOCRでデータ化すれば、エクセルなどのソフトでグラフにして視認性の高いものをつくることができます。
3
名刺情報のDB化
ファイルに保存しても、なかなか探すのに苦慮されたことはないでしょうか?OCRで名刺を読み取っておくと、氏名や社名、メールアドレスを認識してデータとしてストックすることが可能です。
検索をかければ見つけたい人を検索でき、連絡することが可能です。
4
RPA連携で作業を自動化
OCRでデータ化したものを、RPAを活用して自動で入力作業を行うをシナリオを組めば、人は他のことに集中し、単純作業をRPAにまかせることが可能です。夜間や休日など、関係なしに作業してもらえるので、優秀な事務員がひとり増えたイメージになります。
6.OCRで業務効率化を実現した成功事例
いままでOCRの話をしてきましたが、RPAを組み合わせることで、業務効率化を成功した事例がいくつもあります。
今回は3つの事例を解説します。
1
稼働時間の約8割削減に成功 | 辻・本郷税理士法人
課題としては、大量にある紙書類の転記によるリソース不足が課題でしたが、それを変えるきっかけは会社の移転でした。移転先のスペースの問題で、約8トンもあった紙の処分を行う必要性があり、紙のデータ化に踏み切りました。
その実現のために、AI-OCRの導入して業務フローを見直しました。AI-OCRとRPAを組み合わせることで、通帳が一冊につき約54分の作業時間を約10分に大幅短縮を実現しました。
さらに、紙を保管する必要がなくなり、管理・処分する際のコストも軽減しました。
参考・出典:税理士法人における転記業務の効率化
https://business.ntt-east.co.jp/service/rpa_aiocr/#anc-04
2
不動産業における帳票処理をRPAで自動化|株式会社ジェイエーアメニティーハウス
業務量としては、月に約350件もの新規の賃貸申し込みがあり、書類をエクセルと基幹システムの2つに入力していたとのことです。
AI-OCRの読取精度は94.73パーセントと高く、稼働時間を約55パーセント削減することに成功しました。
3データ入力効率化で、スタッフ負担を軽減|株式会社東日本板橋花き
業務の多くを占める作業が、主にFAXでくる出荷情報のデータ入力。通常期で1日約4~5,000件、お彼岸や年末の繁忙期で約7,000件をひたすら手作業で入力している状況でした。
参考・出典:文字の自動読み取りで、スタッフの負担を軽減 AI-OCRで業務負担の削減!
7.まとめ
紙書類は過去からあり、働き方改革を始める一歩の施策としてOCR導入はわかりやすく効果がでるソリューションのひとつです。
NTT東日本では、AI-OCRとRPAを組み合わせたソリューションを幅広い業種業態の企業や自治体に提供しています。導入時の設定や運用時のサポートなども万全。お気軽にお問い合わせください。
-
AI-OCRの読み取り精度を体感したい方AI-OCR読み取りデモ
AI-OCRの読取精度を知りたくないですか?
①NTT東日本で用意した帳票の読取デモ
②お客さまの実帳票での読取デモ
お好きな方法で読取精度を実感できます。
是非、お気軽にお申込みください。 -
AI-OCRのよくある事例・導入プロセスが気になる方【よくある事例10選】AI-OCR導入ガイドブック
AI-OCRの情報収集に困られていませんか?
・AI-OCRの一般的なユースケースを知りたい
・検討するにあたる進め方をしりたい
・具体的に、どんな機能があるかを把握したい
そんな思いをつめたガイドブックです。
この記事を書いた人
NTT東日本 ビジネス開発本部 北森雅雄
NTT東日本に入社後、自治体向けのシステムエンジニアとして、庁内ネットワークや公共機関向けアプリケーションなどのコンサルティングからキャリアを開始。
2018年から現職にて、プロダクト(SaaS)開発、デジタルマーケティング全般のディレクションに従事。
2022年に業務のデジタル化を分かりやすく発信するオウンドメディア(ワークデジタルラボ)のプロジェクトを立ち上げ。
NTT東日本にかかわる、地域のみなさまに向けてデジタル化に役立つ情報発信を展開。