OCRを簡単に説明するならば、紙資料や文字画像などをスキャナー等で取り込み、コンピュータが利用できるデジタルデータに変換する技術のことです。
日本では、1980年代以降から官公庁や大手企業が利用するようになりましたが、OCRは「文字をデジタルデータ化する」ものぐらいの認識しかお持ちでいない方が多いのではないでしょうか。過去に使用した経験から「意外と使いづらい」という認識の方もいらっしゃるかもしれません。
しかし、技術の発展に伴い、現在のOCRはさらに利便性が増し、再び注目を集めています。そこで今回は、OCRの仕組みや特徴的な機能、活用事例までを網羅して紹介します。
◆目次
知っておきたいOCRの基礎知識
OCRで文字がデータ化されるまでの仕組み
OCRがデータ化可能な文字や記号
文字を取り込むだけではない! OCRの活用法
OCRで業務効率化を実現した成功事例
まとめ:業務の効率化、働き方改革の第一歩として活用
知っておきたいOCRの基礎知識
政府が推奨する「働き方改革」の推進や、業務効率化を目的として再び脚光を浴びているOCR(Optical Character Recognition)。日本語では「光学文字認識」と訳されます。
OCRは、今や官公庁や大企業だけではなく、中小企業や個人事業主など小規模な事業体でも活用が期待され、ニーズも高まっています。また、経済産業省が2020年12月に発表したDXレポート2では、企業が取り組むべき施策として、OCRを用いた紙書類の電子化も推奨されています。
まずここでは、基礎編としてOCRにできることを紹介します。
参考:DXレポート2│経済産業省https://www.meti.go.jp/press/2020/12/20201228004/20201228004-3.pdf
こんなことに困っていませんか?
・オフィスの省スペース化を図りたいけれど、紙資料が多過ぎて保管場所に困っている。
・紙資料を見ながらパソコンに手入力しているけれど、作業量に比べてスタッフ数が少ないため時間がかかり、残業が減らない。
・作業時間の増加に伴い、入力ミスが増えるようになり、悪循環が続いている。
・膨大な紙資料から必要な情報を探し出すのが大変。
ペーパーレス化が進む現在でも、このような紙業務にまつわる問題や課題を抱えてはいませんか?
そんなお困り事を解決してくれるのがOCRです!
保管スペースと管理コストの削減
伝票や帳票類、企画書など業務上必要となる紙文書を、OCRでデジタルデータ化することで、保管するスペースや管理にかかるコストを大幅に削減できます。また、紙の経年劣化や書類の紛失といった心配がなくなります。
手作業によるデータ入力業務の削減
取引先の企業や従業員がやり取りする請求書や納品書などの膨大な紙文書を、目視しながらパソコンに入力する作業をOCR活用で効率化できます。また、入力ミスを防ぐことも可能となります。
データ検索や加工、情報共有がスムーズ
OCRで書類をデジタルデータ化しておくことで、パソコンなどから手軽に情報検索が可能です。また、データを他の社員と共有しておくことで、新規の資料作りなどの効率がアップします。
最近では、AIを活用したAI-OCRの登場によって、従来型のOCRでは難しかった、手書きの帳票などの識字率が大幅にアップしています。
OCR導入に必要な機器、環境とは
端末となるパソコン、紙資料の文字情報を読み取るためのスキャナーか専用リーダーが必要となります。スキャナーや専用リーダーは多くの種類がありますが、処理するデータ量や読み取り対象となる紙資料など、自社の業務に最適な機種を選びましょう。
また、OCRはスマートフォンやデジタルカメラで撮影した画像データも読み取り可能です。その場合、読み取り用のスキャナーや専用リーダーは必要ありません。
使用環境は、インターネット経由で利用する「クラウド型」、自社サーバーにインストールする「オンプレミス型」の2つに大別されます。また、OCRのソフトウェアによっても使用環境は変わります。
読み取り制度は96.71%! AI技術を使ったOCRサービス「AIよみと〜る」
OCRで文字がデータ化されるまでの仕組み
帳票や文書のスキャニングからOCRが文字を認識しデータ化するまでの流れを説明します。
書類の画像化
データ化したい帳票や文書をスキャナーやカメラで画像データとして取り込みます。スキャニングする際は、紙にゴミや汚れが付いていないか確認しましょう。OCRが得意とするのは、白っぽい紙に黒色のインクで書かれていたり、印刷されている文字です。
レイアウトの確認
読み取った画像から、登録されたレイアウトデータをもとに画像のどこに文字や罫線、写真などがあるかを分類。文字として読み取る範囲を認識します。レイアウトをテンプレート登録することも可能ですが、不定型の書類は、毎回レイアウトを指定しなくてはいけません。
文字列の認識
見出し、段落、行などの文字列から、1文字単位に切り分けて認識処理します。ちなみに、OCRでは1文字単位の認識になりますが、AI-OCRなら文字列での認識が可能です。
文字の認識
切り分けられた文字に対して、特徴から文字を割り出して認識します。その際、カラー文字や文字のかすれ、欧文文字や特殊文字などが混在していると認識率が下がるので注意が必要です。
また、OCRで読み取ったデータは、基本的に最後に人が目視で確認します。文字の誤変換がないかをチェックし、間違いがあれば手入力で修正します。
フォーマット出力
OCRはデータに変換した書類をファイルにして出力することができます。テキストデータやCSVの他、Word(ワード)やExcel(エクセル)形式での出力も可能です。
OCRがデータ化可能な文字や記号
OCRは、ひらがな、カタカナ、漢字、数字、アルファベットや記号など一般的な文字であれば読み取ることができます。ただし、100パーセントの確率で文字が認識されるわけではありません。
OCRの精度とは
OCRの文字認識率は、スキャニングする紙資料の条件によって左右されてしまいます。画像の解像度が低い、印刷がかすれている、裏面の文字が透けているなどの場合や、図やグラフなど構成要素や複数言語が混在している場合も読み取りの精度が下がるので注意が必要です。
OCRの読み取り精度をアップさせるには
文字認識がうまくいかない場合は、読み取る画像の解像度を調整しましょう。200〜300dpiの高解像度でスキャンするのが理想的です。また、カラー原稿を白黒でスキャンする、コントラストを強調する、あらかじめ画像の傾きを補正することでも文字認識率はアップします。なお、薄い紙を取り込む場合は下に紙を敷くなどして、裏写りしないよう工夫しましょう。
文字を取り込むだけではない! OCRの活用法
OCRは文書をデータ化して保管するだけではありません。紙の情報をデジタルデータ化することによって活用の幅が広がります。ここでは、その一例を紹介します。
簡単、迅速な情報検索
従来のスキャナーで読み込んだPDFは単なる画像データでしかありませんが、OCRで読み取ることでデータ化し、全文検索やインデックス検索ができるようになります。そのため、大量な資料の中からキーワードで必要な文書を見つけ出すことが可能となります。
データの再利用
データ化した情報を即座に再利用できます。たとえば、表組で構成された紙資料をOCRで読み取り、それをタブ区切りしたうえで表計算ソフトのグラフ化機能を使うと、紙の表組の情報をすぐにグラフ化できます。
また、OCRで読み取ったデータは、Word/Excel/PowerPoint®データへ変換することができるため、新規で資料を作成する際などは改めてデータを作り直す必要はありません。
名刺のデータベース化
溜まってしまった名刺の管理はなかなか大変です。しかし名刺ソフトとOCRで情報を読み取っておくと、氏名や社名、メールアドレスを認識してデータベース化することが可能です。検索をかければ見つけたい名刺を探し出せ、名刺に書かれているメールアドレスも記録されているので、すぐにメールを送ることもできます。
RPAとの連携で、より業務の効率化を図る
人間が行っていたコンピュータ業務を自動化する技術として注目を集めているRPA(Robotic Process Automation)とOCRを連携させることによって、業務や作業の一部を自動化することができます。
たとえば、OCRが読み取った情報を元にRPAがコンピュータ上で入力作業を行えば、マンパワーを必要とすることなく業務をこなすことができます。それも夜間や休日を問わず作業を自動化できるため、業務の効率を格段にアップさせることができるのです。
OCRで業務効率化を実現した成功事例
OCRとRPAの連携による業務の効率化は、業種を問わずさまざまな場面で成果を挙げています。では、どのような連携によって業務効率化を実現したのか。
ここでは、3件の成功事例を紹介します。
1日に最大6000件の入力業務を自動化 | 武蔵野市
2020年4月20日、政府が「新型コロナウイルス感染症緊急経済対策」を閣議決定したことを受け、各自治体では特別定額給付金事業の実施に向けた取り組みが急ピッチで進められました。
約7万8000世帯に上る申請対象を抱える、東京・武蔵野市にとって迅速な対応は大きな課題となりました、膨大な申請書情報のシステムへの入力作業を限られた人員で、いかに効率的に進められるか──。
そこで同市では、AI-OCRとRPAの導入を決定。申請入力業務を自動化させることで、業務の効率向上を図りました。具体的な取り組みとしては、まず申請書をスキャンしてAI-OCRへアップロードしてデータ化。その読み取り結果を職員が目視検査を行い、誤りを手補正したのち、RPAで特別定額給付金システムへ自動入力する業務フローを確立したのです。
これにより、従来の手入力に比べて約4倍の処理速度で給付を実現。これは都内の自治体でもトップレベルの迅速さでした。また、AI-OCRを活用することで職員への負担を軽減させ、人による確認や判断が必要な業務へ人員を集中的に配置できたことも成功のポイントとなりました。
今回の成功を受け、武蔵野市では他部署でもAI-OCRとRPAの導入検討が急速に進められています。
稼働時間の約8割削減に成功 | 辻・本郷税理士法人
全国64拠点(海外6拠点)、グループ合計で約1400名もの社員を抱える辻・本郷税理士法人。同社にとって、膨大な帳票の転記作業と紙資料の保管・管理にかかるコストは、かねてから大きな課題となっていました。転機となったのは2年前の会社移転。その際、約8トンもの紙の処分を行い、極力紙を使用しない業務フローの構築を図ることを決めました。
その新しい業務フロー構築にあたって着目したのが、AI-OCRの導入による税務書類作成のために必要な通帳のデジタル化でした。これまでは、通帳をコピーしたうえでエクセルに入力。元の紙資料を保管するという作業を複数人で行っていましたが、この作業にかかる時間は、通帳一冊につき約54分。多くの時間と人員を割く必要があったのです。
ところが、RPAと組み合わせてAI-OCRを導入したことにより、自動入力されたデータを一人の社員が確認するだけで済むようになり、一冊当たりの処理時間を約10分に大幅短縮させることに成功したのです。これは、手書きの文字まで高い精度で読み取れるAI-OCRとRPAの組み合わせだからこそ実現できたものでした。
さらには、データのデジタル化によって紙を保管する必要がなくなり、管理・処分する際のコスト削減にも成功。同社では、今後、他の業務への展開も視野に入れ、業務効率化を実現しながらひとつ先のサービスを目指していくそうです。
不動産業における帳票処理をRPAで自動化|株式会社ジェイエーアメニティーハウス
神奈川県を拠点に、JA組合員の約20,000戸もの賃貸物件管理を主業務としている株式会社JAアメニティーハウス。不動産業といえば、膨大な量となる紙の管理帳票の処理が業務上の課題となりますが、それは同社も例外ではありませんでした。
月に約350件の新規賃貸契約が発生し、契約に必要な書類は2件あたり6種類。それをエクセルと基幹システムの2つに転記しなければならず、また新規契約時だけではなく、入居者の契約更新やメンテナンスのタイミングでも帳票処理が発生します。請求書だけでも月に6000〜7000件もの処理が発生していました。そのため、処理にかかる人的コストも多大なものになっていたのです。
この状況を打破し、業務の効率化や働き方改革を実現するため、同社では以前から着目していたAI-OCRとRPAをトライアル導入することを決定。トライアルを実施したところ、これまで1件あたり1分30秒以上かかっていた申込書投入業務時間が半減。AI-OCRの読取精度は94.73パーセントと高く、稼働時間を約55パーセント削減することに成功しました。
RPAとOCRでどれだけコスト削減が見込める? 「導入効果シミュレーター」
まとめ:業務の効率化、働き方改革の第一歩として活用
平成30年に「働き方改革を推進するための関係法律の整備に関する法律」が成立して以来、業務の効率化、生産性の向上は多くの企業の課題になっています。ペーパーレス化が叫ばれて久しいものの、紙資料を元にした人間による入力作業は以前多く、社員の大きな負担になっているのが現状です。
業務の効率化、生産性の向上、そして働き方改革の第一歩として、自社の業務に最低なOCR製品の導入が求められています。
NTT東日本では、AI-OCRとRPAを組み合わせたソリューションを幅広い業種業態の企業や自治体に提供しています。導入時の設定や運用時のサポートなども万全。お気軽にお問い合わせください。
連載記事一覧
- 第1回 OCRとは? 仕組みや導入事例までをわかりやすく紹介 2021.08.25 (Wed)
- 第2回 AI-OCRとは? 基礎知識から導入のメリット、成功事例を紹介! 2021.08.25 (Wed)
- 第3回 RPAとは? メリット、デメリットから導入事例までを一挙紹介! 2021.08.25 (Wed)
- 第4回 RPAツールの機能や価格を徹底比較! 失敗しないための導入ポイントを解説 2021.10.04 (Mon)