【わかりやすく】OCRを活用した文字認識とは何か?メリットや活用方法、業務での活用事例を紹介
-
2023.4.17 (月)Posted by 北森 雅雄
PDFなどの画像ファイルにある文字情報を読み取り、デジタルテキストとして文字起こしができるOCRという技術があります。
この文字認識技術はどのような仕組みなのでしょうか。
日常やビジネスの場においてはどのように役立つのか、今回の記事では事例などを交えてわかりやすく紹介していきます。
目次:
1.OCR(光学文字認識)とは
OCRはOptical Character Recognitionの略で、スキャンした書類などの画像データに含まれる文字を読み取り、自動でデジタルデータのテキストにする技術です。日本語では光学文字認識と呼ばれています。 パソコンなどで作成したデータは印刷物になってしまったら、元のデータがないとデジタルテキストとして編集できないため、編集するには再度テキスト入力しなければなりません。OCRならば紙の情報からデジタルテキストに自動的に変換してくれます。 そのため、日々の暮らしやビジネスにおける業務効率化などに役立っています。
2.OCRのメリット
紙のデータをデジタルデータにするメリットを紹介します。
1
保存スペースの削減
紙の書類は保存スペースが必要です。大量の書類をデスクに山積みにしてしまう、あるいは資料室のスペースが足らなくなることもあるでしょう。デジタル化できればスペースが削減できます。
2
入力コストの削減
紙の帳票類などを手作業でシステムに入力している場合は、OCRを活用することで人的リソースの削減や業務効率化になります。入力の代行業者に依頼するよりも金銭的コストも低く済むケースが多いです。
3
検索性の向上
紙の書類を探す時は物理的に探す必要がありますが、デジタルデータであれば簡単に検索できます。テキスト入力するだけで検索できるため、資料室などで探すよりも効率的です。
4
更新・編集が可能に
紙の書類はデータの再利用はしにくいですが、デジタルデータならばテキストの編集や更新が可能です。情報の再利用として、グラフや表の作成もしやすいです。
5
人的エラーの削減
文字を直接人間が確認して問題ないかを確認している業務や、正確にたくさんのテキストを打ち込む必要があるような業務はどうしてもヒューマンエラーが出てしまいます。文字認識で確認・入力までできればミスを減らせます。
3.OCRの文字認識の仕組み
OCRがどのように紙データの文字をデジタルテキスト化しているのか、技術的なステップを説明します。
1
画像を取り込む
まず、紙の情報をスキャナやスマホの撮影などで画像データとして取り込みます。
2
レイアウトの解析
文字だけしかない情報もありますが、読み取る書類などの多くは文字の他に区切り線・表・グラフ・段落など、様々な種類の情報が詰まっています。文章のまとまりとしてデジタルテキスト化する範囲を特定するために、文書のレイアウトを解析します。
3
行・文字の切り出し
解析した内容を元に、レイアウトの中のまとまりのある箇所に対し、どこからどこまでが一つの行であるのか、また文字と文字の区切られている部分をより細分化して認識していきます。
4
1文字ごとの認識
区切られた一文字単位で文字がどの文字を示しているのか認識します。文字を拡大・縮小したりして、その文字がどのような線で構成されているか、またフォントはどのフォントなのかなどの特徴を把握して、合致するデジタル文字を探します。
5
テキストデータとして出力
文字の認識をすべて終えたら、最終的にテキストデータとして出力されます。このテキストとして出力する時に、レイアウトや行・文字の切り出しを元にまとまった文章として出力されます。
4.日常で比較的簡単に文字認識によるデータ化をする方法
このOCRですが、ビジネスや業務でコストをかけて扱う場合だけではなく、個人用途として簡単に利用する方法もあります。手軽に利用できる2つのサービスがあります。
1
Googleドライブ
Googleドライブでは、画像やPDFファイルをアップロードすればGoogleドキュメントでテキスト化したファイルを開くことができます。
手順は以下です。
- Googleドライブに画像やPDFファイルをアップロードする
- 右クリックで「アプリで開く」から「Googleドキュメント」を選択
- テキスト化されたファイルを開く
2
LINE
トークアプリのLINEでもOCRを活用した文字認識機能があります。
手順は以下です。
- LINEのトーク画面を開く
- カメラを開く
- 文字認識モードに設定する
- 撮影した文章を指でなぞって選択すると文字化される
- そのまま文章のコピーや翻訳が可能
新しく写真を撮影するだけでなく、すでに保存してある写真やトーク内の画像ファイルを選択することも可能です。
5.ビジネスにおけるOCRの活用シーン
文字認識ができるOCRの技術をビジネスで活用している例を紹介します。
1
工場・倉庫における番号確認など
在庫管理の際、ハンディーターミナルタイプのOCR(バーコードの読み取り機のようなもので文字認識するデバイス)を利用すれば、手元にある現品票と実際の商品の番号などを照らし合わせることが可能です。
賞味期限の管理や、工場などの機械に表示されている測定器の数字なども正しい基準を満たしているか確認できます。
2
経理や会計業務における伝票処理
社内の経理部門が大量の伝票の処理を行う時に役立つだけでなく、経費申請を行う従業員も、スマートフォンで写真を撮影すれば自動的に経費が集計されるようなツールやサービスもあります。
3
毎日の注文表・発注表などの処理
小売店などで毎日注文と販売を行っていて、紙やFAXを使った注文票の受付などが多い場合は、OCRを利用すれば受け取った紙の注文内容をデジタルデータとして扱えます。手書き文字が多い場合は、ハ手書き文字でも高精度で認識できるAI-OCRの活用もおすすめです。
(1)AI-OCRとは
OCRの技術に人工知能や機械学習といった技術を組み合わせたものです。AIにより文字の認識率が高くなり、従来であれば読み取りが難しかった手書き文字の認識が可能です。 ビジネスにおいては非定型の請求書など、複数のフォーマットであっても読み取りが可能で、自動で必要な箇所のみを読み取るようなAI-OCRもあります。
4
顧客からの申込書の入力
メーカーや不動産業などでは紙の書類を顧客に書いてもらい申込書を葉書やFAXで送ってもらうケースもあります。その場合、氏名・住所・電話番号などの大量の情報を入力しなければなりません。 このように決まっているフォーマットの文字情報をデータ化する時は、OCRだけでなく、RPAとの組み合わせもあります。
(1)RPAとは
RPAとはRobotic Process Automationの略で、従来は人間が操作・入力をする必要があった高度な作業を、機械が自動的に行なってくれる技術です。 RPAとAI-OCRを組み合わせることで、書類から必要な部分だけを高精度で読み取り、システムへの入力や表の作成などを自動的に行うような業務構築も可能です。
6.文字情報の電子化で業務効率化やペーパーレス化を実現した事例
NTT東日本が提供するAI-OCRの「AIよみと〜る」を活用して、文字認識により業務効率化をした事例をいくつか紹介します。
1
辻・本郷税理士法人様
約270名の公認会計士・税理士が所属している辻・本郷税理士法人様では、上場企業から中小企業までたくさんの業種のクライアントが存在し、帳票類などのデータの入力・確認に時間がかかっていました。
NTT東日本の「AIよみと〜る」を導入したことで、帳票データを自動で読み取り、処理作業が効率化されました。領収書などの手書き文字でも読み取ることができるのはもちろん、さらなる活用として通帳をハンディスキャナーで読み取りクラウドで保存すれば、通帳を預かる必要がないため、紛失リスクの低減なども期待できます。
2
株式会社メディカル・プリンシプル
医師のキャリアサポートや医学生・研修医のサポート、医療機関向けの職業紹介などを行う株式会社メディカル・プリンシプル様では、求人シートなどの紙書類のデータ化を手作業で行っていました。手書き情報のため、チェックにも時間がかかっていました。
そこで、働き方改革の一環として、NTT東日本の「AIよみと〜る」を導入。書類の自動読み取りはもちろん、手書き文字でも高精度で読み取ることができるため、作業時間の効率化を実現できました。
3
岩手県久慈市
岩手県久慈市様では、効率的に業務を行うために、LGWAN(総合行政ネットワーク、行政専用の閉域ネットワーク)に対応したタイミングで、NTT東日本のAI-OCR「AIよみと~る」とRPA「おまかせRPA」を導入しました。
年間2万件ほどの、ふるさと納税の申請書をシステムに投入する処理業務や、約4,000枚のアンケートのデータ化や集計業務を少ない職員数でも対応できるよう自動化。 ふるさと納税では作業に要する時間が月あたり約78%削減され、アンケート集計業務は月あたり約83%の時間削減の効果があったそうです。 さらなる活用として、RPAを組み合わせて入力も自動化し、紙帳票の読み取りからデジタル化まで自動で行うことも検討中とのことです。
7.まとめ
OCRのような文字認識の技術は知らない人からすると魔法のように便利でびっくりするかもしれません。 従来までは実務においては精度や利便性などからあまり活用できないケースもありました。
AI-OCRの登場で、細かい調整や自動化において必要になるポイントを満たせることが増えています。 文字認識を活用した業務フローの構築は今後もっと増えていくでしょう。
NTT東日本が提供するAI-OCRの「AIよみと〜る」は、高い認識率や手書き文字でも対応可能です。 また誰でも簡単に設定できて業務に組み込みやすいのが特徴です。RPAと連携した業務自動化についても豊富なサポートがあります。 以下のリンクから資料のダウンロードや無料デモの申し込みが可能ですので、ぜひ一度ご覧ください。
-
AI-OCRの読み取り精度を体感したい方AI-OCR読み取りデモ
AI-OCRの読取精度を知りたくないですか?
①NTT東日本で用意した帳票の読取デモ
②お客さまの実帳票での読取デモ
お好きな方法で読取精度を実感できます。
是非、お気軽にお申込みください。 -
AI-OCRのよくある事例・導入プロセスが気になる方【よくある事例10選】AI-OCR導入ガイドブック
AI-OCRの情報収集に困られていませんか?
・AI-OCRの一般的なユースケースを知りたい
・検討するにあたる進め方をしりたい
・具体的に、どんな機能があるかを把握したい
そんな思いをつめたガイドブックです。
この記事を書いた人
NTT東日本 ビジネス開発本部 北森雅雄
NTT東日本に入社後、自治体向けのシステムエンジニアとして、庁内ネットワークや公共機関向けアプリケーションなどのコンサルティングからキャリアを開始。
2018年から現職にて、プロダクト(SaaS)開発、デジタルマーケティング全般のディレクションに従事。
2022年に業務のデジタル化を分かりやすく発信するオウンドメディア(ワークデジタルラボ)のプロジェクトを立ち上げ。
NTT東日本にかかわる、地域のみなさまに向けてデジタル化に役立つ情報発信を展開。