従来のイメージでは、OCRソフトは「紙の文字をデータ化してくれる便利なツール」といった固定観念があるかもしれません。近年のOCRは技術の進歩によってさらに高機能が搭載されています。AI(人工知能)とのコラボレーションから文字認識率は格段に向上し、今やOCRはビジネスとして十分に活用可能なまでになっています。OCRをご存知のない方にもわかりやすいよう、OCRとは何か、導入メリットや活用事例、おすすめのOCRソフトまで紹介します。

OCRとは?

OCRとは、日本語で「光学文字認識」といい、英語で「Optical Character Recognition」の頭文字をとった略称です。複合機やスキャナーなどで文字を画像で読み取り、その画像から自動で文字のみを抜き、コンピュータで利用可能なデジタルデータで認識させるという技術が開発されました。

日本でのOCR誕生は、1968年の郵便番号を導入したことが起源です。郵便局内での業務の自動化を推進するため、郵便番号を読み取って、集配局別に仕分けができるOCR機械が生まれました。また、1980年代になると、パソコンの廉価化やパッケージ化などが進んだことから、法人だけでなく個人向けにも活用可能なレベルのOCRサービスが浸透するまでに至ります。しかし、文字認識率の制度は決して高いわけではなかったため、読み取り後のデータを目視で確認・修正する必要がありました。

また2000年代になるまでは、日本語が難解であるという問題がありました。英語圏の言語であれば、アルファベットと数字で判別可能ですが、日本語には、ひらがなやカタカナ、漢字も存在します。また漢字は画数や類似する形態も多く複雑なため、OCRの精度には限界がありました。そのため、OCRの文字認識において、文字判別のソースとなる情報を事前にデータベースに蓄積し、データベース内の情報と読み取った情報とをマッチングさせて文字を判別しなければならなかったのです。

そんな中、2012年に開催されたILSVRC(コンピュータによる画像認識技術に関するコンペティション形式の研究集会)が、OCRに変化をもたらします。カナダのトロント大学の研究チームが膨大な画像データから対象物を認識するコンテストにおいて、優勝しました。この研究チームが導入していたものが、ディープラーニング(AIの深層学習)を活用した画像認識システムであり、これが世界中で注目されるようになります。研究開発も各国で進み、AIの進化を推し進める形となったのです。そしてこのAIとOCRとをコラボレーションさせたものを、AI-OCRといいます(後述)。

OCRを導入するメリットとデメリット

ペーパーレス時代において、OCRはビジネスに欠かせないツールとなっています。まずはOCRを導入するメリットとデメリットを理解しておくことが、最適なOCRツールを選ぶコツとなるので、ここはキチンと抑えておきましょう。

OCRを導入するメリット

1.改ざんを防止できる

悪意をもって紙の文書に手を加える人も存在するでしょう。また、いつ誰がどのように手を加えたのかわからないのが紙の文書の難点です。対してOCRは何かしらの変更がなされた際にはきちんと履歴が残るため、変更箇所が容易に把握できるようになっています。またパスワード設定があることで誰かが勝手に編集することを防ぎます。

2.ソフトウェアに関係なく閲覧できる

文書作成ソフトなどで作成されたファイルを閲覧する場合には、基本的にそのソフトを利用して見るか、あるいは相性のよいものを利用する必要があります。OCRは、ソフトウェアを問わず閲覧することが可能となっているのも大きなメリットの1つです。

3.テキスト化によるデータ活用

資料や書籍をテキスト化することによって、文字情報の一部を変更したり、追記したりすることができます。文字情報の一部が変更・追記可能であるということは、検索で求める情報をすぐに見つけられるというメリットにつながります。

4.過去データの管理・検索がスムーズ

情報を紙の書類や画像として保存しているときに、膨大な量になれば保管をしたり、過去のデータが必要になったときに探し出したりするのはひと苦労です。そのような場合にOCRを活用し、文字データ化をしておけば情報管理も楽になり、パソコン上で求めている情報をスムーズに検索・閲覧することができます。

5.入力ミスを削減

手入力では日常的なケアレスミスも起こりやすくなりますが、OCRを活用するとソフトが自動でスキャンした文字画像から文字を認識するため、入力ミスを大幅に減少させることができます。

6.入力作業の効率化

入力作業には常に正確さと素早さが求められますが、アナログ情報をデジタル情報に変換するという付加価値の低い単純作業であるとされています。こうした付加価値の低い作業を自動化できる技術がOCRです。自動化で得られる最大のメリットは業務効率化を実現できる点といってよいでしょう。

OCRを導入するデメリット

1.読み取り精度が100%とは限らない

OCRの文字認識精度は、必ずしも100%とは限りません。すべての文字が正しく認識するわけではありません。特に以下のような文字の場合は誤認識する可能性があります。

  • ・特殊文字
  • ・手書き文字
  • ・文字間が詰まった文字列

AI OCRとは?

OCRにはいわゆるAI OCRと呼ばれる処理方法があります。OCRとAI OCRとの違い、そしてAI OCRの役割とメリットについて説明します。

AI OCRとは?

AI OCRとは、手書きの書類や帳票の読み取りなどからデータ化されたOCRにAIを利用するまったく新しいOCR処理のことをいいます。AI OCRは、AIの研究開発が進む中で、深層学習(ディープラーニング)の効果を利用し、OCRで紙の書類や帳票などのレイアウト解析(認識範囲の特定)精度の改善や向上を目的に、幅広く活用することで導入範囲が増加していきます。RPA(ロボティック・プロセス・オートメーション)との互換性もよく、OCRで紙の書類や帳票を自動で読み取り、認識結果をRPAで利用することによって、業界を問わずいろいろな領域での業務改善に役立てられます。

OCRとAI OCRの違い

OCRとAI OCRの異なる点は、「OCR技術にAI技術を結合させたもの」であるといえます。従来のOCRでは、手書き文字は際限なく存在するので、それらの特徴すべてを登録することは不可能であったため、正確な認識が難しい状況にありました。そこで登場した新しいAI OCR技術は文字ごとに違う独自性を自動抽出するので、さらに正確な文字認識ができるようになっています。

AI OCRのメリット

・文字識字率が高い

従来のOCRは、すでに保有するロジックの範囲内で定められた形式でのみ識別することができましたが、AI OCRはAIに深層学習をさせることで、一度読み取りミスをしてもデータAIがミスから学ぶことにより文字認識率を向上させられます。

・フォーマットの違う帳票にも対応

帳票をOCRで読み取るときは、従来であれば読取位置や項目といった細かい位置づけを行う必要がありました。しかし、AI OCRはAIの読取位置や項目を自動的に抽出することが可能なため、紙の書類などの資料をスキャンすれば文字を認識してくれるようになりました。

・RPAや情報システムとの連携で業務効率化を実現

読み取った情報項目や業務システムの入力に必要とされる情報を自動抽出し、生成が可能なため、入力などの単純作業を大きく効率化させることが可能です。このような情報の意味づけから、RPAとの連携により、さらに業務効率を向上させることができます。

OCR/AI OCRの活用事例

OCR/AI OCRを導入したことで得られるメリットについて、ITreviewに集まったレビューをもとに活用事例を紹介します。

自動認識して画像補正でメモより簡単

「以前まではメモ帳でホワイトボードの内容を書き留めていましたが、スマホのカメラで記憶する事を覚えて大分楽に情報を管理する事ができるようになりました。ただ、カメラだと撮影時にうまく撮影できない場合がありました。そこでOffice Lensを使用すると枠を自動認識して画像補正をかけてくれる。これは予想以上の出来です。」
▼利用サービス:Office Lens
▼企業名:株式会社トヤマデータセンター ▼従業員規模:50-100人未満 ▼ソフトウェア・SI

https://www.itreview.jp/products/office-lens/reviews/56171

ミーティング資料をすぐに電子化する習慣がより強固になった

「紙・ホワイトボード・名刺などをスマホのカメラでスキャンして、きれいに矩形補正してくれる。対象被写体の認識から矩形補正までがフルオートなところがすばらしい。また、ビジネス用途に向いているのは、撮影終了後の映像を画像形式以外にPDF形式やOneNote向けにも出力できるところ。複数枚のプレゼン資料のPDF化を出先で済ます、といったことが手軽にできる。」
▼利用サービス:Office Lens
▼企業名:bizlink合同会社 ▼従業員規模:20人未満 ▼情報通信・インターネット

https://www.itreview.jp/products/office-lens/reviews/44792

”手書き”の文字も見事な精度で読み取り

「ここ最近、OCRの分野には、スタートアップ系が台頭してきてAIを利用した文字認識の製品・サービスが発表されています。この製品に関して何が一番すごいのかというと、日々進化していることです。月に数回アップデートされており、進化(成長)し益々と精度が高くなっていることです。当然ですが、”手書き”という、様々な字体があるものも見事な精度で読み取ります。恐らく過去にOCRを利用してみたが、精度が上がらなかったところは、この製品を見ると”開いた口がふさがらない”状態になるのではないでしょうか!」
▼利用サービス:DX Suite(AI OCR)
▼企業名:株式会社システムソフト ▼従業員規模:100-300人未満 ▼情報通信・インターネット

null

https://www.itreview.jp/products/dx-suite-ai-ocr/reviews/21371

OCR/AI OCRを選ぶポイント

OCR/AI OCRを選ぶ際に押さえておきたい5つのポイントについて解説します

1. 文字の読み取り精度

課題の解決を最優先し、システムの精度を見極めることは重要です。ここでの精度とはAI OCR技術を含む読み取り精度のことを指します。読み取り精度は高ければ高いほど効率的であるため、精度の高さを見極めることは大変重要です。高解像度でスキャンすることによってOCRが文字を認識しやすくなり精度が上がります。あまり高解像度にしてもデータの読み取りに時間がかかりすぎてかえって非効率になるので、一般的には300dpi以上であれば問題ありません。

2.専門知識を持たない社員でも使いやすいか

使い勝手の良さも、OCR/AI OCRツール選定において大切なポイントです。帳票などの読み取り業務では、適応範囲をユーザー側で拡大できれば業務効率化にも直結します。専門知識をもたない社員で使いやすい操作性がシンプルなOCR/AI OCRを選びましょう。 

3.RPAなど他のシステムと連携 

さまざまなRPAとの連携や、ほかのシステムとの連携が可能であるかどうかも重要です。また頻繁に利用するシステムがAPIとして備えられていることも大切です。APIがあればプログラムを組む必要もないため、必要に応じてAPIを利用し、円滑な作業を進められます。

4.データのセキュリティ対策 

ツールを提供するベンダーが「Pマーク」や「ISMS」を取得しているかどうかは、強固なセキュリティ対策を施す上で必要不可欠なチェックポイントです。実際にセキュリティ対策の認証を得ているのかどうかは、事前にしっかり確認するようにしましょう。

5.サポート体制が万全か

サポート体制が万全であるかどうかということも、ツールを選ぶ際の重要なポイントです。また日本全国規模、あるいは海外に拠点のある企業の場合には、全国の社員のために説明会を行うケースもあります。説明会開催のためのサポートをするなど、会社固有のニーズに合う対応をしてくれるかについても、ツール選びの材料となります。

OCR/AI OCRの業界マップ

OCRツールのユーザーからの評価を知るには、ITreview Gridが便利です。ITreview Gridは、ITreviewに集まったユーザーのレビューをもとに生成された4象限の満足度マップで、顧客満足度と市場での認知度が掛け合わされた結果が、4象限上でのポジショニングとして確認できます。

OCR/AI OCRツールおすすめ5選

実際に、OCR/AI OCRツールを活用されている企業の方々のレビューが多い製品を中心に、おすすめのOCR/AI OCRツールを紹介します。

(2021年11月25日時点のレビューが多い順に紹介しています)

※製品ページへのリンクは新規タブで開くリンク設定でお願いします。

Office Lens

マイクロソフト社が提供する無料のスキャナーアプリです。名刺や書類などをスマートフォンで撮ることにより、文書や画像をデジタル化して保存したり、共有したりすることが可能です。同社のOneDriveの利便性がさらに高まり、名刺を独自管理したい際や、会議資料を社内で共有したい場合に利用されています。

Office Lensの製品情報・レビューを見る

読取革命

書類などのスキャン画像等文字画像を、テキストデータに変換できるツールです。手書き文字や低品質文字認識などの読み取りを得意とし、OCRエンジンの精度の高さには一定の評価があり、業種問わず、広く導入されています。開発は、パナソニックソリューションズテクノロジー株式会社と、ソースネクスト株式会社が手がけています。

読取革命の製品情報・レビューを見る

DX Suite(AI OCR)

AI inside株式会社が開発を手がけ、高精度でデジタルデータ化を実現しました。手書きや活字・写真やFAXなど、撮影した書類まで、入力の手間がなく、仕分けもすべてAIが行います。まとめてアップロードした書類などは、種類別に自動で仕分けられて便利です。

DX Suite(AI OCR)の製品情報・レビューを見る

HGPscanServPlus

手入力なしで業務効率化を推進できる電子化自動システムを搭載、デジタルドキュメントの作成から保存・保護における一連のフローも自動化するデジタル・ファイリング・オートメーション仕様です。開発は、株式会社ハイパーギアが手がけました。

HGPscanServPlusの製品情報・レビューを見る

AIRead

アライズイノベーション株式会社が開発した、スタンドアロン型やクラウド型、サーバ型など、あらゆる形式で利用可能なAI OCRです。AIを利用した手書き文字認識から、定型・非定型の帳票の読み取り、そしてデータ化を行うことができるツールです。

AIReadの製品情報・レビューを見る

ITreviewではその他のOCRも紹介しており、紹介ページでは製品ごとで比較をしながら導入ツールを検討できます。

OCRの比較・ランキング・おすすめ製品一覧はこちら

まとめ

業務効率や働き方改革のツールとして、改めて注目されるOCR。ITの進歩によって、かつては想像もできなかったような高度化したOCRやAI OCRの需要は、日に日に増しています。OCR/AI OCRを軸にしたデジタイゼーションは、ペーパーレス化の大きな一歩です。OCR/AI OCRをどのように活用するかをしっかりと検討することが、最終的には企業のDXを進めるうえでカギを握ることでしょう。 


おすすめ記事