このコラムでは、当社取扱製品であるABBYY(アビー)社のFlexiCapture(フレキシキャプチャ)を説明します。
ABBYY FlexiCaptureとは?
FlexiCaptureは、紙書類や画像の文字や罫線などの情報を高い精度で認識し、設定を行う事で必要な情報のみを読み取り、データ化する事が可能なデータキャプチャのソフトウェアです。
言語は日本語、英語だけでなく、中国語、ベトナム語など200以上の様々な言語にも対応しています。
データキャプチャでは情報を高い精度で認識しますが100%の精度を保証するものではありません。その為、誤った文字認識を行う事もあります。
その場合、ABBYY FlexiCapture内の補正アプリケーションを使用し正しい情報をABBYY FlexiCaptureに覚えさせる事で、自動学習を行い、精度が高くなります。
又、帳票は構造化された定型フォームや、非構造化のフォームなど、さまざまな形式がありますが、ABBYY FlexiCaptureではこれらの帳票全てに対応しています。
ABBYY FlexiCaptureで設定可能な帳票の種類
定型(固定)帳票
アンケートや申込書など、レイアウトが同じ帳票が該当します。
例:申込書
準定形帳票
疑似性がある帳票。請求書、注文書のような取引先毎にフォームが異なる帳票が該当します。
例:請求書
非定型帳票
定型、準定型に該当しない帳票。契約書や手紙等の非構造化文書が該当します。
例:契約書
ABBYY FlexiCaptureのアプリケーションについて
ABBYY FlexiCaptureにはさまざまなアプリケーションがあり、それらのアプリケーションの総称が、ABBYY FlexiCaptureと呼ばれています。
ここでは、全てのアプリケーションは記載しませんが、アプリケーション毎に簡単な説明を記載します。
FlexiLayout Studio | 主な利用者:設定者 説明:準定型帳票、非定型帳票の読み取り対象帳票に対し、キーワードや取得する項目を指定し、設定ファイルを作成します。 |
プロジェクト設定ステーション | 主な利用者:設定者 説明:プロジェクト設定ステーションは、上記で記載したFlexiLayout Studioで設定した帳票などを実際の本番でOCRする為の最終設定を行うアプリになります。 代表的な機能として、本番利用する為の以下の様な設定を行う事が可能です。下記以外にも実用的な必要機能が多く取り揃えており、これらの機能については別のコラムで紹介します。 |
データ取込方式の設定 | 帳票の入力先として、指定したフォルダ、メール、スキャナなどの入力先設定を行う事が出来ます。これを設定する事でデータ取込の自動化を図ることが可能です。 |
OCR結果出力ファイルの設定 | エクスポートする時のファイルタイプの指定、エクスポートする項目の出力順、エクスポート先フォルダの指定が出来ます。 |
取得データ加工 | 取得データを最終的に欲しいフォーマット(例:日付、金額など)に統一する事やマスタ連携を行いコード化するなどの加工が可能です。 |
ルールチェックの追加 | 取得したデータをそのままエクスポートする事も出来ますが、取得したデータのフォームをチェックする、また、データ同士の結合や比較と言った設定をする事も出来ます。 |
検証画面レイアウトの調整 | 下記記載の検証ステーションの画面レイアウトを利用しやすく調整する、検証項目を必須項目のみにすると言った設定が出来ます。 |
検証ステーション | 主な利用者:ユーザー 説明:実際に帳票画像から読み取った項目の結果を、対象の帳票画像とOCRした結果を比較して確認する事が出来、誤読した項目の編集、修正も出来ます。 |
次回のコラム
次回のコラムで、FlexiLayout studio、プロジェクト設定ステーション、検証ステーションの概要を説明しますので、お楽しみに。