RPA(ロボティック・プロセス・オートメーション)ツール「WinActor」を手掛けるNTTデータは2019年3月27日、RPAを先行導入する自治体と共同で実施した、AI(人工知能)を組み込んだ光学的文字認識技術「AI OCR」の実用性検証の結果を発表した。自治体で扱う紙文書の内容は約93%の確率で正確に読み取れると分かったという。

検証した書類の読み取り結果に関する説明資料の一部
(出所:NTTデータ)
[画像のクリックで拡大表示]

 紙文書の内容をシステムに入力する作業を自動化する場合、まずAI OCRなどで紙文書の内容をデータにしないと、RPAを使ってシステムに自動入力することはできない。NTTデータは、自治体が管理する大量の紙文書のデジタル化を見据え、自治体で扱う紙文書の内容を、手書き文字を含めてどれだけ正確にAI OCRで認識できるのかを調べた。

 検証は東京都の町田市、福島県の郡山市、千葉県の市川市など6つの自治体の協力を得て、2018年12月から2019年3月にかけて行った。給与支払報告書や出生届など73種類の紙文書の内容をAI OCR「DX Suite」を使って読み取った。DX SuiteはAIベンチャーのAI insideが提供し、NTTデータも取り扱う。73種類の紙文書に含まれる約7万6000の文字を読み取ったところ、およそ93%を正確に読み取ったという。

 NTTデータは「AI OCRは自治体が大量に保管している紙文書をデジタル化するのに有効だと確認できた」とする。今後はセキュリティーを確保した状況で自治体がAI OCRを活用できるサービスの検討などにつなげていくという。