紙の文書の画像やPDFをテキストデータに変換するOCRは、DX推進において重要な役割を果たすツールの一つとなっている。AI-OCRサービス「DX Suite」を提供するAI insideは、理論上99.9993%という高いデータ化精度を武器に成長を続けている。一方で渡久地択社長CEOは「OCRは完了した」と強調し、AIによるデータ活用などにもビジネスのフィールドを広げつつある。AIによる業務効率化においてAI insideの技術がどのような強みを発揮するのか、同社の戦略を追った。
(取材・文/南雲亮平)
精度99.999%超え 非定型文書にも対応
AI insideの主力製品であるDX Suiteは、独自開発した大規模言語モデルの「PolySphere-4」を搭載し、AI-OCRの質を大きく向上させている。特筆すべき点は、実データの検証において平均99.6%という高い読取精度を実現していることだ。従来はデータ化が困難とされていた、罫線のない複雑な財務諸表や有価証券報告書などに含まれる長大な表、自治体ごとに書式が異なる課税証明書、旧漢字を含む原戸籍、写真に記された輸出入コンテナ番号などにも高精度で対応できるようになった。非定型文書への対応も進めており、読み取り範囲や項目の指定も不要になりつつある。
AI inside
渡久地 択 CEO
2025年9月にDX Suiteへ実装された「Critic Intelligence」も、高精度なデータ入力業務の自動化を支えている。これはAIが出力した内容の誤りを指摘するAIで、人がエラーを特定できる精度は60~80%にとどまるが、Critic Intelligenceは同社の検証において最高で99.92%、平均で99.86%の精度で誤りを検知したといい、人を大きく上回る精度を実現した。処理時間も約80%削減され、高精度と業務効率化の両立を実現している。DX Suiteと組み合わせることで、データ化精度は理論上99.9993%にまで到達する。これが渡久地CEOが語った「完了」の根拠になっている。
AI戦略を左右する非構造化データの活用
DX Suiteのユーザー数は5年前と比べて2倍以上に増加するなど、AI-OCRの需要は年々高まっている。背景には、「紙がなくなることはない」という現実がある。名刺交換をはじめ、紙やPDFなどのアナログデータは今も存続しており、むしろ紙データを入力する需要は微増傾向にあるという。理由の一つに、単に帳票類のデジタル化にとどまらず、社内に眠る膨大な非構造化データをAIが活用できるかたちへ整備したいというニーズがある。AIをビジネスで活用する場合、ユーザー企業が自社でAIモデルを独自開発するには高いハードルがある。そのため、多くの企業はRAG(検索拡張生成)を構築し、それを既製のAIモデルから参照して成果物を出力するという戦略をとる。RAGの充実度は、企業のAI戦略を左右するため、高品質なデータを求める企業が増えている。
現状では、過去の書類がPDF化されていても、AIが参照できるデータベースとしては機能していないケースも多い。AIにデータを正しく理解させるには、単に文字を読み取るだけでなく、データの意味を構造化して抽出する必要がある。例えばレシートの読み取りでも、「大根」「105円」といった単語だけでなく、それぞれが「品目」「価格」という関係性にあることをAIが理解できなければ、RAGとしての価値は生まれない。
抽出したデータ同士を関連付けるためには、文脈を判断し、関係性の強い部分を適切に「チャンク化」することが重要だ。チャンクとは情報を細かな単位に分割したものだが、データを100文字や1000文字ごと、あるいは段落ごとといったように機械的に区切るだけでは、本来は関連がある情報が分断され、RAGの回答精度が向上しない。渡久地CEOは「DX Suiteの構造化技術を経由したRAGは平均96%の精度を実現している」と述べ、一般的に70%から高くても80%程度とされるRAGの回答精度に対し、同社の技術には優位性があることを強調した。
機能追加も価格据え置き パートナー網通じシェア拡大
DX Suiteはユーザー数を伸ばしているものの、データ入力市場の大半はいまだ人手による作業が占めている。ここからさらにAI-OCRの導入を広げるため、AI insideは三つの戦略を重視している。
一つは「追加料金なし」という価格戦略だ。SaaSビジネスで一般的な、機能追加によるアップセルは行わない。「より良いものを据え置きで提供するか、現行製品をより安価にする」という方針に基づき、Critic Intelligenceなどの新機能も無償提供している。この戦略を支えるのは、AIの進化によるスケーラビリティへの信頼だ。渡久地CEOは、将来的にAIの計算コストは現在の10分の1に下がると見込んでおり、削減したコストをサービス拡充に回すことでシェア拡大を狙う。ユーザーは一度導入してしまえば追加コストの承認手続きなどを繰り返す必要がなく、販売パートナーにとっても、顧客に常に最先端の環境を提供できるというメリットがある。
二つめは、シンプルなユーザーインターフェース(UI)を通じたユーザー体験の提供だ。同社では「ボタンの数を減らす」ことを徹底しており、機能が増えてもUIはシンプルさを維持、あるいはさらに簡素化されている。ユーザーはITリテラシーにかかわらず、「気がつかないうちに製品が便利に、しかもコストパフォーマンスが向上し続ける」という体験を享受できる。
三つめが、幅広い業界・業種・企業規模に対応した製品群をそろえることに注力している。あらかじめさまざまなユースケースを想定した学習を済ませているため、ハイエンドのオンプレミス製品でも、チューニングに時間をかけることなく、構築開始から1週間ほどで利用を開始できる。
シェア拡大のためには販売パートナー網の充実も不可欠だ。同社は1年以上前に、販売代理店を個別に募る手法から、大手ディストリビューターを中心としたネットワーク拡大へと方針転換した。この戦略の背景にあるのは、地方市場の開拓だ。地域で強い影響力を持つ地場のSIerや販売店(ローカルキング)と連携し、地方や中小企業へのアプローチを強化している。
規模や得意分野の異なるリセラーにDX Suiteの取り扱いを促すにあたっては、やはり製品の分かりやすさが武器となっている。展示会や説明会で紙に文字を書き、それを即座に正確に読み取るデモンストレーションは好評だという。
NTTデータ
RPA活用拡大で取り扱い開始 トータルで業務を設計し提案
DX Suiteは、企業の業務効率化を支援するSIerなどのビジネスの加速にも重要な役割を果たしている。
NTTデータは、18年にDX Suiteの販売パートナーとなり、クラウド版とオンプレミス版を展開している。同社がDX Suiteの取り扱いを開始した背景には、17年から本格展開していたRPAツールの「WinActor」がある。当時、定型業務の自動化の需要が非常に高かったが、課題となったのは大量の紙の書類だった。手書きの伝票や見積書、納品書などは人の手が必要な部分が多く、業務効率化の余地があった。ソリューションを探す中で、精度が高く伸びしろもあると期待され、DX Suiteが選定された。
NTTデータ
御堂岡 真 課長
NTTデータ社会基盤ソリューション事業本部ソーシャルイノベーション事業部アセットビジネス統括部アセットビジネス担当の御堂岡真・課長は「従来型のOCRでは難しかった非定型帳票や手書き文字への対応力が決め手になった」と振り返り、公共、金融、メーカー、流通など幅広い分野の顧客が順次導入したと紹介する。
同社が考えるDX Suiteの強みは、タクシーチケットのような走り書きでも判別できる手書き文字への高い読取精度、国産ならではの直感的な使い勝手、そして絶え間ない製品進化の3点だ。特に操作に関する問い合わせが非常に少ないことは、サポートコストの抑制にも役立っているという。
DX Suiteの提供方法は主に二つある。一つはNTTデータが大手顧客に直接提案する方法。もう一つは全国約300社のWinActor販売店を通じた中小規模案件だ。NTTデータがDX Suiteの1次代理店となり、各地域のSIerやディストリビューターを通じてエンドユーザーに届ける体制を築いている。
提案時には、単にAI-OCRの導入を勧めるのではなく、「人間がストレスを感じる単純作業からの解放」という文脈を重視している。「本当に自分がやる意義のある作業か、面倒な作業はないか」と顧客に問いかけ、潜在的な課題を引き出し、自動化による業務削減という具体的な価値を提示している。
AI inside
本田教之 Manager
また、AI-OCRのみでは業務全体を完結することはできないため、AI inside側ではRPAや他業務システムとの連携事例をカタログ化して紹介している。現在注目されている組み合わせは生成AIとの連携で、読み込んだデータの仕分けやサマリー作成など、人の判断が必要な工程をAIで代替するニーズが増えているという。AI insideのPartner Sales事業部Enterprise Partner Sales Division Enterprise Partner Sales Unitの本田教之・Managerは「(OCRの)前後工程を含め、トータルで業務を設計し、サービスを提供する体制づくりが求められる」と支援の重要性を強調する。