Cogent Labs(コージェントラボ)は、強みとする手書き文字認識のAI OCRエンジンの技術を応用して、帳票や文書の自動仕分け、読み取りを行う文書処理プラットフォーム(PF)の領域にビジネスを広げる。帳票に記された項目と数値の関係性や文書のレイアウト全体の意味を読み取ってデジタル化し、基幹業務システムに受け渡しする文書処理のプラットフォームを開発を加速させる。
企業間の取引業務では、紙やファックス、PDF、表計算、ワープロ、メールなどさまざまな形式の帳票や文書がやりとりされる。人の目で見れば、請求書なのか契約書なのかの種類の判別は一目瞭然で、誰に宛てたもので、金額はこの枠、個数はこの枠と認識できる。だが、これを機械が正しく認識するにはAI技術によって帳票や文書の意味を理解し、読み取る能力が不可欠となる。文書処理プラットフォームでは、さまざまな種類の帳票や文書を認識し、読み取ったあとのデータを基幹業務システムに入力するまでの自動化を目指す。
同社では2021年12月に帳票や文書の仕分けを担う製品「SmartRead」の販売をスタート。まずはSaaS方式での提供で、22年の早い段階でオンプレミス版をラインアップに加えるとともに検索機能も順次拡充していく。オンプレミス版は、金融機関や自治体などクラウド環境にデータを出したくないと考える顧客が主な販売対象になる見込み。
大塚登喜男 常務
将来、ペーパーレス化が進んで、PDFやワープロなどの形式に変わったとしても「レイアウトから意味を読み取る文書の認識技術に対する需要は引き続き拡大する」と大塚登喜男・常務執行役員商品企画マーケティング部長は話す。同分野の向こう5年間の世界市場の伸び率を、同社は年平均36%を超えると見ている。
また、特定業種・業務に向けて最適化した業種対応サービスの開発も進めている。例えば、会計事務所向けに預金通帳を正確に素早く読み取る、設計事務所向けに契約書や図面の読み取りに対応する、自治体の特定業務に向けたサービス提供、などを想定している。業種や業務に最適化したチューニングを行うことで、より高い精度を実現するとともに、導入してすぐに使えるよう使い勝手も改良していく。
どこに何が書いてあるのか決まっていて、単一の帳票しか読み取らない「定型」的な業務や、請求書や申込書のようにある程度決まっている「準定型」、契約書のような自由度の高い「非定型」など、用途によって読み取りの難易度が異なり、運用の方法に違いが出る。ほかにも帳票や文書の入力方法や基幹業務システムへのデータの受け渡しにも個別のシステム構築が発生する場合に備え、複合機ベンダーやSIerなどのビジネスパートナーと連携しつつ最適な文書処理業務の自動化を支援することで、文書処理プラットフォームの分野で「市場の伸び以上の成長」(大塚常務)を目指していく。(安藤章司)