Special Issue

東芝ソリューション OCRシステムを中国に展開 手書き文字認識のノウハウで、国内ベンダーとして初進出

2012/12/27 19:55

週刊BCN 2012年12月24日vol.1462掲載

 東芝ソリューションは、中国でOCR(光学式文字読み取り装置)システムの販売を本格的に開始する。韓国に続く2か国目の海外販売で、「海外展開を加速する主力プラットフォーム製品の一つ」(大和田昭彦・取締役営業統括責任者)に位置づけて、シェア拡大に取り組む。中国でのビジネスパートナーを増やしながら販売展開していく意向で、OCRシステムの大口顧客である金融や官公庁、製造、医療などの業種を主なターゲットとしていくものだ。中国でのデータエントリー業務に最適化されたOCRシステムの販売は、日系ベンダーでは東芝ソリューションが初。

入力作業の自動化に威力

大和田昭彦
取締役営業統括責任者
 OCRは文字を読み取る装置のことで、東芝ソリューションの「OCRスキャナ」は、OCRのソフトウェアとハードウェアを一体化した製品群であり、各種データエントリー業務の効率化を実現するOCRシステムとして提案していくという。この製品は、古くは東芝グループが1967年、世界初の手書き文字認識によって開発した郵便区分機からスタートしたもので、45年余りの歴史をもつ。東芝ソリューションでは自社商材の海外展開を積極的に進めており、「OCRスキャナ」もグローバル対応商材の一つと位置づけている。すでに韓国では販売実績があり、この12月から中国での販売を開始する。2013年3月までをめどに中国語の手書き文字認識データベースも完成させることで、東芝の強みである文字認識技術を活用した信頼性の高い製品として販売に弾みをつける。

 スキャナといえば、複合機に付属するイメージスキャナや、文書の読み取りに特化したビジネススキャナ、家庭用スキャナなどを連想しがちだが、大和田昭彦・取締役営業統括責任者は、「OCRスキャナとイメージスキャナは似て非なるもの」と説明する。最も異なる点は、「OCRスキャナ」を構成するハードウェアとソフトウェアの両方がデータエントリーに特化している点にある。通常のイメージスキャナのように画像も読み込めるが、あくまでも付随的な機能であり、最も重要な機能はデータエントリー業務における入力作業の自動化だ。郵便区分機の時代から綿々と読み取り精度の向上に取り組んできたこともあり、「人間が目で読み取って入力するよりも、はるかに高い精度で読み込める」(大和田取締役)というレベルまで完成度を高めてきた。

 手書き文字認識に特化したOCRスキャナを開発しているのは、国内に数社しかなく、中国で本格的な販売を始めるのは東芝ソリューションが初めてとなる。

中国で販売を開始する卓上型のOCRスキャナ。第一弾として読み取り速度50枚/分と、120枚/分の2機種を投入する

高水準の読み取り精度

 OCRスキャナの外見的な特徴は、「スタッカ」と呼ばれる文書や帳票の排出皿が複数備えられている点だ。通常のイメージスキャナは読み取った文書を排出するスタッカが1か所だけだが、OCRスキャナは正常に読み取った文書と、読み取れなかった文書を分ける機能があるために、スタッカも複数が装備されている。エラー判定の文書は、通常判定とは別のスタッカに排出することで、ユーザーはエラー判定の文書を確実に選別できる。

 さらに、読み込んだ文書に「通し番号」を印字するナンバリング機能も、通常のイメージスキャナにはない機能である。一度、OCRスキャナに通した文書で、読み込みきれなかった箇所を探すときにナンバリング機能が役立つ。OCRスキャナの制御用パソコンの画面でエラーの詳細を確認したら、例えば“118枚目”の文書がうまく読み込めなかったことがわかったとする。もし、スタッカやナンバリング機能がなければ、大量の文書のなかから118枚目を探すのは容易なことではない。だが、エラー用のスタッカに排出され、かつナンバリング機能によって「118」と刻印されていれば、効率よく目的の文書にたどり着けるわけだ。

 さらに細かな違いをみていくと、通常のイメージスキャナでは読み込む際に用紙が伸び縮みして、画像に誤差がでてくる。イメージスキャナでは、これをデジタルで補正して正しい画像に仕上げるが、OCRスキャナは極力、用紙の伸び縮みによる誤差を発生させない機構にすることで読み取り速度や精度の向上に努めている。

 その他にも「長年に渡り、日本国内のデータエントリー業務で実績を積み上げてきたノウハウが生かされており、カタログスペック上ではわからない細かな工夫が数多くある」(大和田取締役)という。

手書き漢字の読み取り精度に一日の長

 販売ターゲットは、主に金融や官公庁など帳票や紙文書を多く扱う業種である。金融では、例えば保険の申し込み用紙をコンピュータに入力するデータエントリー装置として活用するケースが多く、官公庁では調査・統計のデータエントリーといった用途が多い。産業分野でいえば、製造業では入出庫管理伝票の読み込み、医療分野では患者が手書きした問診票を電子カルテ関連のシステムに入力するなどの需要が見込める。

 中国では、急速な経済発展による沿岸部を中心とした人件費の高騰が際立っており、これまで人の手で入力してきたデータエントリー作業を機械化する動きが活発化している。東芝ソリューションでは、こうした中国の市場動向を踏まえたうえで、まずは、OCRシステム提案において、卓上型のOCRスキャナで読み取り速度50枚/分の「モデル1500」(日本での販売価格は120万円から)と、120枚/分の「モデル2500」(180万円から)の2機種を投入する。最高で毎分300枚の読み取り能力がある「モデル1000」まで計5機種を揃える東芝ソリューションだが、「人件費の削減需要が高まる中国市場の動向をみながら、投入機種を段階的に増やしていく」考えだ。

帳票読み取り画面のイメージ。中国で使われている漢字(簡体字)に対応する

 欧米にもOCRスキャナを開発しているベンダーはあるが、漢字をはじめとする手書きの2バイト文字を読み取る精度の高さでは、国内ベンダーに一日の長がある。日本と中国は同じ漢字を共有しており、「手書き漢字の読み取り精度では世界最高水準」(大和田取締役)を自負する東芝ソリューションは、ライバル他社と比べた優位性に確かな手応えを感じている。ただ、日本と中国は同じ漢字文化であるとはいえ、字体が異なることと、読み取り精度を高めるためには人名や地名のデータベースの精度を高める必要がある。

パートナー開拓で拡販を図る

 具体的には、「東京都港区芝浦1-1-1」という住所で、仮に「港」という文字が読み取れなかったとしても、前後の地名から「港」の字を推測して当てる。人名も同様にデータベースのなかから確度の高い文字を当てる。東芝ソリューションでは「知識処理」と呼んでおり、処理を行った文字は、後から人の目で確認しやすいよう制御ソフトの画面上の文字の色を変えて表示。精度向上のための細かな配慮がなされている。地名や人名だけでなく、商品名や取引先といったユーザー固有のデータベースを構築することも可能だ。

 東芝ソリューションは、中国の漢字(簡体字)の手書き文字の読み取り精度を高めるために、データベースの拡充作業を進めている。データベースが一通り完成する2013年3月までに、パートナーを開拓しながら、販路の整備も並行して行う。同社は中国大手SIerの東軟集団(Neusoftグループ)と協業関係にあり、瀋陽に東軟集団との合弁会社である瀋陽東芝東軟情報システムを置く。東軟集団の中国全土の販売網を活用するとともに、「中国の業種・ERPに強い有力SIer、中国OCR有力代理店、日本でパートナー関係のある日系企業などと幅広くパートナー関係を構築しながら販路開拓を行う」(大和田取締役)と、OCRシステムの販売においてはビジネスパートナーとの協業を主軸に据える。

 OCRシステムは、各種業務の入口であるデータ入力システムであり、このOCRシステムの提案活動を行う中で、文書や帳票を管理するシステムや、基幹業務システムのつなぎ込みといったシステム構築の案件獲得も見込める。

 大和田取締役は、「どれほど性能の高い商品を出しても、中国でのビジネスパートナーとの協業なしには成り立たない」と、パートナー自身のビジネス拡大に貢献できるよう、営業面やサポート体制を強化していく考えを示す。こうした関連するシステム構築やサービスなどを含め、3年をめどに中国でのデータエントリー業務におけるOCRシステム市場を立ち上げながら、第一段階の目標として年商20億~30億円に育てていく方針だ。
  • 1

関連記事

TSOLのグローバル事業 中国Neusoftと組んで本格立ち上げ 「ギブ・アンド・テイク」で世界を目指す

東芝ソリューション グローバル進出に本腰 中国巨大市場へ大きな一歩

東芝ソリューション、卓上型OCRの最上位モデル

東芝ソリューション、国内最高速クラスのハイエンドOCRシステム

外部リンク

東芝ソリューション=http://www.toshiba-sol.co.jp/