実際の利用環境に耐え得る翻訳アプリを
総務省が2015年度から2019年度までの5年間で約100億円の予算を投じて行う多言語音声翻訳技術の研究開発・実証は、三つの事業から成る。
一つは、雑音抑制技術の開発だ。実際に翻訳が必要になる場面を想定すれば、会話の相手と一対一で静かな場所で対面しているというケースはほとんどないはず。周囲の雑音を抑制し、翻訳したい声だけを認識する技術が求められる。目標は、音声認識誤り率10%以下だ。
二つめは、高精度な画像処理技術の追求だ。文字を画像情報として取り込んで言語に変換するためのもので、具体的には、特殊な字体を使っている文字でも認識できる画像処理技術を開発し、文字認識誤り率20%以下を目指す。
三つめは、病院や商業施設、各種交通機関など、場所・ケースに応じた高精度な翻訳結果を導き出すために、翻訳機能を利用した場所や時間の情報と翻訳結果データを統合的に管理する技術を開発する。
病院や公共交通機関で試験導入して性能を評価
これらの三つの事業で開発した技術は、実際に、国家戦略特区などを活用して病院や公共交通機関などに試験導入し、性能評価を行う。総務省は、「2020年までに、とくに訪日外国人旅行者の多い国で使われている10言語間の翻訳精度を大きく向上させたい。旅行会話、医療分野の会話、買い物時の日常会話、災害情報の翻訳を実用レベルにするのが目標」としている。そのための取り組みとして、分野ごとに固有名詞や専門用語などを1万件収集し、翻訳の基礎データとして活用する。
総務省は、事業の主体として、情報通信研究機構(NICT)と関連の民間企業を想定している。ITの観点でいえば、これらの技術を活用した多言語対応のPOSレジアプリやオムニチャネル・ソリューションなども考えられるだろう。しかし、こうした国の取り組みは、広く知られているとはいい難い。まずは事業の認知度向上に努める必要がありそうだ。(本多和幸)