東芝(田中久雄社長)は、7月2日、音声や映像に含まれる言葉や人物を捉えてその意図や状況を理解し、人にわかりやすく伝えるクラウドサービス「RECAIUS(リカイアス)」の提供を開始すると発表した。その第一弾として、今年10月に「音訳エディタ」と「音声書き起こしエディタサービス」を開始する予定で、7月2日に営業活動を開始した。自治体・図書館向け音訳支援サービス、金融業向け対話サービス、フィールド作業支援などさまざまなサービスへの適用に向けてRECAIUSを提案していく。

 RECAIUSは、人がICTを意識して利用するのではなく、ICTが人の意図や状況に合わせて適切に動作するための仕組みづくりを支援するもの。同社が長年培った音声認識、音声合成、顔・人物画像認識、知識処理技術を融合して、これらの能力を最大限引き出せるよう、必要な知識を日々進化させることが可能なクラウド上で構成されている。さまざまな言葉の表現や人の動き・態度から意図や状況を理解して、要約、翻訳、音声対話、音声合成を利用して、人にわかりやすく伝える。例えば、カメラに写った人に合わせて情報を提示する案内システムや、音声記録をテキスト化して重要な発言だけをチームで共有するなど、幅広い業務や用途で活用できる。

RECAIUSの機能要素

 RECAIUS音訳エディタ「DaisyRings(デイジー・リングス)」は、視覚障がいやディスレクシア(識字障がい)により文字を読むことが困難な人のための音訳コンテンツを、簡単に作成できるクラウドサービス。ウェブブラウザ上で、テキストをアップロードして音訳でき、編集結果をDAISY形式のファイルでダウンロードできる。音声合成の読みやアクセントも簡単に修正できる。図書館や学校、行政機関での利用のほか、一般企業でも製品マニュアルなどドキュメントの音訳に利用できる。

 RECAIUS音声書き起こしエディタは、講演や会議などの録音データをブラウザ上で人が聴いて書き起こす作業を支援するサービス。アップロードした音声データを再生しながらテキスト入力する際、テキスト未入力の箇所を特定して自動的に音声を再生したり、音声認識によるテキスト入力の候補を提示したり、話者の切り替えを推定したりすることで、音声をチェックしながら書き起こしを効率よく行うことができる。

 今後は、RECAIUS音声ビューア、RECAIUS音声クリエータ、RECAIUS音声対話、RECAIUS同時通訳、RECAIUS人物ファインダの各サービスをSaaSで提供していく予定。さらに、RECAIUSの次世代サービスの充実に向け、同社の研究開発センターでさまざまな技術開発に取り組んでいる。その一例として、話者の音声に似た声で多様な感情音声を生成する「感情つき似声生成技術」や、カメラで撮影した看板・標識・メニューなどの画像から複数文字列を同時に認識する「情景文字認識技術」などを開発しているという。