NTTテクノクロスは、音声合成ソリューション「FutureVoice(フューチャーボイス)」をバージョンアップし、最新のAI技術を活用してさらに自然な音声を実現するとともに、直感的で効率的に利用できるようにユーザーインターフェース(UI)を刷新して8月4日に提供を開始した。

バージョンアップした「FutureVoice」のイメージ

 バージョンアップしたFutureVoiceは、NTT人間情報研究所が開発した最先端AI技術のニューラル波形生成型音声合成技術を活用することで、デジタル処理による機械的な音を極限まで削減し、さらに自然な音声を実現。声優や有名人の音声合成では、声の再現性が一層高まり、活用の場面が一段と広がった。また、国内初となる独自の高速音声波形生成アルゴリズムにより、一般的なCPUでの実用的な処理性能と業界トップレベルの自然な音声合成を両立した。

 顧客の潜在的な課題を抽出する独自のデザイン思考を活用し、UIを刷新。直感的な操作を誘導するカラーデザインや表示形式(パターン表示やタグ付など)を採用。動画のナレーション向けの音声制作で長文の音声を作成する際に、セリフ単位で管理することが可能となり、効率的な作業が行えるようにした。さらに、要望が多かった声の高さの部分的な上げ下げや長さの調整を行う機能を付加し、イメージ通りの音声制作が可能となった。