NTTテクノクロス(串間和彦社長)は2月19日、音声合成ソフトウェア「FutureVoice Crayon(フューチャーボイス クレヨン)」の新バージョンを昨年9月に提供を開始し、ファーストユーザーとして、テレビ朝日の「AI×CGアナウンサー 花里ゆいな」の声に利用されたと発表した。

 音声合成での感情表現は、話速・抑揚・音の高さなどの音声合成パラメーターを変更することで作成していたが、機械音の印象が強くなるなど、期待通りの感情を表現した音声を作成することは困難だった。人の悲しい声や楽しい声など感情ごとに音声を収録しモデル化することも可能だが、作成のコストや期間がかかることが課題になっていた。新バージョンでは、こうした課題を解決するために、深層学習(DNN)を活用することで、感情を込めた少量の音声から、より人に近い、肉声感のある感情表現が可能な合成音声を提供する。

 また、人物やキャラクターなど複数の音声を利用して、新たな声を作り出すことが可能。これにより、特定の人の声の権利に依存せず、実在しない独自の声や平均的な声を作り出すことができる。

 さらに、合成音声の発話情報(読み・時間)を出力でき、CGやロボットの動作と連動できるようにした。唇や身体の動きと、合成音声の発話タイミングをより正確に同期させることができるため、自然な発話を可能にした。

 ファーストユーザーとして、テレビ朝日が2月10日深夜放送の地上波インフォメーション番組「CGアナウンサーの番組ニュース」に出演した「AI×CGアナウンサー 花里ゆいな」に、FutureVoice Crayonの新バージョンで作成した合成音声が利用されている。