データグリッドとNTTテクノクロス、ドコモgacco(ガッコ)は、ガッコが運営する誰でも原則無料で受講できる大規模公開オンライン講座「gacco」で、「AIの基礎と開発プロジェクトの進め方」を3月12日に開講した。AIを活用したMOOC講座の提供は日本初となる。

講義動画ができるまでのフローイメージ

 AIを活用したMOOC講座は、講師が話している数分程度の動画と、テキストデータから生成した音声データをもとにAIで講師動画を生成することで、講座をまるで講師本人が話しているように再現する。音声合成技術をもつNTTテクノクロスと、AIによる人物動画生成技術をもつデータグリッドの最先端技術を活用して講義動画を生成し、gaccoを運営するガッコがNTTドコモと連携して講座の提供を行う。

 具体的には、NTTテクノクロスの音声合成サービス「FutureVoice Crayon(フューチャーボイス クレヨン)」を活用して、テキストデータから講座内の音声データを生成する。テキストデータをFutureVoice Crayonにインプットすることで、人間の声と遜色ない自然な音声データが生成される。

 次に、データグリッドのAIによる人物動画生成技術によって、音声データと数分程度の講師動画をもとに、音声に口の動きを合わせ、講師本人が話しているような長尺の講義動画を自動的に生成する。この技術は、少数のデータで精度の高いデータ生成が可能なGAN(Generative Adversarial Network/敵対的生成ネットワーク)によって実現している。

 これまで、講座の動画制作は、撮影用のスタジオを用意し、あらかじめ準備した講義原稿を講師が解説する模様を撮影することが基本だったが、人物動画生成と音声合成の技術を活用することでスタジオに出向くことなく、また講師が資料説明する必要もなく、動画を制作することが可能となった。

 今後、Withコロナ・Afterコロナの時代で、大学や研究機関、企業や団体が求める動画制作の効率化を目的として、AI技術を活用した動画制作のプロダクト化に向け開発を進めていく。

 なお、今回の講座「AIの基礎と開発プロジェクトの進め方」では、AIに関する基本的な解説から始まり、実際にAI開発プロジェクトを進める際のポイントまで、初心者でも理解しやすい平易な言葉で解説する。第1週では、AIの概要と最低限押さえておきたい専門用語の解説を通して、AIの基礎を学んでもらう。第2週では、AIの中でも比較的新しい領域である「生成AI」について、具体的な応用事例も交えながら仕組みを解説していく。そして、第3週ではAI開発プロジェクトを進める上でプロジェクトを成功に導くためのポイントを、フェーズごとにできるだけ分かりやすくまとめている。