九州大学とソフトバンクと豆蔵の3者は、企業や自治体、教育・研究機関などで蓄積されている様々なデジタルデータについて、データの品質を数学的な理論を用いて客観的に判定し、格付けとして明示する「データ格付け」の実現に向けた共同研究を11月から開始した。3者はデータ格付けにより産官学が保有するデータの品質を明確化することで、データの相互利用の促進や、データ流通市場の活性化を目指す。

「データ格付けのサービス」のイメージ

 昨今、官民を挙げて様々な分野でDX(デジタルトランスフォーメーション)が推進されるなか、企業や自治体、教育・研究機関などが組織内で記録・蓄積しているデータの相互利用が、DXの重要なテーマの一つとなっている。しかし、各組織が保有するデータは仕様や形式が異なるほか、そのデータが利用に適した品質であるかどうかが明示されていないため、データを分析する際には、形式上の整合性の確認や重複、誤記、表記の揺れなどを探して修正・削除するデータクレンジングなどの作業が必要になり、データの相互利用の大きな障壁となっている。

 今回、3者は、こうしたデータの相互利用の障壁を取り除くため、データの品質を数理的に判定して明示するデータ格付けの実現に向けた共同研究を行う。データ格付けによってデータの品質を明確化することで、データの相互利用の促進やデータ流通市場の活性化が見込めるほか、様々なデータを掛け合わせた新たなビジネスの展開や、企業や自治体、教育・研究機関のさらなるDX推進につながることが考えられる。

 共同研究では、データ格付けを行うための新しい数理基盤(アルゴリズム)を確立するとともに、クラウド環境と連携した「データ格付けサービス」の実装に向けた理論の構築と実証実験を行う。データ格付けサービスは、クラウド環境にある各種データの品質を数理的に判定し、格付けとして明確化するサービス。このサービスを実装するためには、データ格付けを可能な限り自動化することが必要なため、数理基盤やAI(人工知能)の活用を想定している。データが形式的な要件を満たしているかどうかを数理基盤で判定し、データ利用者に提供可能な品質かを自動で格付けするほか、AIの活用によりデータの品質を保証する仕組みも検討する。

 なお、この共同研究でデータ格付けの理論構築は九州大学と豆蔵が主担当となり、理論の実装と実証実験は、九州大学とソフトバンクが主担当として実施する。

 今後3者は「数理基盤や理論の構築」を21年1月まで、「実証実験の環境構築」を21年5月まで、「実証実験の実施」を21年7月までのスケジュールで共同研究を進めていく予定。