東芝インダストリアルICTソリューション社(錦織弘信社長)は5月25日、ビッグデータや大規模なメディアデータを高速照合するデータ処理技術を開発したと発表した。

 今回開発した高速照合技術は、人物の顔や売り上げデータなどを高次元ベクトルで表現し、あらかじめ類似のベクトル群を索引化しておくことで高速照合を可能とするもの。1000万件の人物の顔画像データから特定の人物を抽出する実験では、従来の技術と比較して、約50倍の8.31ミリ秒(1ミリ秒=1/1000秒)で処理を完了したという。

 具体的には、ベクトル間の距離をなるべく維持したまま圧縮する「ベクトル符号技術」、ベクトル間の距離を計算せずに距離が比較的近いベクトル群をあらかじめ索引化する「ベクトル索引技術」、粗い検索と細かい検索を段階的に組み合わせる「パイプライン検索技術」の三つの技術を連携して高性能化・高速化を実現した。とくに、ベクトル索引技術は、同社が初めて開発したもので、問い合わせデータのベクトルに対して、一つずつベクトルを照合するのではなく、索引化された類似のベクトル群から照合させることで高速処理を実現する。

 同社では、パターンマイニング(類似パターンの検索)、メディア認識の強化、ビッグデータ分析の三つの分野を中心に新技術のソリューション・サービスへの適用を展開していく。例えば、広範囲に設置された監視カメラの映像から特定の人物を瞬時にみつけ出したり、空港などの水際監視では、国際手配者の顔写真リストを高速で照合させることが可能となる。

 今後は、新技術をディープラーニングに応用することで、人工知能(AI)の精度向上につなげるなど適用領域を拡大し、顧客や企業の新たな価値創造を支援していく考え。なお、同社のビッグデータ向けスケールアウト型データベース「GridDB」に新技術を組み合わせ、ビッグデータや大規模メディアデータの高速処理を実現する世界初の高次元ベクトル照合に対応したデータベースを16年度中に製品化する予定。