NRIセキュアテクノロジーズ(NRIセキュア)は12月16日、AIエージェントに関するセキュリティー診断サービス「深層型AI Red Team」を提供開始した。内部状態を可視化して診断する同社独自のアプローチにより、従来の手法では検出困難な脅威に対応できるようにした。
独自開発したツール「ai-guard」により、マルチエージェント環境を含む内部動作を、プログラムの変更なしにリアルタイムで分析する。
脅威の自動検出だけでなく、同社の専門家による診断も併せて行う。可視化された内部状態を観察しながら、従来の診断や標準的なソリューションでは検出困難な攻撃シナリオを立案することで、品質と効率性を両立した診断を実現するとした。
「深層型AI Red Team」の概要
AIエージェントの自律的な実行能力の悪用や、AIエージェントが果たすべき目的の改変、正当な権限と機能を組み合わせた攻撃など、外部からの観察が困難なケースを想定した診断にも対応できるのが特徴だ。
近年、AIエージェントの導入による業務効率化が進む中、内部動作や相互作用などに起因する、AIエージェント固有のセキュリティーインシデントが増加しているという。
現在同社では、AIエージェントシステムのセキュリティー対策を継続的に支援するため、深層型AI Red Teamと同様の内部状態可視化技術を応用した本番環境での継続的な監視サービス「深層型AI Blue Team」を開発している。提供開始は2026年前半を予定する。