オブザーバビリティー(可観測性)ツールは監視対象の多角化や機能統合といった進化を続けながら、開発の焦点が次のステージへと移っている。大手ベンダーはAIの活用を通じてシステムの複雑化に対処するとともに、自動修復機能の高度化を競う。現時点でも類型化できるインシデントに対して自動的に修復するワークフロー機能を備えるが、AIによってさらに精度を向上させる考えだ。共通する到達点は、人手を介さずにインシデント対応が済む未来。技術開発の現在地や市場への浸透について各社に展望を聞いた。
(取材・文/春菜孝明)
米New Relic日本法人
外部ツールと連携エコシステム拡大へ
米New Relic(ニューレリック)はオブザーバビリティー「3.0」への進化を打ち出す。APM(アプリケーションパフォーマンスモニタリング)など監視対象ごとのツールを「1.0」と位置付け、「2.0」は機能群を統合したプラットフォームになる。この段階ではオールインワンで活用できる一方、機能が複雑化し、使いこなすことが難しくなったという。こうした課題解決に向けて(1)ビジネスの全領域への貢献(2)高度な予測(3)データ収集の拡大ーを柱にアップデートしている。
さらに収集、分析、可視化のすべてのレイヤーにAIが関与し、自動化を強化。自然言語でアラート内容などを解説するAIアシスタント機能を搭載し、技術者以外も現状を把握できる仕様になっている。
米New Relic日本法人
松本大樹 執行役員
次の段階にあたる自動修復について、日本法人執行役員の松本大樹・技術統括兼CTOは「今後1~2年後の実現をめどに、機能実装や新機能開発を進めている」と説明する。実現には、どこまでAIに任せられるか状況判断する学習を進めた上で、外部ツールに搭載されたAIエージェントとニューレリックのAIエージェントが連携する「Agentic Orchestration」がかぎになるとみる。これまではツールを監視する機能がメインだったが、AIエージェント同士が連携して情報をやりとりすることで、アラートなどの対応を効率化し、自動修復を視野に入れた運用の自律化が進む。すでに「Gemini」や「GitHub」「ServiceNow」と連携しており、引き続き各ツールのトップベンダーに範囲を広げ、エコシステムを築いていく方針だ。
技術的進化に加え、日本市場ではサポート体制が定着に貢献していると分析する。商談段階からエンジニアが同行し、導入や運用を支援している。9月には認定資格を刷新するなど、人材育成面を強化した。近年はSIerとのパートナー契約に注力しており、市場拡大とともに、蓄積した知見の体系的な共有にも取り組む。松本執行役員は「オブザーバビリティーの知名度は高まったが、エンジニアで活用している人はまだ少ない。人員を増やして対応していきたい」と組織強化も進める考えを示す。
Datadog Japan
AIの機能強化が精度向上に直結
「マニュアル作業でアラート対応するのは、ほぼ限界に達している」。Datadog Japanの守屋賢一・ディレクター(セールスエンジニアリング)は、インシデントに手動で対応する難しさをこう指摘する。システムがさまざまな技術によって複雑に構築、連携されるにつれ、アラートの原因を突き止めるのは手間と時間がかかるようになった。
Datadog Japan
守屋賢一 ディレクター
米Datadog(データドッグ)は2025年6月、AIエージェント「Bits AI SRE」を発表した。AIがインシデント発生の背景を把握し、影響範囲などを分析。AIによる判断プロセスを可視化し、ブラックボックスにならない工夫を施す。ほかにもコードを理解して開発中の問題解決を支援する「Bits AI Dev Agent」、シグナルのトリアージと対応方法を提示する「Bits AI Security Analyst」を新機能として展開する。
一連のAI機能を踏まえ「将来的には(AIによる)自動修復まで持っていく」(守屋・ディレクター)と展望する。調査や分析にフォーカスをしているAIの機能をどこまで強化できるかが、自動修復の精度向上に直結するという。
オブザーバビリティーのデータとの関連性が強いセキュリティー機能の拡張も進める。従来のクラウドセキュリティーと脅威管理(Threat Management)に加え、コードの脆弱性を検知して修正するコードセキュリティーを発表した。ログ管理機能への注力も打ち出し、ログの重要度や利用頻度に応じて分類、保存する機能や、クラウド以外に自社環境内でログ管理ができるソリューションを提供する。
Datadog Japan
正井拓己 社長
日本法人では製品の拡販に向けて24年、中堅企業をターゲットにしたミッドマーケットのチームを立ち上げ、営業体制はエンタープライズとコマーシャル(スタートアップ系)と合わせて三つの組織となった。正井拓己・プレジデント&カントリーゼネラルマネージャー日本法人社長は、オブザーバビリティーになじみがなかった業界でも、クラウドシフトを機に新規導入が活発になっているとして「業種業界や規模問わずにサポートする」と述べる。
米Dynatrace日本法人
全自動化はエージェント型で実現
米Dynatrace(ダイナトレース)はAIエンジンの「Davis AI」を「予測AI」「因果AI」「生成AI」として実装し、従来の監視業務に比べて異常検知から復旧までのプロセスを大幅に効率化している。予測AIはリアルタイムで異常を検知し、傾向分析により予兆も捉える。因果AIが分析モデルを用いて、トポロジーやサービスフローをもとに異常の根本原因を特定。生成AIは予測AI、因果AIの結果を受け、自然言語によるデータアクセスやダッシュボードの生成、解決策の自動提案などの機能を有する。
米Dynatrace日本法人
日野義久 執行役員
加えて、復旧作業を自動化する構想を第3世代プラットフォームとし、実現の決め手となる「エージェント型AI」の開発を進めている。エージェント型AIは、AI同士の連携を強める役割を担う。日本法人執行役員の日野義久・エバンジェリストは「過去の障害対応を分析して自動化するという工程を代替する」と解説する。
AIを中心とする監視フローを支える核として、ツールの導入とデータ収集における独自機能がある。ツール導入時は「OneAgent」をインストールすれば、監視項目の決定や設定作業を自動で行う。手動設定では数カ月かかる可能性がある作業を、早ければ数時間で完了できる。データ収集ではデータレイクハウスの「Grail」が稼働。情報間の関係性が把握できるようにデータにタグ付けすることで、異常を検知したログやトレースなどの関連を早期に見つけられる。
この二つは、情報取得の即応性と精度を両立する基盤と言える。日野執行役員は「ログデータは体系化されておらず、従来型のログを深く分析するツールはデータ量が多くなってしまう」と懸念を示し、「ダイナトレースはサービス監視中心のアーキテクチャーだ」と違いを鮮明にする。顧客からは収集するデータ量を減らせるとして需要が生まれているという。
同社のツールが一番効果を発揮するのは、自動化のメリットを最大限享受できる「複雑なIT環境を持つ企業」とし、グローバルでも大企業を中心に利用が進んでいると明かす。日本市場でもエンタープライズ向けの展開を強化し、案件の大型化も見込んでいる。
ハルシネーション防止にも応用
AIを製品や業務フローに組み込む動きが一般的になる中で、AIシステムの内部処理や判断の根拠が見えなくなる懸念が高まっている。AIの透明性確保に対しても、オブザーバビリティーツールは役立っている。
ダイナトレースは主要なAIエンジンやハードウェアなどのインフラを含むAI環境を監視対象に含め、パフォーマンスだけでなく、ハルシネーションや個人情報のリークといったAI特有のリスクも可視化する。内部の処理を把握する技術によって信頼性と安全性の高いAI運用を支援している。
データドッグは「LLM Observability」として機能を提供。LLM(大規模言語モデル)の応答について別のLLMでチェックする仕組みを構築する。ハルシネーションやプロンプトインジェクション(出力禁止の情報の引き出し)、個人情報漏えいの有無を事前に評価する仕組みのほか、LLMのパフォーマンスをエンドツーエンドで可視化することで、AIのパフォーマンスとコストを最適化できるとする。
ニューレリックが発表している導入事例では、ユーザー体験の定量的な把握やLLMの利用状況の観測を目的に活用されている。中外製薬が従業員業務支援の生成AIアプリを提供する中でモニタリングに採用。複数のLLMを搭載し、ピーク時の利用は1時間で180万トークンに達する環境のモニタリングを担っている。