企業のAI活用は実証段階から本番運用へと移行しつつあるが、その裏側で人材不足やコスト増大、基盤の複雑化といった「運用の壁」が顕在化している。トゥモロー・ネットが5月20日に開催したメディアセミナーで、AIプラットフォーム事業本部の平田敦・ソリューション部門長は、AI活用の最大の課題は導入ではなく運用にあると指摘した。
平田 敦 部門長
同社の調査では、AIインフラへの投資を今後1年で増やすと回答した企業が約7割に達する一方、運用面では人材不足やコスト増大、技術の複雑化が主要な課題として浮上している。特に、AIやMLOps、Kubernetes、GPU運用に精通した人材は限られており、特定の担当者に依存する「属人化」が進みやすい状況にあるという。
AIの常時利用が前提となることで、GPUやクラウド利用料の負担が増大し、コストの見通しが立ちにくいという問題も生じている。加えて、Kubernetesの運用には高度なスキルが求められるため、構築や管理の負荷は想定以上に大きい。
また、PoC(概念実証)段階では問題にならなかった課題が、本番運用に移行した段階で明らかになる点もある。平田部門長は「PoCは動けばいいが、本番では可用性やセキュリティー、コスト、運用体制などを含めて検討する必要がある」と説明し、「制御可能で、継続的に運用できるAI基盤を構築できるかが重要」との認識を示した。
こうした課題に対し、AI基盤には統合管理を前提とした設計が求められているとし、平田部門長は「GPUサーバーだけではAI基盤は動かない。Kubernetesやストレージ、ネットワークを一体として管理する必要がある」と述べた。また、環境構築や更新作業の標準化・自動化を進めるとともに、ワークロードごとに最適なリソース配置を行い、GPU利用効率やコストを継続的に最適化する必要があると指摘した。
(山本浩資)