今後の成長が期待されるフィジカルAIに対して、SIerが商機を探っている。警備や清掃、案内などを担うサービスロボットへの実装を見据え、具体的なビジネスの検討を進める。言語や映像を理解するマルチモーダルAIは実用化が進展し、ロボット制御に関するAI学習が進む2030年代には、人の言動や周辺環境を理解し、人と協働できるロボットの実現が見込まれる。サービスロボット領域は、SIerがビジネスを主導できる余地が大きいとも目されており、各社は技術やノウハウの磨き込みを急ぐ。
(取材・文/安藤章司)
三菱総合研究所
視覚、言語、行動の「VLA」がかぎ
フィジカルAIを明確に定義することは難しいが、一般的には現実世界の多様な情報を受け取ったAIが、情報を処理・分析した上で、ロボットや機器などを通じて物理的に動作させるシステムを指すことが多い。
AIロボティクスの研究を進める三菱総合研究所(MRI)は、フィジカルAIの特徴として▽人の言葉でロボットに指示を出せる▽ロボットが人の動きを見て、自分がどう動くべきかを理解できる▽複数のロボットが人と協調して作業できるようになる―の3点を挙げる。現行の産業用ロボットやロボット掃除機は、人の言葉を直接的に理解することはできず、周囲の状況を理解できないため、人と協調して動くことも難しいが、フィジカルAIの技術によって「ロボットの在り方が劇的に変化する」と、関根秀真・先進技術センター長は指摘する。
三菱総合研究所
関根秀真 センター長
周囲の状況を認識できる視覚(Visual)の能力と、言語(Language)を組み合わせて、適切な行動(Action)を取るフィジカルAIの特徴を示す言葉として「VLA」が使われており、VLAの完成度を高めることがフィジカルAI実用化につながるとされる。「V」と「L」に相当する映像や画像、音声、言語を理解する「マルチモーダルAI」は先行して開発が進んでいるが、ロボットの手足を動かす「A」に当たる行動の部分は発達途上だ。
自動運転車や人型・犬型のロボットは、VLAの成熟度に比例して性能が向上しており、米国と中国が開発にしのぎを削る。人間と同じように幅広い知的活動をこなす汎用人工知能(AGI)が30年頃に登場し、「人間と同じような汎用的作業をこなすフィジカルAIのAGI化は35年頃から段階的に普及していく」(関根センター長)と予測されている。
AIが「行動」を学習するには、実社会のフィールドに出て経験を積むことが欠かせず、また、ロボットのハードウェアを供給する十分なサプライチェーンが存在している必要がある。国内はAIが実地で行動を学べるフィールドが限られ、学習データは不足している。加えて、ハードウェアサプライチェーンの弱さもネックとなって米中の覇権争いに加われない状況が続いている。中国は電気自動車(EV)とドローンで先行しており、「自動運転や人型・犬型ロボットの開発にも有利に働く」(同)とみられる。
国内に目を向けると、自動運転車や産業用ロボットに関しては、自動車メーカーや産業機械メーカー主導で進むことが予想されるが、サービスロボットの社会実装は「現場やユーザー企業の業務を熟知しているSIer主導でビジネスを伸ばせる余地が大きい」(同)。30年にはサービスロボットの国内市場は産業ロボットと同等規模に成長し、40年にはサービスロボットの市場規模が2倍にまで伸びると、MRIは予測している(図参照)。
伊藤忠テクノソリューションズ
「VLM」の活用で知見を蓄積
伊藤忠テクノソリューションズ(CTC)は、早くからマルチモーダルAIに着目してきたSIerだ。寺澤豊・デジタルサービス開発本部アソシエイトプリンシパルは「VLAの完成を待たずとも、現行のマルチモーダルAIとサービスロボットの組み合わせによって、ビジネスを創出することは可能」と話す。
伊藤忠テクノソリューションズ
寺澤 豊 アソシエイトプリンシパル
ポイントとなるのはVLM(視覚言語モデル)の活用である。CTCは警備や案内ロボットを開発するベンダーと共同で、VLMを組み込んだ実証実験を行ったり、複数のロボットを制御するプラットフォームを開発したりするなど、「今の段階から将来のVLAエコシステムの形成を視野に入れた動きをする」(同)ことで、仲間づくりやフィジカルAIの知見を蓄積していくことを検討している。
SIerの視点では、VLAそのものの開発ではなく、VLAとロボットのハードウェアを組み合わせたり、制御したりして、「ユーザー企業の業務に落とし込んでいくSIにビジネスチャンスがある」(同)と指摘。また、マルチモーダルAIを動かす計算資源は、「今のテキスト中心のLLM(大規模言語モデル)とは比べものにならないほど必要になる」(同)として、AI用途のデータセンター需要の増加につながると予測している。
日鉄ソリューションズ
デジタルツインに犬型ロボットを活用
日鉄ソリューションズは、デジタル空間に工場やプラントの操業状況などを一元的に表示する自社開発のデジタルツイン基盤「Geminant(ジェミナント)」と、フィジカルAIの連携を検討している。Geminantは、定点カメラなど各種センサーやIoTを使って情報を収集し、可視化するものだが、「設置型のセンサーだけでは収集が難しい部分に、ロボットを活用している」(下田修・システム研究開発センターデジタルツイン研究部統括研究員)という。
左から日鉄ソリューションズの下田修・統括研究員、
井上和佳・専門部長、石井大介・所長、笹尾和宏・主席研究員
例えば、製鉄所の広大な資材置き場の事例では、これまで人が見回って原材料や中間材、完成品などの在庫を確認していたが、四足歩行の犬型ロボットを使うことで「棚卸作業を自動化できないか検証している」(井上和佳・デジタル製造業センター専門部長)と話す。車輪型のロボットでは、少しの段差で動けなくなってしまうが、犬型ロボットであれば階段の上り下りができるため、人間とほぼ同じ見回り業務がこなせる。
VLAの完成度が高まり、将来的に人型ロボットが実用化されれば、「見回り業務に加えて、人と同じように手を使った作業を行えるようになる」(石井大介・コネクテッド・インダストリー事業推進センター所長)ため、人型ロボットの前段階として、不整地や階段がある場所で、犬型ロボットと見回り業務の組み合わせを試行している。工場や自動倉庫では産業用ロボットが適しているが、野外の資材置き場といったフィールド作業には、人型や犬型といった汎用ロボットが適しているとみる。
副産物として「ロボットを制御する無線ネットワークとしてローカル5Gの導入につながったり、既存のIoTデータとLLMを組み合わせて作業報告書を自動生成するといった案件につながったりするケースもある」(笹尾和宏・デジタルツイン研究部主席研究員)と、商談のきっかけにもなっていると話す。
TIS
マルチロボット管理の“標準”狙う
TISは業界に先駆けてサービスロボットに着目し、事業化に取り組んできたSIerである。17年に警備ロボットなどを開発するSEQSENSEに一部出資するとともに、複数のロボットを管理するマルチロボット管理基盤「RoboticBase」を自社開発してきた。足元のビジネスを見ると「都心オフィスビルの再開発プロジェクトの一環として、サービスロボットを導入し、RoboticBaseで一元的に管理する案件が多い」(正木俊輔・ビジネスイノベーション事業部副事業部長)と、建設・不動産業界と連携したビジネスが好調だという。
TIS
正木俊輔 副事業部長
現状のVLAの完成度では、既存の建物にサービスロボットを導入しても「ドアを開けられない」「エレベーターを使えない」など、できることに限りがあるという課題があった。この点、再開発プロジェクトであれば、サービスロボットと連動する自動ドアやエレベーターを設計の段階から織り込み、「ビルの施設をサービスロボットに合わせる」(同)ことで、実用性を高める手法が取りやすい。
サービスロボットは発展の余地が大きく、今後、さまざまな機種が製品化されることが見込まれる。接続方式が異なる新機種であっても、RoboticBaseがビル設備側との橋渡し役を担うことで、「エレベーターや自動ドアの仕様を変更しなくても、異なるメーカー、異なる仕様のサービスロボットを導入できる」(同)という利点がある。RoboticBaseをサービスロボット管理の事実上の“標準プラットフォーム”に育てていくことで、ビジネスを伸ばす構えだ。