三菱電機(杉山武史社長)は6月3日、同社AI技術「Maisart(マイサート)」の1つである逆強化学習を活用し、人の操作を少ないデータで効率的に模倣学習して、人が操作しているかのような自然な動作を機械が実現することで、人との協調が容易となる「人と協調するAI」を開発したと発表した。

AIが協調して動作する例

 今回の開発では、複数の移動体が存在する環境で、AGV(無人搬送車)に搭載したAIが画像情報により人の操作を模倣学習することで、「道を譲る」など人が操作しているかのような動作を実現し、お見合い状態を回避することなどを可能にした。シミュレーターによる実験では、従来の制御方式と比べて作業効率が30%向上することを確認している。

 従来の機械学習である「教師あり学習」では、教師データを基に操作そのものを学習するため、画像に基づいて操作を模倣する際に大量の教師データが必要となり、教師データを収集するための時間やコストがかかっていた。新技術では、Maisartの1つである逆強化学習により、教師データを基に自ら最適な操作を推定・学習することで、少ない教師データで効率良く学習することが可能になった。シミュレーターによる実験では、従来の「教師あり学習」で必要であった教師データが10分の1以下で、従来と同等以上の模倣学習が可能であることを確認した。

 同社は今後、作業の効率化や作業者間に一定の距離確保が求められる場合など、AGVの利用増加が想定される生産現場や物流現場をはじめ、人と機械が混在する作業環境での実運用や自動運転への適用に向けて、開発に取り組んでいく。