ロボティクス分野におけるAI(人工知能)の導入は近年急速に進んでおり、様々な産業や我々の日常生活に大きな影響を与えています。ここで言うAIというのは機械学習や深層学習など、学習系の技術のことです。AI技術はロボットに高度な知能と自律性を付与し、ロボットは従来を大きく上回る性能を手に入れたため、ロボットにAIを活用した事例もたくさん出てくるようになりました。
本記事ではロボットにAIがどのように活用されているかを大雑把にまとめます。初学者向けの記事ですが、知識の整理としても参考になるものを目指しています。また、実際に企業がロボットへAIを導入し活用しているわかりやすい事例についてもいくつか紹介します。
Contents
ロボットを構成する要素
まず、ロボットはそもそもどのような物なのでしょうか?ロボットは非常に多くの技術的要素が組み合わさって出来るものであり、科学技術の結晶と言えます。しかし、ロボットは主に3つの要素
- 知能・制御系
- センサ系
- 駆動・構造系
から成り立っている機械である、と言われています。知能・制御系というのはロボットが判断を下し、行動計画を立て、意思決定を行う部分です。ここでは、ロボットがより複雑なタスクを効率的に実行できるようにするためにAIが重要な役割を果たします。センサ系は人間に例えると目や耳などの感覚器官であり、ロボットが外部環境から情報を取得するための機能を担っています。カメラ、加速度センサ、音センサ、触覚センサなどが用いられ、これらのデータを解釈して行動に反映させるためにAIが利用されることがあります。駆動・構造系は人間における筋肉や骨格の部分で、モータなどのアクチュエータや動力伝達機構などが該当します。そのようなハードウェア関連でAIはあまり使われないため、本記事では知能・制御系とセンサ系に絞ってAI活用例を解説します。
知能・制御系における活用例
意思決定や行動計画
ロボットは人間が遠隔操作しない場合、自分自身でどのように動くかの判断を下す必要があります。このように自動で動くタイプは自律型ロボットと呼ばれ、人間が操縦する場合に比べ、開発者がいちいち状況に応じどのように動くべきかをプログラムしなければなりません。
このような未知の環境に対応するために使われる技術の一つが強化学習です。強化学習というのは簡単に言うと、行動して環境に働きかけた結果をフィードバックすることで行動の決定の仕方を学習させる手法のことです(本記事では強化学習そのものについての詳しい説明はしません)。強化学習を用いれば、未知の環境で効率的に移動する方法や、作業手順を最適化する方法を人間がいちいちプログラムせずともロボットに自分で試行錯誤させ、習得させることができます。活用例としては、自律移動ロボットに目的地への最短経路を見つけさせたり、ロボットアームに形状が異なる物体を把持させる、などがあります。
また、ロボットに動作を学習させる方法には他にも模倣学習があります。模倣学習というのは人間の行動パターンをロボットに真似させることで効率的に学習させる手法のことです。コントローラーを使って人間が操作したデータをロボットに学習させたりします。
人との会話
センサ系と一部被る内容ですが、ロボットを人とコミュニケーションさせようとするとまた多くの課題を解決しなければいけません。まず、人が言っていることを正確に聞き取る必要があります。このようなとき音声認識という技術が用いられますが、機械学習を活用することで音声認識の精度を高めることができます。過去に学習させたデータの情報を用いて、新たに得た音声が何を言っているのか高い確率で予測させるわけです。また、得た音声データの内容を理解するためには自然言語処理の技術が活用されます。
基盤モデル
近年の流行りとして、外せないテーマが基盤モデルです。ここまで挙げたロボットのAI活用は、あくまで特定のタスクを実行させることを想定したものでした。例えば物体をうまく運ぶためだけに学習させたロボットに対して形の異なる物体を運ばせることは簡単にできるかもしれませんが、そのロボットにダンスを踊らせようとすると、全く異なるタスクなので一からモデルを設計し直し、一から学習させる必要があるでしょう。
今のは極端な例かもしれませんが、やはり理想は一つのロボットが多種多様なタスクに少しの調整で対処することであり、そのためにあらかじめ大量かつ多様なデータで学習させた大規模モデルを用意してそれを少し調整(ファインチューニングなど)するだけで対応させるということが考え出されました。このようなモデルを基盤モデルと言います。
基盤モデルは多様なタスクに簡単に適用させることができるだけでなく、様々なデータで学習されているためその表現力も非常に高く、一般化能力も優れています。しかし課題は多く、世界中で今研究が進んでいますがまだ発展途上の段階です。
センサ系における活用例
画像認識
ロボットに搭載するセンサとしてはまずカメラが思い浮かぶでしょう。カメラ画像に何が、どこに写っているのか認識したいというときに使われる技術が物体認識です。物体認識はAIが大活躍している分野であり、Faster-RCNNやYOLO、SSDなど様々なモデルが提案されています。また、ピクセル単位での識別を行うセマンティックセグメンテーションという技術も活用されています。
音声認識、自然言語処理
知能・制御系の項でも説明しましたが、センサで得た音声データの認識にAIを使って認識精度を向上させることができます。また、読み取ったデータを用いた、自然言語処理によるコミュニケーションでもAIは非常によく用いられています。
AIロボットの企業事例
ここからは、実際にAIをロボットに活用している、名だたる企業達を紹介していきます。
Google DeepMind
世界的に有名な企業であるGoogleもAIを用いたロボットの研究に取り組んでいます。Google傘下のGoogle DeepMindは人工知能の研究開発を行う会社ですが、AIを活用したロボットの研究開発にも取り組んでおり、最近ではAutoRT、SARA-RTなどのモデルを発表しました。同社が以前に発表したRT-2は得た知識を制御指示に変換する生成AIモデルでしたが、それをさらに改良したものがAutoRT、SARA-RTです。これらのモデルを用いると、自然言語で指示した内容をロボットが自動で制御入力に変換し、人間がいちいちプログラムしなくても指示された通りの動作を実行するといった芸当が可能になります。
このDeepMindが公開している動画中でも、テキストで指示した動作をロボットが自動で制御入力に変換し、実行している様子が示されています。
ボストン・ダイナミクス
ボストン・ダイナミクスはMIT(マサチューセッツ工科大学)発の米国ロボットベンチャー企業であり、犬型ロボットや倉庫用荷物整理ロボット、人型ロボットなどの開発で有名です。同社の犬型四足歩行ロボットは階段などの安定しない場所でも自動でスムーズな歩行を実現するために、機械学習を用いた外界の認識や姿勢制御など、様々な工夫がなされています。
また、つい最近ではAIを搭載した人型ロボットの開発加速に向け基盤モデルの知識を必要とし、トヨタの子会社トヨタ・リサーチ・インスティテュート(TRI)と提携した話が有名です。
Figure AI / OpenAI
Figureは2022年に設立されたばかりのロボティクススタートアップ企業であり、AIを活用した人型ロボットの開発を得意としています。FigureはChatGPTで有名なOpenAIと提携し、つい最近人と会話して指示された動作を実行することができる人型ロボット「FIgure01」を公開したばかりです。また、マイクロソフトやNVIDIAなどの大企業からの資金調達もかなり受けており、業界内の注目度はかなり高い企業となっています。
このロボットはカメラからの画像と搭載されたマイクで捉えた音声から書き起こされた文章を、画像とテキストの両方を処理できるOpenAIのモデルに送り、対応する言語応答や動作を導きだして実行しています。
Amazon Robotics
Amazon RoboticsはAmazonの子企業であり、Amazonの物流センターや倉庫における自動化と効率化を推進するためにロボットの開発を行ってきました。Amazonの物流センターでは、AIを使ったロボットが荷物の搬送や在庫管理を行っています。例えば、以下の動画でも紹介されている「Proteus」などがあります。
これにより、商品の取り上げや配送までのプロセスが高速化されています。また、Amazonはドローン配送にも取り組んでおり、AIを駆使して安全かつ効率的に商品を届ける技術を開発しています。
アメリカの企業ばかりになってしまいましたが、やはりAIとロボティクスの融合という分野ではアメリカが世界をけん引しているのが現状です。他には中国のUBTECH Robotics、家庭用ロボット掃除機で有名なiRobotなどもあります。
最後に
今回はロボットにAIがどのように活用されているかをまとめ、実際に企業がロボットへAIを導入し活用している事例についても紹介しました。AIのロボットへの応用は今かなりホットな話題であり、今後も目が離せません。将来的にAIとロボティクスの融合は産業の効率化、生活の質向上、さらには新たな可能性の発見に繋がっていくことでしょう。