人型ロボットの脳が追いつき、転換点に達する

人型ロボットの脳が追いつき、転換点に達する


2012 年、米国国防高等研究計画局は DARPA ロボティクス チャレンジ (DRC) を発表しました。数百万ドルを費やし、数年に渡って行われた災害用ロボットのコンペティションは、ボストン・ダイナミクス社のアトラス、第一世代の有用な人型ロボットの一つからの信じられないほどの瞬間、そして永遠に残る失格ビデオを生み出しました。

コンペティションのアーキテクトであるギル・プラットは、DRC がロボット工学に対して何をしようとしているのかを非常に明確に理解していました。 “理由 [for the DARPA Robotics Challenge] 実際にこの分野を前進させ、この機能を現実のものにしています」とプラット氏は語った。 IEEEスペクトル 当時、彼は、2004 年の DARPA グランド チャレンジと 2007 年の DARPA アーバン チャレンジ以前には、複雑な環境用の無人運転車は本質的に存在していなかった、と述べました。彼は、DRC がロボット工学に関して同じことを行っているのを見ました。

DARPA ロボットチャレンジの結論からほぼ 10 年が経過し、業界の多くの人は、人型ロボットがプラット氏が予測した変革の瞬間を迎えようとしていると信じています。しかし、ロボット工学ではいつものことですが、物事は思っているよりもはるかに難しいことがよくあります。 スペクトラム は、現在トヨタ・リサーチ・インスティテュート(TRI)のCEOであるプラット氏に、何がヒューマノイド・ロボット工学を妨げているのか、これらのロボットが何をすべきか(あるいはすべきでないか)、そしてヒューマノイドの誇大広告バブルをどう乗り越えるべきかについて調べた。

私たちが今直面しているロボット工学の瞬間についてどう思いますか?

ギル・プラット: 実際に変わったのはヒューマノイドに関することではありません。長い間、多くの人が人型の研究ロボットを構築してきました。今違うのは体ではなく脳です。ロボット工学の分野では、私たちが構築しているメカニズムは信じられないほど有能ですが、ロボットの実用性をその可能性に匹敵させる手段を実際には持っていませんでした。今ではそれが実現していますが、それは近年起こった AI 革命のおかげです。

10 年を振り返って、現在商用ヒューマノイドで起こっていることの多くはコンゴ民主共和国のおかげであると直接評価したくなります。何らかの理由があります いいえ それをしますか?

人型ロボットの脳が追いつき、転換点に達する NASA の初期バージョンの Valkyrie DRC ロボットと一緒にポーズをとるギル・プラット。ギル・プラット

プラット: いや、でも謙虚でありたいと思っています。 DRC は半分は自律性、もう半分はリアルタイム遠隔操作に焦点を当てていました。遠隔監視があり、その監視を強化して遠隔地にいる人がロボットに何をすべきかを指示しながらリアルタイムでタスクを管理する半自律性がありました。それはすべて、最近の AI の進歩が起こる前のことでした。

今何が変わったかというと、基本的に、コードを書く必要のない方法で、ロボットに何をすべきかを教え、有能にする方法ができるようになったということです。代わりに、ロボットにタスクをデモンストレーションするだけです。十分なデータと新しい AI 手法があれば、ロボットはこれまでよりもはるかに高いパフォーマンスを発揮できるようになります。

しかし、そのデータがボトルネックになりますよね?ロボットが何かを確実に実行するためには、何が構成されていなければならず、どのくらいの量があれば十分であるかをどのようにして知ることができるのでしょうか?

プラット: これは、主要な言語モデルにおける議論を正確に反映しています。 [LLMs]。 LLM (過去の単語に基づいて次の単語が何であるかを推測する自己回帰予測変数) を使用し、幻覚を解決するためにさまざまな方法を適用すれば、AI システムを信頼できる点に到達できると信じている人もいます。他にも、ヤン・ルカンが一番有名だと思いますが、そんなのはナンセンスで、何か他のことが必要だと言っている人たちがいます。彼の見解は、私も同意しますが、世界的なロールモデルが必要だということです。 AI システムが想像し、物事を試し、実際に推論するための何らかの方法が必要です。

そして、私たちは本質的にパターン マッチング システムであるものに「理由」のような言葉を適用していることを知っています。 「理由がある」と言うのは、私たちが構築するものに貼り付けるステッカーにすぎません。それは本当の推論ではありません。

これは一例です 「システム 1」と「システム 2」 考えていますよね?

プラット: はい、最初のシステムは、私たちが持っている迅速かつ思慮深い思考であり、これは今日の LLM が行っていることに一致する種類のパターンです。システム 2 は、想像力と世界のモデルを含むゆっくりとした推論です。それは私たちがまだやっていないことです。システム 1 の進歩は目覚ましいものですが、システム 2 はまだ実現していません。システム 1 をシステム 2 にするためにシステム 1 にパッチを当てようとするこれらの試みは、水で満たされた風船を絞ろうとするようなものです。片側を押すと反対側から水が出ます。何かを修正しても他の何かが壊れ、全体的なパフォーマンスがあまり向上しないことに驚かされ続けます。

TRIではこの問題にどのように対処しましたか?

プラット: 2 年前、私たちは普及政策を策定し、その後、私が大規模行動モデル (LBM) と呼ぶものを考案しました。これには、多くのタスクでモデルをトレーニングさせ、各タスクを追加すると実際に他のタスクに役立ち、一定レベルのパフォーマンスを達成するために必要なトレーニング データの量が削減されることを示すことが含まれます。これらは驚くべきシステムの前進でした。

画期的な進歩は、拡散をロボットの動作に適用できることに気づいたときに起こりました。私たちは、視覚から行動に至るまでの行動空間での操作が信じられないほどうまく機能することを発見しました。これがこの分野全体の始まりであり、それ以来、私たちが目にするロボット工学のデモンストレーションはすべて、その目的を達成するためにある種の拡散政策を使用していると思います。しかし、繰り返しますが、これはシステムのパターン マッチングです。「世界をこのように見ている場合、私は世界に対してこのように行動します。」このロボットは、従来の手動ロボット工学のように想像したり、考えたり、計画したりはしません。ただ反応しているだけです。

ただし、自動運転の困難さで見てきたように、システム 1 パターン マッチングは現実世界では失敗することがよくあります。

プラット: 10 年前、TRI が始まったとき、ほぼ全員が自動運転はすぐそこまで来ていると言っていました。

10 年後、私たちはそこに到達していると思います。そして、残る疑問はビジネスです。ハードウェアのコスト、保険、サポートはいくらですか、経済的に合理的ですか?必ずしもではありません 解決済み 自動運転も可能ですが、バックアップには人間を使用するため、当社のソリューションは十分に優れています。自動運転車が二重駐車の車に挟まれた場合、自宅に電話し、システム 2 の判断を人に求めます。他のロボットでもできると思います。ほとんどの場合、彼らは自分たちで仕事をしますが、時折手を挙げて助けを求めることもあります。

自動運転車をかろうじて正しく実現できるのであれば、なぜ私たちは脚の長い人型のフォームファクターにこれほど多くの注意を払うのでしょうか?

プラット: 私たちは身体のための物理的資源を使って世界を構築しています。ロボットがその世界でうまく機能するためには、その可能性を活かす何かが必要です。同じ形をしているので模倣学習も効きやすいです。そして脚は特定の環境に適しています。新しい車輪付きの足場に転がるよりも早く、障害物を乗り越えてバランスをとることができます。とはいえ、脚が常に最も実用的なものであるとは限りません。車輪の設置に最適な平坦な環境である工場において、脚式ロボットにこれほど注目が集まっているのは非常に珍しいことです。

人型ロボットの誇大宣伝に対処する

脚のあるヒューマノイドにつぎ込まれている金額は、ロボット工学にとって良いことだと思いますか?

プラット: それには利点と危険性があります。ロボット工学の分野にこれほど多くのリソースがあることは素晴らしいことであり、何か特別なことが起こったと思います。物事は以前とは異なり、人間がロボットに物事のやり方を教えることを考えると、多くの可能性があります。

微笑む男性は、自分より何倍も大きい人型ロボット構造物を見つめています。 東京のジブリ美術館の屋上でロボットを賞賛するギル・プラットさん。ギル・プラット

人間はロボットにどのようなことを教えるべきでしょうか?

プラット: TRIでは10年間、社会と高齢化について考えてきました。それは身体的な障害だけではありません。それは孤独と目的の喪失に関するものであり、これらははるかに一般的な(そしてはるかに悪い)問題です。そこで問題は、人々が若く感じられるようにするために技術的に何ができるかということです。

TRIでは、人間が教えるロボット「ケアロボット」の研究を行っています。私たちは与えて助けることが大好きな生き物に進化しました。マシンのデモ プログラムを実行し、そのマシンが他の人を助けると、目的意識を感じます。私たちは、ロボットは物理的だけでなく心理的にも生活の質を向上させる双方向の役割を果たすことができると考えています。

10年前にTRIを始めたとき、私は何に注力するのかと尋ねました。あなたの答えはとても心に残りました。「他に選択肢がないから」高齢者のケアをしたと。

プラット: はい、日本と米国の統計は悪化の一途をたどっており、私たちも同様です いいえ 選択の余地がある 高齢化社会が若者に大きな影響を与えることを覚えておくことが重要です。これは、若すぎて働けない人々と、若すぎて働けない人々の両方をサポートするために働いている若者の数である依存率によるものです。これらの数字は悪化し続けています。

これをどうやって修正すればよいのでしょうか?

プラット: 私たちはシステム 1 でいくつかの驚くべき進歩を遂げてきましたが、誰かがシステム 2 でも画期的な進歩を遂げない限り、ロボットがそれほどのことをできるわけではありません。あるいは、人間がシステム 2 のある程度の監視制御を提供するシステムがある場合。

このような人間による監視制御は、私たちをコンゴ民主共和国に引き戻しますね。

プラット: [Laughs] まさにその通りです!ほら、RDC を褒めるなとは言いません…これを「ロボットのウッドストック」と呼ぶ人がいて、心が温かくなりました。本当にかっこよかったです。

それで、10 年が経ち、今の人型ロボット工学の誇大宣伝の度合いについてどう思いますか?

プラット: 私たちは、ヒューマノイドに対する期待が膨らむピークに近づいています (そう願っています!)。それは、システム 1 とシステム 2 について十分に真剣に考えている人がいないからです。

現時点では、私たちの物理的な AI システムはパターンのみを照合します。彼らは信じられないほど有能で、その優れた点には驚かされます。私たちはそれをとても誇りに思っています。そして、大規模な行動モデルを通じてマルチタスク学習を集約することは、非常に効果的であると私たちは信じています。しかし、それはまだシステム 2 ではありません。過剰な期待がたくさんあり、それが私たちを堕落へと導くので、本当に悲しいです。私が心配しているのは、その後に起こる幻滅の波です。

ヒューマノイドの誇大宣伝バブルがはじけたとき、ロボット工学におけるその事故をどうやって避けることができるでしょうか?

プラット: 現時点ではバッファリングが必要です。制御システムでは、ダンピングを追加することで不安定なシステムを安定させます。報道機関と学術界は、私たちが現在ヒューマノイドで見ているのは実際には推論ではないことを皆に思い出させることで、鉛の補償を追加することができます。

自動運転の分野でもバブル崩壊があり、誇大宣伝を低く抑えて粘り強く生き残ったのはほんの少数の企業だけだったということも忘れてはなりません。ここでもそうすべきだと思います。

あなたのサイトの記事から

ウェブ上の関連記事

You may also like...

Leave a Reply

Your email address will not be published. Required fields are marked *