独占取材: テスラボットに遅延? イーロンの天才的設計戦略 | スコット・ウォルター博士

14,931 文字

YouTube
作成した動画を友だち、家族、世界中の人たちと共有

先週、イーロン・マスクは来年のテスラボットの大規模な生産計画について発表しました。5万から10万台のボットを製造するというものですが、実はイーロンが意図的にオプティマスの最終設計を遅らせていたことをご存知でしょうか。第3バージョンまで待って、22の自由度を持つ手と、手のひらから手首に移動したアクチュエーター、そしてテンドンを使用するという設計にしたのです。なぜこれほど重要な変更のために大幅な遅延を選んだのか。本日は、2つのロボット企業を設立した経験を持つスコット・ウォルター氏をお招きし、オプティマスが今や何を達成できるのか、市場がどれほど拡大するのか、そしてなぜこの変更が重要だったのかについて詳しく解説していただきます。テスラボットのこの手により、競合他社に対して優位に立てるでしょう。スコットさん、お越しいただきありがとうございます。
ハーバート、こんにちは。2025年にようこそ。あなたは休憩を取られましたが、このボールをキャッチするオプティマスの映像について話し合いたいと思います。これこそが重要なポイントです。ついに22の自由度という発表がありましたが、さらに重要なのは、それが手首に統合されているということです。この変更について、少し共有していただけますか?
はい、そしてさらに重要なのは、それがGen 2ボットに統合されているということですが、それについては後ほど触れたいと思います。動画を見ていただくと、2つの異なる手があり、オプティマスがボールをキャッチできているのが分かります。これが一回限りの偶然でないことは、連続して2回成功していることからも明らかです。
もちろん、オプティマスがボールをキャッチできるということで大きな興奮が巻き起こりました。しかしイーロンはすぐに、これが自律的なものではなく遠隔操作だったことを明確にしました。これによって少し失望する人もいました。「ああ、自律的ではないのか、遠隔操作だったのか」と。しかしイーロンの投稿にはもっと多くの詳細が含まれていました。
実は私は、それが自律的でなかったことにはそれほど関心がありませんでした。むしろ遠隔操作による制御の方に非常に感銘を受けましたが、その理由について詳しく説明したいと思います。手の設計についても同様です。
自律性に関してそれほど感銘を受けなかった主な理由は、それがすでに解決済みの問題だからです。CUOロボティクスによる10年以上前の動画があります。リアルタイムでボールを追跡し、インターフェースする能力を示すデモで、これは高度なAIが登場するずっと前のことです。基本的に古い手法を使用して、カメラでトラッキングを行っています。
この事例の重要なポイントは、ピンポンやテーブルテニスをするロボットということではなく、ロボットがそれほど素早く動き回れる敏捷性を持っているということでした。速度や加速度を持っているということです。ここでは本当にメカニクスの方をソフトウェアよりも誇示していたのです。
非常に印象的で、何百万回も視聴された興味深いデモでした。つまりこれは解決済みの問題なのです。本当に重要なのは、遠隔操作制御についてです。
ボールをキャッチするために必要な反応時間について考えてみてください。ボールを見て、それに反応し、自分の反応が適切に追従しているかを確認する必要があります。
この動画を再生すると…はい、はい。ここでもロボットが超人的なスピードでボールを追跡できているのが分かります。これは単にボールを追跡するだけなら、キャッチしなくても、それほど大したことではありません。
もちろん、ロボットハンドによるグリップは少し厄介です。遠隔操作で行う場合は、レイテンシーを排除する必要があります。これは実際に多くの人々を感銘させました。VRヘッドセットを装着し、ロボットの視点から見ているわけです。その視点は魚眼レンズのように少し歪んでいるかもしれないので、少し奇妙な環境にいることになります。そこでボールを追跡して動かそうとし、ロボットが自分の反応通りに反応することを期待します。少しでもラグがあると、動きの軌道を捉えるのが非常に困難になります。
他にも考慮すべきことがあります。この動画に戻って、どのようにキャッチしているかを見てみましょう。多くの場合、キャッチのコツは全て投げ方にあります。誰かにキャッチさせたい場合は、キャッチできるように投げることです。これはNFLのクォーターバックが毎週日曜日にやっていることです。特定の選手がキャッチでき、他の選手がキャッチできないように投球しているのです。
ここでの方法は、まず速球を投げないということです。投げるのではなく、トスをします。ここで分かるように、非常にシンプルなトスです。トスは顔の方向に向かっています。これが理想的です。低い位置だと難しくなります。VRを通して見ているので、確実に見えるようにする必要があるからです。
同時に、反応して実際にキャッチする必要があります。遠隔操作制御では2つのことが起きています。1つは腕を動かすための制御、もう1つは指を閉じる制御です。手の制御にどのような方法を使っているのか興味深いところです。手は単に閉じるだけなのか、それとも指を個別に動かせるのでしょうか。データグローブのようなものを使用しているのでしょうか。
これにより少し簡単になります。毎回同じ場所に一貫したトスをしており、野球選手のバッターがピッチャーの投球フォームを見て球筋を予測するように、どこに来るかを予測しています。そういった要素はありますが、それでも非常に素早く反応してキャッチするのは印象的です。
腕の全体的な動きについても他に気付いたことがあります。腕だけでなく、胴体も動いていました。胴体が回転してキャッチに関与していました。遠隔操作キットが胴体のトラッキングを行っているのか、それとも全身制御の一部として、上半身を動かすのが良いアイデアだと認識したのか興味があります。
もちろん骨盤部分も適応する必要があります。そこに動きがありますが、それは上半身の動きの結果であり、オペレーターが足を動かしているわけではありません。ロボットがバランスを保つために必要な動きです。
この動画を見ると、いくつかの動作の最後に足が少し滑っているのが分かります。手を動かし始めると床への反力が生じ、足は回転と逆方向に動くはずです。しかし実際には反対方向に動いています。ボールをキャッチした瞬間にロボットの動きを止めようとすると、足が地面で滑るのです。
床との摩擦がそれを防ぐのに十分だと思っていましたが、少し動きがあります。これは、ロボットが何かに素早く反応できる能力を示しています。減速が非常に急激だったため、床で少し滑りが生じたのです。これは腕の能力について興味深い点です。
そのように素早く動くためには、レイテンシーの非常に少ない優れた遠隔操作システムが必要です。データはロボットから操作者へ、そして操作者からロボットへと行き来する必要があります。しかし最も重要なのは、それらのコマンドに素早く反応できるロボットを持つことです。
内燃機関車とEVを運転する違いを考えてみましょう。内燃機関車ではアクセルを踏んでも何も起きず、やっと動き出します。しかしEVでは、触れた瞬間に望み通りに正確に反応します。はるかに優れた制御性があります。
ここでも同じことが起きています。手をここにと指示すると、手はそこにあります。通常これは、両側で物理が働いているため上手く機能します。操作者が手を動かせる速さには限界があり、ロボットにも同様の制限があります。
しかし、何らかの理由で同期が取れていない場合、あるいはグリッチが発生して突然ロボットの手がここにあり、私の手がそこにあって、私がここに動かしたい場合を考えてみましょう。私の動きは小さいですが、ロボットは突然目覚めて「ああ、そこに行きたいのか」と気付き、素早く移動することはできません。
しかし、ほとんどの場合、同期が取れているため、動きは小さく、急な加速にも対応できます。無限の加速や速度はありませんが、それを行うのに十分な量があります。
これが仮想ロボットではなく実際のロボットだという点が重要です。仮想ロボットなら加速度を好きなだけ上げられます。瞬時に一つの場所から別の場所へ非常に素早くジャンプできます。しかし現実世界ではそれはできません。だからこそ印象的なのです。
私も以前、仮想ロボットでこのようなことを行った経験がありますが、速度や加速度を気にする必要はありませんでした。必要なだけ使えましたから。現実世界では少し異なります。
さらに、操作者とロボットの運動学の違いもあります。操作者は完全にバランスの取れた姿勢を取れても、ロボットが同じ姿勢を取ろうとすると、重心が少し異なるため転倒してしまう可能性があります。そのため多くの場合、動きは「ここに行きたい」という推奨に近く、文字通り「そこに行かなければならない」というわけではありません。私の意図を理解して到達しようとするのです。
ボールをキャッチすることについて、他にイーロンが言及したのは、第一世代の手でのグリップが難しかったということです。時々運良くできることもあったかもしれませんが、ほとんどの場合は非常に困難だったと言っています。その潜在的な理由は何だったのでしょうか。
手の違いを見てみましょう。これが最初に公開された元の手です。この時点で、すでに異なるブロックを掴んで配置することができました。ブロックの1つが落ちた時も、再セットアップできたことを覚えていますか。
しかしブロックは静止していて、動作も遅く、すべてを行うのに十分な時間がありました。一方、空中を動くものをキャッチする場合は、追跡し、反応し、掴むチャンスは1回しかなく、非常に素早く行う必要があります。
遠隔操作制御を見ると、ロボットは手袋をはめているように見えます。指が分かれているので、厚手の手袋をした人と同程度の器用さがあるように見えます。それが器用さのレベルです。
しかし今では、もし新しいオプティマスの手だけを見せられたら、実際の人間の手だと思うでしょう。すべてがそう見えます。なんと素晴らしいことでしょう。比率も、すべてが同じです。指の長さも異なり、関節の位置も分かります。誰かがラテックス手袋をはめているように見えます。
まず気付いたのは、それが素晴らしいということです。2つ目に興味深いのは、最初に左手を選んだことです。なぜ右手ではなく左手から始めたのか。おそらく、彼らのスターオペレーターが左利きなのかもしれません。
また、Gen 2ボットとの統合が非常に容易だったように見えます。変更が多かったため、取り外して取り付けるのがそれほど�易ではないと思っていました。しかし、他の腕を取り外して新しい手を取り付けたのは明らかです。
古い11自由度のものと新しいものの主な違いを見てみましょう。まず目につくのは、ケーブルが消えていることです。古いバージョンでは、すべてのケーブルが見えていました。しかし新しい手では、肘のケーブルさえも見えません。手首周りのものを隠せたというだけでなく、肘周りも見えないのは驚くべきことです。
古いバージョンには、手首の動きのためだけに2つの黒い直動アクチュエーターがある、ポパイのような前腕がありました。これについて聞きたかったのですが、イーロンが言っていたのは、古い手ではアクチュエーターが手のひらにあり、それを手首に移動させたかったということでした。そうであれば理論的には手首が太くなるはずですが、実際にはそうではありませんでした。ええ、そう思いますよね。彼らは何を発明したのでしょうか?
それが最初に私が思ったことです。あの前腕部分はすでに混み合っているので、スペースを作る必要があり、異なる戦略を考えているのかもしれないと。
その手を見ると、多くの微妙な点があります。指の関節の数が実際の人間の手より少ないのです。基本的に1つのIP関節、つまり指節間関節しかありません。通常は2つの関節があるところです。DIPかPIP関節と呼ばれるものです。問題を単純化するために減らしたのです。
しかし今では、指に通常ある全てのIP関節を持っています。それが最初の違いです。もう1つの違いは、指を広げる自由度を追加したことです。これがボールを掴む際になぜ重要なのでしょうか?
指が閉じる動きしかできない場合、ボールを掴むのは難しくなります。ボトルやパイプなら大丈夫かもしれませんが、球体の場合は指を広げられる必要があります。多くのものを掴む場合、外転運動と呼ばれるこの動きが重要になります。
つまり、MCJ関節に2つの自由度があるということです。古い11自由度のバージョンではそうではありませんでした。11自由度でしたが、手のひらに6つのアクチュエーターがありました。それらのアクチュエーターを手のひらに詰め込む必要があり、テンドン駆動でした。
アクチュエーターは手のひらにありましたが、機械的なリンケージではなく、実際にはテンドン駆動でした。古いバージョンの画像を見ると、すべてのケーブリングが見えます。元のデザインがどのようなものだったか、モーターをどこに配置しようとしていたのかが分かります。
テンドン駆動の様子を示す別の画像もあります。実際のアクチュエーターがどのようなものだったかを示す次の画像を見てみましょう。長い灰色のモーターがあり、ラックアンドピニオン設計になっています。ウォームギアドライブが回転して青いギアを回転させ、そのギアには少しスペースがあってテンドンを結びつけ、スプールのように巻き付けられるようになっています。
これがテンドンを上下に動かす方法でした。考えてみると、それはかなりのスペースを取ります。そして必要な場所のすぐ近くにある必要がありました。テンドンが何で作られていたのかは分かりません。アラミドのような合成繊維、つまりケブラーのような伸びないものかもしれませんし、金属製、ピアノ線のようなものかもしれません。
問題は、それをスプールに巻き付けると疲労が発生することです。また、金属を何度も曲げ伸ばしするのにエネルギーが必要です。そのため、多くの人々がテンドンを諦めています。扱いにくく、アクチュエーション戦略を見つけるのが難しいからです。
では、その大きく嵩張るモーターを前腕部分に移動させ、アクチュエーション戦略をどのように実現したのでしょうか。また、先ほど話したように、各指にテンドンがありますが、テンドンには問題があります。一方向にしか機能しないのです。引っ張る力には優れていますが、圧縮には非常に弱いです。
つまり、手を閉じることはできますが、開くためには弛緩させるだけで、指は自然には動きません。押すこともできますが、開くための十分な力は得られません。卵を掴んでいる画像に戻ると、各関節をよく見ると、特に卵に触れている人差し指を見ると、トーションスプリングのような機構が見えます。これは関節を開くためのものです。
テンドンの張力を緩めると開くのです。つまり、手の屈曲には大きな力とエネルギーがありますが、伸展はスプリングの力に依存しているだけです。これが問題の1つでした。閉じる力はありましたが、開く力は非常に小さく、単にスプリングの力に依存していました。
そのため、フィギュアやジャンボットなど、他のデザインでは機械的なリンケージを採用しています。モーターを逆回転させれば指が開くような仕組みです。
もう1つの課題は、11自由度について話す時、動かせる関節の数を指していますが、一部の関節は依存関係があります。オプティマスボットでは、指に2つの自由度がありましたが、1つのアクチュエーターに接続されており、独立していませんでした。
つまり、そのアクチュエーターを引くと両方の関節が曲がり始め、一方を他方より制御することはできませんでした。22自由度に移行すると、もう1つ追加されましたが、それらは全て下に来ています。元のオプティマスが抱えていた問題は、この戦略のために指を閉じる時に爪のような動きになってしまうことでした。
ええ、まさにその通りです。その問題は、爪のような戦略では、例えば何かを掴もうとする時に、指をこのように来させたいのですが、爪のように閉じてしまうと、完全に対象を逃してしまう可能性があります。
最初は指をまっすぐにして、それから巻き付けられるようにしたいのです。しかし、その制御ができません。他の関節の動きを止める唯一の方法は、抵抗に当たった時だけです。スプリングやテンドン、その他すべてに押し付けられるからです。そのような制御はできません。
では、22自由度の手では何をしているのでしょうか。たくさんのテンドンがあるように見えます。その内容を分析してみると、指に1本のテンドンがあるわけではないことが分かります。実際の人間の手には、屈筋として機能する2本のテンドン、そして伸筋として1本のテンドンがあります。
つまり、人間の体では実際に3本のテンドンが指の開閉を制御しているのです。私たちの場合、把持の方が伸展より重要なので2本あるのです。必要な力を得るためです。
彼らは、関節にスプリングを入れるのをやめることにしました。スプリングを追加すると開くのが難しくなるからです。代わりに開くための専用のテンドンを設置しました。手の中の全ての関節を示す画像があります。22自由度の由来がここにあります。
はい、DIPとPIP関節、つまり私たちが関節と呼んでいるものがあり、これは遠位指節間と近位指節間の略です。そのためIPと呼ばれます。そしてMC関節は、基本的に指が手のひらに接続される部分です。
MCJ関節には2つの自由度があり、IP関節にはそれぞれ1つずつあります。つまり各指は合計4つの自由度を持っています。よく見ると、テンドンの位置が分かるかもしれません。
次のスライドに進むと…赤で囲んだ中央のテンドンが見えます。これが指を閉じるためのテンドンです。そして前後の動き、有名なバルカン挨拶のような外転と内転の動きがありますが、これは2つの異なるテンドンで行われます。
なぜなら、一方のテンドンを引っ張ってもスプリングで戻すのでなければ、指はそこに留まったままです。人形の糸のように、両側にテンドンが必要なのです。
次の画像では見えませんが、手が閉じている時に上部にテンドンがあることに気付きました。これらが開くための伸筋テンドンです。つまり各指には4本のテンドンがあり、テンドンは定義上、一端が骨に、もう一端が筋肉に付着しています。
この場合、筋肉の役割はアクチュエーターが担っています。下部にある全てのテンドンが、いわゆる手根管を通って、これらの異なるアクチュエーターに接続されているのが分かります。
異なるアクチュエーション方式に注目してください。Dirty Teslaの動画に戻ると、何が起きているのかが分かります。よく見ると、テンドンが上下に動いているのが分かります。アクチュエーターは直動式で、現在のテスラボットのようにスプールに巻き付けるわけではありません。
それは複雑すぎます。ウォームドライブやラックアンドピニオンが必要になり、テンドンには良くありません。この方法なら、テンションは常に同じ場所への直線的な方向を保ち、よりコンパクトです。
これが、手のひらにあった非常に大きく設計過剰なアクチュエーターを下に移動させることができた1つのトリックです。より単純な設計で、必要な動作範囲を得る方法を見つけたのです。
これがテンドンを扱う人々が指摘する厄介さ、難しさ、メンテナンスの問題、破損、伸び、キャリブレーションの課題の一部を解決できる可能性があります。スプールに巻き付ける場合は問題が発生しますが、単に上下に動かすだけなら、多くの問題を単純化できます。
これはスペースの問題を解決できただけでなく、システム全体の信頼性に関する多くの問題も解決できる可能性があります。これが1つのポイントです。
11自由度から6つのアクチュエーターが、どうやって22自由度で24になったのでしょうか。各関節にほとんど必要なアクチュエーターがあり、一部は依存関係があり、他は独立しています。親指は5つの自由度があります。
各指に4つあるので、そこで16になります。親指に行くと、実際には5つあり、各方向に1つ必要なので、そこでさらに4つ追加され20になります。そこに22を加え、さらに手のひらがあります。ピンクの下にある赤いものが手のひら用です。これがもう1つの自由度を追加しますが、2つのサーボが必要です。
それが方法です。因みに、親指には指のMCJ関節に相当する部分に2つの自由度ではなく、実際にはCMC関節と呼ばれる3つの自由度があります。そのため4から5に増えたのです。そして手のひらの各アクチュエーションで24になります。
奇妙なことに、同じ数か少なくなると思うでしょう。8つずつ3つのリングで構成されており、最も重要なものは上部近くにあるようです。動画を見ると、どのアクチュエーターがどの指の動きに接続されているかある程度推測できますが、全てではありません。
もう1つ注目すべきは、テンドンが動く際に少しスペースが必要だということです。また、「ポパイの前腕」はどうなったのでしょう。手首の機構がどうなっているのか、よく見えません。手首の後ろに少し隠れています。
Dirty Teslaの動画では、手が動く瞬間があり、その仕組みが少し垣間見えます。まだそこにありますが、隠れています。アクチュエーションの様子と、全てがどのように組み立てられているのかが少し見えます。機構も少し変更されています。
Gen 2とGen 3の手首設計の違いを示す動画があります。アクチュエーション戦略は、知る限り特に名前はありませんが、一部の人々はMIMOジョイント、つまりマルチインマルチアウトと呼んでいます。これは一種のパラレルキネマティクス設計です。
2つのシミュレーションを作成しました。Dirty Teslaの録画を見てみましょう。テンドンの近くで何が起きているのか、アクチュエーターが上下に動いているのが良く分かります。手首が回転すると、手のひらの内側が見えますが、手首が動くと、その機構がどのようなものか分かります。
今は機構の後ろにあるアクチュエーションが行われていますが、手首が回り始めると、上下に動くレバーが見えてきます。これにより、Gen 3がGen 2とどう異なるのか理解することができました。
これは巧妙な設計で、パラレルキネマティクス設計です。これは、両方のアクチュエーターが同じ方向に動くとピッチング動作が得られ、逆方向に動くとヨー動作が得られることを意味します。
この利点は、ヨーは必要な動きですが、それだけのためにアクチュエーターを1つ専用にするのは過剰に思えるということです。この方法なら、2つのアクチュエーターを分割して、必要な時にその方向の動作を得ることができます。しかしそのためには、機構は単にパラレルであるだけでなく、平面外でなければなりません。
2つを比較するアニメーションがありますが、このアニメーションは平面内のもので、平面外の動きもあることを忘れてはいけません。最も重要なのは、何が起きているのかというアイデアを理解することです。
このアニメーションを見ると、Gen 2ボットのアクチュエーターが非常に大きく嵩張っているのが分かります。黒いアクチュエーターの下部には、ピンジョイントのように見えるものがありますが、実際には平面外の性質のためにハイムジョイントと呼ばれる球面ジョイントです。上部には別のピンジョイントがありますが、これも実際は球面ジョイントで、手の機構が前後に動けるようになっています。
このアクチュエーターは出入りを繰り返す必要があり、そのためのスペースが必要で、物が挟まる可能性もあり、アクセスも必要です。Gen 3では、機構を基本的に逆さまにして、3リンク機構ではなく4リンク機構にしました。アクチュエーターは固定され、動かず、追加のリンケージを上部に設け、両方のハイムジョイントはアクチュエーターの先にあり、必要な動きを得られます。
直動アクチュエーターは常に自身と平行を保ち、キネマティックリンケージがピッチング動作や平面外のヨー動作に接続します。よりコンパクトで、出入りを繰り返す必要がありません。これが彼らの変更点です。
長所短所はありますが、主に長所だと思います。短所は「ああ、リンクを1つ追加する必要がある」という程度です。1つ部品が増えるだけです。しかし得られる利点は非常に大きく、それが前腕部分をとてもコンパクトにできた手法の1つでした。
イーロンの投稿に戻って、前腕について興味深いことを言っています。パッケージングをもっと改善する必要があり、まだ嵩張りすぎで重すぎると嘆いています。冗談じゃないですよね。すでにあのサイズまで小型化できたことが信じられません。
WI Robotで見たものは非常に大きな手に見え、実際に人間の手より大きく見えました。おそらくこれらをテストするためのプロトタイプだったのでしょう。しかし今では洗練され、手はずっと小さくなっています。
質量を減らしたいと言っています。重すぎると。元のものと同じ質量になっているのではないかと思います。あの2つの手首アクチュエーターはかなり大きかったですが、今では手首機構の中にほとんど見えません。
また、全ての質量が同じというわけではないことも覚えておく必要があります。元の手では、全てのアクチュエーターが手にあり、それらのアクチュエーターには質量がありました。今ではその質量を前腕に移動させ、体の中心により近づけています。これには理由があります。
誰でも試せることですが、非常に重いものを持って、手を伸ばしてみてください。すぐに疲れることに気付くでしょう。しかし同じ質量を前腕に移動させると、疲れるまでの時間が大幅に長くなります。
これらが機械的な機構だからといって、私たちと同じストレスやエネルギー損失から免れているわけではありません。私は常に学生たちに言っています。ロボットアームを見て、人間の視点から見て不快そうに見えたり、ストレスがかかっているように見えるなら、おそらく本当にそうなのです。大きな産業用ロボットアームでさえ、トルク要件が非常に高くなる可能性が高いです。私たちと同じ物理法則に従っているからです。
今、手にある質量を後ろに移動させることで、技術的に多くの重量を追加しても、すでに大きな利点を得ています。多くの場合、動きに関しては質量ではなく回転慣性が重要だからです。回転慣性が高いほど、これらはより懸命に働かなければなりません。
彼らがまだかなり質量を減らせると考えているということは、このアームが以前のものより、器用さだけでなく性能面でもはるかに優れたものになるということです。はるかに薄くなり、どんな空間にも入れそうです。今は何も引っかかることがありません。
私に残された唯一の謎は、下部前腕、つまり下側の前腕部分で、あの灰色の手袋のようなものが露出していることです。上部は本当に固い覆いがありますが、下部では露出しています。最初は手首機構のためかと思いましたが、動きのためのスペースが必要なのかもしれません。
しかし手首機構を見ると、そこまでのスペースは必要ないようです。テンドンがまだ動き回っているので、そのための遊びの余地として柔軟な素材を置いたのだと思います。しかし硬い覆いが必要だと思います。
なぜなら、組立作業やものを持ち上げる時に、その部分が露出することを考えると…箱を持ち上げて掴む時に、その部分が擦れるでしょう。柔らかいものは望ましくありません。しかしこれは第一世代の実装なので、少し気になる点です。
もう1つ気になるのは、Gen 3ボットが基本的にこの手首を付けただけのものなのかということです。他にも変更があると思っていたのですが、間違っているかもしれません。これで十分満足なのかもしれません。
ボディシステムの他の部分にも大きな変更があると予想していました。一貫性があると思うのです。他にどこに変更の可能性があるか考えてみると、hip(腰)の部分かもしれません。脚のアクチュエーション戦略の見直しなどです。
しかし、最近の強化学習を使用した歩行の動画を見ると、反射神経があることを示しています。私の懸念は「ああ、あれらのモーターは強力で、大きな力を出せますが、加速と速度を出せるのか」ということでした。
転倒を防ぎ、素早く歩くためには、猫のような反射神経が必要です。強化学習に移行したことで、その能力を持っているのかもしれません。望む歩行速度を達成するための十分な余裕があるかもしれません。
彼らは一度も速度について懸念を表明したことがなく、常に「心配しないで、速度は上げられる」と言っています。「ええ、でも進捗が見えない」と思っていました。まだ有用になるために歩行速度を2倍にする必要がありますが、今ではそれを達成する道筋にいるように見えます。
ええ、そうですね。イーロンは発表しましたよね。今年2025年に数千台、来年に5万台、5万から10万台、そしてその次の年に50万台を製造すると。設計確定にできるだけ近づいているようですが、これで決まりですよね。もしかしたらあなたが言うようにもう1回の改良があるかもしれません。
ええ、明らかにスケールアップする前にもう1回の改良があります。これは常に話題に上っていました。昨年半ばから、2025年つまり来年に数千台を内部使用のために製造し、その学びに基づいて修正を加え、その翌年の2026年からスケールアップして他の顧客に提供を始めると言われていました。
これは消費者や一般公開を意味するわけではありません。すでに多くの顧客を並べているようです。WI Robotでは多くのCEOが関心を示していたという噂が飛び交っています。おそらくオプティマスが準備できたら使用したいと考えているのでしょう。
需要はあるはずで、彼らは設計確定を確実にしたいのです。現在のオプティマスは、まだ家庭用には適していないかもしれませんが、工場用としては十分かもしれません。これは何度も指摘してきたことですが、家庭に入らないのはロボットが準備できていないからではなく、あなたの10倍の金額を支払う意思のある人がいるからです。
それは事業主です。これらの大量供給があるまでは、まず工場に導入されることになります。つまり、少し荒削りでも大丈夫です。実際、工場環境で生き残るためには少し荒削りである必要があります。
家庭環境に入る時には、人々やペット、子供たちの周りで操作できるように、より成熟したものになっているでしょう。パイロットプログラムを実施して、人々にテストさせるかもしれません。より多くのビデオを…あなたと私のように、リストに載っているはずです。ああ、はい、確かにリストはありますが、私たちは載っていませんよ。Sで始まる人々…テストする人々がいて、より多くのユースケース、より多くの環境、より多くのビデオが必要です。だから数千台を製造するのです。
スコット、この遅延は価値があったのでしょうか。私たちは他のロボット企業のCEOと話しましたが、彼らは50ポンドの重量を運ぶ能力が減少し、弱いテンドンのために破損の可能性が高まるので、テンドンと腕でこれを行うのは愚かな試みかもしれないと言っていました。しかし彼らは実行に踏み切りました。
ええ、それが問題です。彼らは見つけ出すでしょうし、おそらく彼らも気付いているはずです。テンドンに関する研究の蓄積があり、多くの人々がこれに取り組んできました。もちろんほとんどの人は「難しい、愚かな試みだ、この道を進むべきかどうか分からない」と言うでしょう。
しかし多くの革新者は、それは不可能だと言われ続け、やり方を見つけ出しました。十分に執着すれば…マスク企業の全てに共通しているのは、常にファーストプリンシプルに基づいているということです。
「hmm…これはテンドンで機能している。この生体システムの中で、私たちは組織を修復する能力を持っています。また、AIがやるように、毎朝自己キャリブレーションする能力もあります。なぜなら私たちの体は常に変化しているのに、なんとかそれを理解する方法を見つけ出すからです」
問題は、十分に信頼できるものを作れるかどうかです。その決意の一部は「できない」と言われているのに、この部屋の周りにいる全員がそれができる証拠だということです。不可能ではないということです。
難しいとは言えますが、不可能ではありません。スコット、あなたは私に早く言っていましたね。多くの競合他社がいると。中国企業が特に、たくさんのデモを出していると。最近のCESテクノロジーショーケースでは、エレクトロニックが美しいロボットを披露し、ピックアンドプレイスができました。
これはどれほど優れているのでしょうか。例えば服を縫ったりピアノを弾いたりなど、他の競合他社にはできない、より多くのビジネスチャンス、より大きなTAMを得られる可能性があります。テスラが22自由度に進み、この新しい方法を発明したことで、ゲームチェンジャーになる可能性があるのでしょうか?
確かにそうかもしれません。なぜなら、多くの場合、このような下位市場のアプリケーションでは、タスクを実行できる安価なボットや何かを持っているからです。全ての機能は必要ありません。余分な機能は必要なく、ちょうど十分なものがあればいいのです。
明らかにそのニッチで機能するボットを設計できますが、もし誰かが「はい、それができるだけでなく、他のことも全てできる」というボットを同じ価格で生産できたら…「ちょっと待って」となります。
つまり、より少ない機能しか持たないものは、価格もかなり低くなければなりません。そうでなければ、他の製品を選びます。他の製品の選択肢がないのは、需要が高すぎて入手できないからかもしれません。多くの場合、携帯電話店に行って特定の機種を買いたいと思っても、緊急に必要な場合は在庫のある機種を購入せざるを得ないといったことがあります。
そういった状況が起こりうるでしょうが、ある時点で他の全ての企業も同様のことをする必要に迫られます。また、多くはトレーニングにも依存します。誰のAIがより優れているのか。どんなに素晴らしい手を持っていても、タスクを簡単に実行できなければ問題です。
全ての要素が揃う必要があります。優れた頭脳、優れたメカニクス、そして十分に良い手が必要です。なぜなら結局のところ、ロボットのビジネスエンドは手だからです。他の全ては単に手を必要な場所に持っていくためのものです。
歩行やバック転は素晴らしいですが、実際にはそれほど重要ではありません。脚が必要なのは、手を作業に必要な位置に持っていくためだけです。時には特定の姿勢を取るために一定の器用さが必要な脚が必要になることもありますが、全てはそのためです。
美しいロボットがあっても、手が全く機能しなければ、それは実用的なものというよりも単なる好奇心の対象にすぎません。
なるほど、手は重要ですね。しかしあなたが言ったように、頭脳も同様です。エレクトロニックにとって良いニュースは、Google DeepMindとのパートナーシップがあることです。彼らが投資家でもあります。それは大きな意味を持ちそうですね。
そしてもちろん、テスラは22自由度に進みました。スコット、ありがとうございます。なぜこれを行ったのか、どのように取り組んでいるのか、深い洞察を得ることができました。テンドンが今はより人間らしく機能しているようですね。今後の展開が楽しみです。来年50,000台のオプティマスが出てくるのを期待しています。
ええ、それは可能だと思います。設計が良ければ、スケールアップできない理由はないと思います。素晴らしい。ありがとうございます、スコット。X(旧Twitter)アカウントの@goingballistic5でフォローしてください。ありがとうございました、さようなら。
テスラ投資家のための最も包括的なリソースとなるウェブサイトを作成しました。herbert.comで確認してください。

コメント

タイトルとURLをコピーしました