ロボティクス企業Figure AIが独自開発のAIモデル「Helix」を公開しました。Helixは視覚・言語・動作(VLA)を統合し、ロボット制御の常識を覆す革新的なシステムです。
Meet Helix, our in-house AI that reasons like a human
— Figure (@Figure_robot) February 20, 2025
Robotics won't get to the home without a step change in capabilities
Our robots can now handle virtually any household item: pic.twitter.com/Wsx5s8Qelc
人型ロボットの精密な動作を単一のニューラルネットワークで制御し、自然言語の指示だけで未知の物体を扱うことが可能。工場や家庭などの実環境でのロボット活用が飛躍的に進む可能性を秘めています。
そこで今回は、Helixの特徴や具体的な機能について紹介。Helix登場により産業へどのような変化を与えるのか考察します。
Helixとは
Figure AIが開発したHelixは、視覚・言語・行動を統合した最先端のビジョン・ランゲージ・アクション(VLA)システムです。従来のロボット制御の課題を解決するために設計されました。[1]
人型ロボットの上半身全体(手首、胴体、頭部、各指)を高頻度で連続的に制御でき、多様な動作を単一のニューラルネットワークで実行できます。たとえば物をつかむ、収納する、ドアを開ける、さらには複数のロボットが協力して作業することも可能です。
これにより従来は専門的な知識や大量の実演データが必要だったタスクも、自然言語で指示を出すだけで新たな行動を即座に生成し実行できるようになりました。
Helixの特徴
We find that just by prompting the robot, we can pick up virtually any object
— Figure (@Figure_robot) February 20, 2025
When asked to "Pick up the desert item," Helix identifies the toy cactus, chooses the nearest hand, and executes precise motor commands to grasp it securely pic.twitter.com/2l70kKG1GV
Helixは下記の特徴を持っています。
全上半身制御 | 手首、指、胴体、頭部など人型ロボットの上半身全体を連続的に制御可能。 |
---|---|
複数ロボットの協調動作 | 2台のロボットが同時に動作し、初めて見る物体でも共同で扱うことが可能。 |
未知の物体のピックアップ | あらゆる小型の家庭用物体を、事前の学習なしに言語指示だけで持ち上げられる。 |
単一のニューラルネットワークによる統合 | 従来のようなタスクごとの調整や追加学習なしに、複数の動作を単一のモデルで実行可能。 |
商業レベルの実用性 | 低消費電力のGPU上で完全に動作し、市場投入可能なレベルのパフォーマンスを実現。 |
Helixのこれらの特徴によって家庭や工場などの実環境でのロボット活用が進み、より柔軟で効率的な自動化が実現する可能性があります。
Helix独自の機能
Helixは「System 1, System 2」のアーキテクチャを採用し、高速かつ汎用的なロボット制御を可能にしています。
システム2(S2)
インターネットで事前学習された大規模言語モデル(VLM)を基盤とし、7~9Hzの頻度で動作。シーンの理解や言語指示の解釈を担当し、幅広い一般化能力を持つ。
システム1(S1)
高速な視覚運動ポリシーで200Hzのリアルタイム制御を実行。S2の出力を元に精密な連続制御を行い、即座に動作を調整。
この分離構造により、S2が高次の目標を「ゆっくり考える」一方でS1は動作を「素早く実行」でき、精密な協調動作が可能です。
Helixは単なる単純な物体操作にとどまらず、2体のロボットが役割分担を決めることなく自然に協力し合う能力を持ち、言語指示に基づいた直感的な行動生成が可能です。
家庭環境という複雑なシチュエーションにおいても新たなスキルを瞬時に獲得し、幅広い物体操作をこなせる点がこれまでのロボット技術との大きな違いです。
Helix登場による産業変化とその影響
Helix の登場によってロボットは単なる繰り返し作業を行う機械から、柔軟に対応できる 「知能を持つパートナー」 へと進化します。これにより製造業ではスマートオートメーション化が加速し、従来の固定的な生産ラインが大きく変わることが予想されます。
たとえば従来は新しい製品の製造に合わせて、ロボットの動作を再プログラムする必要がありました。しかしHelixを搭載したロボットなら自然言語の指示だけで新しい作業を即座に実行でき、製造ラインの変更が容易になります。
この変化により製造業は「固定的なオートメーション」から「適応型オートメーション」へと移行し、生産性向上や人手不足の解消が期待されます。Helixを搭載したロボットの登場で、製造業に関わらずさまざまな産業でロボットの導入が検討されるかもしれません。
Helixの課題と今後の展望
Helix はロボットの柔軟性と知能を大幅に向上させる革新的な技術ですが、実用化に向けていくつかの課題も考えられます。
未知の状況への適応性と安全性
Helixは未知の物体や状況にも対応可能ですが、複雑な環境や人間との協働作業における安全性が課題です。誤った動作による事故を防ぐため、より高度な制御システムの開発が求められます。
高度な学習・認識能力の限界
Helixは自然言語の指示を理解できますが、曖昧な表現や文脈の違いにより誤作動する可能性があります。これを克服するにはより大規模なデータ学習や、人間とのフィードバックシステムが必要です。
法規制と倫理的な問題
自律性の高いHelixを取り扱うには、産業ごとの安全基準や法律との整合性が必要となります。人間の仕事を奪う懸念や誤作動時の責任問題など、倫理的・法的な議論も深まるでしょう。
Helixは多くの産業の発展を促す可能性を秘めており、これらの課題を解決することでより安全で実用性の高いシステムとして広く活用されていくでしょう。
References
- ^ Figure社. 「Helix: A Vision-Language-Action Model for Generalist Humanoid Control」. https://www.figure.ai/news/helix, (参照 2025-02-22).