フィジカルAIの歴史
2020年以前:AIとロボットは別々に進化していた
2020年以前、ロボット工学とAIは、別々の領域で発展してきた。ロボットは工場のような構造化された環境で、事前にプログラムされた反復作業を正確に行うことに特化していた。一方、AIは画像認識や自然言語処理などのデジタル領域で進化していたが、物理的な行動を生成する力は限られていた。この時期のロボットは「知覚→判断→行動」の流れが手動で設計されており、環境の変化には弱かった。
2021〜2023年:AIとロボットが結びつき始めた
2021年には、前述のシッティらの「フィジカル・インテリジェンス」の提唱などを背景に、AIを物理システムに統合する機運が高まった。2022年にはGoogle DeepMindがRT-1を発表し、実世界のデータを用いて、視覚と言語を行動に結びつけるアプローチを確立した。2023年には後継のRT-2が登場し、VLAモデルという考え方が定着する。これにより、ロボットは見たことのない物体や指示に対しても、知識を基に推論して行動できるようになった(いわゆる「ゼロショット学習」)。
2024年:ドメイン特化とシミュレーションの進化
2024年は、汎用モデルから、特定のタスクや環境に適応したモデルへと分化が進んだ年だった。スタンフォード大学などによる「OpenVLA」のようなオープンソースモデルが登場し、開発の裾野が広がる。併せて、NVIDIAのOmniverseやIsaac Simなどのシミュレーション技術が進化し、物理法則に基づく仮想環境でのトレーニングが加速した。
こうした流れの中で、現実世界を仮想空間に再現する「デジタルツイン」を活用し、シミュレーションから現実へと移行する「Sim-to-Real(シミュレーションから現実へ)」の手法が、開発プロセスとして定着し始めた。
こうした流れの中で、現実世界を仮想空間に再現する「デジタルツイン」を活用し、シミュレーションから現実へと移行する「Sim-to-Real(シミュレーションから現実へ)」の手法が、開発プロセスとして定着し始めた。
2025年:ロボティクスにおける「ChatGPTの時代」
2025年は、フィジカルAIにとって大きな転換点となった。NVIDIAは、物理法則を学習したモデル「Cosmos」を発表し、ロボットが仮想空間で安全に学習し、状況を予測するための基盤を提供した。また、テスラのOptimusやFigure AIなどのヒューマノイドロボットは、実際工場や物流倉庫でのパイロット運用を始めている。
生成AI、強化学習、シミュレーション技術の統合によって、ロボットが推論し、計画する能力は飛躍的に向上した。NVIDIAのジェンスン・ファンCEOがこれを「ロボティクスにおけるChatGPTの時代」と表現したように、世界経済フォーラムでも、この技術は産業オペレーションを再定義する存在として位置づけられている。
生成AI、強化学習、シミュレーション技術の統合によって、ロボットが推論し、計画する能力は飛躍的に向上した。NVIDIAのジェンスン・ファンCEOがこれを「ロボティクスにおけるChatGPTの時代」と表現したように、世界経済フォーラムでも、この技術は産業オペレーションを再定義する存在として位置づけられている。
NVIDIA Cosmosのデモンストレーション
via www.youtube.com
具体的なフィジカルAIの例
フィジカルAIは、既にさまざまな形で実社会に実装され始めている。ここでは代表的な3つの事例を見ていく。
1:汎用ヒューマノイドロボット
まずは、人間の形を模したロボットの事例だ。VLAモデルや世界モデルを搭載し、人間用に設計された環境(工場、倉庫、家庭)で作業する。OptimusやFigure 01、Unitree G1といった汎用ヒューマノイドロボットが登場し、視覚情報と言語指示を基に、歩行や物をつかむ動作、運搬といった全身の複雑な動きを生成する。
「その青い箱を棚に置いて」といった指示を理解し、位置を把握しながら障害物を避けて動く。BMWの工場ではFigure 01を使い、従来の産業用ロボットでは難しかった柔軟な部品操作や、人間との協調作業が試されている。
「その青い箱を棚に置いて」といった指示を理解し、位置を把握しながら障害物を避けて動く。BMWの工場ではFigure 01を使い、従来の産業用ロボットでは難しかった柔軟な部品操作や、人間との協調作業が試されている。
BMWの汎用ヒューマノイドロボット活用
via www.youtube.com
2:自律型物流ロボットとフリート管理
自律型物流ロボットは、倉庫内で物品の搬送や仕分けを担うロボットで、AmazonのDeepFleetなどが代表例だ。
カメラやLiDAR(レーザーによる距離測定装置)を使って自ら周囲を把握し、あらかじめ決められたルートに頼らずに走行する。単体で動くだけでなく、多数のロボットをまとめて制御する「フリート管理」により、全体の動きを最適化する点も特徴だ。
Amazonは100万台ものロボットを導入し(100万台目は日本に導入されたそうだ)、AIによる調整でフリートの移動効率を10%向上させたと報告している。
カメラやLiDAR(レーザーによる距離測定装置)を使って自ら周囲を把握し、あらかじめ決められたルートに頼らずに走行する。単体で動くだけでなく、多数のロボットをまとめて制御する「フリート管理」により、全体の動きを最適化する点も特徴だ。
Amazonは100万台ものロボットを導入し(100万台目は日本に導入されたそうだ)、AIによる調整でフリートの移動効率を10%向上させたと報告している。
AmazonのDeepFleet
via www.youtube.com
3:手術支援ロボットと医療AI
RoboNurse-VLAやDa Vinciといった手術支援ロボットは、外科手術や看護業務を支援するロボットシステムだ。医師の音声指示(「メスを取って」など)と、手術場の映像をリアルタイムで解析し、正確なタイミングと位置で器具を手渡す。また、外科医の手の震えを抑えたり、組織の特徴を分析して最適な切開ラインをガイドするなど、人の動きや判断をサポートする。
AI支援によるロボット手術については、手術時間の短縮や合併症の低減につながるとする報告もある。
AI支援によるロボット手術については、手術時間の短縮や合併症の低減につながるとする報告もある。
手術支援ロボットのDa Vinci
via www.youtube.com

小林 啓倫
経営コンサルタント
1973年東京都生まれ、獨協大学外国語学部卒、筑波大学大学院修士課程修了。システムエンジニアとしてキャリアを積んだ後、米バブソン大学にてMBAを取得。その後外資系コンサルティングファーム、国内ベンチャー企業などで活動。著書に『FinTechが変える!金融×テクノロジーが生み出す新たなビジネス』(朝日新聞出版)、『IoTビジネスモデル革命』(朝日新聞出版)、訳書に『ソーシャル物理学』(アレックス・ペントランド著、草思社)、『シンギュラリティ大学が教える 飛躍する方法』(サリム・イスマイル著、日経BP)など多数。














