実際にやってみてわかった、ロボットのダンスの難しさ
ここまで手順を紹介してきましたが、実際に一連の作業をやってみると、いくつか苦労した点や課題が見えてきました。
失敗した際の改善策が「既存のうまくいっている部分」と干渉する
これはフィジカルAI全般における頻出課題かと思いますが、学習がうまくいかなかった場合には、シミュレーターや実機の動きを見て、何が悪いのかを考えなくてはなりません。
ここでいう「うまくいかない」とは、
・シミュレーター上で学習が収束しない
・収束はしたが、想定した動作を覚えてくれない
・実機に移すと、シミュレーターと同じ動きを再現できない
といったケースを指します。
その原因としては、そもそものモーションキャプチャやリターゲティングの精度など、さまざまな要因が考えられます。
中でも厄介なのが、強化学習におけるパラメータの微調整です。
例えば、「関節データ通りに動く」と「身体が一定以上傾かない」という2つの要求がある場合、強化学習ではそれぞれの要求に重み付けをして、どちらがどれくらい大事かを調整する必要があります。
ここで、例えば「腕同士が激しく接触して機体を傷つけてしまう」という失敗に気付き、「自己衝突しない」という新たな要求を追加したとします。
この時、元の要求に新たな要求が加わることで、重み付けが変更されるわけですから、これまで満たせていた要求が達成しにくくなることがあります。
そのため、複数の要求全てをうまく達成できるよう、ロボットエンジニアは調整を重ねていく必要があります。
実際には、こうしたパラメータは10や20を超えるケースもありますから、この調整は非常に繊細な作業になります。パラメータ調整をうまく自動化しようとする研究も進められており、それだけ地道で大変な作業であることが分かります(関連論文は文末に掲載)。
ここでいう「うまくいかない」とは、
・シミュレーター上で学習が収束しない
・収束はしたが、想定した動作を覚えてくれない
・実機に移すと、シミュレーターと同じ動きを再現できない
といったケースを指します。
その原因としては、そもそものモーションキャプチャやリターゲティングの精度など、さまざまな要因が考えられます。
中でも厄介なのが、強化学習におけるパラメータの微調整です。
例えば、「関節データ通りに動く」と「身体が一定以上傾かない」という2つの要求がある場合、強化学習ではそれぞれの要求に重み付けをして、どちらがどれくらい大事かを調整する必要があります。
ここで、例えば「腕同士が激しく接触して機体を傷つけてしまう」という失敗に気付き、「自己衝突しない」という新たな要求を追加したとします。
この時、元の要求に新たな要求が加わることで、重み付けが変更されるわけですから、これまで満たせていた要求が達成しにくくなることがあります。
そのため、複数の要求全てをうまく達成できるよう、ロボットエンジニアは調整を重ねていく必要があります。
実際には、こうしたパラメータは10や20を超えるケースもありますから、この調整は非常に繊細な作業になります。パラメータ調整をうまく自動化しようとする研究も進められており、それだけ地道で大変な作業であることが分かります(関連論文は文末に掲載)。
実際の環境が想定しているより難しい
われわれは、シミュレーター側で床の凹凸や外乱の強さを変えながら学習させ、なるべく悪い環境でも転ばないように強化学習を行っていました。
しかし、実際に動かす環境の難易度が、シミュレーター上の想定を上回る場合、そうした環境への適応は困難になります。
この問題は、ロボット展の最終日に、実際に発覚しました。
過去4日間(本番3日とリハーサル1日)にわたるロボットのダンスによってステージの床材が部分的に摩耗してしまい、滑りやすい場所ができてしまったのです。
こちらは、最終日に撮影した足元の映像です。
しかし、実際に動かす環境の難易度が、シミュレーター上の想定を上回る場合、そうした環境への適応は困難になります。
この問題は、ロボット展の最終日に、実際に発覚しました。
過去4日間(本番3日とリハーサル1日)にわたるロボットのダンスによってステージの床材が部分的に摩耗してしまい、滑りやすい場所ができてしまったのです。
こちらは、最終日に撮影した足元の映像です。
ダンス中に床が摩耗した影響でロボットの足が滑っている様子
via www.youtube.com
ステップによっては左足が大きくスライドしてしまっているのがハッキリとわかると思います。
この影響で実際に転倒することはありませんでしたが、ポジションが大きく乱れてしまうため、背後のディスプレイとの衝突リスクが上がってしまい、何度か人手でガードする展開になってしまいました。
このように、実機にデプロイするだけでなく、現地で実働させてみて初めて分かることも多く、われわれにとっても学びの多いイベントとなりました。
この影響で実際に転倒することはありませんでしたが、ポジションが大きく乱れてしまうため、背後のディスプレイとの衝突リスクが上がってしまい、何度か人手でガードする展開になってしまいました。
このように、実機にデプロイするだけでなく、現地で実働させてみて初めて分かることも多く、われわれにとっても学びの多いイベントとなりました。
まとめ
ここまで、ヒューマノイドのダンスを実現するまでの大まかな手順と、その過程で見えてきた課題について紹介してきました。
2025国際ロボット展の本番では、G1を酷使したことで挙動が不安定になったり、バッテリー交換の猶予がギリギリだったりと、紹介しきれない細かな反省点も多くありました。エンジニア一同が慌ただしく対応する場面もありましたが、それでも4日間にわたり、事故なくG1のダンスを披露することができました。
特に、初日にメディアやSNSをご覧になり、2日目以降に会場へ足を運んでくださった方も多かったようです。会場でご覧いただいた皆さま、ありがとうございました。
今後もダンスに限らず、ヒューマノイド開発の取り組みを紹介していく予定です。GMO AIRのSNSアカウントでは、こうした取り組みの様子も発信していますので、ぜひチェックしてみてください。
2025国際ロボット展の本番では、G1を酷使したことで挙動が不安定になったり、バッテリー交換の猶予がギリギリだったりと、紹介しきれない細かな反省点も多くありました。エンジニア一同が慌ただしく対応する場面もありましたが、それでも4日間にわたり、事故なくG1のダンスを披露することができました。
特に、初日にメディアやSNSをご覧になり、2日目以降に会場へ足を運んでくださった方も多かったようです。会場でご覧いただいた皆さま、ありがとうございました。
今後もダンスに限らず、ヒューマノイド開発の取り組みを紹介していく予定です。GMO AIRのSNSアカウントでは、こうした取り組みの様子も発信していますので、ぜひチェックしてみてください。
参考文献
https://irex.nikkan.co.jp/ – 2025国際ロボット展
https://www.unitree.com/g1 – G1の公式ページ
https://arxiv.org/pdf/2509.20717 – ロボットによるダンスの新しい論文
https://arxiv.org/abs/2512.01996 – G1をシミュレーションから実機に高速にデプロイする論文
https://www.unitree.com/g1 – G1の公式ページ
https://arxiv.org/pdf/2509.20717 – ロボットによるダンスの新しい論文
https://arxiv.org/abs/2512.01996 – G1をシミュレーションから実機に高速にデプロイする論文

真次彰平
【GMOインターネットグループ デベロッパーエキスパート / GMOインターネットグループ グループ研究開発本部AI研究開発室共同研究推進グループ】
リサーチサイエンティスト、2024年 GMOインターネットグループ株式会社へ新卒入社。
ヒューマノイドにおける強化学習を用いたモーションの獲得に関する研究に従事しております。












