卓球ロボットによるサーブのためのSEAL法 (A Sample-Efficient Adjustment-Learning)
ディープラーニングや強化学習技術の急速な進歩により,卓球ロボットの知能も向上している.
しかしながら,多くの学習サンプルが必要であり,またロボットのサーブタスクに焦点を当てた研究は比較的限られている.
このような問題に対し,本論文では,卓球における人間の経験に着想を得た,サーブタスクのためのSEAL法 (A Sample-Efficient Adjustment-Learning)を提案し,追加のサンプル収集の必要なく,利用可能な訓練サンプルを本質的に増強することができる.
この学習方法は,プランニングと予測タスクにおいて優れた性能を発揮し,数回の反復で目標位置に素早く収束し,異なるサーブスタイルに適応することができる.
さらに,データセット作成段階におけるランダム平均法を紹介し,関節空間とデカルト空間における協調学習の有効性を示した.
動画
使用許諾は,yamakawalabo
