研究者

杉本 徳和

所属:

情報通信研究機構(NICT)
脳情報通信融合研究センター
研究員

Specific Research Topic:

強化学習、運動制御、ロボティクス、ヒューマノイドロボット制御

Phone: 

080-9098-3259

住所:

〒565-0871 大阪府吹田市山田丘1-4

Email: 

Homepage:

私の研究分野は高次元状態空間における運動学習、特に、ヒトと同じくらい高い自由度を持つヒューマノイドロボットを用いた強化学習アルゴリズムの開発です。

強化学習はロボティクスの分野で古くから研究が行われています。しかし学習対象が単純なシステムであっても非常に多くの試行回数を要するため、ヒューマノイドロボットのような複雑なシステムへの適用は非常に困難でした。

一つのアプローチとして、複雑なシステムの挙動をよく説明できる特徴量を用いた状態空間の低次元化が挙げられます。しかし効率的な特徴量の抽出は難しく、また無視された物理量が制御器の性能低下を引き起こしかねません。

そこで私は状態空間の低次元化を行わず、少ない学習施行数で元の複雑なシステムを直接最適化できるアルゴリズムを開発しました。実ヒューマノイドロボット用いた運動制御課題において、従来の手法に比べて約200倍高速に学習できることを示せています。

CiNetにおける私の研究目的は、これまでに開発してきた運動学習モデルを応用して、ヒトの運動学習メカニズムを解明することです。その理解が深まればヒトの運動意図の推定にもつながり、社会に役立つBMIシステムの基盤になるだろうと考えています。

主要な業績:

N. Sugimoto, V. Tangkaratt, T. Wensveen, T. Zhao, M. Sugiyama, and J. Morimoto (2016):
Trial and Error: Using Previous Experiences as Simulation Models in Humanoid Motor Learning, IEEE Robotics and Automation Magazine, 23(1), 96-105.

K. Bouyarmane, J. Vaillant, N. Sugimoto, F. Keith, J. Furukawa, and J. Morimoto (2014):
Brain-Machine Interfacing Control of Whole-Body Humanoid Motion, Frontiers in Systems Neuroscience, 8(138), 1-10.

N. Sugimoto, and J. Morimoto (2013):
Trajectory-Model-Based Reinforcement Learning: Application to Bimanual Humanoid Motor Learning with a Closed-Chain Constraint, IEEE-RAS International Conference on Humanoid Robots (Humanoids2013).

N. Sugimoto, J. Morimoto, S. Hyon. and M. Kawato (2012):
The eMOSAIC Model for Humanoid Robot Control, Neural Networks, 29-30, 8-19.

N. Sugimoto, M. Haruno, K. Doya, and M. Kawato (2012):
MOSAIC for Multiple-Reward Environments, Neural Computation, 24, 577-606.