通过在仿真环境中训练智能体并迁移到实体环境, 是高效训练自主机器人的关健技术之一。
由于仿真环境与实体环境之间存在差异,需要智能体能够主动适应环境中的图像、物理、运动、反馈等多方面特性。
机器人场景往往需要在实体环境中进行适应和线上学习,对样本利用效率有着更高的需求。
需要研究离线策略学习、基于模型学习、自监督学习等多种技术,以持续优化和提高样本学习效率。
自主机器人面对新环境和多任务的迁移和泛化能力是机器人大规模应用的关健, 包括在表征、任务、推理和决策等多方面的泛化能力。
能感知和适应环境的自主运动和导航的智能体,可用于机械臂、轮式和足式机器人的运动控制和规划。
研究内容包括深度学习、强化学习、视觉雷达位置等多模态感知、运动规划等。
通过多智能体强化学习、演化学习来提高群体机器人合作协同的效率。