强化学习任务
本节介绍建立在核心仿真栈之上的强化学习任务定义,以及训练侧配置入口。
覆盖内容
从架构、协作和维护成本角度,理解为什么长期任务更适合 manager-based,而不是只用 Gym 风格 direct env。
接入 lav2.tasks.isaaclab,配置任务导入方式,并使用主 manager-based RL 环境。
运行 lav2.tasks.genesis_forge 下的 managed-environment 任务定义。
阅读 lav2.tasks.mjlab 下的 manager-based RL 任务组织方式。
适用范围
调整 manager-based 任务配置、训练策略设置或 RL 专用运行参数时,应阅读本节。本节页面建立在核心仿真栈之上,重点是不同后端的训练工作流。