跳转至

迁移与部署

本节介绍核心仿真器和 RL 任务已经可用之后的工作:如何将训练好的策略迁移到其他运行环境,验证其行为是否保持可用,并接入部署侧软件栈。

flowchart TD
  A[真实平台与日志] --> B[Real2Sim 实物到仿真]
  B --> C[参数与任务假设对齐]
  C --> D[强化学习训练]
  D --> E[导出策略]
  E --> F[Sim2Sim 仿真到仿真]
  E --> G[Sim2Real 仿真到实物]
  F --> H[回放与对齐验证]
  G --> I[ROS 中间件与 PX4 集成]

阅读顺序

通过参数对齐和系统辨识,让仿真参数更接近真实平台。

导出训练好的策略,并在可控条件下于 MuJoCo 中回放。

组装 ROS 中间件、软件在环链路以及面向实物的工作流。

适用范围

当你的核心问题变成“如何把已经训练或验证过的栈迁移到另一个运行环境,并保持其可用性”时,就应该阅读本节。范围覆盖参数对齐、回放验证以及部署侧集成。