DP 模型训练与评测

  • 定位:数据到策略的核心闭环模块

  • 目标:形成可复现、可比较、可迭代的训练与评测流程

训练侧

  • 统一输入数据格式

  • 统一实验配置管理

  • 统一日志与模型版本命名

评测侧

  • 任务成功率

  • 轨迹平滑性与稳定性

  • 失败类型统计(感知失败 / 控制失败 / 交互失败)

下一步

  • 增加跨任务迁移评测

  • 增加 sim2real 一致性对比