机器人学习基准
机器人操作的标准化评估——RLBench、LIBERO、CALVIN 等。 成功率、任务完成情况、评估指标。
快速浏览
热门类别
快速标签
热门标签
评估
操纵基准
模拟
RLBench
PyRep 中有 100 多个操作任务。 广泛用于VLA评估。 BridgeVLA 88.2%,InternVLA 95%+(子集)。
查看基准 → 模拟LIBERO
终身学习基准。 130 个任务、空间/对象/目标套件。 RoboSuite。 95.9% SOTA(实习生VLA)。
查看基准 → 模拟CALVIN
从语言和视觉构成动作。 视野长远,语言制约。 RoboFlamingo 强基线。
查看基准 → 真正的机器人谷歌机器人基准测试
现实世界的操纵。 700 多个任务。 WidowX,各种实施例。 成功率,多任务评估。
查看基准 → 真正的机器人COLOSSEUM
大规模真实机器人基准测试。 不同的任务、环境。 桥VLA 64%。
查看基准 →
关联资产
建议的模型和数据集
可比指标
基准被分组以进行同类性能检查。
真实与模拟覆盖范围
评估受控和面向部署的设置。
模型映射
每个基准路径都链接到兼容的模型系列。
执行支持
需要时支持数据捕获和评估操作。