机器人学习基准

机器人操作的标准化评估——RLBench、LIBERO、CALVIN 等。成功率、任务完成情况、评估指标。

模拟基准轨道

用于可重复的模拟优先评估的任务套件。

真实机器人评估

基准测试侧重于具体部署和稳健性。

语言条件任务

强调教学基础和任务构成的基准。

快速浏览

操纵基准

按环境和评估重点过滤基准套件。

模拟

RLBench

PyRep 中有 100 多个操作任务。广泛用于VLA评估。 BridgeVLA 88.2%，InternVLA 95%+（子集）。

查看基准 → 模拟

LIBERO

终身学习基准。 130 个任务、空间/对象/目标套件。 RoboSuite。 95.9% SOTA（实习生VLA）。

查看基准 → 模拟

CALVIN

从语言和视觉构成动作。视野长远，语言制约。 RoboFlamingo 强基线。

查看基准 → 真正的机器人

谷歌机器人基准测试

现实世界的操纵。 700 多个任务。 WidowX，各种实施例。成功率，多任务评估。

查看基准 → 真正的机器人

COLOSSEUM

大规模真实机器人基准测试。不同的任务、环境。桥VLA 64%。

查看基准 →

关联资产

建议的模型和数据集

可比指标

基准被分组以进行同类性能检查。

真实与模拟覆盖范围

评估受控和面向部署的设置。

模型映射

每个基准路径都链接到兼容的模型系列。

执行支持

需要时支持数据捕获和评估操作。

需要评估或数据作为您的基准？

我们提供数据收集和实际评估支持。

数据服务联系我们