IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:机器人学习

共 1 篇相关文章

IT 累计浏览 12

LARYBench 发布:定义具身动作表征 ImageNet,首次度量从人类视频学习的泛化表征

具身智能领域面临带动作标注数据稀缺的挑战,机器人泛化能力受限。LARYBench 作为首个系统化评测基准,针对隐式动作表征进行量化评估,旨在从大规模人类视频中学习通用动作语义。该基准通过多粒度动作定义,包括本体动作、原子语义动作和复合语义动作,覆盖超过100万段视频、151种动作类型和11种机器人形态,构建了多样化数据集。评测采用浅层探测头验证表征质量,涵盖动作回归和分类任务。实验对比了隐式动作模型、通用视觉编码器等四类范式,结果表明通用视觉模型如 DINOv3 在动作泛化和控制精度上显著优于专门模型,揭示了动作表征可从海量视觉预训练中涌现。这一发现验证了人类视频数据在驱动规模化学习中的潜力,为具身智能突破数据瓶颈、走向数据驱动范式提供路径。LARYBench 开源了数据集和代码,促进社区协作,加速动作表征研究迭代。