云霞资讯网

国内规模最大人形机器人真机数据集发布,开放原子开源基金会生态再添重磅成果!

60000+真机数据开放,破解具身智能“数据饥渴”难题近日,国内规模最大面向真实作业场景的全尺寸人形机器人真机数据集“L

60000+真机数据开放,破解具身智能“数据饥渴”难题

近日,国内规模最大面向真实作业场景的全尺寸人形机器人真机数据集“LET数据集”正式发布,并捐赠60000+分钟数据,在OpenLoong开源社区官网同步上线。

这一由乐聚智能(深圳)股份有限公司、国家地方共建人形机器人创新中心、北京数聚通启运营管理有限公司和苏州吴江智训未来运营管理有限公司等机构联合构建的数据集,以其60000+分钟的真机实采、多模态、多场景特点,精准填补了具身智能领域对高质量真机数据的迫切需求。

01 破解数据困境,真机数据的重要性

在具身智能领域,数据已成为制约创新发展的关键瓶颈。训练高性能的具身智能大模型需要采集视觉、听觉、触觉、力觉等多模态数据,但当前行业面临数据采集成本高、效率低的挑战。

上海市数据科学家指出:“训练具身智能大模型,需采集视、听、触、力觉等多模态数据,保守估计当前已有数据量与所需数据量之间至少还差两个数量级。”

真实数据与合成数据各有优劣。合成数据虽然成本低,但与真实世界存在偏差;而真实数据高度还原现实场景,基于这些数据训练的模型具有更高的可靠性和泛化能力。

目前,业界正创新多种采集方式突破真实数据收集壁垒,包括搭建真机数据采标平台、利用数据手套实时收集高精度操作数据,以及通过产品规模化落地获取更具针对性的数据。

02 LET数据集,多维度解读

LET数据集作为国内规模最大面向真实作业场景的全尺寸人形机器人真机数据集,其价值体现在多个维度。

· 规模空前,内容丰沛

数据集总量达到60000+分钟,涵盖了人形机器人在多种真实作业场景下的完整操作数据。

值得一提的是,作为主导构建方之一的乐聚机器人,藉此构建了目前国内开源规模最大的全尺寸人形机器人数据集,这一规模显著提升了行业数据储备,为训练更加精准、智能的机器人模型提供了坚实基础。

· 真机实采,非仿真合成

与传统的仿真数据不同,LET数据集全部来源于真机实景采集,高度还原了现实场景中的各种参数和条件。LET数据集基于乐聚夸父系列全尺寸人形机器人进行统一采集。该人形机器人具备40+自由度,身高约1.66米,体重约55公斤,同时搭配头部立体相机与腕部RGB-D相机,可有效避免因机器人形态差异导致的数据偏差问题。

· 多模态全面覆盖

数据集包含了机器人头部视角与双腕视角的清晰、稳定视频流,并同步采集RGB图像、深度图、关节状态及末端执行器状态等关键模态信息,全方位捕捉操作细节,为算法训练提供高一致性、高完整度的真机数据基础,能让模型更接近人类认知方式。

这种多模态特性使得研究人员能够从多个角度分析和训练机器人的作业能力,提高模型的泛化性能,显著提升了数据的质量标准。

· 多场景综合应用

数据采集覆盖了多种真实作业场景,确保了数据集的多样性和广泛适用性。

LET数据集以真实作业场景为核心,全面覆盖工业、商业零售及日常生活3大领域,6大场景,31项任务,117种原子技能。场景具体涵盖汽车工厂、快消场景、3C工厂、酒店服务、生活服务及物流场景,包含抓取放置、工具使用、搬运、协作等典型任务,覆盖移动平台、机械臂单臂抓取,多臂协作等多种操作形态。

03 国家地方标准共建的引领

LET数据集的建设不仅是一项技术成就,更是国家地方共建标准在机器人领域的重要实践。

国家地方共建人形机器人创新中心作为这一项目的重要参与方,聚焦人形机器人共性关键技术领域,致力于建设人形机器人创新生态系统。

在数据采集与治理方面,创新中心制定了人形机器人数据采集与管理规范,实现多品牌异构机器人数据采集管理的“车同轨、书同文”。

LET数据集以国家地方共建人形机器人创新中心规范为基准,从源头确保数据的高质量、专业合规性与可用性,旨在为开发者、企业及科研团队提供“开箱即用”的标准化数据资产。

与此同时,双方正联合开展国家及行业标准研制,推动国家级标准化试点标准验证与实施应用。

04 数据集的应用前景与价值

LET数据集的发布将为具身智能领域带来多重价值。

· 加速产业创新循环

LET数据集支持“数据驱动-算法优化-应用反哺”的创新循环,为形成数据与模型双向联动的智能闭环系统奠定基础。

国家地方共建人形机器人创新中心已经过模型训练,真机部署推理验证。

05 开源生态的战略意义

LET数据集捐赠60,000+分钟数据,体现了开源模式在推动技术进步方面的重要价值。

LET数据集的发布与首批60,000+分钟真机数据的开源将助力我国在全球人形机器人竞争中赢得先机。通过汇聚行业智慧,加速技术迭代,降低开发门槛,将促进整个行业的进步,规范化人形机器人传感器、作业执行系统的设计标准。