据致远机器人介绍,World是全球首个基于真实场景、通用硬件平台、全流程质量控制的百万位真机数据集。此前,具身智能训练领域最大的开源数据集是Open X-。与前者相比,世界远程数据规模提高了10倍,场景覆盖范围扩大了100倍,数据质量也从实验室水平上升到工业级标准。
“在这个具身数据的世界里,机器人不再只是执行简单的桌面任务,而是进入了人类日常生活的方方面面,包括抓取、放置、推拉、搅拌、折叠、熨烫等基本操作。熨烫等复杂动作。”致远机器人负责人介绍道。
据了解,世界数据集诞生于致远自建的大型数据采集工厂和应用实验基地。总空间面积超过4000平方米,包含3000多个实物,复制家居(40%)、餐饮(20%)、工业(20%)、超市(10%)和办公(10%)。它包含 80 多个日常生活中各种技能的视频。
目前,高质量的数据集对于当前仿人机器人技术的发展尤为重要,但行业内高质量数据稀缺的问题却长期存在。业内人士此前在接受澎湃新闻采访时指出,虽然语音和图像数据可以通过互联网获得标注训练,但机器人所需的具体场景数据却极其匮乏。
在数据采集方面,行业一直在积极弥补数据不足的短板。比如,今年8月,特斯拉高薪招聘“数据收集员”; 12月27日,北京市共建智能机器人创新数据采集基地揭牌。同日,上海提出“打造超大规模城市级仿真应用场景,率先赋能实体智能、自动驾驶等大规模模型训练”。
据了解,World是致远机器人今年的第三个开源项目。相关数据将在网站、项目主页分批上传。致远机器人表示,将逐步开源千万级仿真数据,支持更泛化、更通用的大模型训练;将发布体现库大模型,支持模型微调;它将发布全套工具链来实现采集和训练。和评估闭环。
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论