当前位置:首页 > 上海厂房信息 > 正文内容

具身智能有了测评“上海卷”

  记者昨天获悉,上海交通大学联合业界研发的具身智能测评集GM-100宣布开源,旨在为衡量机器人“大脑”(智能模型)与“身体”(物理执行)的协同能力,提供一个更系统、开放且可复现的评估基准。后续,国内多个具身智能大模型将引入该测评集进行“跑分”测试。

  当前,具身智能技术路线尚处百家争鸣期,数据集建设缺乏统一标准。GM-100测评集相当于给具身智能出了一套上海版“统考卷”,为国内具身智能评价体系补齐短板。

  据悉,GM-100测评集包含了100个具体任务,总计1.3万条操作轨迹数据,规模可观。项目牵头人、上海交通大学副教授李永露认为,在当前研究阶段,高质量的数据集和评测体系对科研的贡献至关重要,优化数据分布能有效推动模型能力进步。因此,与其单纯追求任务的数据量,该测评集更强调任务设计的广度与评估体系的深度。

  记者从研究团队了解到,GM-100测评集在设计任务时,首先分析人类与物体交互的基本原语(不可分割的指令),再利用大语言模型生成大量候选任务,经专家筛选优化,最终形成涵盖从日常简单操作到罕见复杂场景的100项任务。

  此外,该测评集在传统的任务成功率之外,引入了两项关键指标。一是部分成功率,用于量化多步骤任务中,子步骤的完成情况,避免“非全即无”的粗暴判断;二是动作预测误差,即衡量模型在面对新情况时动作模仿的精度。

  研究团队对全球主流模型测试结果显示,GM-100测评集的任务设计难度合理,在不同机器人平台上均可执行且具备区分度,评估结果在不同硬件间也表现出稳定的泛化性,为跨平台模型能力比较提供了可靠参考。

  目前,测评集所有100个任务的详细说明、所需物料清单均已开源,团队还为每个任务上传了约130条真实机器人操作轨迹数据。“我们甚至公布了具体物料的购买链接,尽可能降低开发者的复现与参与门槛,让更多人能在同一基准上开展测试。”研究团队负责人告诉记者。

  当前,具身智能领域评测标准分散且不统一,各团队自建标准,抓取、路径规划等侧重点也各不相同,且多局限于高频简单场景。随着技术进步,旧有基准的区分度下降,难以反映复杂环境下的核心挑战,行业缺乏公认的客观参照。

  “现有具身智能模型结构的泛化能力已显不足,需进行结构性创新,在数据层面,大规模、高质量数据的采集与评估仍是行业瓶颈。”宇树董事长王兴兴在外滩大会、进博会等多个场合公开表示,当前具身智能的制约因素主要是模型架构和数据质量。

  为此,上海正努力通过具身数据和模型能力双维度,找到具身智能行业的破局之道。

  在数据方面,智元机器人率先建成全球首个数采超级工厂,还开源了包含百万条真机数据的AgiBot World数据集。智元具身业务部总裁姚卯青表示,该数据集提供了工业级高质量数据支撑,包含百万条机器人数据轨迹,每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样。

  此外,国地中心和浦江实验室联合团队计划完成2500万组整机数据积累,数据规模达到谷歌同类数据集的10倍。1月22日,上海库帕思科技与它石智航宣布共建“具身数据星火计划”,推动实现亿小时级别的数据流通规模。

  在模型方面,2025年3月,智元发布全球首个通用具身基座大模型智元GO-1,融合多模态大模型(VLM)与混合专家系统(MoE),支持不同本体平台数据采集和部署。上海具识智能还自主研发了全国首个具身智能操作系统InsightOS,在智能制造产线部署、智慧农业作业等产业场景得到应用。

  在此基础上,GM-100测评集的出现,则为上海乃至国内的具身智能评价体系补齐了短板。

  “我们的目标并非建立一个绝对公平的物理测试环境,而是打造一个开放、透明、可复现的评测平台。”该负责人表示,通过提供标准化的“考题”(任务)、详细的“考试说明”(开源资料)和灵活的“阅卷标准”(多维指标),努力成为一张具身智能模型的“统考卷”,不仅有助于横向比较模型性能,更通过题目设置定义行业的核心能力与前沿问题。(记者 查睿)

  记者昨天获悉,上海交通大学联合业界研发的具身智能测评集GM-100宣布开源,旨在为衡量机器人“大脑”(智能模型)与“身体”(物理执行)的协同能力,提供一个更系统、开放且可复现的评估基准。后续,国内多个具身智能大模型将引入该测评集进行“跑分”测试。

葛毅明微信号
产业招商/厂房土地租售:400 0123 021
或微信/手机:135246785151356468684613391219793 
请说明您的需求、用途、税收、公司、联系人、手机号,以便快速帮您对接资源。 
长按/扫一扫加葛毅明的微信号

扫一扫关注公众号

扫描二维码推送至手机访问。

版权声明:本文由中国产业园区招商网发布,如需转载请注明出处。部份内容收集于网络,如有不妥之处请联系我们删除 13391219793 仅微信

本文链接:http://www.001cf.cn/index.php/post/5925.html

标签: 上海仓库
分享给朋友:

相关文章

上海第三方外包仓库服务好的

上海第三方外包仓库服务好的

  通常一个云仓仓储每天发单要5万票以上,上海第三方外包仓库一年近2000万单。云仓仓储的发货能力体现于效率高,总量大,坪效比高。发货量达不到这个量级的也不能称之为云仓。用把这尺一量,那些加后缀赶时髦的云仓仓储就现出原型了。进到他的仓库看一下有没有这个体量立马就风分晓了。云仓仓储的特点就是发货量大,如果你的发货量十分大,每天5千单以上,我建议你去找云仓仓储,如果没有这个体量,上海第三方...

“每天都能接到十几个物资需求”

“每天都能接到十几个物资需求”

  “先去徐汇区给孩子们送奶粉,这个比较着急。”4月27日,邬敏雯一早出发赶去仓库。她告诉记者,前一天徐汇区妇联找到她,说奶粉、纸尿裤、防疫物品都不够了。   核对出库单、分拣理货、贴箱贴、装车……忙了一个多小时,4米多长的卡车满载一车厢“母婴包”出发了。“这些够300个孩子用半个多月。”邬敏雯说。   邬敏雯是上海复星公益基金会的执行秘书长。3月中...

抗疫Vlog|揭秘上海保供仓库的一天:从黑夜到黎明

抗疫Vlog|揭秘上海保供仓库的一天:从黑夜到黎明

  近日,上海嘉定。一位参与保供工作的小哥已经在某电商仓库奋战逾40天,他说,因为现在疫情比较严重,只要自己多干一点,就会有更多的市民收到属于他们的物资。   近日,上海嘉定。一位参与保供工作的小哥已经在某电商仓库奋战逾40天,他说,因为现在疫情比较严重,只要自己多干一点,就会有更多的市民收到属于他们的物资。   上海有“大白”强行破门进入居民家?实...

上海各区迷你仓库出租

上海各区迷你仓库出租

  本吧因你更精彩,明天继续来努力!   城市居民储存各类物件的小型仓库,节约家中使用空间。   优势:24小时恒温恒湿系统、高清视频监控,电子密码锁(每人独立房间独立锁)高级安防系统,定期除虫。   特点:交通便利多在地铁站附近、24小时存取自由、租期灵活、物流便捷、可代收发货品。   用途:日常和工作生活物品存...

上海全托管仓库出租

上海全托管仓库出租

  本吧因你更精彩,明天继续来努力!   仓储物流是一家专业从事仓储分拣配送物流一体化服务供应商。提供临时仓储、长期仓储、仓储外包、仓储托管、分拣配送一体化服务公司,具有多年仓库管理操作经验及现代化物流团队。拥有自己研发WMS、ERP系统,所有货物均为系统化管理,客户只需通过系统下达收发货指令,剩下完全由跃景替您全权完成。同时可对接国内外各大电商平台,且具有自动抓单、...

上海四行仓库抗战纪念地晋元纪念广场建成

上海四行仓库抗战纪念地晋元纪念广场建成

  8月10日,随着“八一三”淞沪会战纪念日的临近,位于上海市晋元路的上海四行仓库抗战纪念地晋元纪念广场已建成。四行仓库改造也全面竣工,光复西路上还竖起了一块“四行仓库抗日纪念地”的石碑。作为改建工程“重头戏”的四行仓库抗战纪念馆,建于四行仓库建筑体内的一二三层,将于本月13日正式对外开放。   8月10日,随着“八一三”淞沪会战纪念日的临近,位于上海市晋元路的上海四...

上海四行仓库成热门参观景点

上海四行仓库成热门参观景点

  近日,在四行仓库保卫战原址上设立的上海四行仓库抗战纪念馆成为热门参观点。   上海四行仓库西墙。新华社记者 任珑 摄   一名小观众在上海四行仓库抗战纪念馆内参观。 新华社记者 任珑 摄   观众在上海四行仓库抗战纪念馆内参观。 新华社记者 任珑 摄   观众在上海四行仓库抗战纪念馆内参观。 新华社记者 任珑...

视频大爱无疆!上海这个仓库汇聚了中国人民对土耳其地震灾民的关心

视频大爱无疆!上海这个仓库汇聚了中国人民对土耳其地震灾民的关心

  2月9日,上海浦东金闻路,一处普通的仓库内,一场跨国赈灾物资的整理行动正在紧张开展中。3000平方米的库房内,30余位员工各自分工:登记、贴牌、入库有条不紊地进行,短短48小时不到,这些来自上海,甚至全国各地的爱心物资已经堆满了仓库一角,几天后它们就将随专机运往土耳其,分发到灾民手中。   作为土耳其驻上海总领事馆指定的物资仓库,晶采国际货运代理有限公司的咨询电线...