智快网
快讯 行业 产业 汽车 科技 AI+ 热点

具身智能开源模型加速发展,中美同步探索下通用机器人未来可期

2025-09-12来源:ITBEAR编辑:瑞雪

作为人工智能与机器人交叉领域的核心方向,具身智能正引领全球科技变革。其中,机器人大模型作为“智能中枢”,正在推动机器人突破单一任务限制,向复杂环境下的自主学习与进化迈进。近期,中美两国具身智能企业几乎同步开源模型,标志着这一领域的技术生态进入爆发期。

9月8日,中国自变量机器人公司开源了具身模型WALL-OSS;次日,美国Physical Intelligence(PI)公司也发布了π₀.₅模型。这一“巧合”引发行业热议,被视为具身智能迈向成熟的关键信号。回顾语言大模型发展路径,从2018年开源社区初步探索,到2020年ChatGPT-3引发全球关注,技术迭代用了三年。如今,机器人大模型是否也站在了“GPT-3时刻”的门槛上?

在近期的一场技术对话中,自变量机器人CTO王昊与PI研究员柯丽一鸣(π₀、π₀.₅论文作者)深入探讨了这一话题。他们认为,2025年机器人模型领域最显著的突破是“泛化能力”与“长程任务”的突破。柯丽一鸣以叠衣服任务为例:“过去二十年,机器人叠衣服始终面临挑战,因为衣物褶皱、折叠顺序的多样性远超想象。但到2025年,模型已能将π₀.₅部署到陌生家庭环境中,完成抓取、移动等基础操作,尽管表现不完美,却展现出类似人类的适应性。”

王昊进一步指出,通用机器人基础模型的发展,使机器人从“单任务专家”转向“多任务学习者”。例如,2023年前,机器人需针对每个任务单独优化;如今,统一模型可同时学习数百种任务,优化目标从“单一任务极致”转向“全局任务平均成功率”。这种指数效应让机器人能处理包含连续步骤、需多步推理的复杂任务(如整理餐桌、布置餐具),成为行业最令人兴奋的现象。

然而,泛化能力的提升仍面临三大挑战。首先是物理世界的“长尾效应”:光照变化、桌布褶皱、透明物体反光等微小扰动,可能导致任务失败。人类能凭直觉适应,但依赖数据驱动的AI模型仍需突破。其次是长程任务中的误差累积:微小扰动可能像滚雪球一样放大,最终导致任务失败。王昊强调,需构建理解物理常识的模型基础,让机器人具备空间推理与因果推理能力。最后是数据质量与数量的平衡:高质量数据需精心设计,但追求数量时难以兼顾细节;低质量数据则可能影响模型性能。

数据采集的“真机维护”问题也被频繁提及。柯丽一鸣笑称:“做机器人研究,每天都在拧螺丝。”她回忆,早期研究时,硬件故障频发,新人常因维修压力而放弃。如今,尽管硬件稳定性提升,但真机维护仍是门槛。王昊补充道,机器人数据采集受限于硬件场地、操作员效率,成本高昂。为此,行业探索了多种解决方案:低成本本体、穿戴式传感器、人类视频数据等。其中,人类视频数据规模大、成本低,但仅能提供高级语义理解与任务规划,难以直接生成动作级数据。

在模型架构上,中美企业呈现出不同路径。自变量机器人主张“端到端”训练,将语言、视觉、动作模态统一表征,避免分层导致的信息损失。王昊解释:“训练时,模型可同时学习理解推理与动作生成;部署时,将动作部分压缩蒸馏,语言推理部分放在云端,通过梯度回传更新参数。”而PI则保持开放态度,柯丽一鸣认为:“当前机器人大模型尚未达到GPT-2水平,数据驱动是核心,但具体架构(如双系统分离或端到端)并非首要问题。”

商业化方面,中美企业展现出差异化策略。美国企业倾向于“自上而下”,优先构建超大规模通用模型,再探索应用场景。这得益于其算力优势——顶级芯片与大规模算力集群集中在美国。而中国企业则采取“上下结合”的双轨路径:一方面迭代通用基础模型,另一方面在养老、公共服务等泛化场景中落地,形成数据飞轮。王昊强调:“必须先有大而通用的基础,才能实现小而精的垂直部署。”柯丽一鸣则观察到,中国制造业的硬件需求与场景优势,为机器人商业化提供了独特土壤。

对于家用机器人的落地时间,两位专家给出不同预测。王昊认为,5年内机器人可进入家庭,完成厨房简单任务(如洗碗、切菜),但需人类协作;柯丽一鸣则保守估计5-10年,她以扫地机器人为例:“早期产品不完美,但用户明确其能力边界,这种模式值得借鉴。”他们一致认为,机器人需跨越数据、算法、供应链、商业模式等多重门槛,才能真正实现规模化应用。

华为鸿蒙6系统登场:流畅度大幅提升,跨生态互传成亮点,用户体验全面升级
就在刚刚,华为HarmonyOS 6 正式亮相,这次流畅度直接暴增40%,用余承东的话来说,体验就像换了新手机。接下来就是AI了,作为当下大厂都在卷的能力,这次鸿蒙直接自带 “智能体”。 10 月 22 …

2025-10-23

2025旗舰手机怎么选?荣耀Magic8系列凭全能实力成热门之选
从性能表现到AI体验,再到影像与设计,Magic8系列用实际体验证明了它为何能被列为“最好旗舰”的代表。更重要的是,Magic8在手感上做了细腻优化,机身弧线与掌心贴合,带来更舒适的握持体验。对那些追求稳定性…

2025-10-23

华为鸿蒙6系统新突破:支持与苹果设备“碰一碰”互传文件,个性化功能升级
值得注意的是,鸿蒙操作系统6还可以通过简单的“碰一碰”轻松分享照片、音乐、链接等丰富内容。与大部分国产智能厂商类似,为了增加和苹果生态的协同性,鸿蒙操作系统6可以通过碰一碰和iOS、iPadOS、macOS设…

2025-10-22

鸿蒙操作系统5问世一年终端破2300万,6代系统今日下午将正式登场
2025年10月22日,华为召开鸿蒙操作系统6发布会,发布会一开始,华为常务董事、终端BG董事长余承东对外表示,鸿蒙操作系统5终端数量突破2300万。 据了解,鸿蒙操作系统5是华为于2024年10月22日推出…

2025-10-22

性能旗舰之争:荣耀Magic8凭软硬件协同优势成今年热门之选
荣耀Magic8的影像系统结合AI算力,在长焦、夜景、人像等场景中都有显著提升。 对于正在考虑入手一款顶级旗舰的用户而言,荣耀Magic8无疑是今年最值得关注的答案——在众多高性能机型中,它以稳、快、智的综合…

2025-10-22

售价13000元!三星Galaxy XR头显发布 直面苹果Vision Pro高端之争
【CNMO科技消息】10月21日,三星正式发布了其首款混合现实头戴设备——GalaxyXR,官方售价定为1799.99美元(约合人民币13000元),直接瞄准了苹果Vision Pro的高端市场。借助头显的…

2025-10-22

真我GT8 Pro深度体验:影像创新联动理光GR,性能越级再升级
使用真我GT8 Pro拍摄后就会发现,它可以说是把理光GR的整套理念和色彩科学都塞进了手机里。 长焦还上了2亿像素1/1.56英寸大底潜望,在3倍、6倍和12倍变焦下,画质都有很高可用性,也是长焦街拍的很好补…

2025-10-22

AMD驱动优化显成效!RX 9070与RTX 5070实测对比,性能差距扩大至13%
Hardware Unboxed(HU)的最新测试结果,再次印证了这一说法:Radeon RX9070在最新的驱动和游戏补丁加持下,性能差距与竞争对手RTX 5070明显扩大。 即使加入各自的超分技术,R…

2025-10-22

性能狂飙无上限!一加15携六大行业首创技术震撼登场
行业首发冰河超临界气凝胶,航天级隔热材料,有效隔绝指尖温度; 行业首发冰河VC散热,超薄手撕钢材料,散热速度快两倍; 除此以外,一加15还拥有独家自研冰河芯片空调架构,可降低芯片核心区温度,同时安卓首批全新…

2025-10-22

iQOO 15今晚登场:以跨代理念重塑性能旗舰,带来极致体验盛宴
iQOO 15以“跨代领先”为核心理念,在电竞体验、视觉观感、影像能力和续航表现等方面实现全方位突破,为追求极致的用户带来前所未有的使用体验。从电竞性能到视觉观感,从影像能力到续航表现,iQOO 15以全方…

2025-10-22