在中关村论坛的AI开源前沿分论坛上,一场汇聚AI领域顶尖人物的圆桌对话吸引了众多目光。月之暗面创始人杨植麟、智谱华章CEO张鹏、小米Mimo大模型负责人罗福莉、无问芯穹联合创始人夏立雪,以及香港大学助理教授黄超齐聚一堂,围绕AI开源、Agent框架、大模型发展等热点话题展开深入探讨。
对话伊始,话题聚焦于近期备受关注的OpenClaw。张鹏作为早期使用者,从程序员视角分享了独特体验。他认为,OpenClaw打破了顶尖模型能力使用的专业壁垒,让普通用户也能借助自然交互实现复杂编程与任务处理。其核心价值在于搭建了一个灵活的“脚手架”,充分释放了用户的创造力。夏立雪则从基础设施厂商的角度出发,指出OpenClaw给整个大模型系统和生态带来了新的机遇与挑战。他透露,公司部署量自1月底以来每两周翻一番,目前已增长10倍,资源优化与整合迫在眉睫。
罗福莉将OpenClaw视为框架层面的革命性事件。她强调,开源特性使其成为社区深度参与改进的理想平台。在技术层面,OpenClaw既保证了模型任务完成的下限,又通过创新设计拉升了上限,在多数场景下任务完成度已接近Claude最新模型。黄超则从交互模式和架构创新角度分析了OpenClaw的成功。他认为,IM软件嵌入的交互模式带来了“活人感”,而Agent Loop架构的高效性也得到了验证,为社区生态发展提供了新思路。
在讨论智谱最新GLM模型时,张鹏介绍了模型在Agent能力上的增强。新模型专注于从简单对话向实际任务处理的转变,强化了长期规划、信息压缩和动态信息处理等能力。针对提价策略,他解释称,复杂任务处理导致模型消耗量大幅增加,成本上升,回归商业价值是行业健康发展的必然选择。
随着token量的爆发式增长,AI发展逐渐从训练时代迈向推理时代。夏立雪表示,无问芯穹作为AI时代的基础设施厂商,通过软硬件打通的方式布局解决方案。公司接入了多种计算芯片,统一连接国内算力集群,解决了算力资源紧缺问题。面向Agent时代,他提出了“Agentic Infra”概念,认为基础设施应具备自我进化和迭代能力,与AI发展形成深度耦合。
罗福莉在探讨中国大模型团队优势时,特别强调了模型结构创新的重要性。她以DeepSeek系列为例,指出在算力受限情况下,中国团队通过MoE和MLA等创新设计,实现了训练效率和推理效率的提升。她认为,Long-Context是实现模型自迭代的关键,而高效的Long-Context架构将是未来竞争的焦点。
从Agent框架和应用层面看,黄超认为Planning、Memory和Tool Use是关键技术方向。他指出,当前模型在复杂任务规划方面仍存在不足,未来需将隐性知识固化到模型中。Memory模块面临信息压缩和检索准确性的挑战,分层设计可能是解决方案。在Tool Use方面,技能质量和安全问题亟待解决,社区协作推动技能发展至关重要。
展望未来12个月大模型发展趋势,嘉宾们各抒己见。黄超强调“生态”建设的重要性,认为Agent从个人助手向“打工人”转变需要完整的生态支持。罗福莉则看好“自进化”能力的发展,她认为借助强大模型和Agent框架,大模型有望在一年内实现科学研究效率的指数级提升。夏立雪提出“可持续Token”概念,希望中国能发挥能源优势,成为全球AI的“Token工厂”。张鹏则关注“算力”问题,指出需求爆发与算力不足的矛盾将影响行业发展,需要各方共同寻找解决方案。