旧金山初创公司Moonlake AI近日宣布,其“世界建模智能体”已进入公开测试阶段。该团队同步发布的技术博客详细拆解了保龄球小游戏的十阶段开发流程:从3D网格资产生成、刚体物理参数配置、碰撞检测算法搭建,到计分系统逻辑编写、空间音频融合及逆向运动学抓取动画实现,全程由AI自主完成。其beta版本产品能在15至20分钟内,将自然语言描述转化为具备物理反馈、可交互操作的完整游戏原型。
区别于传统游戏生成工具,Moonlake的野心不止于简化开发流程。创始人Fan-Yun Sun与Sharon Lee明确表示,该项目旨在通过游戏开发过程训练具备“世界运行规律”理解能力的AI模型。这种定位源于团队核心成员的学术背景:Fan-Yun Sun在斯坦福攻读博士期间,同时参与英伟达Omniverse项目,专注于大规模3D世界生成;Sharon Lee则深耕扩散模型与3D引擎的结合,致力于构建空间理解基础模型。两人的研究领域形成闭环——前者解决虚拟世界构建,后者赋予世界交互能力。
2025年10月,该公司结束隐身模式并宣布完成2800万美元种子轮融资,由AIX Ventures、Threshold Ventures及英伟达旗下NVentures联合领投。其天使投资人阵容堪称豪华:YouTube联合创始人Steve Chen、Google首席科学家Jeff Dean、GAN发明者Ian Goodfellow,以及来自Hugging Face、DeepMind等机构的高管均参与投资。截至近期,融资总额已增至约3000万美元,团队规模约15人,成员包括ACM ICPC奖牌得主及国际奥赛获奖者。
2025年12月发布的核心理念产品Reverie(生成式游戏引擎GGE),被团队定义为首个“可编程世界模型”。其突破性在于实现状态持久性——区别于Sora等视频生成模型仅预测下一帧画面的模式,Reverie通过绑定扩散模型与结构化3D信号,确保虚拟世界中的变化能够长期维持。例如,玩家打碎的花瓶不会在几秒后自动复原。Sharon Lee在采访中强调:“生成式世界缺失的关键是控制权,创作者需要定义变化的触发条件、持续时间及影响范围。”
技术架构层面,Reverie采用“编排者”模式而非单一模型。当用户输入自然语言指令后,系统会调用多个专业化第三方AI模型分工处理:空间布局由多模态推理模型完成,游戏逻辑依赖程序合成技术,物理交互通过模拟层实现,视觉渲染则交给实时扩散模型。Fan-Yun Sun透露,编排模型会随时间推移逐步整合外部模型能力,形成自主融合多模态数据的系统。
官方博客以赛博朋克风格保龄球游戏为例,展示系统推理流程:用户仅提供“在街机房创建半写实赛博朋克保龄球游戏”的简短描述后,AI自动完成十个开发阶段——从生成球道、球瓶的3D网格及PBR纹理,到配置摩擦系数0.4、弹性0.15的物理参数;从设计空间布局与核心游戏逻辑,到管理球体生命周期、处理边界异常、集成音频及逆向运动学抓取系统,最终通过用户反馈优化细节。整个过程无需人工干预架构设计或代码编写。
Moonlake对“世界模型”的定义显著区别于行业主流。当前多数AI项目将“world model”简化为视频帧预测,如Google DeepMind的Genie 3可生成24帧/秒的3D导航环境,李飞飞团队推出的Marble能从文本生成3D世界。而Moonlake认为,世界状态不能被压缩为像素集合。以保龄球瓶为例,其同时是空间中的纹理物体、具备质量惯性的刚体、可被撞倒的目标、计分符号实体及撞击声源。球击中瓶子的瞬间,需同步更新变换矩阵、解析碰撞冲量、递增比分、触发音频及推进重置计时器——任何模态的延迟都会导致世界不连贯。
基于此,团队提出世界模型需编码五大维度:几何(变换、拓扑、空间关系)、物理(质量、力、碰撞约束)、可供性(可行动作及执行主体)、符号逻辑(规则、分数、状态机)及感知映射(视觉投影与空间音频)。这一框架更接近传统游戏引擎的实际功能,而非单纯追求视觉真实。
实际测试显示,Reverie可快速生成游戏原型,但精细化打磨仍需人工介入。Fast Company记者在体验中,首次尝试制作3D地牢探险游戏失败,仅生成布满胶囊形角色的单房间场景;改做2D冰淇淋堆叠游戏时,初版虽在15分钟内完成核心玩法,但存在物理效果缺陷——冰淇淋无法正确堆叠,厨师角色显示为白色粗糙图形。经过数小时反复调整需求,最终版本虽实现计分与结束画面,但消耗了月度1500信用点中的950点(按40美元月费计算约25美元)。
Moonlake的长期目标超越工具开发。团队强调,用户每次纠正物理行为、补充游戏规则或调整因果关系,都在为多模态模型提供训练数据。Fan-Yun Sun对比现有数据采集方式指出:激光扫描房间获取的是静态数据,视频分析缺乏人类语境,单一游戏数据(如《堡垒之夜》录像)难以泛化至真实世界。而用户交互天然包含意图与反馈,属于因果数据。若用户基数形成规模,数据量将呈指数级增长,推动模型能力持续提升。目前,团队已收到制造业企业的咨询,探索将技术应用于机器人训练、自动驾驶及人因分析领域。不过,其beta版每日仅开放100个测试名额,距离构建数据飞轮仍有较大差距。

