谷歌再次在人工智能领域掀起波澜,其旗下DeepMind团队推出的世界模型Genie 3实验性研究原型「Project Genie」正式向公众开放。这一创新项目允许用户创建、编辑并探索虚拟世界,标志着交互式环境生成技术迈入新阶段。
作为通用世界模型Genie 3的延伸,Project Genie整合了图像生成与编辑模型Nano Banana Pro和语言模型Gemini的技术优势。用户可通过文本描述或上传图片创建动态环境,定义角色行为模式——从步行、骑行到飞行均可实现。系统特别引入"世界草绘"功能,允许用户在进入虚拟场景前预览并调整视觉效果,甚至切换第一人称或第三人称视角。
该平台的核心突破在于实时路径生成技术。当用户移动角色时,系统会根据交互行为动态延伸场景,这种突破性的一致性使机器人训练、动画制作乃至历史场景重建成为可能。目前开放的功能包含三大模块:环境创建、交互探索和内容重混。用户既能从零构建虚拟世界,也可基于现有作品进行二次创作,最终生成的视频内容支持下载保存。
首批体验的Google AI Ultra用户已展示出惊人创造力。有人构建出"法国女子攀越非逻辑世界"的奇幻场景,墙壁漂浮着飞行物体;另有用户尝试让系统运行经典游戏《毁灭战士》,创造出嵌套式的屏幕迷宫。这些作品虽然存在物理模拟瑕疵——比如水獭飞行员头顶鸭子、角色开门动作略显僵硬——但已展现出技术潜力。
项目团队坦言当前版本存在局限性:生成内容时长限制在60秒内,部分预设功能如"提示事件"尚未开放,角色控制偶发延迟。但这些不足并未削弱技术社区的热情,用户在社交平台分享的创作视频已引发广泛讨论。随着更多用户参与测试,这个专注于沉浸式世界构建的平台有望持续进化,重新定义数字内容的创作方式。

