智快网
快讯 行业 产业 汽车 科技 AI+ 热点

从“看”到“玩”:Xmax AI用实时交互模型开启视频交互新纪元

2026-02-10来源:快讯编辑:瑞雪

当全球AI视频生成领域还在为画质提升和时长拓展激烈竞争时,一家中国初创公司已悄然开启交互革命。Xmax AI近日发布的实时交互模型X1,通过毫秒级响应和手势操控技术,将传统视频消费模式升级为虚实融合的共创体验。这项突破性成果标志着AI视频正式进入"可玩时代",用户无需专业设备即可用指尖调动虚拟与现实世界的像素。

在技术演示中,X1展现出惊人的交互能力:当手机摄像头对准桌面时,用户上传的滚球兽照片瞬间"活"过来,在桌面上四处探索。这个虚拟生物不仅能对抚摸、捏抓等手势做出精准反应,还能根据物理规则呈现Q弹形变。更令人惊叹的是,所有交互响应都在毫秒级完成,彻底摆脱了传统AI视频生成需要云端渲染的等待时间。目前该技术已通过X-cam测试版开放体验,苹果用户可通过TestFlight下载尝鲜。

突破性成果背后是多项核心技术创新。研发团队构建的端到端流式重渲染架构,将扩散采样速度提升百倍;统一交互模型架构则融合三维空间关系与二维屏幕操作,使模型能精准解析"捏""拖拽"等复杂手势。针对虚实融合数据稀缺的难题,团队开发的半自动化合成管线已积累大量珍贵数据资产,为行业树立新的技术标杆。

这款革命性产品的四大核心玩法正在重塑内容交互方式。"次元互动"功能让动漫角色突破屏幕限制,用户抚摸屏幕中的兔子时,模型会实时生成转头蹭手的动态响应;"世界滤镜"可将现实场景转化为梵高画作或乐高积木风格,且人物动作保持风格连贯性;"触控动图"能唤醒静态照片,拖拽猫咪嘴角即可让它露出微笑;"表情捕手"则能快速生成魔性表情包,为社交互动增添趣味。

这个颠覆性产品出自一支跨界精英团队。由前华为"天才少年"领衔的研发阵容,汇聚了清华大学、香港科技大学(广州)的学术力量,以及字节跳动、快手等企业的工程专家。团队在算法优化与工程落地间找到完美平衡点,既攻克了实时性与精准度的世界级难题,又确保技术能真正走进日常生活。

X1模型的发布只是开始。Xmax AI正以"Play the World through AI"为理念,构建下一代内容交互引擎。当其他公司还在卷画质参数时,这家中国初创公司已用技术创新重新定义了AI视频的边界——在这里,每个用户都能成为虚拟与现实世界的创造者与玩家。

阿里达摩院RynnBrain开源:赋予机器人时空记忆,推动具身智能迈向新高度
RynnBrain首次让机器人拥有时空记忆和空间推理能力,智能水平实现大幅跃升,在16项具身开源评测榜单上刷新纪录(SOTA),超越谷歌GeminiRobotics ER 1.5等行业顶尖模型。 达摩院具身…

2026-02-10

AI社区新势力:陈炜鹏携Loopit亮相,欲打造互动内容新平台
所以我觉得通用才是AI时代最大的确定性,这是我们做产品或者技术的principle。陈炜鹏:因为AI的Coding和多模态能力在不断提升,尤其到了Nano Banana和Sora 2,我们觉得产品可以不只是…

2026-02-10

字节Seedance 2.0开启内测 限制真人素材防滥用 探索AI发展平衡点
北京航空航天大学人工智能研究院教授沙磊评价称,现在Seedance 2.0还在小范围内测阶段,字节也限制了一部分模型功能,比如只有在进行活体认证的情况下可以生成真人视频,不支持输入真人图片或视频做主体参考…

2026-02-10

英特尔Nova Lake-S处理器将至 配套Z990旗舰与Z970主流双芯片组同步登场
英特尔预计将会在今年下半年推出Nova Lake处理器,处理器的规格提升明显,考虑到现在ArrowLake不太给力,因此众多消费者尤其是桌面用户都将希望寄托在Nova Lake处理器上,目前有消息称英特尔将…

2026-02-10

谷歌Aluminum OS新动向:Gemini深度集成,Google键加空格一键唤醒
IT之家 2 月 10 日消息,据科技媒体 9To5Google 昨天报道,谷歌的“安卓电脑”系统 Aluminum OS上月意外泄露,当时人们发现顶部的状态栏上有 Gemini 图标,不过最近的蛛丝马迹进…

2026-02-10

九凌JLOO户外广告机:手机APP远程操控,全场景信息更新高效又精准
九凌JLOO深耕户外智能显示领域十余载,以“云-管-端”智能架构为核心,打造全场景手机APP操控系统,让户外广告机摆脱空间束缚,实现随时随地调整屏幕信息、精准掌控传播节奏的高效体验,重新定义户外智能显示的运维…

2026-02-10