智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌Gemini Omni多模态大模型发布:支持混合输入,对话实时编辑生成多元内容

2026-05-20来源:互联网编辑:瑞雪

在谷歌2026 I/O开发者大会上,一款名为Gemini Omni的全模态大模型正式亮相,成为全场焦点。这款模型突破了传统AI在模态处理上的割裂状态,实现了文本、图像、音频、视频等多种信息形式的深度互通与自由生成。

Gemini Omni的核心能力被概括为“任意输入、任意输出”。无论是手绘草图、文字描述,还是图片、音频、视频素材,用户都可以自由组合输入模型。系统能够自主解析信息逻辑,并模拟真实物理规则,最终生成高精度、符合现实逻辑的多元化内容,包括视频、图像和文本等。

支撑这一强大功能的是谷歌的三大核心技术底座:世界模型Genie、图像模型Nano Banana和视频生成模型Veo。这三项技术共同构建了Gemini Omni的全模态AI框架,使其能够处理复杂的多模态任务。

在发布会上,Gemini Omni的对话式实时编辑能力成为最大亮点。与传统AI生成工具一次性输出、修改繁琐不同,这款模型支持用户在生成过程中通过自然语言对话进行交互式迭代优化。例如,用户可以精准调整视频场景、修改物体材质或调整动态特效,而修改过程不会破坏画面的整体逻辑和物理效果。

现场演示中,工作人员仅用手绘简易图形和文字指令,便生成了一段带有物理碰撞效果的完整特效视频。这一展示直观展现了Gemini Omni在内容创作领域的强大潜力,为AI技术的应用开辟了新的可能性。

英特尔力促消费PC厂商加快采用18A制程处理器,谋求产能与利润双提升
IT之家 5 月 19 日消息,《日经亚洲》今日报道称,Intel(英特尔)正要求其主要 PC 合作伙伴扩大 Intel 18A 制程新款处理器在消费级设备中的用量;而相对老款的英特尔客户端处理器的供应情况“…

2026-05-20

iOS 27系统AI大升级:原生写作工具添专业语法检查,办公能力再提升
据外媒macrumors报道,iOS27系统AI升级细节近日再度被曝,苹果将全面优化内置智能写作工具,新增专业AI语法检查功能,对标主流文字校对软件,进一步完善端侧AI办公能力。 业内分析,接连曝光的AI壁…

2026-05-20

谷歌Android Halo新功能来袭:系统层级实时展示AI智能体运行状态
这项功能在 Google I/O 期间亮相,会在屏幕顶部加入一个较为低调的状态提示,向用户展示 AI 智能体是否正在设备上实时运行。等到该功能在今年晚些时候上线后,Android Halo 还会支持其他 …

2026-05-20

谷歌三星联合发布两款智能眼镜:Gemini AI助力,语音导航实时翻译成亮点
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌携手三星公司,展示了由 Gentle Monster 与Warby Parker 共同参与设计的 2 款智能眼镜。 该眼镜…

2026-05-20

百度2026年首季财报:AI新业务占比过半,智能云与自动驾驶双轮驱动增长
2026年第一季度,百度集团-SW(09888)发布了令人瞩目的财报,显示公司实现总收入321亿元人民币,其中核心AI新业务收入占比首次突破50%,这一数据标志着百度在转型过程中取得了重要里程碑,进一步巩固了…

2026-05-20

百度2026年Q1财报:总营收321亿,AI业务占比首过半,李彦宏看好智能体市场
《科创板日报》5月19日讯(记者 黄心怡),百度发布2026年第一季度财报,显示季度总营收321亿元,同比小幅下降约1%;归属百度的净利润为34.45 亿元,同比下降 55.36% ;非公认会计准则下归属百…

2026-05-20

苹果2026年硬件盛宴来袭:4款Ultra新品齐发,引领科技新潮流
具体涵盖暂定名为iPhone Ultra的首款折叠屏手机、配备触控式OLED屏幕的MacBookUltra、内置摄像头模块的全新AirPods Pro无线耳机以及迎来重大重新设计的智能手表Apple Wa…

2026-05-20