智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌Gemini Omni模型发布:跨模态交互升级,自然语言指令实现深度视频编辑

2026-05-21来源:快讯编辑:瑞雪

在近期举办的Google I/O 2026大会上,谷歌公司正式推出了其最新研发的Gemini Omni模型,这一创新成果标志着人工智能技术在跨模态生成与编辑领域取得了重大突破。该模型不仅支持文本、图像作为输入,还首次实现了音频与视频的全面整合,为用户提供了前所未有的创作自由度。

在音频处理方面,Gemini Omni初期版本主要聚焦于语音输入功能,但谷歌公司已明确表示,未来将逐步扩展其音频输入能力,涵盖更多类型的音频信号,以满足不同场景下的应用需求。这一举措无疑将进一步拓宽AI在音频创作与处理领域的应用边界。

作为首发产品,Gemini Omni Flash已率先在Gemini应用中亮相,并计划后续向企业客户开放API接口,以便更多开发者能够利用这一强大工具进行二次开发与创新。该模型的核心竞争力在于其深度视频编辑能力,用户只需通过简单的自然语言指令,即可对生成的视频内容进行持续迭代与优化,包括添加或删除特定对象、调整摄像机角度、修改环境氛围与视觉风格等。

得益于Gemini Omni对物理规律的深刻理解以及对历史、科学、文化等多领域知识的全面整合,其生成的视频在角色塑造、场景构建以及视觉逻辑上均表现出高度连贯性,甚至能够根据已有情节推测后续发展,为用户带来更加沉浸式的创作体验。用户还可以创建个人数字分身,并将其无缝植入到视频中,实现个性化的视频创作。

在保障内容安全方面,谷歌同样不遗余力。所有通过Gemini Omni生成的视频内容均会自动嵌入SynthID数字水印,这一技术不仅能够有效防止内容被非法复制与传播,还支持通过Google搜索及Chrome浏览器进行快速验证,确保内容的真实性与合法性。

目前,Gemini Omni Flash已面向拥有Google AI Plus/Pro/Ultra订阅服务的用户开放,用户可在Gemini应用及Google Flow平台上体验这一创新成果。同时,为了鼓励更多用户参与创作,谷歌还决定免费向希望混剪YouTube Shorts的用户以及YouTube Create应用用户提供该服务,进一步降低了AI创作的门槛。

Google DeepMind负责人哈萨比斯在大会上表示,Gemini Omni模型的推出是AI技术发展的重要里程碑,它正推动AI从单纯的任务执行向更加智能、通用的方向迈进,为人类社会的数字化转型注入新的活力。

谷歌Android 17“接续流转”功能来袭,多设备任务切换将更便捷高效
谷歌还以谷歌文档和邮箱做了实操演示:其一,在手机打开谷歌文档,切换至平板后可在同一页面、保持原有编辑状态继续编辑;其二,手机端安卓版谷歌邮箱的邮件会话,可无缝流转到大屏设备的网页版邮箱,直接打开同一封邮件对…

2026-05-21

ATK今晚发售A9 Ultimate与Air大师版+鼠标 定制传感器中大手模具任选
ATK(艾泰克)即将于今晚发售 A9 Ultimate 大师版 + 和 A9 Air 大师版 + 这两款搭载 " 定制 "原相 PAW3955Master 传感器的鼠标新品,最终到手价都是 299.2 元。…

2026-05-21

西圣、华为、倍思充电宝大比拼!充电效率、容量、控温谁更胜一筹?
今天,就在我测评的众多充电宝中把西圣、华为、倍思这三款充电宝拿出来进行对比,分别从品牌、容量与兼容性、充电速度、便携与安全四大维度真实对比,帮大家一步选对、不踩雷!完整充满2次后,在进行第3次充电时,手机电…

2026-05-21

2026智能家居怎么选?安徽洲润、华为、小米,口碑佳作助你畅享智能生活
生态链丰富:小米拥有庞大的智能家居生态链,用户可以根据自己的需求选择不同品牌的智能设备,实现设备之间的互联互通。 设备选择:在选择小米智能家居设备时,建议优先选择小米官方推出的产品,以确保设备之间的兼容性和…

2026-05-21

iQOO15T深度体验:2K屏游戏沉浸感拉满,2亿像素影像惊喜不断
综合体验下来,iQOO15T最大的亮点还是在于游戏体验,天玑9500Monster版处理器+自研电竞芯片Q3充分发挥出了最大性能,同档唯一的2K大屏带来更出色的显示与操控体验,又有8000mAh超薄蓝海电池…

2026-05-21

北通鲲鹏40御铠白深度评测:300元内AI智控手柄,软硬兼优的沉浸体验之选
用户反馈普遍提到这款手柄做工扎实,长时间握持不易疲劳,这为后续的深度游戏体验打下了良好的硬件基础。它不仅搭载了双限位阻尼可调TMR摇杆、光轴按键3.0、双切震动扳机等旗舰级硬件配置,更通过北通智控软件和AI语…

2026-05-21