智快网
快讯 行业 产业 汽车 科技 AI+ 热点

亚马逊新推AI语音模型Nova Sonic,能否挑战OpenAI与谷歌地位?

2025-04-09来源:ITBEAR编辑:瑞雪

近日,亚马逊震撼发布了其最新一代生成式AI模型——Nova Sonic,这款模型在语音处理领域实现了重大突破,能够生成自然流畅的语音,为语音交互技术树立了新的标杆。

据亚马逊官方介绍,Nova Sonic在速度、语音识别以及对话质量等多个关键指标上,表现与OpenAI和谷歌的前沿语音模型不相上下。这一成就标志着亚马逊在AI语音技术上的显著进步,也是对近年来新兴AI语音模型的有力回应。

与亚马逊早期的Alexa等模型相比,Nova Sonic在语音交互时更加自然流畅,用户体验得到了显著提升。这一转变得益于Nova Sonic强大的语音处理能力,它不仅能够准确识别用户的语音指令,还能在对话中展现出更加自然的语言风格。

为了让更多开发者能够利用Nova Sonic的强大功能,亚马逊将其通过Bedrock开发者平台向用户开放。该平台是专为构建企业级AI应用而设计的工具,而Nova Sonic则通过一个全新的双向流式API接入,使得开发者能够轻松地将该模型集成到自己的应用中。

在价格方面,亚马逊声称Nova Sonic是市场上“最具成本效益”的AI语音模型。与OpenAI的GPT-4o相比,Nova Sonic的价格便宜了约80%,这无疑将吸引更多开发者选择该模型。

亚马逊高级副总裁兼人工通用智能(AGI)部门首席科学家罗希特·普拉萨德透露,Nova Sonic的部分组件已经为亚马逊升级版数字语音助手Alexa+提供了动力支持。这一消息进一步证明了Nova Sonic的强大实力。

普拉萨德还表示,与竞争对手的AI语音模型相比,Nova Sonic在将用户请求路由到不同API方面表现出色。它能够根据上下文信息判断何时需要从互联网获取实时信息、解析专有数据源或在外部应用程序中采取行动,并使用合适的工具来完成任务。

在双向对话中,Nova Sonic展现出了出色的等待“合适时机”发言的能力。它能够准确判断说话者的停顿和打断情况,确保对话的流畅性和自然性。Nova Sonic还能够为用户的语音生成文本记录,这些文本记录可以被开发者用于各种应用场景。

在语音识别方面,Nova Sonic的表现同样令人瞩目。据普拉萨德介绍,该模型在语音识别错误方面比其他AI语音模型更少。即使在用户咕哝、说错话或处于嘈杂环境中时,Nova Sonic也能够准确理解用户的意图。在一项跨语言和方言的语音识别基准测试中,Nova Sonic在英语、法语、意大利语、德语和西班牙语上的平均单词错误率仅为4.2%。

在衡量多人参与的高音量互动的基准测试中,Nova Sonic也展现出了出色的表现。与OpenAI的GPT-4o-transcribe模型相比,Nova Sonic在单词错误率方面准确率高出46.7%。同时,Nova Sonic还拥有行业领先的速度,其平均感知延迟为1.09秒,比OpenAI的GPT-4o模型更快。

普拉萨德强调,Nova Sonic是亚马逊构建人工通用智能(AGI)这一更广泛战略的一部分。未来,亚马逊计划推出更多能够理解不同模态(包括图像、视频和语音)的AI模型,以及“其他在将事物引入物理世界时相关的感官数据”。

由普拉萨德负责的亚马逊AGI部门在公司产品战略中扮演着越来越重要的角色。上周,亚马逊刚刚推出了Nova Act的预览版,该模型似乎为Alexa+和亚马逊的“代我购买”功能的部分元素提供了支持。从Nova Sonic开始,亚马逊希望将更多内部的AI模型提供给开发者使用,以助力他们构建各种创新应用。

华为Mate X7或本月登场 首发20GB超大内存 配色丰富性能强劲
11月份的机圈将会是华为的主场,不仅新一代的直板旗舰华为Mate80系列会震撼亮相,还会有迭代的大折叠屏手机华为Mate X7发布。@定焦数码爆料,华为Mate X7将会首发定制20GB超大内存,这是华为史…

2025-11-15

安谋科技发布“周易”X3 NPU IP,端侧AI性能飙升助力多领域落地
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-14

Steam Frame登场 Valve停产Index VR头显 开启VR新征程
用户可通过无线适配器,将 PC 或 Steam Machine 上的平面屏(flatscreen)及 VR 游戏串流至 SteamFrame;与此同时,Steam Frame 本身也是一款独立设备,搭载高通…

2025-11-14

华为Mate70 Air深度体验:打破常规,超大屏“Air”的另类演绎
可以确定,华为Mate70 Air的影像没有因为“Air”的定义做妥协,在同价位机型中是能打的,硬件配置方面也是这个思路。这也符合华为Mate70 Air的技术路径,虽然重量不可避免地来到208g,但是保…

2025-11-14

欧加9K级大电池定版试产,一加骁龙8系直屏新机测试,中端机竞争升级
IT之家 11 月 14 日消息,博主 @数码闲聊站 今天在微博透露,欧加的 9K 级别大电池现已定版试产。 博主表示,这块电池采用单块4.51V 单电芯设计,额定容量 32.59Wh,额定电池 8760m…

2025-11-14

联发科天玑8系芯片屠榜安卓次旗舰性能榜 性能能效双优成市场新宠
以榜单第一的真我Neo7 SE为例,通过与MTK联发科技的深度联合调校,该机在同价位段中展现出极为出色的游戏性能,搭配真我GT性能引擎,通过芯片级调校,实现了持久稳定的高帧率表现,同时能耗最高可降低7%,帧…

2025-11-14

四名MIT辍学00后,两年打造AI编程神器,估值冲300亿成资本新宠
两年前,在完成种子轮融资后,创始人曾写了这样的期待—— Cursor的诞生,推动了「氛围编程」(vibe coding)在全球兴起。 他还在创纪录的时间内,完成了一份手写编程测试,给早期Facebook投资…

2025-11-14

iPhone 17系列发售不到俩月,中国市场激活量破1000W,双十一销量也亮眼
11月14日,数码博主“数码闲聊站”发文透露iPhone17系列于本周完成中国市场激活1000W+。 iPhone17系列9月19日正式发售,如今距发售不到两个月。 该博主此前曾透露,截至11月2日,iPh…

2025-11-14

荣耀500 Pro配置亮点全揭秘:骁龙8至尊版+2亿主摄+8000mAh长续航
【CNMO科技消息】11月14日,有数码博主曝光了荣耀500Pro的核心参数。CNMO注意到,新机将搭载骁龙8至尊版移动平台,电池容量达到8000mAh,主打2亿像素大底主摄。 除了上述核心亮点外,荣耀50…

2025-11-14

苹果iPhone 17系列发售不到俩月 中国市场激活量或破千万
苹果 iPhone 17 系列于今年 9 月 19 日正式发售,如今还不到两个月。 该博主曾透露,截至 11 月 2 日,苹果 iPhone17 系列国内激活销量超 825 万。具体数据如下: iPho…

2025-11-14