智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌AI同声传译新突破:任意耳机秒变翻译神器,情绪语调全保留

2025-12-19来源:快讯编辑:瑞雪

科技巨头谷歌近日在翻译领域迈出重要一步,将升级后的Gemini 2.5 Flash原生语音模型整合至Google翻译,推出耳机实时语音翻译测试版功能。这项创新突破传统硬件限制,用户无需购买专用设备,只需佩戴任意耳机并连接安装Google翻译的安卓设备,即可开启实时翻译服务,实现单向聆听与双向对话的无缝切换。

该功能的核心优势在于"零硬件成本"与"情绪传递"技术。区别于苹果AirPods Pro 3需绑定特定iPhone机型的限制,谷歌方案支持所有有线、蓝牙及AI耳机,覆盖超过70种语言和2000个语言对。更引人注目的是其语音处理能力——通过Gemini 2.5 Flash模型,翻译不仅能保留说话者的语调、重音和节奏,还能在学术会议、跨国谈判等场景中区分不同发言者。演示视频显示,四位使用者分别使用韩语、英语、中文和德语交流,系统可精准识别主要说话者并在对话中动态切换语言。

技术层面,新模型将准确率提升至71.5%,多轮对话质量从62%跃升至83%。尽管海外用户反馈仍存在识别误差,尤其在专业术语翻译方面,但谷歌披露的数据显示其性能已显著优于前代。产品管理副总裁Rose Yao强调,这项技术突破使机器翻译从"信息传递"升级为"情感共鸣",例如西班牙语的热情重音或中文的含蓄语速都能被完整保留。

市场格局因此面临重构。当前同声传译领域存在三类主要方案:一是科大讯飞、时空壶等厂商的专用硬件,翻译准确率高达95%但售价昂贵;二是苹果生态的封闭方案,仅支持5种语言且需特定设备;三是Nebulabuds等轻量化APP,依赖第三方AI模型且需商业合作激活。谷歌的入局打破了这种平衡——其方案既无需硬件投入,又突破生态限制,虽在专业领域仍不及专用设备,但已实现"所有耳机皆可翻译"的普及化目标。

目前该功能已向美国、墨西哥和印度的安卓用户推送,计划2026年扩展至iOS生态及更多地区。行业观察者指出,这将对翻译耳机、AI眼镜等智能硬件造成冲击——当实时翻译成为基础功能而非产品卖点,厂商需重新思考差异化竞争策略。尽管谷歌方案尚不能完全替代专业设备,但其普惠性已为翻译技术普及开辟新路径。

英伟达1000亿美元投资OpenAI计划引关注 黄仁勋:资金尚未实际拨付
【环球网科技综合报道】12月19日消息,英伟达首席执行官黄仁勋在近日接受福克斯商业频道采访时,就市场关注的1000亿美元投资OpenAI计划作出明确回应,直言公司“尚未给过OpenAI一分钱”,意味着这一备受…

2025-12-19

雷军官宣小米17 Ultra下周发布,卢伟冰揭秘影像战略合作升级亮点
12月18日,小米创办人,董事长兼CEO雷军宣布,小米17 Ultra下周正式发布。 同时,卢伟冰发文介绍, 小米与徕卡全球影像战略合作升级。 卢伟冰表示,“我们一起带来了划时代的光学系统方案,以及移动影像领…

2025-12-19

荣耀WIN系列手机12月26日发布 曝6.83英寸185Hz直屏+骁龙8 Elite旗舰芯
IT之家 12 月 18 日消息,荣耀 WIN 系列手机将于 12 月 26 日 14:30 发布,博主 @熊猫很禿然今晚曝光了这款新机的屏幕规格。 荣耀 WIN:骁龙 8 Elite Gen5 处理器 …

2025-12-19

小云雀搭载字节新视频模型Seedance 1.5 pro,让普通人轻松拍出高质量视频
在此前烧烤摊的案例里,我们已经看到Seedance 1.5pro说普通话的能力,这一模型还支持了粤语、四川话等多种方言的生成,只要在提示词里进行限定即可。 我们将这条爆款视频的链接直接输入小云雀,只在提示…

2025-12-19

华为艾优、未野、飞利浦迷你剃须刀测评:性能、贴合、舒适度谁更优?
出门通勤、差旅随行,迷你剃须刀早已成为男士口袋里的“颜值救星”,可小巧机身的背后,却藏着不少让人头疼的痛点:为了压缩体积,多数产品被迫妥协性能,要么动力不足刮不干净胡茬,要么刀头设计不合理,剃须时还会出现扯须…

2025-12-19