智快网
快讯 行业 产业 汽车 科技 AI+ 热点

豆包原生全双工语音大模型Seeduplex上线,语音交互告别机械迈向自然新时代

2026-04-10来源:快讯编辑:瑞雪

字节跳动旗下Seed团队近日宣布,其研发的原生全双工语音大模型Seeduplex正式上线豆包App,并面向全体用户开放。这一突破标志着语音交互技术从实验室走向规模化应用,用户无需等待内测或灰度发布,即可直接体验“边听边说”的流畅对话模式。

传统语音交互常因“抢话”“卡顿”或环境噪音干扰被诟病为“机械感强”。Seeduplex通过两项核心技术突破解决了这一痛点:其一,动态判停技术使模型能结合语音特征与语义状态,精准判断用户是“思考中”还是“已说完”,抢话比例较传统模型降低40%;其二,精准抗干扰能力通过直接解析原始音频信号,在咖啡厅、车站等嘈杂场景中,误回复率与误打断率减少一半。实测显示,用户即使中途打断对话或插入其他指令,系统也能自然衔接上下文,例如在点咖啡时暂停行程讨论,模型会主动询问是否需要复述推荐内容。

在极限场景测试中,Seeduplex展现了接近人类对话的节奏感。当用户参与“飞花令”游戏时,模型几乎实现零延迟响应,甚至能识别用户“套娃”重复诗句并即时提醒;在模拟英文面试中,面对用户长达5秒的“um…uh…”卡顿,模型未强行插话,而是耐心等待完整回答后再提出下一个问题。这种“懂分寸”的交互体验,源于模型对语调、呼吸节奏等人类无意识信号的深度学习,而非单纯依赖静音时长判断。

技术实现层面,Seeduplex摒弃了传统“语音转文字→大模型处理→文字转语音”的三段式架构,采用端到端原生设计,使模型直接从音频信号中学习语音与语义的一体化表达。工程团队通过重构模型框架、升级训练体系、优化推理性能等手段,在保障低延迟(判停延迟降低约250ms)的同时,将服务稳定性提升至亿级用户并发场景。横向对比显示,其对话流畅度MOS分较上一代提升12%,复杂场景下响应准确率与打断响应速度均领先行业主流应用。

该技术的落地不仅提升了消费级产品体验,更为车载、教育、客服等高频场景开辟了新可能。例如,在驾驶场景中,系统需在复杂声学环境中快速识别用户指令;在教育领域,口语陪练模型需理解学生的犹豫与思考过程;在客服场景中,系统需在多人对话中稳定主线交互。Seeduplex的产业价值在于,它将过去局限于演示场景的全双工技术,推向了需要高鲁棒性与实时性的真实世界。

从行业演进视角看,语音交互正经历从“回合制问答”到“实时自然交流”的关键跨越。早期级联模型因各模块独立优化导致体验割裂,端到端实时语音技术虽降低了延迟,却仍未能解决对话节奏控制的核心问题。Seeduplex的突破在于,它首次将“对话流控制能力”——即何时听、说、停、等——纳入模型训练,使AI从被动响应工具进化为具备主动交互意识的伙伴。这一转变或可类比GPT-3.5对文本交互的革新:当机械感被消除,技术才能真正融入日常生活。

Anthropic拟自研AI芯片破局,应对行业短缺与外部依赖难题
【环球网科技综合报道】4月10日消息,据路透社援引三位知情人士透露,人工智能实验室Anthropic正探索设计自有AI芯片,以此应对当前AI芯片短缺的行业困境,不过该计划目前仍处于早期阶段,尚未最终确定。知…

2026-04-10

小米18系列或首发高通骁龙8E6 2nm芯片 成本攀升或致售价显著上调
【太平洋科技】据数码博主“数码闲聊站”爆料,某品牌采用 2nm 工艺的大屏迭代旗舰机型,其工程机电池容量已确定为 8000mAh以上,同时支持百瓦级有线快充与无线充电。 骁龙 8E6 系列将全面采用台积…

2026-04-10

瑞起推出基于K3芯片的Vividnode Mobile AI迷你主机,受内存涨价影响暂停众筹
IT之家 4 月 10 日消息,株式会社瑞起 (ZUIKI) 是日本的一家嵌入式领域企业,其硬件产品传统上基于 Arm 指令集芯片。在今年 3月该企业公布了一款采用 RISC-V SoC 的迷你主机 Viv…

2026-04-10

联想集团收购Infinidat,借力技术优势强化高端企业存储业务布局
联想集团执行副总裁、基础设施方案集团总裁Ashley Gorakhpurwalla表示,此次收购恰逢其时,将大幅提升联想企业存储业务实力,加快交付高可靠、高性能的数据基础设施,为人工智能、数据分析及关键业务…

2026-04-10

华为Pura X Max四月下旬发布!搭载麒麟9030 Pro芯片,大屏阔折叠带来全新体验
快科技4月9日消息,华为全新阔折叠屏Pura X Max已经敲定将在本月正式发布。 在带来极致视觉冲击力的同时,Pura X Max还兼顾了优异的握持感。它在展开后的沉浸体验与折叠后的携带负担之间找到了完美平…

2026-04-10

OPPO A6s Pro 4月14日发布:3D景深工艺+7000mAh电池,颜值性能双在线
OPPO A6s Pro 在设计上独具匠心,带来了极具辨识度的外观。 屏幕与续航方面,OPPO A6s Pro 正面配备了一块6.57英寸直屏,分辨率为1080x2372,能为用户带来清晰细腻的视觉体验。同…

2026-04-10

豆包语音交互大升级!告别机械对话,全双工技术开启自然交流新体验
这要是换做是以前的语音模型,早在每一次「um/uh」之后,火急火燎地跳出来接话。而最让人玩味儿的,是团队在「人人对话」基准上的一次测试,看人机对话到底相对真人聊天到了什么程度。 它是在争夺下一件更本质的东…

2026-04-10

Hermes Agent崛起:与OpenClaw分野竞进,Agent框架开启分层新篇
它受到关注,不是因为提供了更多平台接入或更庞大的技能市场,而是因为在架构层面给出了另一种回答:当Agent被设计为长期运行的系统,是否可以把复杂度更多地收敛进模型和学习循环本身,而不是不断堆叠外部编排层? 也…

2026-04-10

消息称三星显示未来三年独家供应苹果折叠屏iPhone面板 初期出货量或低于预期
据外媒,苹果折叠屏iPhone所用面板,未来三年将由三星显示(SamsungDisplay)独家供应。在此期间,苹果预计不会再引入其他折叠屏面板供应商。 供应链消息称,三星显示计划从第二季度开始为苹果量产折…

2026-04-10