智快网
快讯 行业 产业 汽车 科技 AI+ 热点

Soul开源SoulX-FlashTalk:14B模型助力数字人亚秒级生成与全场景应用

2026-05-21来源:天脉网编辑:瑞雪

近日,Soul App旗下的AI团队Soul AI Lab宣布正式开源其自主研发的实时数字人生成模型——SoulX-FlashTalk。这一模型凭借140亿参数的强大算力,在生成速度、画面流畅度以及视频稳定性方面实现了显著突破,为行业提供了可商业化的实时生成式数字人解决方案。该模型的推出,不仅解决了传统数字人技术在实时交互中的延迟问题,还为电商直播、短视频制作、AI教育等多个领域带来了新的可能性。

SoulX-FlashTalk的核心优势在于其超低的生成延迟和高效的画面输出能力。据测试,该模型的首帧视频输出延迟仅为0.87秒,达到了亚秒级水平,同时支持每秒32帧的高帧率输出。这一性能使得数字人在视频通话、直播弹幕互动以及智能客服等场景中能够实现即时响应,彻底消除了传统大模型生成过程中的滞后感。模型搭载的14B超大DiT架构经过深度优化,推理吞吐量远超直播所需的25fps标准,确保了画面的丝滑流畅。

针对数字人长视频生成中常见的面部不一致和画质下降问题,SoulX-FlashTalk引入了独家自纠正双向蒸馏技术。该技术通过多步回溯自纠正机制,实时修正长序列生成中的误差,实现了无感纠错且画质无损。同时,模型保留了双向注意力机制,使得每一帧的生成都能参考过去和未来的上下文信息,从而有效抑制身份漂移,确保数字人在超长直播中的口型、面部细节以及背景保持高度一致。该模型还突破了传统数字人仅面部对口型的局限,支持音频驱动的全身动作生成,能够精准呈现手部细节,动作灵动且身份一致性高达99.22%。

在技术实现上,SoulX-FlashTalk采用了两阶段训练策略以平衡生成质量与速度。第一阶段为延迟感知时空适配,通过动态长宽比分桶微调优化模型性能;第二阶段为自纠正双向蒸馏,利用DMD框架压缩采样步数并移除CFG,同时结合多步回溯自纠正与随机截断策略,高效优化显存使用。团队还打造了全栈加速引擎,通过混合序列并行、算子级优化以及3D VAE并行化等技术,大幅提升了推理速度,最终实现了亚秒级延迟。这一系列技术创新使得SoulX-FlashTalk在保持高效运行的同时,能够生成高质量的数字人视频。

在TalkBench-Short与TalkBench-Long数据集的测试中,SoulX-FlashTalk的表现全面领先行业主流模型。在短视频评测中,其ASE评分达到3.51,IQA评分达到4.79,口型同步Sync-C为1.47;在长视频生成中,Sync-C评分提升至1.61,且长短视频均能稳定维持32fps的高帧率输出。基于这些优异性能,SoulX-FlashTalk可广泛应用于电商7×24小时AI直播、短视频制作、AI教育、NPC交互以及AI客服等场景,有效解决传统数字人直播中画质模糊、口型错位等问题,同时降低运营成本。

值得一提的是,此次开源并非Soul AI Lab的首次尝试。此前,该团队曾开源语音合成模型SoulX-Podcast,并在HuggingFace TTS趋势榜上登顶,GitHub星标数超过3100。此次SoulX-FlashTalk的开源,标志着Soul在AI技术开源领域迈入了新的阶段。未来,Soul AI Lab将继续推进技术开源,与全球开发者共同构建AI+社交的生态系统。

前华为字节高管携手创业,聚焦消费级具身智能,获数亿元融资打造家庭机器人伙伴
在自主持续做事能力方面,我们的工作主要体现在两部分:一是 Wild2Bot 数据框架,即通过部署环境中的数据持续提升具身智能的能力;二是真机强化学习,这也是我们团队积累较多的方向。国内供应链和本体产业基础较…

2026-05-21

印尼Q1手机市场:OPPO领跑但同比下滑,三星逆势增长或改写格局
根据Counterpoint提供的数据在2026年第一季度,印尼市场排名第一的品牌是OPPO,市场份额达到22%。 从整体数据来看印尼市场排名前五的品牌只有三星一家同比在增长,剩下的四家同比全部在下跌,其中下…

2026-05-21

英特尔CEO陈立武:外部芯片代工有进展,正与多家客户洽谈合作
5月21日消息,据媒体报道,英特尔CEO陈立武(Lip-Bu Tan)周一表示,公司的外部芯片代工业务正在取得进展,正成为其复苏计划中的关键一环。当被问及此事时,陈立武拒绝透露客户名称,但他表示,预计英特尔将…

2026-05-21

小米申请注册新商标“XIAOMI MIMO ORBIT”等 启动计划回馈全球AI开发者
【CNMO科技消息】近日,小米科技有限责任公司申请注册“XIAOMI MIMO ORBIT”“XIAOMI MIMO CLAW”商标,国际分类涉及科学仪器、网站服务,当前商标状态均为等待实质审查。在模型调用量…

2026-05-21

从“建算力”到“织算网”:我国算力网加速构建,赋能千行百业新发展
总台央视记者苏童:在河南郑州的国家超算互联网核心节点,6万张国产AI加速卡正在高速运行,不仅可以完成科学计算,也能支撑人工智能训练和推理,更可以实现不同地区和类型的异构算力资源统一接入、统一调度。 工信部…

2026-05-21

AI翻译虽便捷,但学习外语仍是认知提升与文化联结的必经之路
澳大利亚《对话》网站在5月18日的报道中指出,在AI翻译迅速普及的同时,一个至关重要的问题也浮出水面:如果机器能比人类更快、更准确地翻译语言,那么投入数年光阴学习另一种语言,是否仍然值得? 这表明,多语言体…

2026-05-21

哈博森黑鹰4号无人机亮相:16km图传搭配4K拍摄 续航达28分钟
IT之家 5 月 21 日消息,哈博森今日宣布新品黑鹰 4 号无人机通过民航 UOM RID 合规认证,并公布了新品的配置信息。 黑鹰 4号是一款航拍无人机新品,支持 16km 数字图传;搭载第四代三轴无刷…

2026-05-21

未来智能战略升级!viaim讯飞智能体耳机发布,AI Agent开启办公新体验
而未来智能的全球市场表现和用户数据,恰恰证明了viaim讯飞AI会议耳机正在跨越这道分水岭:用户不再只在开会时才想起它,而是把它嵌入到日常的工作流中,持续地依赖、持续地交互、持续地喂养数据。 回到这一次新品…

2026-05-21

2026年荣耀手机怎么选?这三款高口碑高性价比机型,总有一款适合你!
说实话,每次有朋友问我"荣耀手机现在买哪个好",我都得先反问一句:你平时拿手机主要干啥?今天就把目前荣耀阵营里口碑最好、性价比也最高的三款机器给大家掰开了聊聊,看完你心里就有数了。你想想,你连着打两三个小时原…

2026-05-21