智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌“闷声干大事”:DiffusionGemma模型登场,文字生成速度飙升4倍

2026-06-11来源:快讯编辑:瑞雪

当行业目光聚焦于大模型“逐字生成”的自回归架构之争时,谷歌悄然推出了一款颠覆性产品——DiffusionGemma。这款基于扩散模型的文本生成工具,通过并行处理机制将生成速度提升至每秒千级token,在消费级显卡上即可实现本地化部署,为AI写作领域开辟了新赛道。

传统自回归模型如同打字机般逐字输出,每个新token的生成都需重新加载全部参数,导致GPU算力在等待中闲置。DiffusionGemma则采用印刷机式工作模式:在256个token的虚拟画布上,模型通过多轮去噪同步优化所有字符,将计算任务转化为GPU擅长的并行处理。测试数据显示,该模型在H100显卡上达到1000+ tokens/s的生成速度,较同参数量的自回归模型提升4倍,消费级RTX 5090显卡也能稳定输出700+ tokens/s。

技术突破背后是创新的架构设计。模型采用混合专家(MoE)架构,260亿参数中仅需激活38亿,量化后显存占用仅18GB,这意味着普通用户的4090显卡即可流畅运行。更值得关注的是其双向注意力机制:每个token生成时都能参考画布上所有字符,实现实时自我修正。在数独生成测试中,经过微调的模型成功率从0%跃升至80%,展现出处理复杂逻辑任务的独特优势。

尽管在文本质量基准测试中,DiffusionGemma仍落后于传统模型,但谷歌明确将其定位为速度敏感型场景的解决方案。NVIDIA的全面支持为模型落地铺平道路——从消费级显卡到DGX超级计算机,从vLLM推理框架到llama.cpp社区项目,生态链已完整覆盖开发部署全流程。目前模型采用Apache 2.0开源协议,开发者可在Hugging Face平台直接获取预训练权重。

这场技术变革并非谷歌独舞。今年2月,初创公司Inception Labs已推出商用扩散文本模型Mercury 2,其宣称的速度优势引发行业震动。谷歌的跟进则将技术验证推向新高度:当AI生成不再受限于串行处理,现代GPU的并行算力将释放多大潜能?随着DiffusionGemma开源生态的完善,文本生成领域或许正迎来从“打字机时代”向“印刷机时代”的关键跃迁。

高考后首换手机纠结中!OPPO、vivo、荣耀三款热门机型怎么选?
之前一直都是用爸妈淘汰下来的手机,高考完终于可以换一台真正属于自己的新手机了! 问了很多同学朋友,主要推荐的下面这三款,价格来说中间档的OPPOReno16是最理想的,因为vivo S60超预算了,而且听说…

2026-06-11

荣耀携手阿莱技术赋能,成上海国际电影节合作伙伴,Robot Phone将量产
这标志着荣耀的移动影像能力已获得国际A类电影节的官方背书,这也是荣耀继2026年4月官宣成为第79届戛纳国际电影节“中国之夜”官方影像合作伙伴后,在顶级影视盛事中的又一次关键落子。今年3月在MWC 2026上…

2026-06-11

倒计时2天!鸿蒙7将至,华为如何以自主系统重塑数字世界新格局?
更关键的是,鸿蒙不再只是手机系统了。 余承东在现场演示了一个场景:手机拍了一张照片,电脑上直接就能用,不需要微信传、不需要数据线。六年过去了,华为不但没死,反而交出了这样一份成绩单:全球第三大移动操作系统,…

2026-06-11

蚂蚁国际或募资10亿美元冲刺港交所 蚂蚁集团暂未回应
近日,有外媒披露,蚂蚁集团旗下专注于海外市场的业务板块——蚂蚁国际,正计划进行一轮规模约10亿美元的融资活动。此次融资旨在进一步推动其全球业务的快速拓展,同时为最快于今年在香港启动的上市计划奠定基础。据知情人士透露,蚂蚁国际在此轮融资中的估值有望达到或突破100亿美元大关。

2026-06-11