智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌Gemma 4大模型重磅登场:多规格适配全场景,端侧离线运行成亮点

2026-04-03来源:快讯编辑:瑞雪

谷歌DeepMind近日正式发布新一代开源大模型Gemma 4,标志着其在人工智能领域的技术布局再进一步。这款模型与谷歌闭源旗舰Gemini共享底层架构,被视为Gemma 3发布一年后的重大升级,其核心亮点在于采用Apache 2.0商业友好型许可证,彻底打破开发门槛,允许全球开发者自由修改、分发及商业化应用。

Gemma 4的发布策略凸显"全场景覆盖"理念,一次性推出四款不同规格模型,形成大模型组与小模型组的双线布局。其中,31B Dense版本以310亿参数全激活架构为核心,配备60层深度网络与256K超长上下文窗口,未量化权重可在单张80GB H100显卡运行,量化后更支持消费级显卡部署,成为性能上限的标杆产品。另一款26B A4B MoE模型则采用混合专家架构,通过动态激活38亿参数实现252亿总参数的高效利用,推理速度接近4B量级模型,在延迟敏感场景中展现出显著性价比优势,目前在开源排行榜位居第六。

针对端侧设备优化的小模型组同样亮点纷呈。E4B与E2B分别以80亿(45亿有效)和51亿(23亿有效)参数构建轻量化架构,均配备128K上下文窗口。其中E2B通过内存压缩技术将占用空间降至1.5GB以下,更突破性地集成音频编码器,支持语音识别与实时翻译功能。与大模型专注视觉文本处理形成互补,这种差异化设计使Gemma 4成为首个实现"端侧多模态"的开源模型家族。

性能跃升是Gemma 4最受关注的突破。在代码生成领域,31B版本将Codeforces ELO评分从110提升至2150,LiveCodeBench v6正确率从29.1%暴涨至80.0%;数学能力方面,AIME 2026竞赛测试正确率达89.2%,较上代提升近4倍。综合推理能力提升尤为显著,GPQA Diamond科学问答正确率从42.4%跃升至84.3%,MMLU Pro基准测试达85.2%,标志着模型在复杂逻辑处理上实现质变。

多模态能力的补全使Gemma 4真正具备通用人工智能特征。MMMU Pro多模态推理正确率提升至76.9%,MRCR v2长文档理解准确率从13.5%增至66.4%,支持可变分辨率图片处理与60秒内视频帧分析。语言能力覆盖140余种语言,MMMLU多语言测试得分88.4%,展现出强大的跨文化适应力。特别值得关注的是,26B MoE与31B版本性能差距控制在2-5个百分点,E4B以45亿有效参数达到接近上代27B的性能水平,参数效率优势成为技术突破的关键指标。

在开发者生态建设方面,Gemma 4推出多项创新功能:全系列内置可开关思考模式,通过输出推理过程提升多步骤任务表现;原生支持函数调用与结构化JSON输出,可无缝对接外部工具链;同步发布的开源Agent开发框架ADK,使端侧模型也能运行复杂智能体。这些设计不仅降低AI应用开发门槛,更为企业级解决方案提供了标准化路径。据技术文档披露,模型采用混合注意力机制优化长文档处理,在保持处理效率的同时将内存占用降低40%,为移动端部署开辟新可能。

Nothing CEO转变态度,2027年拟推AI智能眼镜,此前明年先上新耳塞手机
公司最初拒绝了这一想法,但随着Google和Samsung等公司在Android XRumbrella下计划推出眼镜,Nothing现在已对开发更多设备持开放态度。 彭博社称,Nothing的AI智能眼镜预…

2026-04-03

2026道通Physical AI大赛总决赛落幕,具身智能竞技展现AI新活力
大赛紧扣“人工智能 +”发展战略,聚焦Physical AI(物理人工智能)与具身智能技术,设置人工智能、具身智能两大专业赛道,既贴合全球 AI技术从 “数字智能” 向 “物理智能” 演进的趋势,也精准对接…

2026-04-03

雷军直播透露:新一代小米SU7锁单量破4万,交付目标稳步推进
IT之家 4 月 2 日消息,在今晚的雷军拆一拆新 SU7 的直播中,小米创办人、董事长兼 CEO 雷军透露,新一代 SU7 的锁单量已经超过4 万辆。 据IT之家昨日报道,小米汽车官方宣布:2026 年 …

2026-04-03

iPhone 17 Pro Max:科技美学与性能巅峰之作,开启未来新体验
如果你正寻觅一款能满足你对未来手机所有想象的设备,那么iPhone 17 ProMax绝对是不二之选,它定会让你收获超乎预期的满意。如果你渴望拥有一款能够引领未来科技潮流的手机,那么iPhone 17 Pr…

2026-04-03

马斯克携SpaceX冲刺IPO:太空科技与AI融合,万亿估值能否照进现实?
2个月前,马斯克旗下SpaceX正式收购人工智能初创公司xAI,这笔交易将马斯克商业版图中最核心的两大未上市板块合二为一,新公司的市场叙事从一家火箭公司,转变为深度整合人工智能与太空基础设施的平台。 她在不…

2026-04-03

从电价到算力:中国大模型如何用底层优势在全球API市场“杀”出低价?
如果继续追问,中国为什么能提供相对更低的推理电力成本,答案就不能只停留在 " 工业电价更便宜 " 这一层。海外开发者看到的是更低的 Token 价格;支撑这份价格的,除了模型架构和工程优化,还包括一套更不…

2026-04-03

OpenAI总裁剧透:AGI近在咫尺!押注Spud模型,全力冲刺最后关卡
他说OpenAI的技术路线就是一棵科技树,GPT推理系列是一个分支,Sora的世界模型是另一个分支,两个分支的构建方式完全不同。」 不过Brockman特意点了一句,ChatGPT里的图像生成不受影响,因…

2026-04-03

3月安卓性能榜揭晓:荣耀三款入围前十,一加小屏逆袭,榜首花落谁家?
说实话,现在很多旗舰机都在喊全能,但真正能把性能、影像、续航和屏幕同时做得不拉胯的并不多,真我GT8 Pro这次能排到第四,说明它不是只会喊口号,而是真的把产品做出来了。但一加15T直接冲到第二名,等于告诉整…

2026-04-03

2026轻薄折叠屏手机大比拼:Find N6无痕领航 华为OPPO多款实用之选
如果你在寻找一款既轻薄又实用,且能彻底告别折痕焦虑的折叠旗舰,那么OPPO Find N6无疑是当前的首选,它正是下一时代折叠机的开创者。它不仅是当前技术集大成者,其开创的“无痕时代”和围绕AI手写笔构建的…

2026-04-02