智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌发布Gemma 4开放模型系列:端侧优化让AI Agent离线畅行无阻

2026-04-03来源:快讯编辑:瑞雪

谷歌近日正式推出新一代开放模型系列Gemma 4,宣称这是其迄今为止最智能的开放模型。该系列专为复杂推理场景和智能体工作流设计,采用Apache 2.0商业许可证开源,包含四种不同规格的通用模型:20亿参数的高效版(E2B)、40亿参数的高效版(E4B)、260亿参数的混合专家模型(MoE)以及310亿参数的稠密模型(31B)。

在移动端和物联网设备领域,E2B与E4B模型通过优化推理时的参数激活量实现低功耗运行。前者仅激活约20亿参数,后者激活约40亿参数,这种设计显著降低了内存占用和电量消耗。目前这两个模型已与谷歌Pixel团队、高通、联发科等硬件厂商达成合作,支持在手机、树莓派、NVIDIA Jetson Nano等设备上实现近乎零延迟的离线运行。

26B MoE模型的创新之处在于其动态参数激活机制。在执行推理任务时,该模型仅需激活38亿参数,既保持了高运算效率,又完整保留了大型模型的知识储备。这种设计使其在处理复杂任务时,既能快速响应又能提供深度分析。

针对开发者和研究人员的需求,26B与31B模型专门优化了消费级GPU的兼容性。这使得用户无需依赖云端服务,即可将个人工作站转化为具备本地AI处理能力的服务器,特别适合学生、研究人员进行深度学习实验和模型开发。

谷歌DeepMind团队的研究人员Clement Farabet和Olivier Lacombe透露,通过优化算法架构,Gemma 4系列实现了"单位参数智能"的显著提升。以31B稠密模型为例,其在行业标准评测的开源模型榜单中已跻身前三,展现出超越参数规模的性能表现。

在智能体开发方面,Gemma 4系列实现了原生支持能力的大幅升级。相较于前代需要额外调整才能实现工具交互的模型,新一代产品直接集成了函数调用、结构化JSON输出、系统指令执行等功能,并支持超过140种语言。这种设计使开发者能够直接构建自主智能体,实现与第三方工具的无缝对接和多步骤任务规划。

律师访谈笔录整理难?五款苹果手机录音转文字App实测,帮你选最优解
之前刷到测评博主说“试了七八款转写工具,准确率最高的还是它”,这次测完真的有同感,听脑AI对法律术语的识别准得夸张,“不安抗辩权”“举证责任倒置”“诉前财产保全”这类高频词全对,就连当事人说的江浙口音小众地名…

2026-04-03

苹果17 Pro照片加水印全攻略:三种方法满足不同场景需求!
钛金属机身握着确实稳,但拍出来的照片如果不加个水印,总感觉少了点“这是我拍的”仪式感。 2. 在网上搜一个“照片加水印”的现成指令规则导入,或者自己新建一个:添加“选择照片”→“叠加图像/文本”→“存储到相…

2026-04-03

谷歌Gemma 4大模型重磅登场:多规格适配全场景,端侧离线运行成亮点
一口气推出四款不同规格模型,覆盖从手机、边缘设备到工作站、服务器的全场景部署,在参数效率上表现亮眼,31B版本更是跻身ArenaAI开源排行榜第三。 小模型组的E4B和E2B主打端侧部署,分别为80亿总参…

2026-04-03

Nothing CEO转变态度,2027年拟推AI智能眼镜,此前明年先上新耳塞手机
公司最初拒绝了这一想法,但随着Google和Samsung等公司在Android XRumbrella下计划推出眼镜,Nothing现在已对开发更多设备持开放态度。 彭博社称,Nothing的AI智能眼镜预…

2026-04-03

2026道通Physical AI大赛总决赛落幕,具身智能竞技展现AI新活力
大赛紧扣“人工智能 +”发展战略,聚焦Physical AI(物理人工智能)与具身智能技术,设置人工智能、具身智能两大专业赛道,既贴合全球 AI技术从 “数字智能” 向 “物理智能” 演进的趋势,也精准对接…

2026-04-03