智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌Gemini 3.1 Flash-Lite登场:性能跃升,成本优化,多场景应用潜力大

2026-03-04来源:快讯编辑:瑞雪

谷歌近日正式推出轻量级人工智能模型Gemini 3.1 Flash-Lite,宣称这是Gemini 3系列中速度最快、最具成本效益的版本。该模型通过Google AI Studio的Gemini API向开发者开放预览,企业用户也可在Vertex AI平台同步体验。此举标志着谷歌在降低AI应用门槛方面迈出重要一步,其定价策略引发行业关注。

在定价体系上,谷歌为该模型制定了极具竞争力的方案:每百万输入Tokens仅收费0.25美元,输出Tokens价格为1.50美元。这种定价策略显著低于同类产品,尤其适合需要处理大规模数据的场景。例如,内容审核、实时翻译等基础任务的成本将大幅降低,为中小企业采用先进AI技术创造了条件。

性能测试数据显示,新模型在响应速度方面实现突破性提升。根据Artificial Analysis平台的评估,与前代2.5 Flash相比,首字响应时间(TTFT)缩短至原来的40%,整体输出速度提升45%。这种低延迟特性使其特别适合需要即时交互的应用场景,如智能客服、实时数据分析等。在Arena.ai排行榜上,该模型以1432分的Elo得分证明其综合实力,在多模态理解和逻辑推理测试中均领先同级别竞品。

具体能力方面,Gemini 3.1 Flash-Lite在专业测试中表现亮眼。在GPQA Diamond测试中取得86.9%的得分率,MMMU Pro测试达到76.8%的准确率,部分指标甚至超越体积更大的2.5 Flash模型。这些数据表明,轻量化设计并未牺牲模型的核心能力,反而在特定任务中展现出更优的效率。

该模型的创新功能"思考层级"机制备受关注。开发者可根据任务复杂度动态调整模型推理深度:处理简单任务时降低层级以提升效率,面对复杂逻辑或创意生成时则提高层级激发深度思考能力。这种灵活性使单一模型能够适应从基础自动化到高级决策支持的不同场景需求。

早期采用企业已验证其实际价值。Latitude、Cartwheel等公司将其部署于用户界面生成、数据可视化等复杂业务场景,反馈显示模型在保持高效处理的同时,能准确理解复杂指令并输出高质量结果。测试团队特别指出,其推理精度可与大型模型媲美,但资源消耗和响应速度明显优于同类产品。

七彩虹iGame RTX 50系显卡助力《生化危机:安魂曲》开启极致光影流畅之旅
游戏支持路径追踪,并借助NVIDIA DLSS 4多帧生成与Reflex低延迟技术,实现高帧流畅体验与精准操作响应。七彩虹针对不同玩家需求,对多款iGame RTX 50系列显卡进行了实测,测试设定为:图形…

2026-03-04

Steam平台2月硬件大变局:RTX 5070登顶,32GB内存成主流
其中,RTX 5070 显卡的份额猛增 6.4% 来到 9.12%,拿下平台显卡份额榜第一;32GB 内存占比则飙升 18.91%,拿下56.93% 份额。 从 2 月数据大变动来看,IT之家推测主要受中…

2026-03-04

马斯克点赞中国AI模型:AI竞赛度量衡生变 小模型时代来临
但就在3月2日晚,当阿里千问开心3.5系列旗下4款小尺寸模型后,马斯克旋即在社交媒体留下了一句辣评: "Impressiveintelligence density."(令人惊叹的智能密度) 表面上看…

2026-03-04

MWC 2026荣耀亮剑:Robot Phone与人形机器人引领AI终端生态新变革
当然,影像也是Robot Phone上的一大看点。) 不过,Robot Phone也不仅仅只是一个拍摄工具,在荣耀AI大模型的加持下, 手机摄像头还能感知环境,并跟着环境变化和场景而变换姿态,仿佛自带情绪一…

2026-03-03

蚂蚁数科AoE框架:以手机+支架开启具身智能数据采集低成本轻量化新篇
由蚂蚁数科天玑实验室团队研发的AoE(Always-On Egocentric)持续性第一人称视频采集框架,提出了一种轻量化且低成本的具身数据采集方案。据论文介绍,蚂蚁数科攻克了“长视频转化为训练数据”的技术…

2026-03-03

vivo手机信号实测大揭秘!这4款在电梯等信号弱区刷视频也不卡顿
最让我惊喜的是它的信号和续航。骁龙8s Gen3处理器性能不错,再加上6500mAh的大电池,信号稳得一批,续航也特别给力。 接下来是iQOO Neo11,虽然iQOO现在独立了,但它还是vivo家的,信号…

2026-03-03