智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌新推Gemini 2.0 Flash Thinking:能否成为AI推理新标杆?

2024-12-20来源:ITBEAR编辑:瑞雪

谷歌近期发布了一款名为Gemini 2.0 Flash Thinking Experimental的新型人工智能推理模型,但该模型仍处于实验阶段,根据初步测试,其性能仍有待提升。

这款新模型在谷歌的AI原型平台AI Studio中可供使用,其全称略显冗长,但功能定位明确:专注于多模态理解、推理及编码,尤其擅长解决编程、数学和物理等领域的复杂问题。AI Studio的产品负责人Logan Kilpatrick在平台上的一篇帖子中,将Gemini 2.0 Flash Thinking Experimental描述为谷歌在推理技术探索上的初步尝试。

谷歌DeepMind的首席科学家Jeff Dean也在个人帖子中透露,这款模型经过特殊训练,能够通过思维强化其推理能力。他表示,当增加推理时间计算时,模型展现出了令人鼓舞的成果。这里的推理时间计算,指的是模型在解决问题时所需的计算资源。

Gemini 2.0 Flash Thinking Experimental是基于谷歌之前发布的Gemini 2.0 Flash模型构建的,其设计理念与OpenAI的o1等推理模型相似。这类推理模型与其他人工智能的一大区别在于,它们能够进行有效的自我事实核查,从而避免陷入一些常见的人工智能陷阱。然而,推理模型通常需要更长的时间(几秒到几分钟不等)来得出解决方案。

在使用时,Gemini 2.0 Flash Thinking Experimental会在接收到提示后暂停片刻,然后考虑一系列相关提示,并在此过程中解释其推理过程。经过一段时间后,模型会给出它认为最准确的答案。但在实际测试中,这款模型也并非无懈可击。例如,当被问及单词“strawberry”中有多少个R时,它错误地回答了两个。

自OpenAI发布o1以来,谷歌并非唯一一家在推理模型领域发力的公司。许多竞争对手的人工智能实验室也纷纷推出了自己的推理模型。例如,由量化交易员资助的人工智能研究公司DeepSeek在11月初发布了其首个推理模型DeepSeek-R1的预览版。同月,阿里巴巴的Qwen团队也宣布了他们所谓的首个o1公开挑战者。

据彭博社10月份的报道,谷歌内部有多个团队正在致力于推理模型的开发。而The Information在11月份的报道中进一步透露,谷歌至少有200名研究人员专注于这项技术。这一趋势反映出业界对于改进生成式人工智能技术的迫切需求。然而,传统的扩展模型技术已经逐渐失效,难以再带来显著的改进效果。

尽管推理模型在基准测试中表现出色,但并非所有人都认为这是最佳的发展方向。一方面,推理模型的价格昂贵,因为它们需要大量的计算能力来运行。另一方面,尽管这些模型在基准测试中取得了不错的成绩,但它们能否保持这种进步速度仍然是一个未知数。

业界对于推理模型的探索仍在继续。谷歌的Gemini 2.0 Flash Thinking Experimental只是众多尝试中的一次。随着技术的不断进步和竞争的加剧,我们有理由期待未来会有更多创新性的推理模型涌现。

然而,对于当前的推理模型而言,它们仍然面临着诸多挑战和未知。如何在保证性能的同时降低成本,如何保持持续的进步速度,以及如何更好地应用于实际场景中,都是未来需要解决的问题。

荣耀500 Pro规格揭晓:骁龙8 Elite加持 2亿主摄配8000mAh大电池
IT之家 11 月 14 日消息,博主 @数码闲聊站 今日曝光了荣耀 500 Pro 手机的核心规格,这款新机将于近期上市。 IT之家整理如下:6.55 英寸 2736*1264p 120Hz 中屏 骁龙…

2025-11-15

苹果联名iPhone Pocket:争议中售罄,高价能否续写品牌忠诚传奇?
苹果与日本时尚品牌三宅一生日前联名推出的iPhone Pocket(iPhone 口袋)11月14日正式开售,1299元至1899元的定价引发全网热议,成为科技圈与时尚圈跨界合作的又一争议焦点。尽管争议不断,…

2025-11-14

iPhone 17系列上市两月中国市场激活破千万,配置亮眼预售火爆
2025年11月14日,知名数码博主“数码闲聊站”爆料称,iPhone 17系列于本周完成中国市场激活超1000万台。 据了解,iPhone 17系列于2025年9月10日苹果秋季发布会推出,含标准版、Air…

2025-11-14

Apple Store应用6.6版焕新登场:液态玻璃设计带来视觉与交互新体验
2025-11-14 08:20:29 作者:狼叫兽 今日,iPhone与iPad平台的AppleStore应用迎来6.6版本更新,此次更新引入了全新设计的应用图标,并对界面进行了视觉升级,以适配iOS 2…

2025-11-14

中国“天衍-287”超导量子计算机搭建完成 搭载同款芯片将全球开放应用
感谢IT之家网友 的线索投递! 11 月 14 日消息,据《科创板日报》11 月 13日报道,从中国电信量子研究院获悉,搭载“祖冲之三号”同款芯片的超导量子计算机“天衍-287”已完成搭建。 该量子计算系…

2025-11-14

iPhone17系列销售势头猛 本周国内激活量或冲破1000万台大关
【CNMO科技消息】11月14日,据数码博主爆料称,iPhone17系列国内激活量将于本周突破1000万台。截至11月2日,该系列在国内的激活数量已突破825万台,其中iPhone 17 Pro Max约3…

2025-11-14

华为Mate 80系列新料:20GB国产内存搭配麒麟9030 配置亮点多
根据近期华为新机规划以及各方爆料,这款机型预计为华为 Mate 80 系列,有爆料称该系列新品将在 11 月 25 日发布。其中,ProMax 并非简单的名称更换,而是定位与 Pro 版差距更大的新增机型…

2025-11-14

vivo S50系列12月将至:S50 Pro mini紧凑旗舰,S50配望远镜后摄
vivo S50系列,包括 vivo S50和S50 Pro mini 。预计将在12月发布。 vivo S50 Pro mini将是一款紧凑型旗舰手机,配备 6.31 英寸显示屏。 据传闻 它将配备高通骁…

2025-11-13

京东11.11平板教育品类齐发力 办公游戏平板热销 智能学习设备受青睐
直播渠道同样表现抢眼,联想小新Pro GT、荣誉平板GT2 Pro、小米平板7 Pro获得观众最多青睐。在新兴的闺蜜机品类中,海信、小度添添、小米占据品牌领先地位,海信大白闺蜜机X8 Pro、小度添添闺蜜机…

2025-11-13