智快网
快讯 行业 产业 汽车 科技 AI+ 热点

Kimi-k2 thinking模型发布!编程表现出色,IMO数学题求解遇挑战

2025-11-07来源:快讯编辑:瑞雪

月之暗面公司近日正式推出了其最新研发的Kimi-k2 thinking模型,这款具备通用智能体能力和深度推理功能的思考模型,标志着AI技术在复杂问题解决领域迈出了重要一步。该模型通过多轮工具调用机制,能够高效应对编程、数学及逻辑推理等领域的挑战性任务。

作为Kimi K2系列的最新迭代,此次发布的模型在7月11日首发的10000亿参数基础上,通过9月5日发布的Kimi K2-0905版本实现了核心能力升级。新版本不仅强化了智能编码能力,支持256K长文本处理,还将API输出速度提升至每秒60-100Token,并兼容Claude Code技术标准。在定价策略上,基础版每百万输入token(缓存未命中)收费4元,输出收费16元;针对高速运算场景推出的turbo版本,输入价格提升至8元,输出价格达58元。

在实际测试环节,研发团队重点考察了模型在三个关键领域的能力表现。在编程测试中,要求生成包含导航栏、主体展示区及两个特色功能的开源模型分享网站原型。生成的HTML页面不仅完整实现了所有功能模块,搜索框、按钮等交互元素均可正常使用,点击上传模型按钮会弹出文件格式及大小限制提示。整个项目生成耗时约3分钟,消耗9K token,但在多次测试中偶尔出现程序崩溃现象。

数学能力测试选取了2025年国际数学奥林匹克竞赛最具挑战性的第六题。基础版模型经过4分钟运算,在21188字的思考过程中给出了4048的错误答案(正确答案为2112),消耗23.5K token。升级至turbo版本后,虽然运算时间缩短至2分钟,但token消耗量激增至38.5K,且答案依然错误。面对另一道IMO竞赛题时,模型在深度思考10余分钟后停止运算,两次尝试均卡在47000字左右的思考节点未能给出答案。由于缺乏图片识别能力,复杂数学公式的输入成为制约模型表现的瓶颈。

在逻辑推理测试中,模型展现出较强的基础认知能力,能够快速识别并规避常见逻辑陷阱。面对进阶型推理题目时,模型可在1分钟内给出准确答案,单次推理消耗约16.6K token。测试表明,该模型在处理需要多步骤推导的复杂问题时,仍存在运算稳定性不足的问题。

值得关注的是,就在月之暗面发布新模型前两天,阿里云刚推出Qwen 3系列最强推理模型Qwen3-Max-Thinking的早期预览版。两家科技企业接连在智能推理领域发力,反映出当前AI行业竞争焦点正从基础能力建设转向复杂问题解决能力的深度开发。随着智能体技术成为行业主流发展方向,模型的推理运算能力将成为衡量AI实用价值的核心指标。

华为Mate X7或本月登场 首发20GB超大内存 配色丰富性能强劲
11月份的机圈将会是华为的主场,不仅新一代的直板旗舰华为Mate80系列会震撼亮相,还会有迭代的大折叠屏手机华为Mate X7发布。@定焦数码爆料,华为Mate X7将会首发定制20GB超大内存,这是华为史…

2025-11-15

安谋科技发布“周易”X3 NPU IP,端侧AI性能飙升助力多领域落地
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-14

Steam Frame登场 Valve停产Index VR头显 开启VR新征程
用户可通过无线适配器,将 PC 或 Steam Machine 上的平面屏(flatscreen)及 VR 游戏串流至 SteamFrame;与此同时,Steam Frame 本身也是一款独立设备,搭载高通…

2025-11-14

华为Mate70 Air深度体验:打破常规,超大屏“Air”的另类演绎
可以确定,华为Mate70 Air的影像没有因为“Air”的定义做妥协,在同价位机型中是能打的,硬件配置方面也是这个思路。这也符合华为Mate70 Air的技术路径,虽然重量不可避免地来到208g,但是保…

2025-11-14

欧加9K级大电池定版试产,一加骁龙8系直屏新机测试,中端机竞争升级
IT之家 11 月 14 日消息,博主 @数码闲聊站 今天在微博透露,欧加的 9K 级别大电池现已定版试产。 博主表示,这块电池采用单块4.51V 单电芯设计,额定容量 32.59Wh,额定电池 8760m…

2025-11-14

联发科天玑8系芯片屠榜安卓次旗舰性能榜 性能能效双优成市场新宠
以榜单第一的真我Neo7 SE为例,通过与MTK联发科技的深度联合调校,该机在同价位段中展现出极为出色的游戏性能,搭配真我GT性能引擎,通过芯片级调校,实现了持久稳定的高帧率表现,同时能耗最高可降低7%,帧…

2025-11-14

四名MIT辍学00后,两年打造AI编程神器,估值冲300亿成资本新宠
两年前,在完成种子轮融资后,创始人曾写了这样的期待—— Cursor的诞生,推动了「氛围编程」(vibe coding)在全球兴起。 他还在创纪录的时间内,完成了一份手写编程测试,给早期Facebook投资…

2025-11-14

iPhone 17系列发售不到俩月,中国市场激活量破1000W,双十一销量也亮眼
11月14日,数码博主“数码闲聊站”发文透露iPhone17系列于本周完成中国市场激活1000W+。 iPhone17系列9月19日正式发售,如今距发售不到两个月。 该博主此前曾透露,截至11月2日,iPh…

2025-11-14

荣耀500 Pro配置亮点全揭秘:骁龙8至尊版+2亿主摄+8000mAh长续航
【CNMO科技消息】11月14日,有数码博主曝光了荣耀500Pro的核心参数。CNMO注意到,新机将搭载骁龙8至尊版移动平台,电池容量达到8000mAh,主打2亿像素大底主摄。 除了上述核心亮点外,荣耀50…

2025-11-14

苹果iPhone 17系列发售不到俩月 中国市场激活量或破千万
苹果 iPhone 17 系列于今年 9 月 19 日正式发售,如今还不到两个月。 该博主曾透露,截至 11 月 2 日,苹果 iPhone17 系列国内激活销量超 825 万。具体数据如下: iPho…

2025-11-14