智快网
快讯 行业 产业 汽车 科技 AI+ 热点

马斯克xAI再发力:Grok 4.1发布,情商智商双提升,团队或成“全华班”

2025-11-21来源:快讯编辑:瑞雪

马斯克旗下人工智能公司xAI近日推出新一代大模型Grok 4.1,以"智商情商双突破"的定位向行业头部发起冲击。该模型分为Thinking(推理版)和标准版两个版本,现已通过Grok官网及X平台向全球用户开放,移动端iOS和Android应用同步更新,用户可免费体验。

在权威评测平台LMArena的最新榜单中,Grok 4.1 Thinking以1483分登顶全球大模型排行榜,较第二名Gemini 2.5 Pro高出31分。其标准版同样表现亮眼,直接占据榜单次席。更引人注目的是情商专项测试EQ-Bench3的结果:Thinking版以1586分刷新纪录,标准版紧随其后,国产模型Kimi K2位列第三。

实测反馈显示,新模型在交互体验上实现质的飞跃。相比前代产品,Grok 4.1展现出更强的共情能力,回复中不仅增加耐心倾听的表述,还会在结尾添加爱心符号等情感化设计。创作能力方面,其文本生成评分较前代提升600分,叙事流畅度与画面感显著增强。技术团队通过优化训练方法,将模型幻觉率从12.09%压缩至4.22%,降幅达65%。

xAI后训练负责人Dustin Tran透露,技术突破主要源于强化学习框架的革新。团队开发了基于智能体推理模型的奖励机制,通过分析数万条真实对话数据,将RLHF(人类反馈强化学习)技术推向新高度。"我们扩大了10倍训练规模,让模型在自主评估与迭代响应中实现指数级进化。"他举例说明,新系统能像人类评委般分析对话质量,并据此优化回答策略。

值得关注的是,xAI近期因团队构成引发讨论。社交平台流传的合影显示,其核心研发团队以亚裔工程师为主。有消息称,公司近期调整了人员结构,但官方未对此作出回应。这种技术团队的国际化特征,或许正是其能快速突破技术瓶颈的关键因素。

关于备受期待的Grok 5,马斯克在最新访谈中给出明确时间表。这款规划中的6万亿参数模型将推迟至明年发布,原因在于需要更强大的算力支撑训练过程。"这将是通往通用人工智能的重要里程碑,"他强调,"我们宁愿延迟也要确保其成为世界上最智能的系统。"与此同时,谷歌即将推出的Gemini 3.0被行业视为Grok 4.1的有力竞争者,大模型领域的军备竞赛正进入白热化阶段。

华为WATCH Ultimate 2非凡探索11月25日登场:北斗卫星语音+海豚声呐通信来袭
快科技11月20日消息,今日,华为WATCH Ultimate2非凡探索官宣将于11月25日发布,这是华为目前最高端的智能手表,号称“全能表王”。 目前,这款手表已在华为商城开启预售,可选两款配色,其中苍穹…

2025-11-21

华为畅享70X:长续航耐摔曲面屏,全能实力派重塑中端机体验
1️⃣ 实测续航表现惊人:在中等使用强度下(包括社交软件、视频播放、网页浏览等),畅享70X可以轻松支撑两天使用。华为畅享70X在这方面下足了功夫,通过了严格的五星耐摔测试,日常使用中能有效抵御意外跌落带来…

2025-11-21

vivo X300与X300 Pro怎么选?懂行人从影像续航等方面给出实用建议
选择vivo X300的情况:如果你 特别看重手机的轻便手感,希望单手操作无压力,并且对手机摄影的要求是全面均衡、画质优秀,而非极致追求长焦极限,那么vivo X300提供了极高的性价比和愉悦的日常使用体…

2025-11-21

家电ETF易方达159328开盘上扬0.82%,重仓股多数飘红麦格米特涨幅领先
来源:新浪基金∞工作室 11月20日,家电ETF易方达(159328)开盘涨0.82%,报1.100元。家电ETF易方达(159328)重仓股方面,三花智控开盘涨0.74%,美的集团涨0.13%,海尔智家跌0…

2025-11-21

大疆Osmo Action6运动相机登场!可变光圈+超强性能,2998元起售
硬件方面,大疆Osmo Action 6搭载全新升级的 1/1.1 英寸方形 CMOS 传感器,其像素大小为 2.4μm,最高动态范围可达13.5 挡,最高可拍摄 4K 120FPS 4:3 比例视频。 …

2025-11-20