智快网
快讯 行业 产业 汽车 科技 AI+ 热点

百模大战升级,讯飞星火X2聚焦B端发力:智能体激增,医疗教育成果斐然

2026-02-15来源:ITBEAR编辑:瑞雪

马年春节前夕,国内AI领域迎来新一轮激烈竞争,多家平台企业纷纷推出新版本大模型,掀起新一轮“百模大战”。据不完全统计,今年1月以来,文心大模型5.0、千问Qwen3-Max-Thinking、星火X2、智谱GLM-5、Kimi K2.5、MiniMax M2.5、Deepseek V3.2(版本更新)、Seedance 2.0、可灵3.0等新模型相继问世。豆包大模型2.0、千问Qwen3.5等也计划在春节期间发布,进一步加剧市场竞争。

在这场竞争中,科大讯飞的星火X2显得尤为独特。与其他平台侧重消费级应用和C端用户不同,星火大模型更聚焦行业应用和B端市场。科大讯飞董事长刘庆峰曾表示:“中国AI开发者只要用星火,出海再也不用担心卡脖子。”这一底气源于星火大模型是目前中国主流大模型中唯一基于全国产算力(华为昇腾)训练的通用大模型,实现了从算力自主到算法创新、模型框架、应用落地、生态系统的全面自主可控。

星火X2的推出标志着科大讯飞正式对标国际顶尖模型。该模型采用293B MoE稀疏架构,结合权重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分层通信等工程化创新,实现国产大EP并行部署。通过量化,单台昇腾服务器即可运行,推理性能较X1.5提升50%。这一提升得益于四大技术升级:训推采样校准强化学习算法、递归式高难数据合成方法、多阶段RL高吞吐采样方法、服务高性能部署优化算法。

科大讯飞称,星火X2的通用能力已全面升级,整体水平可对标国际顶尖模型,尤其在数学、推理、语言理解、智能体等能力上表现突出。其130+多语言综合能力进一步提升,在拉美、东盟等地区重点语种效果保持领先。例如,在2025年11月哈佛-麻省理工数学锦标赛(HMMT)中,一道难倒国内主流模型的英文题目被星火X2成功解答,并给出详细过程;即使是西班牙语数学题,该模型也能应对自如。数据对比显示,在通用大模型核心能力测试中,星火X2在语言理解、逻辑推理、数学、翻译、多语言等方向领先DeepSeek V3.2和Qwen3-Max;在外部公开高难任务测试中,其在数学(AIME 2025、HMMT Feb 2025)、综合答题(MMLU Pro)、推理(ARC-AGI-1)、智能体(Tau2-bench)等方向同样表现优异。

在行业应用方面,科大讯飞推行“1+N”大模型组合策略,即1个通用底座大模型+N个定制开发大模型,以更专业、高效地服务不同行业企业需求。依托星火X2的算法突破、行业高质量数据集和专业思维链强化学习,其行业大模型持续升级,应用方案取得显著进展。例如,在医疗领域,基于X2底座的星火医疗大模型在智能健康分析、报告解读、运动饮食建议、辅助诊疗、用药审核等任务上表现超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。讯飞医疗还着力建设医疗高质量数据资源平台,推动AI+医疗服务全面落地。面向C端的“讯飞晓医”App提供多轮问诊、用药咨询、检验单解读等服务,并支持语音交互,其能力已通过上海市医疗大模型应用检测验证中心评测。

在教育领域,基于X2的星火教育大模型在“步骤级批改”“错因定位”等技术上扩大领先优势,并首发“错因贯穿”个性化学习能力。作为企业级智能体平台,星辰Agent进一步强化“会思考、能执行”的构建能力,其智能体数量已超130万,整合语音交互、图像理解等百余种开放平台能力,支撑复杂场景智能体搭建。例如,面向企业采购的“招采智能体”在招标合规检测、供应商资质核验等场景效率提升超3倍,开发时间从数天压缩至分钟级;面向行业分析的“行业大师”产品结合产业图谱推理,将商情洞察及决策时间从“周”缩短至“天”。

硬件领域,科大讯飞持续推进软硬件协同战略。基于星火X2能力升级,其多尺寸中小模型(2B、7B、30B-A3等)在汽车智能座舱、翻译机、办公本等设备上的交互体验显著提升。例如,在汽车座舱中,新模型在模糊意图理解、高情商回复等方面从“完全不可用”提升至“基本好用”,实车评测达业内领先水平;在AI学习机上,依托X2教育大模型的精准批改和个性化学习能力,诊断精准率、规划合理率和辅学启发性效果进一步提升,带来更好的人机交互体验。

当前,国内AI产业正从通用能力竞争转向特色化发展。例如,DeepSeek V3.2聚焦长上下文与复杂任务能力,智谱GLM-5强调Agent与编程能力,MiniMax M2.5延续多模态与应用导向路线。而科大讯飞凭借全国产算力训练的通用大模型、垂直行业应用和B端市场聚焦、软硬件协同等特色标签,构建了独特的AI生态体系。这一体系以星火大模型为底座,联合讯飞研究院核心技术及能力星云合作伙伴,形成覆盖能力层、应用层和行业层的完整技术体系。尽管在消费级市场用户规模和产品竞争力上存在劣势,但其行业应用生态和特色标签已成为核心竞争力。随着国产算力平台性能提升、AI技术在各行业深化应用以及硬件市场普及,科大讯飞有望迎来更广阔的发展空间。

谢霆锋手持荣耀Magic V6折叠屏新机曝光,或于今年3月MWC 2026大会亮相
IT之家 2 月 15 日消息,博主 @旺仔百事通 昨日分享了一张照片,画面显示谢霆锋正手持一款折叠屏手机。博主透露,这款手机是荣耀 MagicV6 的红色。 将图片放大可以隐约看到,该机将延续家族化设计语…

2026-02-15

苹果智能家居新品前瞻:HomePod mini 2、家庭中枢等有望2026年登场
据悉,苹果内部还在设计室内安防摄像头,可接入 HomeKit 并与 HomeHub 中枢联动,并且该公司还可能研发支持面容 ID的智能门铃,可与智能锁联动使用,预计支持 HomeKit Secure Vi…

2026-02-15

LG海外发布Xboom Buds Lite与Plus耳机,功能差异显著怎么选?
IT之家 2 月 14 日消息,LG 现已在海外市场推出 Xboom Buds Lite、Xboom Buds Plus真无线耳机,新品主打强劲低频,由音乐人will.i.am(威廉姆 · 亚当斯)调音。 …

2026-02-14

AI春节档“群雄逐鹿”:字节阿里智谱MiniMax齐发力,谁能抢占先机?
Seedance 2.0爆火引发全球关注,把视频模型的能力拉上了新高度,之后字节官宣了新的豆包大模型2.0,谷歌宣布升级Gemini 2.0Deep Think,DeepSeek开始灰度测试上下文提升10倍…

2026-02-14