近日,人工智能领域迎来重要进展——阶跃星辰正式开源其最新模型Step 3.5 Flash,并同步上线相关平台。该模型在智能体场景与数学任务处理能力上已接近闭源模型水平,能够高效完成复杂长链条任务,被视为阶跃星辰迄今性能最强的开源基座模型。
技术架构方面,Step 3.5 Flash采用稀疏混合专家(MoE)设计,总参数量达1960亿,但单个token仅需激活约110亿参数。这种设计在保证模型能力的同时显著提升了推理效率。针对长文本处理场景,该模型通过三路多Token预测技术实现每秒100-300个token的生成吞吐量,在单请求代码类任务中峰值可达350TPS,并支持256K长度的文本理解与生成。
在性能测试中,Step 3.5 Flash展现强劲实力。数学竞赛级任务方面,该模型在AIME 2025、IMOAnswerBench、HMMT 2025等测试中分别取得97.3、88.8、96.2分,开启Parallel Thinking增强模式后性能跃居首位。编码能力测试中,其在LiveCodeBench-V6获得86.4分,增强模式下仅次于Gemini 3.0 Pro。智能体能力测试显示,该模型在BrowseComp和xbench-DeepSearch测试中分别获得69.0和54.0分,紧追行业领先水平。
实际应用测试中,该模型展现出强大的任务处理能力。面对"9.9和9.11谁大"的数学问题,模型能快速给出正确答案,仅在数值输出时出现9.9误写为99.9的小误差。在复杂计算任务中,模型可准确计算等差数列求和、立方和、阶乘和等数学问题。智能体编程测试中,模型根据文字描述自动生成可调节海浪频率的模拟平台,并成功构建包含15000个动态节点的气象情报仪表盘,展现出强大的地理空间可视化能力。
多智能体协作方面,Step 3.5 Flash采用分层框架设计,主智能体通过动态路由协调"搜索""验证"等子智能体并行工作。在价格对比任务中,模型将"查询Mac Mini M4各平台价格"的需求拆解为淘宝、京东、拼多多三个子任务,最终精准识别出最低价平台并提供购买建议。这种云端规划能力显著降低了本地执行难度,提升了数据抓取成功率。
该模型的开源已获得产业界广泛支持,华为昇腾、沐曦股份、壁仞科技等六家芯片厂商率先完成适配。模型可在Mac Studio M4 Max等消费级硬件上安全运行,在保证数据私密性的同时维持高性能表现。据透露,阶跃星辰已启动Step 4模型的训练工作,持续聚焦智能体基础模型研发。


