首页 > 行业资讯

阶跃星辰 Step 3.5 Flash:110亿激活参数实现前沿级智能

来源:5e
时间:2026-02-06 14:00:26
热度:

近日消息,阶跃星辰开源Agent基座模型Step3.5Flash上线仅两天成功登顶OpenRouter平台Trending榜单。该榜单排名来自全球知名大模型聚合平台OpenRouter数据,数据基于全球开发者与用户的实际模型调用量,直观反映

近日消息,阶跃星辰开源Agent基座模型Step3.5Flash上线仅两天成功登顶OpenRouter平台Trending榜单。该榜单排名来自全球知名大模型聚合平台OpenRouter数据,数据基于全球开发者与用户的实际模型调用量,直观反映出模型在真实应用场景中的受欢迎程度与市场接受度。

阶跃星辰Step3.5Flash荣登OpenRouterTrending榜首,不仅验证了该模型作为技术黑马在高吞吐与复杂推理场景下的强劲实力,更彰显了其作为兼具极致性能与稳定性的实战首选地位作为面向实时Agent工作流场景的模型,Step3.5Flash在推理效率上表现突出,最高推理速度可达每秒350个token。该模型款稀疏混合专家(MoE)架构,在保持较为精巧的1960总参数量的同时,每个token在处理过程中仅需激活约110亿个参数,在保障模型性能的同时实现运行效率的优化,从而弥合前沿级智能体智能与计算效率之间的鸿沟。

在官方发布的Step3.5FlashTechReport里显示,该模型聚焦于构建智能体的精准推理能⼒以及快速可靠的执行效率。Step3.5Flash通过交错的3:1滑动窗口/全注意力机制(SlidingWindow/FullAttention)和多Token预测(MTP-3)进行优化,以最小化多轮智能体交互的延迟和成本。为实现前沿级智能,Step3.5Flash还采用了可扩展的强化学习(RL)框架,推动模型在数学、代码和⼯具使用等领域持续自我提升。

Step3.5Flash在智能体、编码和数学任务中展现出卓越性能:在IMO-AnswerBench上达到85.4%的准确率,在LiveCodeBench-v6(2024.08‒2025.05)上达到86.4%,在τ2-Bench上达到88.2%,在BrowseComp(含上下文管理)上达到69.0%,在Terminal-Bench2.0上达到51.0%——其性能与GPT-5.2xHigh、Gemini3.0Pro等前沿模型相当。通过重新定义效率边界,Step3.5Flash为在真实工业环境中部署复杂智能体提供了高密度基础。Step3.5Flash仅1960亿总参数、110亿激活参数,就能做到与前沿“巨模”在推理能力、智能体能力上性能相当。

上图:Step3.5Flash仅需110亿激活参数(1960亿MoE总参数)即可实现前沿级智能,性能比肩主流闭源和开源模型。