Step 3 是什么?
Step 3 是阶跃星辰团队最新推出的多模态推理模型,它基于 MoE(混合专家)架构精心构建,拥有高达 321 亿的参数总量,其中激活参数量为 38 亿,上下文长度可达 64k。该模型具备卓越的视觉感知能力和复杂的推理能力,能够精准地完成跨领域的复杂知识理解以及数学与视觉信息的交叉分析。无论是应对日常生活中的各类视觉分析问题,还是处理更为专业的复杂任务,Step 3 都展现出其卓越的性能和无与伦比的能力,为用户带来全新的智能体验。

Step 3 的主要亮点
- 强大的多模态能力:视觉感知方面,Step 3 拥有卓越的视觉感知能力,能够高效处理复杂的视觉信息。
- 无论是图像识别还是场景理解,它都能精准捕捉细节,为各类应用场景提供有力支持。
- 在复杂推理方面,模型展现出强大的跨领域知识理解能力,能够将数学与视觉信息进行深度融合与分析。
- 无论面对多么复杂的视觉分析问题,Step 3 都能游刃有余地解决,确保推理结果的准确性和可靠性。
- 在架构优化上,采用了自研的 MFA(多矩阵分解注意力)机制和 AFD(注意力-前馈神经网络解耦)系统。
- 这一创新设计有效降低了注意力计算中的缓存开销和计算资源消耗,大幅提升了模型的推理效率。
- 从硬件适配角度看,Step 3 通过 StepMesh 通信库,利用 GPU Direct RDMA 技术实现了跨显卡的低延迟、高带宽传输。这种优化使其能够灵活适配多种异构硬件,确保关键性能在实际服务过程中稳定如一。
- 目前,模型正在限时折扣中,价格极具竞争力。所有请求均按照最低价格计算,每百万 token 的输入价格低至 1.5 元,输出价格仅为 4 元。对于企业和开发者来说,这无疑是一个性价比极高的选择,能够在保证高性能的同时,显著降低成本支出。
Step 3 的模型性能
- 根据官方信息,Step 3 在多个评测集上进行了测试,包括 MMMU、MathVision、SimpleVQA、AIME 2025、GPQA-Diamond 以及 LiveCodeBench(测试时间为 2024 年 8 月至 2025 年 5 月)。测试结果显示,在同类型开源模型中,Step 3 的成绩拔得头筹,位居行业领先地位。

如何使用Step 3 ?
- 第三步,我们的模型已经开源,API服务也已经上线至阶跃星辰开放平台。您还可以在“阶跃AI”官网或者通过下载“阶跃AI”App(可在应用商店搜索获取)来体验这些先进的功能。
Step 3官方网站及资源项目
- 在线体验:stepfun.com
- API服务:platform.stepfun.com
- 开源地址:
- GitHub仓库:https://github.com/stepfun-ai/Step3
- Hugging Face:https://huggingface.co/stepfun-ai/step3
- 魔搭 ModelScope:https://www.modelscope.cn/models/stepfun-ai/step3
- 技术报告:https://stepfun.ai/research/zh/step3