中证报中证网讯(记者 杨洁)2月2日,阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash。该模型面向实时Agent工作流场景打造,兼顾推理速度、智能水平与使用成本,在单请求代码类任务上,Step 3.5 Flash最高推理速度可达每秒350个token(词元,处理文本的最小数据单元)。
据介绍,Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计1960亿参数),在保证模型能力的同时显著提升推理效率,为Agent类应用提供更高效、可负担的底层模型选择。截至目前,包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已率先完成对Step 3.5 Flash的适配,通过底层联合创新提升模型适配性和算力效率。
模型与算力的协同发展,有助于降低推理成本,降低企业和开发者在应用大模型时的综合门槛,加快大模型在实际应用场景中的落地。公开信息显示,阶跃星辰于2025年7月联合近10家芯片及基础设施厂商发起“模芯生态创新联盟”,旨在打通芯片、模型与平台之间的技术壁垒,通过联合优化提升算力利用效率,加速大模型在各行业场景中的应用落地。