阿里Qwen3.5-Plus/397B-A17B新模型上线,后者定位“开源旗舰”
创始人
2026-02-16 18:49:20
0

IT之家 2 月 16 日消息,今天下午,阿里在 chat.qwen.ai页面低调上线了 Qwen3.5-Plus 和 Qwen3.5-397B-A17B 两款新模型。

IT之家从官方页面介绍获悉,Qwen3.5 Plus 定位为 Qwen 3.5 系列最新大语言模型,Qwen3.5-397B-A17B 定位则是 Qwen3.5 开源系列旗舰大语言模型。两款模型均支持文本和多模态任务

根据阿里云方面介绍,Qwen3.5 实现了底层模型架构的全面革新,其中,Qwen3.5-Plus 版本总参数为 3970 亿,激活仅 170 亿,性能超过万亿参数的 Qwen3-Max 模型,部署显存占用降低 60%,推理效率大幅提升,最大推理吞吐量可提升至 19 倍。

Qwen3.5-397B-A17B 在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异,助力开发者与企业显著提升生产力。该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,实现出色的推理效率:总参数量达 3970 亿,每次前向传播仅激活 170 亿参数,在保持能力的同时优化速度与成本。同时,语言与方言支持从 119 种扩展至 201 种,为全球用户提供更广泛的可用性与更完善的支持。

Qwen3.5 在能力、效率与通用性三个维度上推进预训练:

  • 能力(Power):在更大规模的视觉-文本语料上训练,并加强中英文、多语言、STEM 与推理数据,采用更严格的过滤,实现跨代持平:Qwen3.5-397B-A17B 与参数量超过 1T 的 Qwen3-Max-Base 表现相当。
  • 效率(Efficiency):基于 Qwen3-Next 架构 —— 更高稀疏度的 MoE、Gated DeltaNet + Gated Attention 混合注意力、稳定性优化与多 token 预测。在 32k/256k 上下文长度下,Qwen3.5-397B-A17B 的解码吞吐量分别是 Qwen3-Max 的 8.6 倍 / 19.0 倍,且性能相当。Qwen3.5-397B-A17B 的解码吞吐量分别是 Qwen3-235B-A22B 的 3.5 倍 / 7.2 倍。
  • 通用性(Versatility):通过早期文本-视觉融合与扩展的视觉 / STEM / 视频数据实现原生多模态,在相近规模下优于 Qwen3-VL。多语言覆盖从 119 增至 201 种语言 / 方言;25 万词表(vs. 15 万)在多数语言上带来约 10–60% 的编码 / 解码效率提升。

根据介绍,Qwen3.5 凭借高效的混合架构与原生多模态推理,为通用数字智能体奠定了坚实基础。下一阶段的重点将从模型规模转向系统整合:构建具备跨会话持久记忆的智能体、面向真实世界交互的具身接口、自我改进机制,目标是能够长期自主运行、逻辑一致的系统,将当前以任务为边界的助手升级为可持续、可信任的伙伴。

相关内容

最新资讯

高手在民间,没有上春晚 热搜天天换,网红遍地跑,但你发现没——真正刷屏的狠人,往往根本不刷手机。他们可能连直播都不会开,却能...
春晚节目单:同为中国人,不分彼... 陈良飞 一年一度的央视春晚在除夕夜如约而至。 刚刚公布的央视春晚节目单提前“剧透”了全部节目和表演者...
突发!俄罗斯遭大规模袭击!俄方... 每经编辑:段炼,宋思艰 据中新网报道,俄罗斯莫斯科市长索比亚宁15日晚在社交媒体上最新发文表示,俄防...
春节档AI激战继续:腾讯元宝宣... 2月16日,腾讯宣布,元宝APP春节红包活动将在除夕当天追加100张万元现金小马卡。自2月1日元宝A...
阿里Qwen3.5-Plus/... IT之家 2 月 16 日消息,今天下午,阿里在 chat.qwen.ai页面低调上线了 Qwen3...
佩斯科夫:在日内瓦三方会谈议题... △俄罗斯总统新闻秘书佩斯科夫(资料图)当地时间16日,俄罗斯总统新闻秘书佩斯科夫表示,在即将举行的有...
空间站的年夜饭都有什么?听航天... 神舟二十一号乘组的太空出差已过半,他们在浩瀚太空迎来除夕,航天员将空间站装点一新,节日气氛格外浓厚。...
美官员:超过1000名移民执法... 据凤凰卫视报道,美国政府边境事务主管霍曼2月15日表示,已有超过1000名移民执法人员撤出明尼苏达州...
好消息!新增本科院校公布202... 各位2026届3+证书中职考生注意了,高职高考本科新增,顺德职业技术大学和广州职业技术大学,学校已经...
靠谱的成人自考教育机构实力盘点... 导语:成人自考教育是现代职业提升体系中的关键环节,其教学服务质量直接影响学员的学习效率、证书获取率与...