英伟达最强开源权重AI模型:Nemotron 3 Super登场
创始人
2026-03-13 09:04:41
0

IT之家 3 月 12 日消息,英伟达公司昨日(3 月 11 日)发布博文,宣布推出 Nemotron 3 Super 开源大模型,是其迄今为止最强大的开源权重 AI 模型。

IT之家注:开源权重模型(Open-weight AI models)是指将决定 AI 模型行为的关键参数(权重)向公众免费开放的模型。与完全闭源的模型(如 GPT-4)不同,开发者可以下载并在自己的设备上运行或微调这些模型。

Nemotron 3 Super 模型拥有 1200 亿参数,采用混合专家(MoE)架构(推理时仅激活 120 亿),专为大规模运行复杂智能体(Agentic AI)系统设计。

该模型结合了先进的推理能力,能够为自主智能体高精度地完成任务。Perplexity、Palantir 和西门子等行业巨头目前已将其应用于搜索、软件开发、电信和半导体设计等核心工作流中。

随着企业将 AI 应用从聊天机器人转向多智能体,往往面临两大瓶颈:“上下文爆炸”与“推理税”。多智能体交互会产生最多 15 倍的 Token 量,导致成本飙升和目标偏移;同时,复杂智能体每步都需要推理,让系统变得昂贵且迟钝。

Nemotron 3 Super 为解决这些问题,配备了 100 万 Token 的上下文窗口。这让智能体能够将完整的工作流状态保留在内存中,从而防止目标偏移,并大幅降低多步推理的成本。

在架构与性能方面,该模型采用了混合专家(MoE)架构,将吞吐量提升了 5 倍,准确率比前代翻倍。具体而言,其 Mamba 层使内存和计算效率提高了 4 倍,而 Transformer 层则负责高级推理。

此外,模型引入了“潜在 MoE(Latent MoE)”新技术,以单个专家的计算成本激活四个专家;并支持多 Token 预测,让推理速度提升 3 倍。在英伟达 Blackwell 平台上,该模型以 NVFP4 精度运行,相比 Hopper 架构上的 FP8,内存需求更低且推理速度快 4 倍。

英伟达对该模型采取了高度开放的策略。官方不仅遵循宽松许可证开源了模型权重,还公布了完整的训练方法,包括超 10 万亿 Token 的数据集和评估配方。在实际场景中,它能一次性加载完整代码库进行端到端调试,或瞬间读取数千页财务报告。

开发者目前可通过 Hugging Face、各大云服务商(谷歌云、甲骨文,及即将上线的 AWS 和 Azure)获取该模型。同时,它已被打包为 NVIDIA NIM 微服务,支持无缝部署制本地数据中心和云端。

相关内容

最新资讯

油价重回100引爆通胀担忧,全... 油价飙升重燃通胀恐慌,抛售潮席卷全球固收市场,全球债券年内涨幅悉数回吐。 3月12日,彭博数据显示,...
绿色动力环保(01330.HK... 绿色动力环保(01330.HK)发布公告,绿色动力环保集团股份有限公司(以下简称“公司”)分别于20...
广发证券(01776.HK)完... 广发证券(01776.HK)公布,广发证券股份有限公司 2026 年面向专业投资者公开发行短期公司债...
三门峡高新投资集团采购2026... 立方招采通显示,3月12日,三门峡高新投资集团有限公司2026年度专项债券、项目贷咨询服务项目公开招...
广发证券(01776)完成发行... 智通财经APP讯,广发证券(01776)公布,广发证券股份有限公司 2026 年面向专业投资者公开发...
九州通成功发行2026年度第二... 3月10日,九州通医药集团股份有限公司(以下简称“九州通”)成功在银行间市场交易商协会发行2026年...
亚马逊发行540亿美元债券遭疯... 亚马逊本周在美国和欧元市场共发行了540亿美元债券,遭到投资者疯抢。具体来看,亚马逊在美国分11个期...
伊朗伊斯兰革命卫队空军指挥官遇... 据伊朗法尔斯通讯社12日报道,伊朗伊斯兰革命卫队空军指挥官萨达尔·伊斯梅尔·德甘及其妻子、两个孩子等...
【伊朗称袭击以色列两处空军基地... 【伊朗称袭击以色列两处空军基地和辛贝特总部】据伊朗伊斯兰共和国通讯社12日报道,伊朗伊斯兰共和国军队...
原创 美... 美国太空军作战司令部司令加尼翁中将在2月26号的美国空天军协会战争研讨会上对记者声称:“保护和防御卫...