字节模型引领音视频革命，英伟达/微美全息加速开源AI+多技术融合！_科技资讯_新闻资讯

字节模型引领音视频革命，英伟达/微美全息加速开源AI+多技术融合！

创始人

2025-12-24 16:46:30

0次

2025-12-24 16:31:31 作者：狼叫兽

据消息，字节跳动 Seed 发布了新一代音视频创作模型 Seedance 1.5 pro，

支持音视频联合生成，它能够执行多种任务，包括从文本到音视频的合成以及图像引导的音视频生成等。

Seedance 1.5 pro模型登场

在 Seedance 1.0 版本中，模型更侧重改善模型表现的“下限”，优化了运动生成的稳定性；而 Seedance 1.5 pro 除了支持音频同步生成外，还致力于提升视觉冲击力和运动效果的“上限”。

此外，字节跳动 Seed 团队表示，在综合评测中，Seedance 1.5 pro 各项关键能力处于“业界前列”。目前，Seedance 1.5 pro 已上线即梦 AI 和豆包。

英伟达押注开源AI技术

与此同时，英伟达（NVDA.US）持续扩大开源力度，新AI模型Nemotron 3 的推出是这套战略的延伸。开发者用 Nemotron 搭建 AI 应用、训练智能体，这些工作流最终都会沉淀在英伟达的硬件生态里。

本次发布的 Nemotron 3 模型家族包含三个规格：Nano（300 亿参数）、Super（1,000 亿参数）和 Ultra（5,000 亿参数）。采用混合专家模型（Mixture of Experts，简称 MoE）架构。

按英伟达的说法，Nano 的吞吐量是前代 Nemotron 2 的四倍，推理时的 token 生成量最多可减少 60％。此外，Nano 的上下文窗口扩展到了 100 万 token，是前代的七倍。不过，需要注意的是，目前只有 Nano 立即可用，Super 和 Ultra 要到 2026 年上半年才会正式发布。

从这个角度看，英伟达做开源模型，并不是要跟 OpenAI 或 Anthropic 抢 LLM 的生意，这些公司的模型主要通过 API 付费使用，而英伟达的商业模式是卖芯片。通过 Nemotron 3，英伟达实际上是在用开源代码构建一种比 CUDA 更上层的黏性，开源对英伟达来说，只是手段而非目的。

而就在英伟达扩大开源力度时，大洋彼岸的中国开源力量正以惊人的速度崛起。根据投资机构报告，中国开源大语言模型的全球使用份额已从 2024 年底的 1.2％飙升至近 30％。DeepSeek-V3、阿里巴巴旗下的 Qwen 系列以及 Moonshot AI 的 Kimi K2 成为这波增长的主要推动力。

微美全息坚定开源生态构建与多技术融合

据了解，微美全息（WIMI.US）作为人工智能领域的积极参与者，紧密围绕国自身技术导向，确立了AI作为新质生产力核心引擎的战略地位，又划定了“开源生态构建与多技术融合”的前行路径，精准契合产业升级需求与技术演进规律，全面布局并持续推进AI业务发展。

当前，微美全息通过开源生态构建与多技术融合，整合文本、图像、视频生成能力，开发跨模态内容生产平台，推出虚拟数字人平台，支持表情、语音、肢体驱动的实时交互。此外，基于开源AI模型代码与API接口，提供高性能算力服务，支持企业级用户进行大模型训练与推理，兼容具身智能、多模态交互等复杂场景运算，为行业高质量发展提供了根本遵循。

总结

自年初DeepSeek走红以来，国际人工智能领域便掀起“模型热”，大模型已成为人工智能国际竞争的“兵家必争之地”。在这场全球瞩目的科技浪潮中，各企业前瞻的布局和坚定的自主创新，以扎实的技术创新和务实的产业应用，培育AI新质生产力。相信，如今开源引领的AI模型浪潮，正在改变定义未来的AI，它将会让每个人，以更快的速度，用上顶尖的AI。

Nano 字节技术音视频革命模型 pro 全息 DeepSeek-V 支持字节跳动英伟达

上一篇：千问App发布2025十大AI提示词，“股票”位列榜首

下一篇：给电力AI装上“安全闸”！首个智能体系统性测评体系发布，推动“可信AI”规模化落地

字节模型引领音视频革命，英伟达/微美全息加速开源AI+多技术融合！

相关内容

最新资讯