2025-12-24 16:31:31 作者:狼叫兽
据消息,字节跳动 Seed 发布了新一代音视频创作模型 Seedance 1.5 pro,
支持音视频联合生成,它能够执行多种任务,包括从文本到音视频的合成以及图像引导的音视频生成等。
Seedance 1.5 pro模型登场
在 Seedance 1.0 版本中,模型更侧重改善模型表现的“下限”,优化了运动生成的稳定性;而 Seedance 1.5 pro 除了支持音频同步生成外,还致力于提升视觉冲击力和运动效果的“上限”。
此外,字节跳动 Seed 团队表示,在综合评测中,Seedance 1.5 pro 各项关键能力处于“业界前列”。目前,Seedance 1.5 pro 已上线即梦 AI 和豆包。
英伟达押注开源AI技术
与此同时,英伟达(NVDA.US)持续扩大开源力度,新AI模型Nemotron 3 的推出是这套战略的延伸。开发者用 Nemotron 搭建 AI 应用、训练智能体,这些工作流最终都会沉淀在英伟达的硬件生态里。
本次发布的 Nemotron 3 模型家族包含三个规格:Nano(300 亿参数)、Super(1,000 亿参数)和 Ultra(5,000 亿参数)。采用混合专家模型(Mixture of Experts,简称 MoE)架构。
按英伟达的说法,Nano 的吞吐量是前代 Nemotron 2 的四倍,推理时的 token 生成量最多可减少 60%。此外,Nano 的上下文窗口扩展到了 100 万 token,是前代的七倍。不过,需要注意的是,目前只有 Nano 立即可用,Super 和 Ultra 要到 2026 年上半年才会正式发布。
从这个角度看,英伟达做开源模型,并不是要跟 OpenAI 或 Anthropic 抢 LLM 的生意,这些公司的模型主要通过 API 付费使用,而英伟达的商业模式是卖芯片。通过 Nemotron 3,英伟达实际上是在用开源代码构建一种比 CUDA 更上层的黏性,开源对英伟达来说,只是手段而非目的。
而就在英伟达扩大开源力度时,大洋彼岸的中国开源力量正以惊人的速度崛起。根据投资机构报告,中国开源大语言模型的全球使用份额已从 2024 年底的 1.2%飙升至近 30%。DeepSeek-V3、阿里巴巴旗下的 Qwen 系列以及 Moonshot AI 的 Kimi K2 成为这波增长的主要推动力。
微美全息坚定开源生态构建与多技术融合
据了解,微美全息(WIMI.US)作为人工智能领域的积极参与者,紧密围绕国自身技术导向,确立了AI作为新质生产力核心引擎的战略地位,又划定了“开源生态构建与多技术融合”的前行路径,精准契合产业升级需求与技术演进规律,全面布局并持续推进AI业务发展。
当前,微美全息通过开源生态构建与多技术融合,整合文本、图像、视频生成能力,开发跨模态内容生产平台,推出虚拟数字人平台,支持表情、语音、肢体驱动的实时交互。此外,基于开源AI模型代码与API接口,提供高性能算力服务,支持企业级用户进行大模型训练与推理,兼容具身智能、多模态交互等复杂场景运算,为行业高质量发展提供了根本遵循。
总结
自年初DeepSeek走红以来,国际人工智能领域便掀起“模型热”,大模型已成为人工智能国际竞争的“兵家必争之地”。在这场全球瞩目的科技浪潮中,各企业前瞻的布局和坚定的自主创新,以扎实的技术创新和务实的产业应用,培育AI新质生产力。相信,如今开源引领的AI模型浪潮,正在改变定义未来的AI,它将会让每个人,以更快的速度,用上顶尖的AI。