当1314岁的杜甫遇上刚出生的Seedance2.0_国内资讯_新闻资讯

当1314岁的杜甫遇上刚出生的Seedance2.0

创始人

2026-02-12 20:21:18

0次

2026年初，Seedance2.0带给人类的震撼，恰如2025年初的DeepSeek，2024年初的Sora以及2023年初的ChatGPT。

Seedance2.0能仅靠几张图片和文字描述，自动生成堪比大片的AI视频。

《黑神话：悟空》制作人冯骥，直言这是地表最强视频生成模型，没有之一。他说，Seedance2.0的出现，标志着“AIGC的童年时代，结束了”。

许多读者都知道，红星新文化从2023年开始，每年会做一个让AI以杜甫的身份与我们交流的测试，见证AI新的发展。今天刚好是杜甫1314岁诞辰，在这个AI几乎以日计飞速进化的时代，人类和AI这对CP是否可以牵手“1314”呢？怀着这样的心情，我们和刚刚“出生”的Seedance2.0一起，进行了第四次的“杜甫测试”。

杜甫穿越至2026年的成都，并接受采访由Seedance2.0生成

全程AI，生成AI杜甫视频

在今年的“AI杜甫试验”中，我们计划从指示词、图片再到视频，完整走一遍“全流程AI生成”的路径。

之所以从“指示词”切入，是因为在AI创作里，指示词往往决定了结果的上限。很多不常使用AI的人，容易把用AI理解成一句简单的“你帮我生成一张图”“你帮我生成一段视频”，然后期待AI立刻输出准确、可用的成片。但现实是，同样使用一款AI工具，不同的人往往会得到完全不同的效果，差异的核心，就在于指示词是否足够明确和精准。

图片和视频的AI指示词生成，我们选取了Gemini3.0。

这是一款由Google DeepMind开发的多模态大型语言模型，被谷歌官方称为“最智能的模型”。业内认为，Gemini3.0具备优秀的逻辑、推理和计算能力。在本次“杜甫试验”中，我们运用到的文本写作能力只是它强大功能的冰山一角。

首先，我对Gemini3.0输入了需求：“我现在要生成一小段杜甫在2026年成都生活的视频，现在需要给AI下指令，生成5张图片，以便于后面进一步生成视频。请你先给我这5张图片的指令。”

Gemini3.0很快给出了十分清晰的图片指令。不仅每一张图片的指令都非常详细、精准和清晰，同时也提前考虑到了后续“生成视频”的衔接需求，整体呈现出较强的连续性与场景感。

Gemini3.0生成的部分指令

随后，我将Gemini3.0生成的AI图片指令，给到了本次主要试验对象——Seedance2.0，并要求每张图片需要调整到相同比例。

很快，Seedance2.0生成以下5张图片：

特别是最后一张，居然还挺有设计感的

图片生成后，我再次要求Gemini3.0生成视频指令：“我需要一段AI生成视频时候的指令，将这5张图片生成一小段视频。请给我一段指令描述。”

Gemini3.0迅速理解到从图片到视频的逻辑，生成了十分细致的视频脚本。

我们拿了第一张和第二张杜甫图片来试验，输入了Gemini3.0生成的视频脚本：

“镜头从杜甫站在室外红墙边开始。杜甫收回仰望天空的目光，转过身，缓步穿过翠绿的竹林小径，走入古朴的茅屋。镜头采用平滑的追踪摄影（Tracking Shot），跟随他的背影从明亮的室外日光进入光影柔和的室内。他走到书桌前坐下，画面自然过渡到他伸手触碰全息光幕的瞬间。整个过程动作优雅缓慢，充满电影感，光影切换自然。”

但当我们把这段130个字的指令和两张图片，发送给Seedance2.0后，超过了24小时，依然卡在99%的进度条上。即使经过会员加速，还是没有生成成功。在之后的使用中，也多次出现了类似情况，只要指令稍显复杂，便会出现数小时甚至数十小时都显示仍在生成的情况。

一直卡在“99%造梦中”

我们只能人工精简了视频指令。针对第一张和第二张图片，我们将指令精简为：

镜头从图一的红墙开始，人物收回仰望天空的目光，转过身，缓步穿过竹林小径，走入茅屋。镜头跟随他的背影从明亮的室外日光，进入光影柔和的室内。图二人物走到书桌前坐下，画面自然过渡到他伸手触碰全息光幕的瞬间。

20分钟后，Seedance2.0生成一段5秒的视频：

因在本文中需要转成GIF，视频精度有所下降

针对第三、四、五张图片，我们将指令精简为：

图一机器人提起茶壶，清澈的水流注入杯中，杯口升起袅袅的热气。人物看着茶杯，身体微微前倾，做吸入茶香的动作。图二人物向前行走，长袍下摆随风摆动。身旁的行人正常走动，无人机掠过。图三人物缓慢眨了一次眼，瞳孔中的城市霓虹倒影闪烁，胡须在风中细微颤动。

20分钟后，Seedance2.0生成一段5秒的视频：

因在本文中需要转成GIF，视频精度有所下降

短短三年，“AI杜甫”成长惊人

第一次让人类大规模地认识到“AI时代”的来临，是在2023年2月。

那年，由OpenAI发布的ChatGPT横空出世，我们率先以“采访”AI的形式，邀请“AI作为杜甫写诗”（），也与AI探讨了版权、伦理困境等问题。

它快速高效的内容创作能力让初尝AI的网友惊叹，“AI是否要取代人工”等相关话题，也在网络上被越来越多的人讨论和重视。

2023年的ChatGPT

但彼时AI创作的内容还相对幼稚，甚至会出现文字上的逻辑混乱，比如“茶馆里的烤鸭香味四溢”。

评论区内，一些网友表示，看到AI写的诗“松了一口气”“看来文字工作者短期内还不太会失业”。

但2024年的2月，Sora的出现，让人明显感觉AI又发展到了新阶段。

于是我们创建一位AI Bot（AI机器人），并为它设定“从唐朝穿越至2024年的杜甫”（）。

2024年的2月，Coze（海外版）生成的杜甫

在对AI杜甫的“采访”中，我们还让它生成了照片。评论区里，网友们的观感开始发生变化：“我觉得很恐怖，AI很像活生生的人了，回答的逻辑性很强。”

等到2025年2月，在AI技术上，美国一枝独秀的局面被打破。其中，火遍全球的Deepseek，成为许多中国用户最常使用的AI软件。

这年，我们选择了市面上最火的几款国产AI工具——DeepSeek、豆包和kimi，让他们分别扮演AI杜甫，并生成杜甫穿越后的“照片”，从对话逻辑性、文学性等方面进行横向比较（）。评论区内，网友们纷纷为DeepSeek的文笔感叹。

2025年2月，豆包绘制的穿越到现代成都的杜甫

今年，Seedance2.0的出现，让我们意识到，就像是当年AI可以大幅度降低文字创作门槛一样，人人都能创作视频的时代真的来了。

上一篇：苹果Safari 26.3发布：提升Vision Pro体验与加载速度

下一篇：老爸当总理，儿子刷屏，这个家族要崛起了？

当1314岁的杜甫遇上刚出生的Seedance2.0

相关内容

最新资讯