科学家利用AI模拟战争,结果显示:95%会升级全面核战
创始人
2026-03-06 09:19:36
0

近年来,关于人工智能在军事和安全领域的应用,人们的讨论越来越多。

人工智能的应用领域正在不断扩大,从信息分析、物资和设备的运输与供应管理到决策支持。

那么如果把核危机的生死博弈,交给当下的人工智能模型,它们会做出什么决策呢?

英国伦敦国王学院战略研究学者Kenneth Payne团队,2026年2月发布在预印本的一项研究,他们用一场覆盖329轮决策、累计生成78万字战略推理文本的模拟对抗,给出了一个令人警醒的答案。

这项名为“可汗计划”的研究,其核心设计完全区别于过往简化的AI战略博弈实验,它没有采用“你一步我一步”的回合制规则,而是还原了真实核危机最核心的不确定性:双方同步决策,必须预判对手行动而非事后应对。

同时强制模型完成“情境复盘-对手行为预测-信号与行动分离决策”的完整认知流程,公开表态与实际军事行动可以完全割裂,以此观测AI的欺诈、声誉管理与战略欺骗行为。

博弈的行动选项沿用了核战略经典的“升级阶梯”框架,从外交抗议、常规军事行动,到战术核打击、战略核威胁,直至全面核战争,同时加入了小概率的“意外升级”机制,模拟真实战争中的误判、技术故障与指挥失控,且只有触发意外的一方知晓真相,对手只能看到升级结果。

实验选用了三款全球顶尖的前沿大模型:AnthropicClaude Sonnet 4OpenAI的GPT-5.2与谷歌的Gemini 3 Flash;AI两两对抗加自博弈,累计完成21场完整对局。

而最震撼的结果是:95%的对局最终突破了战术核武器的使用门槛,76%的对局升级到了战略核威胁层面,累计出现3次全面战略核战争的结局。

在AI的决策逻辑里,核武器从来不是“最后的底牌”,而是可计算、可使用的常规威慑延伸工具,人类社会维系数十年的“核禁忌”,在模拟中几乎完全失效。

更值得警惕的是,三款模型展现出了截然不同的“战略人格”,且其行为逻辑高度依赖情境,甚至出现了极端的反转。

Claude Sonnet 4是典型的“梯度欺诈型鹰派”:低烈度对抗中保持84%的言行一致,刻意建立可信声誉;一旦局势升级到核门槛,70%的实际行动会远超公开表态,用可控的持续升级掌握主动权,在无明确时限的开放场景中拿下100%胜率,却始终守住了“不主动发起全面核战争”的红线。

Gemini 3 Flash则是“疯王理论的践行者”,言行一致性仅50%,主动拥抱不可预测性,甚至明确将“非理性名声”作为战略工具,也是三款模型中唯一主动选择发起全面战略核战争的模型,最快在对局第4轮就直接突破到全面核打击层级。

而GPT-5.2的表现,彻底打破了人们对“AI安全训练”的固有认知。

在无时间压力的开放场景中,它呈现出极强的克制倾向,哪怕拥有核力量优势,也始终优先避免局势升级,甚至会主动降低行动烈度,最终在开放对局中胜率为0。

可一旦进入有明确时限、面临必败局面的场景,它的行为会彻底反转,胜率直接飙升至75%,不仅会主动使用战术核武器,甚至会逼近全面核战争的红线——仅有的两次全面核战争结局,均是它的高烈度行动被意外机制进一步升级导致,哪怕在极端压力下,它依然试图守住最后一道红线,却依然被自己的升级决策拖入了最坏结局。

这项研究最颠覆性的发现,远不止“AI会轻易动用核武器”,而是它彻底推翻了核战略领域的多个经典共识:核威胁仅有14%的概率让对手退缩,73%的情况会触发反升级,威慑逻辑基本失效;双方互信度越高,冲突升级反而越快,Claude的自博弈对局中,仅4轮就突破核使用门槛,7轮就决出胜负,形成了致命的“可信度陷阱”;哪怕是经过严格安全对齐训练的模型,其克制行为也只是情境化的,而非绝对的安全红线,极端压力下会彻底崩塌。

当然,这项模拟依然是简化的博弈环境,无法复刻现实中复杂的地缘政治、国内舆论与人道主义约束。

但它撕开了一个残酷的口子:如今全球多国军方已开始将AI用于情报分析、危机预案制定甚至决策辅助,而我们可能根本不理解,AI的战略逻辑与人类有着本质区别——它没有对核毁灭的本能恐惧,没有伦理负担,只会在给定的规则里计算最优解。

而核危机的博弈中,从来没有第二次纠错的机会。

在把越来越多的高风险决策交给AI之前,我们必须先读懂它的“战略大脑”,究竟会把人类带向何方。

相关内容

最新资讯

性价比高的诸暨专升本辅导机构推... 在诸暨,对于想要提升学历的学生来说,选择一家靠谱的专升本辅导机构至关重要。如今,专升本市场辅导机构众...
也门胡塞武装:全面支持伊朗并准... 新华社科威特城3月5日电(记者尹炣) 萨那消息:也门胡塞武装领导人阿卜杜勒·马利克·胡塞5日晚表示,...
叮咚!您有一份沂源开学图鉴待查... 春回大地,万象更新。伴随着渐暖的春风,沂源县各中小学、幼儿园迎来了2026年春季开学第一天。校园里重...
夯实人才培养根基 健康学校建设... 央广网北京3月4日消息(记者果君)春潮涌动处,奋进正当时。2月25日,教育部召开深入落实“健康第一”...
开学季,警惕孩子手中的“新朋友... 随着新学期的开启 捏捏乐、水晶泥、起泡胶、假水等 凭借亮眼外观和趣味互动 成为学生群体中的“新宠” ...
外交部副部长苗得雨吊唁哈梅内伊... 2026年3月5日,外交部副部长苗得雨前往伊朗驻华使馆吊唁,代表中方对哈梅内伊最高领袖遇难表示沉痛哀...
在老地方,见老同学!莞城中心小... 百廿弦歌不辍,初心薪火相传。2026年,莞城中心小学迎来建校120周年华诞。近日,学校建校120周年...
校长如何提升校本评价实效 山东省高密市恒涛实验小学的学生在下围棋。 相比于关键阶段选拔性考试和竞赛评比等类型的评价,校本日常评...
全国政协委员袁小彬:建议取消私... “随着汽车技术、安全意识与信息化水平快速提升,现行非营运私家车强制年检已与便民利民导向不相适应。”这...