高考题,AI大模型不能解,也不敢解
创始人
2025-06-12 09:39:18
0

作者:李程程

高考,中文世界权威度和认可度最高的标准化考试,世界上最公平的大型选拔考试之一,还在如期进行中。

这项考试制度成熟、人数众多、标准统一,各科命题经过多轮审定,阅卷过程统一标准、分数精确。考试考取的分数背后,看似是对知识点和做题能力的展示,实则揭示的是其抽象逻辑、信息整合、快速运算和写作表达等能力。

尤其是逻辑思考和推理能力,是学生时期被重点训练的素养,是绩优生引以为傲的资本,进入社会用来吃饭的看家本事,而当今年大模型深度思考能力全面开花之际,想必大多数学霸会产生一种别样的复杂的心情。

当然了,高考的特殊性,使其成为了大模型能力的天然试金石。高考期间,哪家大模型解题能力强,综合评分到底可以上几本学校,成为很多人津津乐道的话题,今年类似相关的测评文章也零星出现了。

而当随机测试了下市面上主流通用大模型解答高考题时,结果却出人意料——这些大模型压根没有想要参加高考。

高考期间(6月7日-10日),主流国产模型厂商对今年高考数学题的回应。(图/网页截图)

事实上,不只是数学难题,国产大模型已经屏蔽掉了K12阶段学科(语文、数学、英语、物理、化学、生物、历史、地理、政治)内容的部分推理与解析能力。具体而言是,图片识题(拍题)功能禁用,高考真题关键词屏蔽,甚至禁止回答具体某年高考题目。

高考期间(6月7日-10日),相比其他大模型应用,DeepSeek对高考以及高考题相关的话题限制更为严格,而给出略显详细的提示词后,也会给出丰富的答案。(图/网页截图)

也就是说,在今年高考期间,主流的国产模型厂商,都主动或被动对高考采取了限制措施,这在国产大模型发展进程里还是头一回。

实际上,ChatGPT、Claude等国外的大模型可以解答今年高考相关题目,并且以高水平完成推理过程。而大多数国产通用大模型,已经在多项技术指标上持续逼近全球顶级水平,甚至在某些垂直细分场景呈现领先的趋势,也意味着它们是具备足够的能力来解答这些题目的。

很显然,这一次功能“降级”,本质上是一次策略性的行为,也是平台技术治理与内容安全机制的体现。

这一场高考期间“特别监管”,目前各大厂商未主动发布官方声明。而最直接的原因,恐怕是为了防止高考考试作弊。因为多数模型厂商直接在页面给出文字提示,无法支持相关功能,是“为了保证高考公平公正”,“为了确保高考的公平性”,“重要考试期间,换个话题试试”等。

这里涉及的是,今年高考前,教育部、中央网信办、公安部查处了部分商家。这些商家利用一些考生、家长的投机心理,将押题当成牟利工具,通过宣称“神预测”“精准押题”、炒作“名师押题”“AI押题”等虚假宣传手段,诱导考生、家长购买所谓的“高考押题卷”“高考猜题库”“备考攻略”等。

与此同时,当AI大模型进入更多硬件设备而非只是手机时,与考试有关的新问题也随之浮现。今年4月,《央视新闻》发出了一个疑问,“AI眼镜成考试作弊‘神器’怎么防?”而Rokid创始人、CEO祝铭明就这一问题答复是,“可能最简单的方法就是屏蔽信号或者把功能关掉”。

回到高考本身,这是我国最重要的考试之一,已经纳入国家治理的重要领域,现代教育测试学的标准性和普适性,使得高考一直被看作是教育公平与社会稳定的制度性支柱。高考题目及其解析涉及国家教育考试制度,具有高度敏感性和保密等级,任何失误或越界可能被定性为破坏考试秩序。

而一旦出现泄题或作弊的情况,都会被视为国家级事件。大模型有可能被考生用于作弊,而错误解答了真实或类似的高考试题,会持续引发公众的质疑。

事实上,监管层在今年已经明令禁止AI技术干扰正常的高考秩序。5月30日,教育部会同中央网信办、公安部发布了消息联合查处涉高考违法有害信息,重点整治的是,炒作夸大涉考不实信息,借AI技术生成发布涉考虚假信息,以及,干扰舆论和误导公众等行为。

在考试期间,涉及高考试题相关行为,可能被认定为是协助作弊,或者扰乱考试秩序,平台将面临监管和法律风险。主流国产大模型目前仍在“合规优先”的阶段,在监管本就密集的K12教育领域,冒险展示技术能力,将面临政策、伦理和市场风险多重压力。

(图/ unsplash )

而其实,如果从技术侧考虑,模型厂商限制相关功能,也未必是全然是“被迫”的行为。因为AI大模型的幻觉问题始终难解,同一个提问和提示词情况下,多次生成的内容也不全然一致,尤其是数理等更标准化的科目,纯属将模型能力的弱项暴露给公众。

尽管有些模型厂商已经以“解答高考题的准确率”为卖点宣传自身,但是,更多厂商为避免出现“AI答案”和“官方答案”不一致的尴尬,全部禁止作答高考题,不失为一种较为理性的决策。

不过,大模型的平台自律与避险机制,在高考结束后,就会陆续恢复对K12内容的部分支持,因为市场需求永远都在那里。

一个有意思的现象是,今年高考期间,“高考期间能用的AI”在社交平台上引起了小范围的讨论,而关注这一话题的,却是大学生群体。“正在复习的大学生天塌了”,“救救大学生吧”,“高考最大的受害者出现”,因为当前也正值大学期末考试季。

这些在社交媒体上小范围的“怨声载道”,段子式的调侃,说明的是,大模型已经深深地介入了大学生的学习、成长的主线任务。

不同于K12的解题答疑,大模型在高等教育中使用场景更为丰富,但也面临着最为激烈的争议。一些学校明令禁止使用,但随着大模型的发展,有的学校和教师也鼓励学生,以负责任的方式用AI辅助学习与研究,并允许在明确声明的前提下适度使用AI。

即便如此,考试场景也是被各方排除在外的一个共识场景。

如何划定学生使用AI的边界,使用场景自然是核心要义。大模型可成为启发式学习伙伴,尤其是深度思考普及之后。而在考试场景中,尤其是K12阶段,大模型一旦越界,必然会对公平性构成实质破坏。

可以预期的是,未来一段时间,高考期间,国产大模型厂商相关功能依旧会“策略性限制”。但从长远来看,“AI+教育”的变革不会停止。AI教师已经是各大主流教育科技公司正在探索的方向之一。

教育大模型或者通用大模型的教育相关应用,正确的方向是,以启发式学习的方式,构建知识图谱导航,成为教师教学和学生学习的辅助工具,而非一次次简单答案投喂,成为考试题目的解答机器。

相关内容

最新资讯

菏泽市2025年中小学、幼儿园... 义务教育阶段学校暑假具体时间为2025年7月7日至8月31日,9月1日开学。 普通高中学校暑假具体时...
公安部提醒:高考后 所谓“招考... 高考已经结束,千万考生家庭进入等待查分阶段。然而,在这段紧张而充满期待的日子里,一些不法分子也瞄准了...
通师高专2025年乡村定向师范... 今天(13日) 南通师范高等专科学校 公布2025年初中毕业起点乡村教师定向师范生 面试办法 202...
黄春梅爱子人设快要立不住了,汪... S家的成员和汪小菲究竟谁才是真正的爱孩子?从月初的六一儿童节,就可以找到答案了! 在六一儿童节还没有...
笔试又调整啦??2026fal... 大家好呀!今天要给申请英国大学的小伙伴们带来一些超重要的消息—— 关于2025-2026申请季牛津大...
今日开考!福建6月高中学考各科... 下载历年学考真题试卷+答案 01 高三同学注意事项 1.参加学考在哪里报名? 普通高中学生在考籍所在...
双向奔赴!宁陕考生鲜花谢交警 阳光讯(记者 李孝华 通讯员 张飞飞)6月9日,宁陕中学高考考点外,一场温暖人心的双向奔赴悄然上演。...
留学申请竞争激烈,如何凭借实习... 最近几年,留学申请圈的竞争激烈程度堪称"地狱模式"!英国院校收到90+成绩单越来越多... 当学术成...
小升初数学毕业真题密押卷(电子... 今天给大家分享:小升初毕业季已至,数学作为小升初考试的关键学科,一套高质量的真题密押卷对孩子备考至关...
一年级下册语文期末专项复习卷(... 今天给大家分享:期末将至,孩子的语文复习安排上了吗?尤其是一年级,拼音和汉字可是基础中的基础 。今天...
提升申请剑桥大学访问学者的成功... 大学介绍 剑桥大学(University of cambridge)始创于1209年,坐落于英国剑桥...
注意!高考志愿填报智能参考系统... 记者从省教育考试院获悉,河北省高考志愿填报智能参考系统自6月11日12时起开始,面向我省高考考生及对...
济宁市中小学教师资格6月17日... 济宁市人民政府官网 2025年济宁市中小学教师资格认定(第二批次)公告 根据教育部统一部署和山东省教...
一年级下册语文期末复习1-8单... 今天给大家分享:一年级语文学习,字词基础打得牢,后续知识吸收才更顺!一年级下册语文期末复习词语盘点来...
高考志愿填报需要注意什么? 2025全国高考志愿填报将于6月26日全面开启,考生需要了解并注意哪些关键环节或细节? 这些事项值得...
江西理工大学段勇教授到访江西工... 6月11日下午,江西理工大学原马克思主义学院院长段勇教授莅临江西工程学院马克思主义学院开展学习交流活...
高中校园刮起“爱自己”旋风 极目新闻记者 张裕 通讯员 王聪 青春期的小烦恼、小纠结怎么破?武汉大方高中给出了超暖心的答案!6月...
以色列证实袭击伊朗 称或已打死... 新华社德黑兰/耶路撒冷6月13日电 以色列军方13日证实袭击了伊朗数十个与核计划相关的设施目标,称或...
北京动物园被清华学生玩出了什么... 作者:程恋雯 你是否以为冠以清华的名称,课程会严肃或正经?实则不然~清华大学讲究全方位发展,不读死书...
兰州市城市四区小学招生方案及划... 6月12日,城关区、七里河区、安宁区、西固区教育局分别公布了小学招生工作实施方案及划片范围。 城关区...