苹果研究称AI推理模型缺乏真正思考能力
创始人
2025-06-09 13:17:27
0

2025-06-09 08:40:11 作者:狼叫兽

苹果近期发布了一篇研究论文,指出当前主流的推理模型其实并不具备真正的思考能力。不论是DeepSeek、o3-mini还是Claude 3.7,这些模型所展现的“推理”行为本质上仍属于模式匹配的范畴,所谓的逻辑推导过程也只是一种表象。

为了更科学地评估模型在推理方面的实际表现,研究人员构建了四类结构化谜题任务:汉诺塔问题、跳棋交换问题、过河问题以及积木世界。这四类任务均可通过调整参数实现对难度的精确控制,从而系统性地测试模型在不同复杂度下的应对表现。

实验结果显示,当问题复杂度逐步提升时,模型一开始会表现出一定的适应能力,表现为生成回应前的等待时间变长。然而,随着任务进一步复杂化,模型的推理深度反而开始减弱,即使仍有大量可用的token预算,它们却在最关键的时刻停止了深入分析。当问题复杂度超过某个临界值时,不论是推理模型还是标准模型,都无法维持基本的解题能力,整体准确率迅速降至零,显示出明显的性能崩溃现象。

这篇论文发布后,在网络上引发了讨论。有用户发表评论称:“一家坐拥最多资金支持的科技公司,在两年内都没有推出令人信服的技术成果,现在反过来质疑其他人的进展。”

此外,虽然论文揭示了当前模型在推理能力上的局限性,但也有人认为其意图并非单纯否定现有成果,而是希望引起业界对更有效推理机制与评估方法的关注和投入。苹果在2024年全球开发者大会上首次展示了其智能系统Apple Intelligence,但在过去一年中,该系统多项功能经历了推迟上线、功能不完善甚至被撤回的情况。

相关内容

最新资讯

上周新能源销量榜:比亚迪领跑,... 最新一周的中国新能源汽车市场再次展现了其蓬勃的发展态势,各大厂商销量数据新鲜出炉,竞争格局依旧激烈。...
豪爵新车爆料:GSX500公路... 近日,网络上流传出一组据称是豪爵内部座谈会的图片,这些图片意外地揭示了豪爵未来一系列新车型的上市时间...
原创 车... 最近后台好多朋友私信问我,车补贴明年还有没有?今天咱就好好唠唠这事儿。 先说结论哈,就目前的情况来看...
极核EZ4系列电摩震撼登场,亲... 近日,电动摩托车市场迎来了一股新潮流,极核品牌一口气推出了多款新品,其中EZ4系列凭借亲民的价格和出...
索尼发布革命性车载激光雷达传感... 6月10日,索尼半导体解决方案公司发布了一款颠覆性的车载激光雷达核心传感器——堆叠式SPAD深度传感...
雷军辟谣 针对近期网传“小米汽车高阶驾驶培训发生致命车祸”传闻,6月10日上午,小米汽车董事长兼CEO雷军在微...
特斯拉新动作,牵手闵行的项目落... 近日,全球新能源汽车巨头特斯拉的直营钣喷中心正式落户吴泾镇创E谷E栋1层,这座结合创E谷园区“北欧风...
雷军严正声明:小米精英驾驶培训... 近日,关于小米汽车精英驾驶培训项目的一则谣言在网络上迅速传播,引发了广泛关注。对此,小米公司创始人雷...
刚刚,雷军发声:启动法律程序 每经编辑:何小桃 针对近期网络广泛传播的“小米汽车高阶驾驶培训发生致命车祸”传闻,10日上午,小米创...
原创 以... 车卖家相信现在很多人买车的时候基本上第一选择就是插混车型了,因为既享受绿牌的政策也没有所谓的充电焦虑...
终端销量同比增长4.3%,上汽... 最近,有一场车圈活动“刷屏”了,那就是2025中国汽车重庆论坛,现场多位车企高层与行业人士,针对“反...