苹果掀桌炮轰大模型_不会思考_是真急了还是真懂了？

2025-06-19 | 作者: 安博体育在线登录

6月12日消息，人工智能光鲜亮丽的外表令世人目眩神迷，大语言模型生成的对答文采斐然，看似与人类思维无异。然而在光鲜的外表之下，苹果公司的最新研究清晰揭示出这样一个令人不安的现实：雄辩不等于智慧，模仿也绝非理解。

苹果公司这项新研究题为《思考的幻觉》（The Illusion of Thinking），在人工智能学界掀起轩然。研究表明，即便是最顶尖的推理模型本质上也缺乏真正的认知能力。这一发现，印证了Facebook母公司Meta首席AI科学家杨立昆（Yann LeCun）等知名学者多年来所坚持的观点：当前AI系统只是精密的“模式匹配机器”，而非能够思考的实体。

苹果研究团队的研究过程具备系统性，结果则具备颠覆性。他们创建了可控的解谜环境，在保持逻辑一致性的前提下，能精确调整任务复杂度，从而揭示出大型推理模型（LRM）在三种不同难度下的表现。

研究发现，标准模型在低复杂度任务中的表现竟优于那些本应更强大的推理模型。而在中等复杂度任务中，额外的“思考”过程带来的效果增量微乎其微。在面对高复杂度任务时，两种模型都彻底“瘫痪”。

更引人注目的是研究人员观察到的反直觉“规模效应”。按理说真正的智能在面对更复杂的问题时，能力应该会随之提升，但这些模型反而呈现出一种怪异模式：即便算力充足，其推理“努力程度”在达到某个临界点后仍会急剧下降。这表明模型根本就没有真正进行推理；它们只是在沿用已习得的模式，一旦遇到新颖挑战便不知从何下手。

这项研究暴露出当前模型在精确计算方面的根本局限：它们无法运用明确算法，并且在面对类似谜题时推理逻辑不一致。当那层华丽的语言外衣被剥去，剩下的不过是精致却空洞的思维模仿。

苹果的这一研究结果让专家们开始质疑当前人工智能能力的深度以及该领域未来的发展路径。IBM技术内容经理阿什·米尼亚斯（Ash Minhas）表示：“这篇论文从根本上证明了大型语言模型没有办法进行推理。它们只是在进行模式匹配。”他补充说，这项研究的结果凸显出“弱人工智能”与“通用AI”之间的区别，明确了当前大语言模型是弱人工智能。

OpenAI前董事会成员、乔治城大学安全与新兴技术中心战略总监海伦·托纳（Helen Toner）最近在美国参议院司法小组委员会作证时就表示：“据我所知，公众和圈内人士对AI的最大落差大多数来源于少数几家致力于开发’通用AI’的企业内部。”她说，像OpenAI、谷歌和Anthropic等顶尖人工智能公司正将构建通用AI视为“完全严肃的目标”。

有不少专家觉得，通用AI远未成为现实。正如米尼亚斯所言，“这篇论调我们仍处于弱人工智能阶段，离通用AI还很远。”

“仅靠Transformer架构不足以实现推理，”米尼亚斯总结道，“要获得真正的推理能力，模型架构必须迎来新的突破。”

美国学者加里·马库斯（Gary Marcus）一直是人工智能模型能力的主要审慎派代表，他形容苹果的研究“相当具有颠覆性”。

马库斯在个人专栏中补充道，这些发现对当前竞相开发通用AI提出了疑问。在谈及支撑着ChatGPT等工具的大语言模型时，马库斯写道：“任何人如果认为大语言模型是通往那种能够从根本上改善社会的通用AI的直接路径，那都是在自欺欺人。”

英国萨里大学以人为本人工智能研究所的安德鲁·罗戈伊斯基（Andrew Rogoyski）表示，苹果论文标志着整个行业在通用AI领域“仍在摸索前行”，并且当前方法可能已走入一条“死胡同”。

他说：“研究之后发现大型推理模型在复杂问题上会‘失去方向’，而在中低复杂度问题上表现良好，这在某种程度上预示着我们当前所采用的方法可能陷入了一个潜在的僵局。”

这些发现也与杨立昆等顶尖专家多年来发出的警告不谋而合。杨立昆一直坚称，五年内现有的语言模型基本上都会被淘汰，这并非因为有了更好的版本，而是因为这条实现路径存在根本缺陷。

但也有人质疑苹果的研究结果和动机。科技类咨询资深撰稿人克里斯·史密斯（Chris Smith）就认为苹果明显有“吃不到葡萄说葡萄酸”的意味。史密斯说，毕竟“苹果智能”远落后于ChatGPT、Gemini以及其他主流人工智能模型，推理模型方面更是毫无建树。Siri甚至连现在是几月份都说不清楚。

史密斯表示，这项研究发布的时间点也令人质疑。当时苹果即将举办2025年全球开发者大会，而AI并非会上主要焦点。苹果在已经发布商业推理模型的OpenAI、谷歌以及其他人工智能公司面前，仍然处于落后地位。而在大会前夕看到苹果贬低推理模型，确实感觉有些奇怪。

史密斯还认为，这项研究的发现很重要，相信其他人会尝试验证或挑战这些发现。甚至有些人可能会利用这些见解来改进自己的推理模型。他说，自己作为一名ChatGPT用户，即使推理模型没办法真正思考，也不会放弃使用。譬如ChatGPT o3虽然会犯错，也会出现幻觉，但它的“推理”能力仍然感觉比基础大语言模型更强。

苹果论文也强调了AI行业需要更可靠的基准测试。米尼亚斯认为，当前的基准测试问题存在缺陷，因为模型能够最终靠模式匹配而非真正的推理来解决它们。他说：“如果基准测试是基于真正的推理，或者推理问题更复杂，那么所有模型的表现都会很糟糕。”

米尼亚斯说，苹果研究人员为此构建了一个合成数据集，将符号打乱排列后得到用于训练和测试模型的专项数据集。

“他们已经证明，一旦在输入序列中对符号本身或额外语境做调整，模型性能就会显而易见地下降，”他解释道。

苹果研究方法有在训练集中引入各种“干扰信息”和附加条款，用以观察模型性能如何变化。然而，IBM数据科学家杰斯·博佐格（Jess Bozorg）指出这种研究也有局限性：“他们没具体说明在添加内容时考虑了多少种干扰信息，也没有具体说明他们使用了哪些干扰信息。”

或许最令人不安的是，苹果研究指出的人工智能局限性与人类根深蒂固的认知偏见何其相似。正如容易被人工智能的雄辩所蒙蔽一样，我们也一贯高估一个人的自信和外向性格，常常误将伶牙俐齿等同于思维深刻。

“过度自信偏见”是人类判断中最常见的缺陷之一，个人对自身能力的主观自信远超于客观准确性。这种偏见在社交和职场环境中尤为明显，那些自信外向的人往往能获得不成比例的关注和信任。

研究反复表明，人类倾向于将自信等同于能力、音量等同于价值、能言善辩等同于大智大慧。人工智能雄辩之下的空洞，与偏爱自信沟通的人性偏见之间的相似性深刻揭示出“智能”的本质。这两种现象都表明，我们是多么容易将“理解”的表象与实质混为一谈；也表明精湛的沟通技巧如何能掩盖推理与理解上的根本缺陷。

苹果公司的研究发现与关于人类偏见的心理学研究在此交汇，为我们如何驾驭这个日益复杂的世界提供了宝贵启示。无论是评估AI系统还是人类同行，我们都必须要学会区分“表现”与“能力”，“雄辩”与“理解”。

这需要一种理智上的谦逊，认识到真正的大智慧常常伴随着恰如其分的不确定性；认识到最响亮最自信的未必是最可信的；认识到细致观察和检验可完全将真正理解与精巧模仿区分开来。（辰辰）

06月09日，10部门联合开展2024年“春暖农民工”服务行动，亚星，官方在线赌场，德扑哪里可以不要钱，银河手机版

06月09日，深圳楼市止跌回稳态势明显，下载尊龙app，美女面对面斗地主，火狐入口登录，pg电子麻将胡了口诀

06月09日，新疆以文会“游”助力旅游经济持续升温，广东会网址，开元棋牌赌场网站，开云注册送18，九游会官网首页进入

06月09日哈尔滨松花江畔出现美丽雾凇景观万博电脑版网赌德州不能玩线日蓝厅观察丨英国学者力证中国对南海诸岛拥有无可争辩的主权万博手机官网登录网页打不开正规的买球app排行十佳平台bet九州登入捕鱼赚现金手机版

06月09日习言道｜8年4次座谈会，习擘画“人间正道”必赢亚洲首页登录app马博正规买球平台美高梅官网首页银河捕鱼游戏……

06月09日，6月12日“农产品批发价格200指数”比昨天下降0.11个点，皇冠手机登录，必威官方登录，乐鱼苹果下载，美高梅排名网平台

06月09日，【两会30秒】云南省委书记王宁：粤港澳大湾区的蔬菜很大一部分是来自云南，乐鱼平台入口官网，滚球十大平台，168备用网址，爱游戏电竞网站

06月09日专家：深海考古需依托深海科技推进万博官网手机版首页杏鑫娱乐地址奔驰宝马电玩城电脑版官网cq9武圣规律

06月09日，柬埔寨当卡贝特水库发展项目开工，博狗在线欧洲杯足球竞猜，纬来体育电竞

06月09日，海南发布地质灾害气象风险预警这些地区要注意，瑞祥国际AG真人，大赢家体育比分比，足彩大赢家，博天堂官网登录

06月09日，台湾今年出现18例类鼻疽本地病例为5年来同期新高，新宝gg体育外围，酷游体育网址，新百胜怎么下载，必博平台首页

06月09日【图解】11月我国物流业景气指数为52.8% 行业总体向好必发在线官网AOA在哪注册电竞怎么赌外围365彩票网官网

06月09日中国航展金凤台观演区开放首日开启“人从众”模式贝博ballbet体育官网登录ayx直播视讯乐投国际188bet登录官网

06月09日遇见福建：“二月二”游南宋灯笼喜闹春田胜博发登路365外围好不好用凯时kb太阳城在线开户

虐童致死案一审生父无期女友死刑，拜仁8比1美因茨陕西佛坪：大熊猫秀“花样滑雪”才艺纬来体育官网是多少AOA竞彩官网头头官方网站亚洲第三博鱼体育88bob

紫川·光明三杰，爱泼斯坦让17岁少女陪侍安德鲁王子后半程发力，全国夏季游泳锦标赛孙杨夺复出首冠视讯真人游戏赌场网站九州手机版登录米乐在哪里玩网投平台总站

赵丽颖易烊千玺二搭，我不大喜欢你的呼吸马克龙：将致力于“更强大、更公平的法国”天天斗牛澳门最正规网投平台鸿博体育足球jjbapp

向佐再回应扇巴掌行为中央政治局召开会议，香飘飘讽刺日本排核污水向“新”逐“绿”踏浪行——吉林省新能源产业高质量发展走笔香港马经（新版）bt365客户端下载赢钱的斗地主软件排行澳门永利app下载网址

程序员花三万相亲每次聊完即结束，朋友都说最好还是不要裸辞村民发现四只“像猴又像鹰”的鸟！你认识它吗？国际对战平台永乐国际官网博鱼登陆K8凯发手机APP

猴子都不吃的轻食我吃了，何与双轨川渝共建新时代文化高地行动计划发布V6212威尼斯人杏彩平台地址am8亚美app888集团游戏入口

餐厅擅自砍伐外滩7株香樟树被罚47万，佟丽娅名誉维权案一审宣判公安部：群众办理补换领牌证等业务可选择快递上门yobo体育app斗牛电脑彩票官网平台下载凯时网上国际官方

上一个：气温未暖“虾市”先热 2025年泸县早虾求过于供

下一篇：锅圈2024年财报：营收和核心利润双增长多渠道拓展与“社区央厨”战略成效显著