图灵奖得主萨顿警示：当前生成式AI难产真正科学突破

美国计算机科学家、强化学习领域的奠基人理查德·萨顿，近日对当前主流生成式人工智能的潜力提出了质疑。他强调，尽管大型语言模型、图像模型及视频模型展示了惊人的学习与生成能力，但它们在实现真正科学发现方面存在显著不足。

萨顿指出，这类AI模型虽然能从海量数据中学习并生成与训练材料相似的内容，但当其输出超越原有材料的“新颖”内容时，往往会显现出“幻觉”现象。他借用一句研究者间的俏皮话精辟概括了这一现状：“好的部分不算新颖，新颖的部分却不尽人意。”

然而，萨顿并非否定生成式AI的所有价值。他承认，在摘要生成、研究辅助、智能助手以及娱乐等领域，生成式AI依然能发挥重要作用，尤其是在以更高效、更经济、更定制化的方式模仿现有对象时，其价值不言而喻。

但他明确指出，科学发现绝非止步于模仿。真正的发现过程包含三个核心环节：变异（提出多样选项）、评估（测试这些选项）、以及选择性保留（筛选并保留有效方法）。萨顿认为，这一原则广泛存在于进化、科学方法、规划、搜索和强化学习等领域。

萨顿强调，当前普通生成式AI最欠缺的就是“评估”机制。尽管语言和图像模型可以生成无数变体，但如果没有有效的测试环节来判断这些变体的优劣，就无法筛选出更优的解决方案。他认为，人类在图像选择、棋局胜负判断、形式化证明和程序测试中获得的反馈，都能作为有效的评估指标。

他进一步列举了AlphaGo、AlphaZero、AlphaFold、AlphaProof、Claude Code和GT-Sophy等成功案例。这些系统之所以能超越文本或图像生成，追踪并找到更优解，正是因为它们内置了评估闭环，而不只是提供候选答案。

萨顿也对当前AI行业过度追求更大规模语言模型的趋势表示担忧。他更看好那些能够与环境长期互动、通过自身经验不断学习、构建世界模型并制定策略的AI智能体，认为它们才是通向更高智能的路径。