美国计算机科学家、强化学习领域的奠基人理查德·萨顿,近日对当前主流生成式人工智能的潜力提出了质疑。他强调,尽管大型语言模型、图像模型及视频模型展示了惊人的学习与生成能力,但它们在实现真正科学发现方面存在显著不足。
萨顿指出,这类AI模型虽然能从海量数据中学习并生成与训练材料相似的内容,但当其输出超越原有材料的“新颖”内容时,往往会显现出“幻觉”现象。他借用一句研究者间的俏皮话精辟概括了这一现状:“好的部分不算新颖,新颖的部分却不尽人意。”
然而,萨顿并非否定生成式AI的所有价值。他承认,在摘要生成、研究辅助、智能助手以及娱乐等领域,生成式AI依然能发挥重要作用,尤其是在以更高效、更经济、更定制化的方式模仿现有对象时,其价值不言而喻。
但他明确指出,科学发现绝非止步于模仿。真正的发现过程包含三个核心环节:变异(提出多样选项)、评估(测试这些选项)、以及选择性保留(筛选并保留有效方法)。萨顿认为,这一原则广泛存在于进化、科学方法、规划、搜索和强化学习等领域。
萨顿强调,当前普通生成式AI最欠缺的就是“评估”机制。尽管语言和图像模型可以生成无数变体,但如果没有有效的测试环节来判断这些变体的优劣,就无法筛选出更优的解决方案。他认为,人类在图像选择、棋局胜负判断、形式化证明和程序测试中获得的反馈,都能作为有效的评估指标。
他进一步列举了AlphaGo、AlphaZero、AlphaFold、AlphaProof、Claude Code和GT-Sophy等成功案例。这些系统之所以能超越文本或图像生成,追踪并找到更优解,正是因为它们内置了评估闭环,而不只是提供候选答案。
萨顿也对当前AI行业过度追求更大规模语言模型的趋势表示担忧。他更看好那些能够与环境长期互动、通过自身经验不断学习、构建世界模型并制定策略的AI智能体,认为它们才是通向更高智能的路径。
