大模型时代的警钟:Richard Sutton 呼吁重拾智能理解的科学探索

在最近举办的 RLChina2025 开幕式上,伦敦大学学院的汪军教授与 「强化学习之父」RichardSutton 进行了深入对话,探讨了智能的本质和未来发展方向。汪军教授作为智能信息系统领域的权威,与 Sutton 共同回顾了强化学习 (RL) 的学科根基,并关注当下行业的快速扩张对基础科学研究的影响。

Sutton 指出,当前的人工智能技术,尤其是大规模语言模型 (),虽然在实际应用中展现出强大的能力,但并不是真正理解智能的途径。他强调,LLM 在训练完成后就失去了学习能力,因为它们缺乏明确的目标和奖励机制。相比之下,强化学习强调的是通过与环境的互动来达成目标,这种方式能更好地理解和模拟智能的运作过程。

Sutton 提出,真正的智能需要对目标进行明确的定义,并通过 「奖励」 信号来驱动学习。他认为,从经验中学习是强化学习的核心,而不仅仅依赖于梯度下降等单一方法。为了推动智能的发展,研究者们需要将搜索与梯度下降相结合,以此探索更多的可能性。他还强调,尽管行业资金的涌入促进了应用发展,但这并不应让科学研究偏离长远目标。

在对年轻研究人员的寄语中,Sutton 鼓励他们关注基础科学,强调人工智能的探索是一个长期的过程,而非短期内能够解决的问题。他提到,虽然工业界更关注当下可实现的技术,但科学界必须致力于探索尚未解决的根本性问题,以推动智能的真正理解。

此次对话提醒我们,在追求技术进步的同时,不能忽视对智能本质的深入理解。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​前 Stability AI CEO:AI 革命将让人类智力价值归零,未来 1000 天面临巨变

2025-9-29 1:20:58

AI 资讯

Moondream3.0 发布,多项基准测试超越了 GPT-5 等顶尖模型

2025-9-29 1:21:15

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索