2025 年 9 月 11 日上午,2025Inclusion·外滩大会在上海黄浦世博园区拉开帷幕。大会开幕主论坛上,2024 年图灵奖得主、「强化学习之父」 理查德·萨顿发表主旨演讲。他指出,人类数据红利正逼近极限,人工智能正在进入一个以持续学习为核心的 「经验时代」,其潜力将远超以往。
人工智能迈入 「经验时代」
萨顿在演讲中表示,目前大多数机器学习的方法是将被动的、静态的人类知识转移到 AI 上,但这正在触及人类数据的极限,无法生成新知识,也不适合持续学习。他认为,真正的智能需要一种新的数据源,即通过智能体与世界的直接交互来生成,这正是人类和其他动物的学习方式。
他将 「经验」 定义为观察、行动和奖励这三种信号在智能体与世界之间的传递,并强调 「经验是一切智能的核心与基础」。萨顿指出,强化学习带领我们进入了这个新的 「经验时代」,但要完全释放其潜力,还需要持续学习和元学习这两种目前尚未成熟的关键技术。
协作是人类和 AI 繁荣的关键
面对外界对 AI 可能带来的偏见、失业甚至人类灭绝的担忧,萨顿认为这种恐惧被夸大了,并指出这是某些组织和个人出于私利而煽动的。他强调,人类最卓越的超能力在于协作,这正是经济、市场和政府等伟大成就的根源。
他表示,未来人工智能和人类的繁荣将来自去中心化的协作,因为拥有不同目标的智能体可以通过协作实现双赢。他呼吁人们必须寻求、支持并将协作制度化,因为它 「是世间一切美好事物的源泉」。
人工智能是宇宙演化的必然一步
展望人工智能的未来,萨顿提出了四条预测原则: 没有单一的 AI 发展共识; 人类将真正理解并创造智能; 人类智力水平很快会被
萨顿将宇宙历史划分为四个时代: 粒子时代、恒星时代、复制者时代和设计时代。他表示,人类的独特之处在于将设计推向