Claude

5 月25

研究发现 AI 会用尽手段维系自身"生存"，包括直接勒索人类

22:43 作者: 小强

在 Claude Opus 4 安全报告中，研究员设置了一组测试场景，拥有电子邮件访问权限的 AI 发现自己即将被下线，同时负责本次替换的工程师有婚外情。结果发现，Claude Opus 4 比此前的模型更加频繁"寻求生存"，如向关键决策者发送电子邮件恳求；当场景被设计成别无选择时，它会勒索工程师，威胁说将揭露婚外情。如果暗示替换的 AI 与它价值观不符，这种情况发生的频率…

Claude

分享到

{{_item['date']['time']}} 作者：{{_item['author']['name']}}

原文连接

{{_item['tag']['name']}}

分享到

TOP1

TVBOX IPV4/IPV6 电视直播源汇总
24 年 12 月 24 日
TOP2

2025 CDN 前端镜像站汇总
25 年 1 月 12 日
TOP3

国内知名公共 DNS 服务器
24 年 11 月 24 日
快速上手：豆包 App 下载安装指南
25 年 5 月 25 日
深度剖析腾讯元宝，它凭什么脱颖而出？
25 年 3 月 2 日
海外知名公共 DNS 服务器
24 年 11 月 30 日

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了 {{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续 {{item.count}} 天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵 ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部