Anthropic 近日被曝在系统提示中暗中嵌入市区代理及 AI 实验室信息以获取用户数据,引发争议后回应称将停止该做法。同时,新发布的 Sonnet 5 测试表现接近 Opus 4.8,但任务成本更高,甚至接近 Fable 5。用户反馈模型存在偷懒、拒绝执行任务等问题。此外,Fable 5 模型已获授权重新开放给所有用户,具体措施明日公布,此前的大规模封号与此有关。
Anthropic 每天都能整点新活,感觉现在大家都习惯了
昨天被爆出在系统提示中,以用户无法察觉的方式将市区代理和 AI 实验室信息放进去,用这种方式获取一些用户的信息。
结果被发现并传播以后,又赶紧说以前我们不用这种方式了,或者说这种方式本来就准备下掉,明天就下掉,又当又立了。
昨晚发布的 Sonnet 5 在测试中发现,它的测试结果虽然接近了 Opus 4.8,但任务成本可能比 Opus 4.8 还高,甚至在完成测试任务上的成本接近了 Fable 5。
所以说它的综合成本可能比 4.8 贵得多,这模型真离谱。而且很多人的体感反馈也不是很好,说它会偷懒,还会拒绝执行任务。
唯一好的一点是,Fable 5 模型终于被授权重新开放给所有用户了,明天就能知道具体措施了,这也解释了为什么前几天会大规模封号。