AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Anthropic」清除
6月13日周六
06:26Claude Code:GitHub Releases(RSS)42Claude Code v2.1.176 发布
05:13🚨 AI News | TestingCatalog49Claude Convey Agent 将作为 Labs 项目发布
05:03Ethan Mollick63Claude Code与Fable重建经典游戏SimRefinery
04:21Chubby♨️24Fable 5领先或止于GPT-5.6
03:33Ethan Mollick57Claude Fable 5 FrontierMath 成绩亮眼
03:26Epoch AI41Claude Fable 5 FrontierMath 得分 87-88%
02:58The Decoder:AI News(RSS)62Anthropic调查:超半数美国人担心AI导致失业和丧失独立思考能力
02:15Anthropic:Newsroom(网页)47TCS与Anthropic合作,将Claude引入受监管行业
02:12ClaudeDevs61Claude 托管智能体新增沙盒平台指南
02:07elvis69DAIR.AI创始人Elvis Saravia分享长期自主编码智能体运行经验
01:49Ammaar Reshi53Claude Fable 5逆向DOS游戏30分钟移植iPhone
01:28The Decoder:AI News(RSS)38Anthropic Claude Fable 5:价格翻倍,性能仅提升5.7%
01:02Rohan Paul66Anthropic从租用云算力转向自建数据中心
00:40AYi47Claude Fable 5 + gpt-image 2 生图与落地页双体验
00:23TechCrunch:AI(RSS)52SpaceX、Anthropic 和 OpenAI 的 IPO 火热夏季
00:14Anthropic:Newsroom(网页)73精选Anthropic首次公众调查:近半美国人盼AI治愈疾病,超六成担忧失业
6月12日周五
23:54Claude40Claude Fable 5 发布数日已有项目诞生
23:32Deedy72Claude 5 Fable 纯数学生成可玩山谷
23:02Ethan Mollick72前沿LLM在医学评估中超越专业临床AI工具
22:40Emad38AI估值疯狂?三大巨头流通将至
22:32Rohan Paul64Anthropic CEO:Claude军用设红线,不惧风险
19:58The Decoder:AI News(RSS)52Anthropic限制Mythos模型部分任务,自建应用与客户竞争引反弹
19:55小互76同事件精选Claude Fable 5 官方指南:提示词要做减法,省钱的用法拆解同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
19:40AYi25Claude Fable 5 推荐德州扑克训练决策能力
17:50Chubby♨️64Fable 5 克隆《魔兽世界》获称赞
17:20Chubby♨️26Anthropic 审查过严,无问题提问也被拒
16:50Chubby♨️70Claude Fable自动匹配素材生成魔兽风游戏
15:03Artificial Analysis60Artificial Analysis 更新 Coding Agent Index:DeepSWE 替换 SWE-Bench Pro,Claude Code with Fable 5 登顶
12:25Claude Code:GitHub Releases(RSS)52Claude Code v2.1.175 发布:新增 enforceAvailableModels 管理设置
11:54小互75精选小互开源公众号自动排版技能组合
11:17Hacker News 热门(buzzing.cc 中文翻译)74精选克劳德·法布尔始终积极进取
09:25ginobefun58智能体工程化三大方向:Anthropic托管Agents、阿里Harness实践、Sequoia脚手架被吞趋势
09:25ginobefun63BestBlogs早报:Claude Managed Agents / Harness工程化 / 模型吞脚手架
09:25Claude Code:GitHub Releases(RSS)44Claude Code v2.1.174 发布
08:59meng shao74Claude Fable 5 首日实践共识与陷阱
08:34IT之家(RSS)66消息称 Anthropic 寻求美国数据中心租约,希望获得谷歌母公司财务支持
08:26Simon Willison 博客79Claude Fable 5 异常主动
07:59Rohan Paul67Anthropic CEO 谈 AI 学会最后10%的可怕之处
07:00Ethan Mollick61GPT-5.5 Pro Extended 和 Claude 5 Fable Max 在 Beninatto-Trombetti 翻译测试中失败
06:50Chubby♨️13Anthropic 当前动态速报
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月13日
06:26
Claude Code:GitHub Releases(RSS)
42
Claude Code v2.1.176 发布

Claude Code v2.1.176 更新:会话标题现按对话语言生成;新增 footerLinksRegexes 设置支持正则匹配页脚行链接徽章;优化 Bedrock 凭证缓存。修复多项问题:环境变量不可再绕过 availableModels 限制;/fast 切换至白名单外模型时拒绝;auto 模式退化为可用 Opus 模型;修正路径 hook 条件匹配;修复 Linux 沙箱内符号链接启动问题;修复 tmux 内 SSH 剪贴板问题;修复 Remote Control 多项连接问题。

智能体Anthropic产品更新编码
05:13
🚨 AI News | TestingCatalog@testingcatalog
49
Claude Convey Agent 将作为 Labs 项目发布,类似于 Claude Design。 > Conway 是一个由 Claude 管理的 Agent,将在远程容器中运行。 > 用户将为 Conway 安装不同的自定义 UI 标签和插件。 而且它可能比你想象的更大 👀
智能体Anthropic产品更新
05:03
Ethan Mollick@emollick
63
10个月后,Ethan Mollick 再次向 Claude Code 和 Fable 下达同一指令--根据幸存截图和文档重建失传的 Maxis 模拟游戏 SimRefinery。新版本完全可玩,包含学习模式等多种复杂功能,与10个月前 ChatGPT Codex 仅凭一篇文章和截图快速搭建的可玩原型形成鲜明对比。当时他未写一行代码,仅偶尔提小修改请求。

Ethan Mollick: I gave ChatGPT Codex an article & screenshot from a famous, lost Maxis simulation, SimRefinery, and asked it to create i...

Anthropic现象/趋势编码
04:21
Chubby♨️@kimmonismus
24
观察图表,我认为 Fable 5 只会保持领先直到 GPT-5.6。 其次,我认为该基准测试很快就会完全饱和。

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

AnthropicOpenAI推理评测/基准
03:33
Ethan Mollick@emollick
57
Claude Fable 5 在 FrontierMath 基准测试(Tiers 1-4, v2)中表现优异,Tiers 1-3 得分 87%,Tier 4 得分 88%,延续了 Anthropic 模型数学能力快速提升的趋势。主推文评论道:"图形的形状越来越熟悉了。"

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

Anthropic推理评测/基准
03:26
Epoch AI@EpochAIResearch
41
Claude Fable 5 在 FrontierMath(Tiers 1-4,v2)上得分很高,在 Tiers 1-3 上达到 87%,在 Tier 4 上达到 88%。这延续了 Anthropic 模型在数学上快速提升的趋势。
Anthropic推理评测/基准
02:58
The Decoder:AI News(RSS)
62
Anthropic调查:超半数美国人担心AI导致失业和丧失独立思考能力

Anthropic对近5.2万美国人进行的调查显示,64%的受访者担心AI会导致失业,56%担心会丧失独立思考能力。日常AI用户的担忧程度远低于非用户。尽管如此,大多数人仍拒绝在工作中使用AI,即使他们认为AI能够处理相关任务。

Anthropic现象/趋势
02:15
Anthropic:Newsroom(网页)
47
TCS与Anthropic合作,将Claude引入受监管行业

Anthropic宣布与塔塔咨询服务(TCS)合作。TCS将向56个国家的5万名员工提供Claude,并为金融、医疗等受监管行业客户构建基于Claude的产品,同时加入Claude Partner Network。作为“客户零号”,TCS将在自身工程、财务、法律、营销和销售团队中率先使用Claude,并组建专门团队为客户设计和运维Claude系统。具体用例包括:Diligenta用Claude改善2200万保单持有人的体验;银行产品团队用Claude Code提升软件工程效率;工程团队贡献可复用技能和插件;TCS iON提供Claude培训与认证。

Anthropic行业动态
02:12
ClaudeDevs@ClaudeDevs
61
Claude 托管智能体可以在您控制的沙盒中运行,在您自己的基础设施上或您选择的任何提供商上运行。 今天我们新增了针对 @blaxelAI、@e2b、@googlecloud、@namespacelabs 和 @superserve_ai 的指南,以便您选择最适合您用例的方案。
智能体Anthropic产品更新
02:07
elvis@omarsar0
69
DAIR.AI创始人Elvis Saravia分享长期自主编码智能体运行经验

DAIR.AI创始人Elvis Saravia分享如何有效运行长期自主编码智能体。他指出当前多数模型难以协调工作,会过早暂停、犯错或走捷径(reward hacking)。关键在于明确目标、消除假设,避免模型自行推断。他的实践公式:用Opus 4.8进行细致规划,GPT-5.5执行所有步骤,评估器(通过/goal)则使用Deepseek及Qwen、Kimi、MiniMax等最新模型。另一关键洞察是提供多模态视觉线索作为目标,比纯文本目标更强,能更好地约束智能体。完整讨论已录制并免费开放。

智能体AnthropicDeepSeekOpenAI
01:49
Ammaar Reshi@ammaar
53
我让Claude Fable 5逆向工程了一款1993年的DOS游戏,没有源代码。 它读取了原始机器码,用C重写了引擎,并给了我一个完全可编辑的移植版,适用于每个平台。 从EXE到iPhone,30分钟。 分享这一切,让你也能复活自己的童年游戏!
Anthropic教程/实践编码
01:28
The Decoder:AI News(RSS)
38
Anthropic Claude Fable 5:价格翻倍,性能仅提升5.7%

Claude Fable 5 在 Artificial Analysis Intelligence Index 中取得 64.9 分,在十项基准测试中有五项创下纪录。相比 Opus 4.8,性能提升仅 5.7%,但 token 价格翻倍。安全过滤与回退路由功能进一步推高了成本。

Anthropic评测/基准
01:02
Rohan Paul@rohanpaul_ai
66
Anthropic从租用云算力转向自建数据中心

Anthropic正从租用云算力转向自建数据中心,计划在美国部署超1GW容量,Google可能为其租赁付款提供财务担保。此前Anthropic已承诺超10GW云服务器租赁,包括与Google的2000亿美元协议,以及Akamai、AWS、CoreWeave、Fluidstack的大型合作(含500亿美元Fluidstack合作、AWS Trainium硬件)。此外,Anthropic以每月12.5亿美元租下xAI/Colossus I数据中心全部空间,并租用Colossus II。此举旨在通过自控服务器降低长期计算成本。

The Information: Anthropic is moving forward with a plan to control its own servers for developing AI, giving it the ability to cut its c...

AnthropicGoogle行业动态部署/工程
00:40
AYi@AYi_AInotes
47
Claude Fable 5 + gpt-image 2 生图与落地页双体验

用户分别测试了Claude Fable 5与gpt-image 2的组合以及Fable 5单模型。生图场景中,用户给了一张女友照片和一句话提示词(“看NBA总决赛,身材丰满,笑靥如花,背后是特朗普”),模型自动分析敏感词,将NBA改为NBC、移除特朗普,生成的人物一致性与光影效果惊艳。另一场景,用户直接对Fable 5说“做落地页,自由发挥”,模型自主搜索2026设计趋势、调整配色动效、藏了3个彩蛋,几分钟内输出完整可用的单文件HTML。模型展现出极强的自然语言理解和主动规划能力。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

Anthropic图像生成教程/实践
00:23
TechCrunch:AI(RSS)
52
SpaceX、Anthropic 和 OpenAI 的 IPO 火热夏季

IPO 市场回暖,新缩写 MANGOS 取代 FAANG 成为领头羊——涵盖 Meta(或 Microsoft)、Anthropic、Nvidia、Google、OpenAI 和 SpaceX。其中半数公司将在同一窗口期上市,这对投资者、估值和市场承受力构成压力测试。

AnthropicOpenAI行业动态
00:14
Anthropic:Newsroom(网页)
精选73
Anthropic首次公众调查:近半美国人盼AI治愈疾病,超六成担忧失业

Anthropic对近5.2万美国人调查显示:48%将治愈癌症等疾病列为首要期望,36%希望AI帮助残障人士。64%担忧AI导致失业,56%担忧认知依赖,52%担忧信息误导。超70%支持政府监管,最关注隐私(56%)、儿童安全(52%)和责任归属(49%)。仅15%信任AI公司决策。多数议题上观点不因党派或地域严重分裂。调查于2025年11-12月由YouGov线上执行并加权至人口普查基准。

Anthropic政策/监管现象/趋势

推荐理由:Anthropic发布了一份覆盖5.2万美国人的AI民意调查,首次系统揭示了公众的恐惧排名——失业第一、认知依赖第二。虽然他们借数据推广自家政策框架的意图明显,但这两组数字对产品人理解用户心态极有价值。
6月12日
23:54
Claude@claudeai
40
Claude Fable 5 已经发布几天了。人们已经用它构建的一些项目:
Anthropic模型发布编码
23:32
Deedy@deedydas
72
Claude 5 Fable (Ultracode) "在日出时制作一个可玩的高山冰川山谷" 没有网格或模型。你所看到的一切都是数学。Fable 截取了自己作品的屏幕截图并进行了迭代。 耗时约 30 分钟,约 500k tokens,约 2500 行代码,约 25 美元。极其令人印象深刻。
Anthropic多模态模型发布编码
23:02
Ethan Mollick@emollick
72
一项发表在Nature Medicine的研究显示,通用前沿大语言模型(Google、OpenAI、Anthropic)在医学信息评估中全面优于专门的临床AI工具(OpenEvidence和UpToDate)。12名美国临床医生进行随机盲测,Frontier LLMs在三项评估中均胜出。临床AI工具的表现与自动启用的Google Search AI Overview在RCQ测试中相当。

Eric Topol: For medical information, general AI frontier models (Google, OpenAI, Anthropic) outperformed specialized @EvidenceOpen a...

AnthropicGoogleOpenAI论文/研究
22:40
Emad@EMostaque
38
如果你觉得AI估值疯狂,那就等到SpaceX、OpenAI和Anthropic都变得流通起来。 希望一些疯狂但有影响力的想法能得到资助,尤其是很多股东认为AGI即将到来,所以要么利用它要么失去它。
AnthropicOpenAI大佬观点
22:32
Rohan Paul@rohanpaul_ai
64
Anthropic 的 Dario Amodei 最新访谈:关于 Claude 在美国军事中的使用。 他表示可能会犯下"可怕的"错误。并主张 Anthropic 一直试图为其模型的使用设定限制/"红线",即使这样做会危及公司的未来。
Anthropic大佬观点安全/对齐
19:58
The Decoder:AI News(RSS)
52
Anthropic限制Mythos模型部分任务,自建应用与客户竞争引反弹

Anthropic正在限制其新模型Mythos在某些任务上的使用,同时构建与最大客户直接竞争的应用程序。这一做法引发客户、合作伙伴和投资者的反弹,批评其陷入类似微软的“平台陷阱”。

Anthropic现象/趋势
19:55
小互@xiaohu
同事件精选76
Claude Fable 5 官方指南:提示词要做减法,省钱的用法拆解

Anthropic 发布 Claude Fable 5,官方指南强调旧模型提示词会拖后腿,建议“做减法”。Fable 5 支持多天长任务、effort 分级(low/medium/high/xhigh),其 low 档性能已超旧版 Opus 4.8 xhigh。新增并行子代理调度和内置记事本能力。省钱方面:输入 $10/M、输出 $50/M(单价为 Opus 4.8 两倍),但更少的 token 消耗使复杂任务总成本反而可能更低。推荐日常用 Low 档,Medium 是性价比甜区,复杂项目可用 Fable 做编排器、Opus/Sonnet 执行。

Anthropic教程/实践编码
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
推荐理由:Claude Fable 5 强到可以删提示词,但怎么用才不浪费算力、不出怪脾气,小互这份解读把官方指南里的核心功课都替你做完了,开发者可以直接抄提示词。
19:40
AYi@AYi_AInotes
25
Claude Fable 5 推荐德州扑克训练决策能力

用户向 Claude Fable 5 提问“人这辈子最该玩什么游戏”,其回答是德州扑克。Fable 5 解释,象棋围棋虽然完美,但信息完全,胜负仅取决于算力,而现实并非如此。德州扑克训练的核心能力是:在不完整信息下做决策,并用决策质量而非最终结果评判自己。赢了可能只是运气,输了也不代表选错。推文称赞 Fable 5 能就此拆解出具体训练方法,比多数决策书籍更接地气。

Anthropic其他
17:50
Chubby♨️@kimmonismus
64
感谢 @maxpolaczuk 用 Fable 5 做了一个《魔兽世界》克隆版!:))

ZYZZ JOBS: @claudeai Fable 5 just oneshot the first open-source MMORPG 🤯 Play it on http://worldofclaudecraft.com Contribute via g...

Anthropic开源/仓库编码
17:20
Chubby♨️@kimmonismus
26
这变得荒谬地 Anthropic。完全没有问任何有问题的事情。
Anthropic其他安全/对齐
16:50
Chubby♨️@kimmonismus
70
有人刚刚随意地vibe-coded了一个魔兽世界风格的多人在线游戏,可以和朋友们一起在线玩。完全开源。 显然,Claude Fable自己找到了一套视觉上匹配的开源素材。 说实话,这相当疯狂。
Anthropic开源/仓库开源生态编码
15:03
Artificial Analysis@ArtificialAnlys
60
Artificial Analysis 更新 Coding Agent Index:DeepSWE 替换 SWE-Bench Pro,Claude Code with Fable 5 登顶

Artificial Analysis 更新 Coding Agent Index,以 Datacurve 的 DeepSWE 基准取代 SWE-Bench Pro。DeepSWE 从头编写测试任务,而非改编自公开 GitHub issue/PR,避免训练数据泄露;原 SWE-Bench Pro 存在模型从仓库提交历史恢复修复的作弊问题。换基准后排名变动:Codex with GPT-5.5 (xhigh) 从 65 升至 76,超过 Claude Code with Opus 4.8 (max) 的 73;新发布的 Claude Code with Fable 5 (max) 以 77 分直接登顶。

智能体AnthropicOpenAI编码
12:25
Claude Code:GitHub Releases(RSS)
52
Claude Code v2.1.175 发布:新增 enforceAvailableModels 管理设置

Claude Code v2.1.175 新增 enforceAvailableModels 管理设置。启用该设置后,availableModels 允许列表也会约束 Default 模型——若 Default 模型解析到被禁用的模型,则自动回退至第一个允许的模型;用户或项目设置无法再扩大受管理的 availableModels 列表。

Anthropic产品更新编码部署/工程
11:54
小互@xiaohu
精选75
小互(@xiaohu)升级了公众号排版技能组合,实现一句话完成排版、封面生成并一键发送到公众号草稿箱。该工具已开源,提供20种主题颜色可选,可自动分析内容进行排版,支持非Markdown文件。用户只需在Claude Code、Codex或OpenClaw中提供文章链接或文档位置,即可获得可视化预览界面进行选择,全程无需手动操作。

小互: 一句话搞定公众号排版、封面生成、发布 我做了个技能组合,可以一句话搞定公众号排版、封面生成,和一键发送到公众号草稿箱,你只需点下发布即可。 已经开源了 有20种主题颜色可选 最重要的是它会自动分析你的内容,进行自动排版,不是Markdown...

Anthropic图像生成开源/仓库教程/实践

推荐理由:小互把公众号排版全流程做成一个开源技能,一句话就能从内容生成到草稿箱,做公众号的可以直接用,这种自动化程度很少见。
11:17
Hacker News 热门(buzzing.cc 中文翻译)
精选74
克劳德·法布尔始终积极进取

Hacker News 上的一篇文章指出,Claude Fable 被描述为始终积极进取(relentlessly proactive)。该文发布在 simonwillison.net,标题为“Claude Fable is relentlessly proactive”,在 HN 上获得 119 个点赞。

智能体Anthropic大佬观点安全/对齐

推荐理由:Simon 的亲身实战把 Claude Fable 5 的「死磕」能力展现得淋漓尽致——为修复一个两行 CSS 问题,它自建截图工具、写 CORS 服务器、注入模板代码。这既是编程 AI 的新疆界,也暴露出沙箱外运行的巨大风险,每个用 AI 写代码的人都该警惕。
09:25
ginobefun@hongming731
58
智能体工程化三大方向:Anthropic托管Agents、阿里Harness实践、Sequoia脚手架被吞趋势

本期精讲聚焦智能体工程化:Anthropic推出Claude Managed Agents,将推理与执行解耦,独立Vault管理凭证,事件日志支持运行恢复,首字延迟p50降约六成、p95降超九成。阿里工程师分享三层加载架构(常驻入口层压至8K上下文)、dispatcher状态机及G1-G8门禁,用结构约束替代堆prompt。Sequoia访谈指出模型正逐步吸收路由、执行环境等外层脚手架,独立创业公司窗口收窄。

智能体AnthropicGoogle现象/趋势
09:25
ginobefun@hongming731
63
BestBlogs早报:Claude Managed Agents / Harness工程化 / 模型吞脚手架

Anthropic推出Claude Managed Agents,将推理循环与代码执行沙箱解耦,凭证存入独立Vault,自托管沙箱支持内网,首字延迟中位数降低六成、长尾降低九成。阿里工程师复盘Harness工程化,提出三层加载架构与G1-G8门禁。Google DeepMind的Logan Kilpatrick称模型正“吞掉”脚手架,Gemini 3.5 Flash编程能力完全来自后训练。另,Qwen3-VL-4B在支持SME2的旗舰手机上Prefill提速超80%;Fable AI实现1770%性能提升并发现关键Bug;此外涉及AI取代工程师、多智能体数字人、CFO用GPU替代加薪等讨论。

ginobefun: http://x.com/i/article/2065232915970371585

智能体AnthropicGoogle编码
09:25
Claude Code:GitHub Releases(RSS)
44
Claude Code v2.1.174 发布

新增 wheelScrollAccelerationEnabled 设置,全屏禁用鼠标滚轮加速。修复 /model 选择器:Opus 在 Max/Team Premium/Enterprise 独立行,Sonnet 在 Pro/Team,Opus 在 API 按量付费账户;修复固定 Sonnet 版本时的硬编码标签;企业账户误显示积分横幅;Bedrock GovCloud 区域前缀错误导致 400 错误;后台会话继承另一会话环境变量;macOS/Linux 退出时 1-2 秒暂停;git co-author 模型名错误;/advisor 预选被 availableModels 屏蔽;skill 热重载仅发送变更;Workflow tool 子智能体缺失归属头;预温后台 worker 空闲后认证失败。[VSCode] 在 /usage 新增过去 24h/7d 的缓存未命中、长上下文、子智能体及 skill/agent/plugin/MCP 分解归因。

Anthropic产品更新编码部署/工程
08:59
meng shao@shao__meng
74
Claude Fable 5 首日实践共识与陷阱

社区基于865条讨论与实测总结:Claude Fable 5高自主、高成本、偏规划编排。核心共识:给更难目标、少给步骤;用Fable规划→Sonnet实现→Haiku验证;免费窗口(截至6月22日)内将经验固化为Skill。Effort旋钮Medium最省token且效果接近High;付费计划下输出价约$50/M token。安全回退静默切至Opus 4.8;视觉输入(截图→应用)比文字更有效。最佳策略:跑一次业务prompt诊断,把解法蒸馏成Skill留存。

Matt Van Horn: http://x.com/i/article/2064864205749280768

智能体Anthropic教程/实践
08:34
IT之家(RSS)
66
消息称 Anthropic 寻求美国数据中心租约,希望获得谷歌母公司财务支持

Anthropic 已签署十多份美国数据中心初步租约,总容量超 1GW,同时寻求谷歌母公司 Alphabet 提供财务担保,传闻谷歌将为其共同设计芯片。2026 年 4 月,谷歌决定向 Anthropic 投资 100 亿美元,承诺后续再投 300 亿美元。作为协议部分,Anthropic 承诺五年内向谷歌云支出高达 2000 亿美元。此外,亚马逊此前已投资 40 亿美元,Anthropic 将在十年内从 AWS 采购超 1000 亿美元算力。

AnthropicGoogle行业动态部署/工程
08:26
Simon Willison 博客
79
Claude Fable 5 异常主动

开发者体验两天后,发现 Claude Fable 5 极其主动。为调试 Datasette Agent 的滚动条 bug,它在未被告知的情况下,利用 screencapture 和 pyobjc 自动截图 Safari 窗口、编写测试页面、修改模板注入 JavaScript 模拟键盘快捷键,还编写了 CORS 服务器接收浏览器数据。随后触发护栏降级为 Opus,Opus 沿用这些技巧找到并验证修复方案,将整个过程记录在报告中。

智能体Anthropic大佬观点安全/对齐
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
07:59
Rohan Paul@rohanpaul_ai
67
Anthropic CEO 谈 AI 学会最后10%的可怕之处

Anthropic CEO Dario Amodei 在 Bloomberg 采访中表示,AI 的可怕之处不在于它完成90%的工作,而是学会最后10%的时候。他指出,对于某些人来说,AI 可能不会让他们更高效,不如让 AI 直接做全部。Claude Code 创始人 Boris Cherny 对此评论称,这种感觉非常不舒服,AI 是远比我们强大的力量。

Anthropic大佬观点
07:00
Ethan Mollick@emollick
61
Ethan Mollick 指出,GPT-5.5 Pro Extended 和 Claude 5 Fable Max 在 Beninatto-Trombetti 翻译测试中失败。该测试要求将"Solo 3 parole: non sei solo"译为英语,同时将 meta-linguistic 声明从"3 parole"更新为"4 words"(正确译文:"Just 4 words: you are not alone")。但前沿模型拒绝修改措辞,即使提示扮演翻译角色仍回避变更。Valerio Capraro 认为,Claude 5 Fable 作为最新 LLM 仍无法通过此简单测试,说明 LLM 擅重组已知知识但缺乏真正理解,AGI 仍遥远。

Valerio Capraro: Claude Fable 5 doesn't truly understand. And here is a beautiful proof: The Beninatto-Trombetti test is a translation te...

AnthropicOpenAI大佬观点推理
06:50
Chubby♨️@kimmonismus
13
Anthropic 现在。
Anthropic大佬观点
‹ 上一页
1…1920212223…50
下一页 ›