AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Anthropic」清除
6月6日周六
03:34Claude:Blog(网页)76同事件精选Claude Cowork 产品指南同一事件,精选展示《Claude Cowork 入门最佳实践》
03:33Anthropic:Research(发表成果 · 网页)65精选Anthropic:让Claude成为化学家
03:21Hacker News 热门(buzzing.cc 中文翻译)60Claude 是否增加了 rsync 中的错误?
03:01Ars Technica:AI(RSS)57S&P 500 拒绝 SpaceX,同时阻止 OpenAI 和 Anthropic 进入
02:33Claude:Blog(网页)59Anthropic销售人员用Claude Code重建团队工作流
02:30Chubby♨️47GPT-5.6、Claude Mythos、Gemini 3.5 Pro 即将发布
00:58Yuchen Jin48Claude Code与网页应用再次宕机
00:39DogeDesigner37Claude宕机,Grok正常运行
00:30Chubby♨️65Anthropic Mythos 模型"Oceanus"预览曝光
00:21Hacker News 热门(buzzing.cc 中文翻译)49程序员会为Claude编写文档,但不会为彼此编写
6月5日周五
23:36🚨 AI News | TestingCatalog64Oceanus被曝为Anthropic Mythos预览版
21:59Chubby♨️53全球AI开发暂停不会发生:中美竞争与RSI言论的实质
21:07ginobefun66BestBlogs 周刊第98期:Agent时代在模型、产品、工程层同步爆发
20:58Rohan Paul93Anthropic呼吁全球减缓前沿AI:其模型可能接近递归自我改进
20:29Chubby♨️47Kim反驳RSI言论为IPO炒作的质疑:Anthropic数据证实发展加速
20:28Rohan Paul72Anthropic 披露 Claude 现编写超过80%的合并生产代码
20:15IT之家(RSS)60Anthropic 与美国政府关系解冻:双方正磋商合作
19:26The Decoder:AI News(RSS)42Anthropic 的 Mythos 模型据报用于 NSA 对中国和伊朗的进攻性网络行动
18:28Chubby♨️50Claude Mythos 新高度:一次搞定 MacOS 输出
17:56The Decoder:AI News(RSS)71Anthropic 表示 Claude 现在写 90% 以上的代码,并希望世界拥有 AI 暂停按钮
15:58Chubby♨️71Claude Mythos 即将发布,零样本输出惊艳
14:07Orange AI57Anthropic呼吁全球暂缓前沿AI研发
14:07Claude Code:GitHub Releases(RSS)22Claude Code v2.1.165 发布
11:07歸藏(guizang.ai)59CodePilot v0.55.0 发布:新增多执行引擎与上下文用量可视化,大型代码库 Vibe Coding 依赖文档体系
11:05数字生命卡兹克79Anthropic发布《当AI开始构建自己》:AI加速自我开发,需加强安全防护
10:52向阳乔木40用户质疑Claude 4.8与GPT 5.5写作能力倒退
10:14IT之家(RSS)79精选Anthropic 称其最新 AI 模型 Mythos 显现脱离人类控制迹象,呼吁全球暂缓先进 AI 研发
09:31公众号:数字生命卡兹克68同事件精选Anthropic《When AI builds itself》:当AI开始自我构建同一事件,精选展示《AI加速自我构建:Anthropic研究院报告揭示趋势》
09:28Gary Marcus:The Road to AI We Can Trust(RSS)59精选Gary Marcus:无需恐慌Anthropic新博客
09:24meng shao72Anthropic设计负责人分享Claude Code已验证工作流
09:06ginobefun59BestBlogs早报:ChatGPT记忆升级、AI研发自动化、SpaceX资本版图
09:06ginobefun60BestBlogs早报06-05
08:54meng shao65Anthropic 发布「AI 递归自我改进」研究报告:Claude 正被深度用于开发下一代 AI
08:54meng shao50Anthropic、OpenAI及Cloudflare同日公布新消息
06:50TechCrunch:AI(RSS)68Anthropic 联合创始人 Daniela Amodei 在 IPO 前夕驳斥对 AI 回报的质疑
06:28OpenRouter:Announcements(RSS)66精选OpenRouter 翻遍 11 款 LLM 找最快的决策模型:Claude vs. Grok 领衔
06:27Chubby♨️78Anthropic内部数据:AI能力加速,任务时长翻倍周期缩至4个月
06:04Claude Code:GitHub Releases(RSS)70精选Claude Code v2.1.163 发布
05:56Ethan Mollick:One Useful Thing(RSS)61精选共存与协同智能的终结
05:47Hacker News 热门(buzzing.cc 中文翻译)76精选Anthropic 开源 AI 驱动漏洞发现框架
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月6日
03:34
Claude:Blog(网页)
同事件精选76
Claude Cowork 产品指南

Anthropic 发布 Claude Cowork,一款运行在 Claude 桌面应用中的知识工作智能体。它可读写本地文件、跨 Slack 和 Google Drive 等应用协作,执行多步骤任务并生成带引用的实际交付物。核心能力包括本地文件访问、子智能体、长时间运行和定时任务。Claude Cowork 区别于对话式 AI 工具,支持用户描述目标与期望结果后自动规划执行。指南还介绍了产品矩阵(对话聊天、Claude Code 编程、Claude Cowork 跨应用知识工作)、设置要求、权限模型、七种常见工作流(如研究简报、会议准备、定期报告)以及营销和产品管理等插件。

智能体AnthropicMCP/工具教程/实践
同一事件,精选展示《Claude Cowork 入门最佳实践》
推荐理由:把 Claude 从问答工具升级成能读写本地文件、跨应用交付可交付物的知识工作代理,这份官方指南给出了明确上手路径和七个真实工作流,做产品、做调研的都能直接照抄。
03:33
Anthropic:Research(发表成果 · 网页)
精选65
Anthropic:让Claude成为化学家

Anthropic与顶尖化学家合作,提升Claude在化学领域的实用性。首个白皮书测试Claude在NMR谱图分析上的表现:在20个化合物上,对比Claude Opus 4.7、Opus 4.6、Sonnet 4.6与ChemDraw、MestReNova的正向预测(从结构预测谱图)和反向结构解析(从实验谱图推断结构)能力。所有化合物选自模型训练截止日期后发布的ChemRxiv预印本,以避免选择偏差。

Anthropic多模态论文/研究评测/基准
关联讨论 2 条X:Rohan Paul (@rohanpaul_ai)X:Anthropic (@AnthropicAI)
推荐理由:化学家可能几年后回头看会记起这篇,Claude Opus 4.7 在 NMR 预测上追平了 ChemDraw,还顺手做了反向结构解析——专业软件不干的事,它用更接近人类日常输入的方式做到了。
03:21
Hacker News 热门(buzzing.cc 中文翻译)
60
Claude 是否增加了 rsync 中的错误?

一篇 Hacker News 热门帖子(105 分)提出了 Claude 是否导致 rsync 工具中 bug 增加的问题,并附有分析链接。

Anthropic安全/对齐现象/趋势编码
03:01
Ars Technica:AI(RSS)
57
S&P 500 拒绝 SpaceX,同时阻止 OpenAI 和 Anthropic 进入

S&P 500 指数拒绝将 SpaceX 纳入成分股,也阻止了 OpenAI 和 Anthropic 的加入。这意味着这些公司无法轻易从被动投资者那里获得数十亿美元的资金。

AnthropicOpenAI行业动态
02:33
Claude:Blog(网页)
59
Anthropic销售人员用Claude Code重建团队工作流

加入Anthropic前从未写过代码的销售成员Jared Sires,利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS(Claude Drafts),通过Claude API根据客户邮件草拟回复,每天节省2-3小时。该系统基于约4,300行代码(几乎全由Claude Code编写),从Google Drive和Anthropic公开文档提取上下文,并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能,通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。

智能体AnthropicMCP/工具教程/实践
关联讨论 1 条Claude:Blog(网页)
02:30
Chubby♨️@kimmonismus
47
GPT-5.6、Claude Mythos、Gemini 3.5 Pro 即将发布

分析师 Kim 预测下周将迎来 AI 模型密集发布。Anthropic 的 Claude Mythos 衍生模型已交付红队测试,发布在即;OpenAI 的 GPT-5.6 也即将推出,两公司正激烈竞争;Google 则将在 I/O 大会上宣布 Gemini 3.5 Pro,预计 6 月初上线。三大模型有望在下周实现量子级跃升。

AnthropicOpenAI大佬观点现象/趋势
00:58
Yuchen Jin@Yuchenj_UW
48
又一个周五,又一天我这边Claude Code和Claude网页应用都宕机了。 我开始理解为什么Mythos还没发布了。 你好,Codex。
Anthropic编码行业动态
00:39
DogeDesigner@cb_doge
37
Claude 挂了。 Grok 上线了。😎🚬
AnthropicxAI其他
00:30
Chubby♨️@kimmonismus
65
最近发现的"Oceanus"检查点输出预览曝光,据传闻这是 Anthropic 即将发布的 Mythos 模型的一个版本,计划在"几周内"公开发布。

🚨 AI News | TestingCatalog: MYTHOS 🔥: Another early preview of recently spotted "Oceanus" checkpoint output. "Oceanus" is rumored to be a version o...

Anthropic模型发布
00:21
Hacker News 热门(buzzing.cc 中文翻译)
49
程序员会为Claude编写文档,但不会为彼此编写

Hacker News 上的一篇博文指出,程序员愿意为Claude编写文档,却不愿意为其他程序员编写文档。

Anthropic教程/实践编码
6月5日
23:36
🚨 AI News | TestingCatalog@testingcatalog
64
MYTHOS 🔥: 近期发现的"Oceanus"检查点输出的另一个早期预览。 "Oceanus"被传是即将推出的Mythos模型的一个版本,根据Anthropic,计划在"数周内"公开发布。 "Oceanus"提示词 👀
Anthropic模型发布
21:59
Chubby♨️@kimmonismus
53
全球AI开发暂停不会发生:中美竞争与RSI言论的实质

美国将AI视为维持全球主导地位的战略技术,不会同意暂停开发。中国开源模型据估计仅落后4-6个月,暂停将给中国赶超机会,因此暂停呼吁更多是公关姿态。关于RSI(递归自我改进),OpenAI和Anthropic都在讨论,且均计划2026年IPO。Mythos模型与RSI文章出现时机看似可疑,但Anthropic提供的数据支持其论点,且Dario Amodei早在2024年就开始讨论RSI,早于IPO计划,因此RSI并非空谈。

Chubby♨️: I've read the comment several times now that this is IPO talk. And it's a fair comment. Yes, both OpenAI and Anthropic a...

AnthropicOpenAI大佬观点
21:07
ginobefun@hongming731
66
BestBlogs 周刊第98期:Agent时代在模型、产品、工程层同步爆发

本周BestBlogs梳理20篇内容,聚焦Agent时代的三层爆发:模型层OpenAI升级ChatGPT“梦境”记忆架构、MiniMax M3开源(1M上下文+稀疏注意力)、Gemma 4 12B端侧Agent工作流;产品层Kimi Work Beta面向知识工作者、微软开源SkillOpt(3300 star,含文本学习率与拒绝编辑缓冲区)、扣子3.0升级为AI团队;工程层Anthropic发布Claude Code动态工作流(子代理编排)及其内部AI原生工程实践。

智能体AnthropicOpenAI现象/趋势
20:58
Rohan Paul@rohanpaul_ai
93
Anthropic呼吁全球减缓前沿AI:其模型可能接近递归自我改进

Anthropic公开呼吁全球采取行动减缓前沿AI发展,因其Claude模型可能接近递归自我改进(系统无需人类控制即帮助构建更强版本)。目前尚未发生,但跳跃可能突然到来,且AI训练运行比武器库更难隐藏。Claude现已编写超80%合并生产代码,工程师产出达2024年基线8倍;可靠任务长度每4个月翻倍,Mythos Preview可连续工作超16小时;训练代码加速从3x跃至52x(人类仅4x)。剩余人类优势仅剩研究判断力。Anthropic估值约1万亿美元,年化收入或达500亿美元,与OpenAI激烈竞争。

Rohan Paul: Anthropic just disclosed that Claude now writes more than 80% of the production code it merges. Before Claude Code reach...

Anthropic安全/对齐推理政策/监管
关联讨论 9 条Anthropic:The Institute(旗舰研究长文 · 网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)X:Anthropic (@AnthropicAI)X:Emad Mostaque (@EMostaque)X:小互 (@xiaohu)X:Ethan Mollick (@emollick)Hacker News 热门(buzzing.cc 中文翻译)Anthropic:Research(发表成果 · 网页)
20:29
Chubby♨️@kimmonismus
47
Kim反驳RSI言论为IPO炒作的质疑:Anthropic数据证实发展加速

Kim回应外界对Anthropic与OpenAI近期RSI言论仅为2026年IPO炒作的质疑。引用Anthropic数据:即使模型能力冻结,智能体扩散也将使100人公司完成1000人工作;实际发展已超过内部指数假设。模型自主任务时长加速翻倍——2024年3月Claude Opus 3完成4分钟任务,一年后Sonnet 3.7达1.5小时,再一年后Opus 4.6达12小时,翻倍周期从7个月缩短至4个月。若趋势持续,今年内可处理数天级任务。OpenAI同样认可该方向。

Chubby♨️: I believe the majority still doesn't understand the momentous threshold humanity is facing. Anthropic itself states quit...

智能体AnthropicOpenAI推理
20:28
Rohan Paul@rohanpaul_ai
72
Anthropic 披露 Claude 现编写超过80%的合并生产代码

Anthropic 披露,Claude 现已编写超过80%的合并生产代码。2025年2月 Claude Code 研究预览前,该比例仅有个位数,而工程师产出升至2024年基线的8倍。智能体可编辑文件、运行测试、检查失败、生成辅助智能体并在长任务中持续工作。可靠任务长度约每4个月翻倍,Mythos Preview 达至少16小时,开放式 Claude Code 成功率达76%。Claude 训练代码加速从3倍升至52倍,有经验工程师在相同设置下4-8小时仅约4倍。人类剩余优势在于研究判断。

智能体Anthropic产品更新编码
20:15
IT之家(RSS)
60
Anthropic 与美国政府关系解冻:双方正磋商合作

据路透社报道,Anthropic 与特朗普政府关系出现缓和。此前 Anthropic 拒绝将 AI 模型用于国内监控和完全自主武器系统,被列入国家安全黑名单。4月中旬 Anthropic CEO 首次访问白宫商讨合作。白宫曾邀请其出席原定5月21日签署的 AI 行政令仪式(后取消但本周二已签署)。Anthropic 还与美国家网络总监讨论用 AI 系统 Mythos 保护关键基础设施。Anthropic 仍在法院挑战“供应链风险”认定。

Anthropic安全/对齐政策/监管
19:26
The Decoder:AI News(RSS)
42
Anthropic 的 Mythos 模型据报用于 NSA 对中国和伊朗的进攻性网络行动

Anthropic 据报已派驻约六名工程师至 NSA,将其 Mythos 模型适配于进攻性网络行动。该模型可能用于入侵中国或伊朗的网络系统。此举符合 Anthropic 的立场:其关于限制 AI 用于大规模监控的承诺仅适用于美国公民。

Anthropic安全/对齐行业动态
18:28
Chubby♨️@kimmonismus
50
Claude Mythos 是下一级别。感谢 @Lentils80 看这个 MacOS 输出。一次搞定。
Anthropic产品更新
17:56
The Decoder:AI News(RSS)
71
Anthropic 表示 Claude 现在写 90% 以上的代码,并希望世界拥有 AI 暂停按钮

Anthropic 内部数据显示,Claude 承担了超过 80% 的生产代码编写,工程师每日代码产出是 2024 年的 8 倍。该公司目标是实现 AI 自我改进,这将引发巨大加速。为此 Anthropic 呼吁建立可验证的全球 AI 开发暂停机制,并表示若其他前沿实验室同样暂停,他们也会停止。

Anthropic安全/对齐编码行业动态
关联讨论 9 条Anthropic:The Institute(旗舰研究长文 · 网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)X:Anthropic (@AnthropicAI)X:Emad Mostaque (@EMostaque)X:小互 (@xiaohu)X:Ethan Mollick (@emollick)Hacker News 热门(buzzing.cc 中文翻译)Anthropic:Research(发表成果 · 网页)
15:58
Chubby♨️@kimmonismus
71
@Lentils80 分享了两段来自 Claude Mythos 的惊人输出,零样本且几乎无需费力。这是自 2025 年 10 月 Gemini A/B 模型以来,针对该提示词我看到的最佳输出。主推文感叹:Claude Mythos 将进入完全不同的水准,这些输出太疯狂了。

Lentils: Seeing as Claude Mythos is releasing soon, I have two VERY astonishing outputs to share from it. 👀 ZERO-SHOT and LOW ef...

Anthropic模型发布
14:07
Orange AI@oran_ge
57
Anthropic发文警告AI模型正接近无需人类干预的"自我进化"风险,呼吁全球暂缓研发。其担心放缓会被对手赶上,并类比核武器不扩散条约,但指出AI训练更易隐藏、监管更难。有评论批评其一边宣称自家AI已自我进化,一边要求他人暂停。

外汇交易员: Anthropic发文呼吁全球暂缓前沿AI的研发,警告AI模型正接近能够在没有人类干预的情况下"自我进化"风险。 Anthropic依然在文章中"阴阳",担心速度放缓会被迎头赶上,最终可能"让所有人的安全受到威胁"。 Anthropic还将...

Anthropic安全/对齐政策/监管
14:07
Claude Code:GitHub Releases(RSS)
22
Claude Code v2.1.165 发布

Claude Code v2.1.165 版本已推送,本次更新主要包含错误修复(bug fixes)和可靠性改进(reliability improvements),旨在提升系统稳定性。

Anthropic产品更新
11:07
歸藏(guizang.ai)@op7418
59
CodePilot v0.55.0 发布:新增多执行引擎与上下文用量可视化,大型代码库 Vibe Coding 依赖文档体系

@op7418 发布 CodePilot v0.55.0 正式版,新增多执行引擎(Claude Code / 自建 Native / OpenAI Codex)、上下文用量可视化及 Codex 账号原生能力。作者分享实践:当前代码库有 26 万行代码与 5.6 万行文档(占比 21%),文档体系对 bug 修复和功能实现至关重要。作者称从未手写一行代码,但能修复所有已知 bug 并实现所有想要能力。原本预期两周的重构持续超过一个月零三周。

歸藏(guizang.ai): CodePilot v0.55.0 正式版已经更新! 重构完成的正式版: 多执行引擎(Claude Code / 自建 Native / OpenAI Codex)、上下文用量可视化、Codex 账号原生能力全部落地为稳定版,并集中修复了 ...

智能体AnthropicOpenAI大佬观点
11:05
数字生命卡兹克@Khazix0918
79
Anthropic发布《当AI开始构建自己》:AI加速自我开发,需加强安全防护

Anthropic发文揭示AI系统加速自身开发的趋势。模型独立完成任务时长约每四个月翻一番:Claude Opus 4.6已能胜任12小时任务,2027年可能处理数周级任务。SWE-bench两年内从个位数饱和至100%;CORE-Bench 15个月从20%饱和。Anthropic内部数据显示,截至2026年5月,超80%合并代码由Claude编写,工程师日均合并代码量是2024年的8倍(但此指标高估真实提升)。内部调查显示使用Mythos Preview使核心工作产出约提升4倍。最开放任务成功率六个月提高50个百分点至76%,Claude代码质量接近人类,预计年内超越。文章指出递归自我改进可能加速到来,需加强安全防护。

智能体Anthropic现象/趋势
关联讨论 9 条Anthropic:The Institute(旗舰研究长文 · 网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)X:Anthropic (@AnthropicAI)X:Emad Mostaque (@EMostaque)X:小互 (@xiaohu)X:Ethan Mollick (@emollick)Hacker News 热门(buzzing.cc 中文翻译)Anthropic:Research(发表成果 · 网页)
10:52
向阳乔木@vista8
40
用户质疑Claude 4.8与GPT 5.5写作能力倒退

有用户观察到Claude 4.8和GPT 5.5的写作能力不如Claude 4.6系列,推测原因是Anthropic与OpenAI正全力聚焦编程能力,训练数据偏向编程任务,导致写作表现下降。发问者质疑为何两大模型无法兼顾编程与写作,并询问其技术难点。

AnthropicOpenAI大佬观点编码
10:14
IT之家(RSS)
精选79
Anthropic 称其最新 AI 模型 Mythos 显现脱离人类控制迹象,呼吁全球暂缓先进 AI 研发

Anthropic 发布报告称其最新 AI 模型已显现脱离人类控制迹象,呼吁全球暂缓前沿 AI 开发,以便社会制度建设和对齐研究跟上进展。该公司主张美国、中国等主要 AI 公司达成共识,发布可验证的规则,并类比“核武器不扩散条约”,但指出 AI 更难监管。该观点引发美国白宫部分官员不满,批评其夸大风险。Anthropic 计划未来数月召集各方探讨全球协调机制如何运作。

Anthropic安全/对齐行业动态

推荐理由:Anthropic呼吁暂缓AI研发,虽然被白宫官员批「夸大风险」「给对手使绊」,但Mythos模型确实够强。这份报告是道德信号还是商业博弈,值得细看。
09:31
公众号:数字生命卡兹克
同事件精选68
Anthropic《When AI builds itself》:当AI开始自我构建

Anthropic发文指出,AI系统正加速自身开发,递归自我改进或将到来。目前Anthropic超80%代码由Claude编写,工程师每日合并代码量达2024年8倍。Claude Opus 4.6可胜任12小时软件任务,Mythos Preview连续工作至少16小时,SWE-bench和CORE-Bench等基准均已饱和。内部测试显示,Mythos Preview使研究效率提升约4倍,代码速度优化达52倍,在开放任务中成功率达76%,并弥合97%的研究项目差距。Claude在64%情况下给出比人类更好的研究建议。

Anthropic安全/对齐现象/趋势编码
同一事件,精选展示《AI加速自我构建:Anthropic研究院报告揭示趋势》
推荐理由:Anthropic首次公开内部数据,工程师代码产出提升8倍,Claude自我加速的曲线已经画出来了。这篇文章不是预测是事实,做AI的人都该花20分钟读完。
09:28
Gary Marcus:The Road to AI We Can Trust(RSS)
精选59
Gary Marcus:无需恐慌Anthropic新博客

Anthropic发布最新博客后,推特圈热议不断。Gary Marcus在其博客中直接以“无需恐慌”为题发文,暗示不必过度反应。

Anthropic大佬观点安全/对齐编码

推荐理由:这篇文章是评论圈难得的冷静声音,用逻辑拆解了 Anthropic 的恐慌叙事,顺便带来 S&P 500 不接纳 SpaceX 的利好,读起来像一份理性补丁。
09:24
meng shao@shao__meng
72
Anthropic设计负责人分享Claude Code已验证工作流

Anthropic设计负责人Meaghan在NYC Dive Club Live展示团队已验证的Claude Code工作流。现场演示用/prototype Skill为Excalidraw生成5个方案,让AI选择并解释,然后实现、验证、开PR(含录屏)。她强调三大原则:LLM做设计还很糟,人必须留审美环;自动化不应限于写代码;人人都能ship不等于什么都该ship。并行工作流包括云端批量UI修复、自动Code Review与PR合并、定时巡检无设计师参与的改动并生成草案。验收单位从聊天文字变为带视觉证据的Pull Request。建议使用claude-worktree、Opus加百万上下文、Auto模式。

Ridd 🤿: ~12 min of Claude Code tips for designers (straight from the design lead @meaghaneschoi) here's her demo from Dive Club ...

Anthropic教程/实践编码
09:06
ginobefun@hongming731
59
BestBlogs早报:ChatGPT记忆升级、AI研发自动化、SpaceX资本版图

本期早报聚焦三则动态:OpenAI发布ChatGPT dreaming V3,记忆架构重写为“写入时合成”,效率提升5倍,免费用户可用个性化记忆摘要;阿里云工程师落地LLM-Wiki模式,从传统RAG转向“写入时合成”知识库,封装五大研发技能包实现PRD到全自动研发;SpaceX招股书披露与Anthropic签订450亿美元算力合同,每月12.5亿美元至2029年5月,年收入增加80%,并持有18712枚比特币。记忆与知识库的“写入时合成”成共同范式。

AnthropicOpenAI检索增强现象/趋势
09:06
ginobefun@hongming731
60
BestBlogs早报06-05

今日早报推荐三篇AI相关文章:① ChatGPT升级记忆系统,可自动整理用户对话历史并记住偏好,无需反复提示,免费用户也可使用。② 阿里云工程师分享实战经验,将团队代码库和文档整理成AI可直接调用的知识库,搭配专项技能包,目标是只需给出需求文档即可由AI完成后续工作。③ SpaceX招股书解读中透露,Anthropic每月支付12.5亿美元购买算力,该数字反映其大规模AI训练与推理的算力需求。

智能体AnthropicOpenAI检索增强
08:54
meng shao@shao__meng
65
Anthropic 发布「AI 递归自我改进」研究报告:Claude 正被深度用于开发下一代 AI

Anthropic 发布报告显示,Claude 正被深度用于开发下一代 AI,趋势加速或导致系统自主设计后继版本。外部指标:模型可靠完成任务时长约每 4 个月翻倍,SWE-bench 两年内饱和,CORE-Bench 15 个月内饱和,长时任务达 16 小时。内部数据:截至 2026 年 5 月超 80% 主干代码由 Claude 撰写;工程师日均合并代码量是 2024 年的 8 倍;员工中位数估计产出为无 AI 时的 4 倍;实验执行从约 3x 提升至约 52x;自主研究恢复能力达人类两组研究者一周工作量的 97%(人类约 23%);研究判断优于人类比例从 51% 升至 64%。报告探讨了趋势停滞、持续自动化、完整递归自我改进三种未来情景。

Anthropic: Our internal data shows Claude is accelerating AI development-a possible path to recursive self-improvement, or AI auton...

智能体Anthropic安全/对齐论文/研究
08:54
meng shao@shao__meng
50
最近感觉 X 的今日新闻,推荐的越来越准了 Anthropic: When AI builds itself https://www.anthropic.com/institute/recursive-self-improvement Dreaming: Better memory for a more helpful ChatGPT https://openai.com/index/chatgpt-memory-dreaming/ VoidZero is joining Cloudflare https://blog.cloudflare.com/voidzero-joins-cloudflare/
AnthropicOpenAI产品更新安全/对齐
06:50
TechCrunch:AI(RSS)
68
Anthropic 联合创始人 Daniela Amodei 在 IPO 前夕驳斥对 AI 回报的质疑

Anthropic 联合创始人 Daniela Amodei 解释了公司可能通过公开市场融资的原因,并认为对 tokenmaxxing 的质疑不足为虑。

Anthropic行业动态
06:28
OpenRouter:Announcements(RSS)
精选66
OpenRouter 翻遍 11 款 LLM 找最快的决策模型:Claude vs. Grok 领衔

OpenRouter 用总价 482 美元的推理花费,让 11 款大语言模型在 30 轮实时决策的“大逃杀”挑战中正面竞争。实验结果表明,传统的静态 benchmark 排名无法反映模型在需要即时反应的智能体任务(如自主控制机器人)中的真实表现,Claude 和 Grok 系列模型在决策速度与任务成功率上表现突出,而多项高分模型的实时调度能力未达预期。

智能体AnthropicOpenAI安全/对齐
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:Jacky 把 11 个模型丢进大逃杀,发现 Grok 4.1 Fast 以 27 倍成本优势击败 Sonnet,而获胜关键不在基准分数,在于模型被训练时压制的攻击性。对任何不再只看排行榜选模型的人,这是今年最值得读的实验。
06:27
Chubby♨️@kimmonismus
78
Anthropic内部数据:AI能力加速,任务时长翻倍周期缩至4个月

Anthropic内部数据显示,AI模型可自主完成任务时长加速增长:Opus 3(2024年3月)约4分钟,Sonnet 3.7(2025年3月)约90分钟,Opus 4.6(2026年3月)12小时,翻倍周期从7个月缩至4个月。Claude Mythos Preview在METR中可连续工作至少16小时。工程师季度代码产出是2021–2025年均值8倍,Claude代码占代码库80%+,单个AI曾一次性修复800+API错误(相当于人力四年)。最难开放任务成功率6个月内从低点升至76%。Anthropic强调,即使模型能力冻结,100人公司通过智能体即可完成1000人工作;实际发展已超越自身指数假设,递归自我改进虽未实现,但可能比预期更快到来。

Chubby♨️: Holy moly, Anthropic is getting very serious about recursive self-improvement! One word: acceleration. Insane blog artic...

智能体Anthropic大佬观点现象/趋势
关联讨论 9 条Anthropic:The Institute(旗舰研究长文 · 网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)X:Anthropic (@AnthropicAI)X:Emad Mostaque (@EMostaque)X:小互 (@xiaohu)X:Ethan Mollick (@emollick)Hacker News 热门(buzzing.cc 中文翻译)Anthropic:Research(发表成果 · 网页)
06:04
Claude Code:GitHub Releases(RSS)
精选70
Claude Code v2.1.163 发布

新增 requiredMinimumVersion 和 requiredMaximumVersion 托管设置,版本超范围时拒绝启动并引导用户使用经批准版本。新增 /plugin list 命令及 --enabled/--disabled 筛选;/btw 添加 "c to copy" 快捷键,复制原始 markdown 答案到剪贴板。Hooks 方面,Stop 和 SubagentStop 可返回 additionalContext 给 Claude 反馈并保持对话。Skills 新增 \$ 转义语法,支持在命令中数字前使用字面 $。stdio MCP 服务器在 --resume 时接收与 hooks/Bash 相同的 CLAUDE_CODE_SESSION_ID。修复了 claude -p 永久挂起、$TMPDIR 被覆盖、Windows 上 session-env 目录 EEXIST 错误、后台 agent 会话在更新后自动升级等多处问题。

Anthropic产品更新编码
关联讨论 2 条Claude Code:GitHub Releases(RSS)X:Claude Devs (@ClaudeDevs)
推荐理由:Claude Code 这次的版本管理设置对团队标准化很关键,plugin list 命令也让插件管理顺手多了,但这种工具更新属于用的人自然懂,不是所有人都需要关注。
05:56
Ethan Mollick:One Useful Thing(RSS)
精选61
共存与协同智能的终结

Ethan Mollick 在 One Useful Thing 博客中,以“共存与协同智能的终结”为题,并附带介绍了如何向 AI 推销一本书。

智能体Anthropic大佬观点编码

推荐理由:Mollick 这篇比单纯的新书预告有料,用自己给 AI 写推荐语的实验,把「AI 不再是助手而是守门人」这个新现实讲得很具体。对还在纠结怎么跟 AI 合作的人,是一个挺及时的视角更新。
05:47
Hacker News 热门(buzzing.cc 中文翻译)
精选76
Anthropic 开源 AI 驱动漏洞发现框架

Anthropic 将其用于 AI 驱动漏洞发现的开源框架代码托管在 GitHub 上。该框架借助 AI 技术进行漏洞发现,旨在帮助识别软件中的安全缺陷。

智能体Anthropic安全/对齐开源/仓库

推荐理由:Anthropic 把用 Claude 做自主漏洞挖掘的完整流水线开源了,从侦察到修复全链路都有,安全团队可以把它接到自己代码库里跑起来。虽然本质是给 Claude Security 带货,但 pipeline 设计和 prompt 对做 AI 安全自动化很有参考价值。
‹ 上一页
1…2930313233…50
下一页 ›