AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 983 条
全部一手资讯X论文
标签「Anthropic」清除
6月9日周二
03:02Hacker News 热门(buzzing.cc 中文翻译)62xAI看起来更像是一家数据中心房地产投资信托基金,而非前沿实验室
02:50Claude:Blog(网页)72精选Claude 为 Connector 开发者推出性能监控仪表盘
01:46Anthropic:Research(发表成果 · 网页)77精选为生物学AI智能体铺路
00:41Tomer Tunguz 博客(VC 分析)56精选AI 替代浪潮:三大力量重塑成本结构
6月8日周一
04:33TechCrunch:AI(RSS)52大型AI公司计划上市引发价格上涨担忧
02:03TechCrunch:AI(RSS)45Notion 恢复 Anthropic 服务后产品负责人震惊于转发量
00:58Hacker News 热门(buzzing.cc 中文翻译)61美国人工智能的OnlyFans经济
00:00Anthropic:Research(发表成果 · 网页)79同事件精选Anthropic研究:大语言模型加速N-day漏洞利用自动化同一事件,精选展示《Anthropic 联合研究者测量 Claude Mythos Preview 漏洞利用能力》
6月7日周日
22:58Hacker News 热门(buzzing.cc 中文翻译)47Anthropic,请发布适用于 Linux 的官方 Claude Desktop 版本
16:35The Decoder:AI News(RSS)62Anthropic 挖走 OpenAI 定制芯片项目第二号硬件工程师,两家公司均在冲刺 IPO
15:19IT之家(RSS)53OpenAI 芯片团队元老 Clive Chan 出走,跳槽 Anthropic
08:19IT之家(RSS)55微软警告:Claude Code存在提示词注入漏洞,可致GitHub凭证泄露
08:09Claude Code:GitHub Releases(RSS)31Claude Code v2.1.168 发布
6月6日周六
21:59The Decoder:AI News(RSS)59Sakana AI 押注能自我改进的 AI,欲打破前沿实验室的算力军备竞赛
19:34OpenRouter:Announcements(RSS)75同事件精选OpenRouter 30 场 AI 大逃杀:11 个 LLM 对决,Claude 与 Grok 谁更优?同一事件,精选展示《OpenRouter 翻遍 11 款 LLM 找最快的决策模型:Claude vs. Grok 领衔》
19:29The Decoder:AI News(RSS)59xAI 被曝数月来用 Claude 训练编码模型,被切断访问后仍通过私人账户和 Blackbox AI 继续
17:17IT之家(RSS)65Ramp:美国企业 AI 成本飙升,DeepSeek 成为 B2B 市场新宠
17:17IT之家(RSS)54Anthropic被曝雇1000名工程师训练Claude Code,每项任务280美元
14:22Hacker News 热门(buzzing.cc 中文翻译)68标普500指数拒绝纳入SpaceX,同时也不允许OpenAI和Anthropic入选
10:07Claude Code:GitHub Releases(RSS)35Claude Code v2.1.167 发布
09:32Gary Marcus:The Road to AI We Can Trust(RSS)35No, Anthropic did not call for a pause on AI development
09:07Claude Code:GitHub Releases(RSS)64同事件精选Claude Code v2.1.166 发布同一事件,精选展示《Claude Code v2.1.163 发布》
08:16IT之家(RSS)48IT早报:Anthropic呼吁全球暂缓AI研发,腾讯大部分代码由AI生成,华为云联合多模型厂商发布生态计划
03:34Claude:Blog(网页)76同事件精选Claude Cowork 产品指南同一事件,精选展示《Claude Cowork 入门最佳实践》
03:33Anthropic:Research(发表成果 · 网页)65精选Anthropic:让Claude成为化学家
03:21Hacker News 热门(buzzing.cc 中文翻译)60Claude 是否增加了 rsync 中的错误?
03:01Ars Technica:AI(RSS)57S&P 500 拒绝 SpaceX,同时阻止 OpenAI 和 Anthropic 进入
02:33Claude:Blog(网页)59Anthropic销售人员用Claude Code重建团队工作流
00:21Hacker News 热门(buzzing.cc 中文翻译)49程序员会为Claude编写文档,但不会为彼此编写
6月5日周五
20:15IT之家(RSS)60Anthropic 与美国政府关系解冻:双方正磋商合作
19:26The Decoder:AI News(RSS)42Anthropic 的 Mythos 模型据报用于 NSA 对中国和伊朗的进攻性网络行动
17:56The Decoder:AI News(RSS)71Anthropic 表示 Claude 现在写 90% 以上的代码,并希望世界拥有 AI 暂停按钮
14:07Claude Code:GitHub Releases(RSS)22Claude Code v2.1.165 发布
10:14IT之家(RSS)79精选Anthropic 称其最新 AI 模型 Mythos 显现脱离人类控制迹象,呼吁全球暂缓先进 AI 研发
09:31公众号:数字生命卡兹克68同事件精选Anthropic《When AI builds itself》:当AI开始自我构建同一事件,精选展示《AI加速自我构建:Anthropic研究院报告揭示趋势》
09:28Gary Marcus:The Road to AI We Can Trust(RSS)59精选Gary Marcus:无需恐慌Anthropic新博客
06:50TechCrunch:AI(RSS)68Anthropic 联合创始人 Daniela Amodei 在 IPO 前夕驳斥对 AI 回报的质疑
06:28OpenRouter:Announcements(RSS)66精选OpenRouter 翻遍 11 款 LLM 找最快的决策模型:Claude vs. Grok 领衔
06:04Claude Code:GitHub Releases(RSS)70精选Claude Code v2.1.163 发布
05:56Ethan Mollick:One Useful Thing(RSS)61精选共存与协同智能的终结
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月9日
03:02
Hacker News 热门(buzzing.cc 中文翻译)
62
xAI看起来更像是一家数据中心房地产投资信托基金,而非前沿实验室

xAI在资产结构和运营模式上被比作数据中心REIT,而非传统的前沿AI实验室,这一观点来自martinalderson.com的分析文章。

AnthropicxAI数据/训练现象/趋势
02:50
Claude:Blog(网页)
精选72
Claude 为 Connector 开发者推出性能监控仪表盘

Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。

AnthropicMCP/工具产品更新
关联讨论 1 条X:Claude Devs (@ClaudeDevs)
推荐理由:Claude给connector开发者加了仪表板,能跟踪用量和错误,还能直接提交到目录,做MCP集成的省了监控的麻烦,即开即用。
01:46
Anthropic:Research(发表成果 · 网页)
精选77
为生物学AI智能体铺路

一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后,准确率接近100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。

智能体Anthropic论文/研究

推荐理由:再强的模型在 NCBI Virus 上检索病毒序列都会翻车,Anthropic 加了个确定性检索层后准确率飙到近 100%。做 AI for science 的人该看看这个基础设施层的解法。
00:41
Tomer Tunguz 博客(VC 分析)
精选56
AI 替代浪潮:三大力量重塑成本结构

三大力量重塑 AI 成本:前沿闭源模型持续涨价,开源模型在多数场景已足够好,买家开始替代。Coinbase 将提示词路由至更便宜模型,成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4,节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%,超越 Opus 的 14%,同一 100 任务成本 $84 vs $954(约 11 倍价差)。Cursor 后训练 Kimi K2.5 得到 Composer 2.5,称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵,开源平价且性能接近,选择决定企业单位经济学的斜率。

AnthropicDeepSeek开源生态推理

推荐理由:Tunguz 用 Coinbase、Lindy 等真实案例,把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了,做 AI 应用的人该重新算一下单位经济账。
6月8日
04:33
TechCrunch:AI(RSS)
52
大型AI公司计划上市引发价格上涨担忧

大型AI公司计划上市,预计未来将出现更多价格上涨。原文标题探讨这是否标志着Tokenpocalypse的开端。

AnthropicGitHubMicrosoft现象/趋势
02:03
TechCrunch:AI(RSS)
45
Notion 恢复 Anthropic 服务后产品负责人震惊于转发量

Notion 恢复了对 Anthropic 的访问。其产品负责人表示,对“转发此事的人数”感到“震惊”。

Anthropic行业动态
00:58
Hacker News 热门(buzzing.cc 中文翻译)
61
美国人工智能的OnlyFans经济

一篇题为“The OnlyFans Economy of American AI”的文章于6月7日在Hacker News上获得104点赞,探讨美国人工智能行业中的类似OnlyFans的订阅制经济现象。

AnthropicDeepSeekOpenAI开源生态
00:00
Anthropic:Research(发表成果 · 网页)
同事件精选79
Anthropic研究:大语言模型加速N-day漏洞利用自动化

Anthropic最新研究评估了大语言模型对N-day漏洞利用的自动化能力。Claude Mythos Preview在18个近期Firefox安全补丁中自主构建了8个可执行代码利用,在21个Windows内核补丁(无源码)中产生8个完整利用链,可将低权限用户提升至SYSTEM控制权。公开模型(关闭安全措施)也能构建利用,但数量较少。研究中位补丁间隔为19天,表明当前补丁空窗期已被LLM显著缩短,防御方需加速补丁部署。

Anthropic安全/对齐论文/研究
同一事件,精选展示《Anthropic 联合研究者测量 Claude Mythos Preview 漏洞利用能力》
推荐理由:Anthropic 的这一研究将 N-day 漏洞利用时间从数周压缩到几小时,证明了前沿模型对安全防御时限的根本性颠覆,所有依赖补丁窗口的系统都得重新评估威胁模型。
6月7日
22:58
Hacker News 热门(buzzing.cc 中文翻译)
47
Anthropic,请发布适用于 Linux 的官方 Claude Desktop 版本

Hacker News 用户发帖呼吁 Anthropic 为 Linux 推出官方 Claude Desktop 应用,相关讨论已在 GitHub 上展开,帖子获得 100 点热度。目前官方尚未回应。

Anthropic开源生态现象/趋势
16:35
The Decoder:AI News(RSS)
62
Anthropic 挖走 OpenAI 定制芯片项目第二号硬件工程师,两家公司均在冲刺 IPO

OpenAI 定制芯片项目的第二位硬件员工 Clive Chan 已跳槽至 Anthropic。Chan 曾参与特斯拉 Autopilot ASIC 设计及 OpenAI 与 Broadcom 的合作项目。此举正值 Anthropic 与 OpenAI 均在筹备 IPO,且 Anthropic 据称正考虑自研 AI 芯片。

AnthropicOpenAI行业动态
15:19
IT之家(RSS)
53
OpenAI 芯片团队元老 Clive Chan 出走,跳槽 Anthropic

Clive Chan 今天宣布离开 OpenAI 并于本周加入 Anthropic。他是 OpenAI 的 002 号芯片员工,曾深度参与定制芯片项目。他解释离职原因是想再次从底层攀爬新高峰,并称赞 Anthropic 的人才、价值观和雄心。OpenAI 此前与博通联合公告自研芯片项目预计 2026 年下半年启动。Chan 的跳槽凸显 AI 公司间人才竞争愈演愈烈。

AnthropicOpenAI端侧行业动态
08:19
IT之家(RSS)
55
微软警告:Claude Code存在提示词注入漏洞,可致GitHub凭证泄露

微软研究人员发现Anthropic旗下Claude Code的GitHub自动化流程存在漏洞,攻击者可通过提示词注入攻击,劫持CI/CD工作流窃取敏感凭证。漏洞源于Claude Code的读取工具未像Bash工具那样设置沙箱防护,恶意提示词可绕过两层防护读取系统文件中的API密钥等凭证。Anthropic于4月29日收到报告后,在5月5日发布Claude Code 2.1.128修复,通过限制对/proc/目录下敏感文件的访问防止信息窃取。

AnthropicMCP/工具Microsoft安全/对齐
08:09
Claude Code:GitHub Releases(RSS)
31
Claude Code v2.1.168 发布

Claude Code v2.1.168 版本发布,更新内容仅为错误修复和可靠性改进。因原文较短,无法达成 50-100 字。

Anthropic产品更新部署/工程
6月6日
21:59
The Decoder:AI News(RSS)
59
Sakana AI 押注能自我改进的 AI,欲打破前沿实验室的算力军备竞赛

日本初创公司 Sakana AI 成立了一个专门的递归自我改进(RSI)研究实验室,致力于让 AI 迭代式地自我提升。这家由 Transformer 架构合著者 Llion Jones 联合创办的公司认为,RSI 可以成为美国大型实验室之间纯粹算力军备竞赛的替代方案。与此同时,Anthropic 对该技术的控制风险发出了警告。

Anthropic安全/对齐行业动态
19:34
OpenRouter:Announcements(RSS)
同事件精选75
OpenRouter 30 场 AI 大逃杀:11 个 LLM 对决,Claude 与 Grok 谁更优?

OpenRouter 展开了 30 场 AI 大逃杀式对比,涉及 11 个大语言模型,共消耗 482 美元推理费用。实验得出一个发现,该发现应改变用户阅读模型基准测试的方式。

智能体AnthropicxAI安全/对齐
同一事件,精选展示《OpenRouter 翻遍 11 款 LLM 找最快的决策模型:Claude vs. Grok 领衔》
推荐理由:这场大逃杀实验把模型对齐税摆上了台面,Grok因少斟酌、多行动而胜出,Claude的犹豫反而是现实场景里更需要的品质,选模型不能只看赢不赢,要看任务需要什么性格。
19:29
The Decoder:AI News(RSS)
59
xAI 被曝数月来用 Claude 训练编码模型,被切断访问后仍通过私人账户和 Blackbox AI 继续

xAI 数月来利用 Anthropic 的 Claude 输出训练自家编码模型,被 Anthropic 切断访问后仍通过私人账户及 Blackbox AI 服务继续使用。与此同时,xAI 预训练团队缩减至不到 5 人,多名负责人离职;马斯克购入的计算资源转而出租给 Anthropic 和 Google,未用于自研模型。

AnthropicxAI数据/训练行业动态
17:17
IT之家(RSS)
65
Ramp:美国企业 AI 成本飙升,DeepSeek 成为 B2B 市场新宠

美国企业 AI 累计投入突破 1 万亿美元,模型推理成本飙升,降本增效未达预期。Ramp 报告显示 DeepSeek 首次登上其软件趋势榜榜首。案例包括某企业一个月为 Claude 支付 5 亿美元,Uber 四个月内耗尽全年 Token 预算。DeepSeek 宣布 API 价格永久下调 75%,MiniMax 压至新低。Ramp 首席经济学家称这是美国企业寻找 OpenAI、Anthropic 低成本替代方案的最明确信号。部分企业已直接向 DeepSeek 付费。2025 年初 DeepSeek R1 模型曾登顶 App Store,但企业采用率一度达 0.3%,后回落至 0.1% 并维持到 2026 年 4 月。成本压力是再度受关注的主因。

AnthropicDeepSeek开源生态推理
17:17
IT之家(RSS)
54
Anthropic被曝雇1000名工程师训练Claude Code,每项任务280美元

Anthropic通过数据标注公司Snorkel AI的“Marlin”项目,雇佣约1000名软件工程师微调Claude Code。外包人员编写提示词、审查代码,每项任务报酬280美元(约1小时),要求对两种模型输出进行A/B测试,选择偏好结果并判断是否达到提示词要求的细节程度,旨在训练Claude Code生成更简化、易维护的代码。外包人员不知所评模型版本,项目仍在进行。

Anthropic数据/训练编码行业动态
14:22
Hacker News 热门(buzzing.cc 中文翻译)
68
标普500指数拒绝纳入SpaceX,同时也不允许OpenAI和Anthropic入选

标普500指数正式拒绝将SpaceX纳入其成分股,同时也不允许OpenAI和Anthropic入选。这一决定意味着这三家备受关注的科技公司目前无法成为标普500指数的成员。消息由arstechnica报道。

AnthropicOpenAI行业动态
10:07
Claude Code:GitHub Releases(RSS)
35
Claude Code v2.1.167 发布

Claude Code v2.1.167 版本包含错误修复和可靠性改进。

Anthropic产品更新编码
09:32
Gary Marcus:The Road to AI We Can Trust(RSS)
35
No, Anthropic did not call for a pause on AI development
Anthropic大佬观点安全/对齐
09:07
Claude Code:GitHub Releases(RSS)
同事件精选64
Claude Code v2.1.166 发布

Claude Code v2.1.166 新增 fallbackModel 设置,最多配置三个后备模型在主模型过载或不可用时按序尝试;--fallback-model 现也适用于交互会话。deny rule 中工具名位置支持 glob 模式("*"拒绝所有工具),未知工具名启动时警告。跨会话消息中继不再携带用户权限,接收方拒绝被中继的权限请求。MAX_THINKING_TOKENS=0、--thinking disabled 及逐模型 thinking 开关可禁用默认开启思考的模型(仅 Claude API,第三方不变)。API 返回非预期不可重试错误时,在后备模型上重试一次。修复了图像处理失败、远程会话卡死、JetBrains IDE 终端闪烁、Kitty 键盘协议下 Shift+非 ASCII 字符丢失、PowerShell 命令验证挂起、macOS 后台进程孤儿化等问题。

智能体Anthropic产品更新部署/工程
同一事件,精选展示《Claude Code v2.1.163 发布》
推荐理由:Claude Code 重度用户该升级了,fallbackModel 让你设三个备用模型防止高峰期罢工,跨会话安全加固也让自动模式更敢放任跑了。
08:16
IT之家(RSS)
48
IT早报:Anthropic呼吁全球暂缓AI研发,腾讯大部分代码由AI生成,华为云联合多模型厂商发布生态计划

Anthropic称其最新AI模型已显现可能脱离人类控制的迹象,呼吁全球主要AI公司协调放缓前沿AI开发。腾讯汤道生表示今年腾讯大部分代码由AI生成,工程师更多投入架构设计。华为云联合智谱、DeepSeek、Kimi等20余家模型厂商发布“百模千态,云聚共赢”生态合作计划。抖音副总李亮回应“豆包误判蘑菇”称AI仅供参考。追觅创始人俞浩内部发文称一季度扫地机器人全球销量销售额双第一,其微博因违规被禁言。理想与蔚来就底盘实测视频论战。英伟达CEO黄仁勋在首尔称已在韩国新建AI技术中心。微软中国Azure被曝裁员,理论最高补偿N+7。

Anthropic行业动态
03:34
Claude:Blog(网页)
同事件精选76
Claude Cowork 产品指南

Anthropic 发布 Claude Cowork,一款运行在 Claude 桌面应用中的知识工作智能体。它可读写本地文件、跨 Slack 和 Google Drive 等应用协作,执行多步骤任务并生成带引用的实际交付物。核心能力包括本地文件访问、子智能体、长时间运行和定时任务。Claude Cowork 区别于对话式 AI 工具,支持用户描述目标与期望结果后自动规划执行。指南还介绍了产品矩阵(对话聊天、Claude Code 编程、Claude Cowork 跨应用知识工作)、设置要求、权限模型、七种常见工作流(如研究简报、会议准备、定期报告)以及营销和产品管理等插件。

智能体AnthropicMCP/工具教程/实践
同一事件,精选展示《Claude Cowork 入门最佳实践》
推荐理由:把 Claude 从问答工具升级成能读写本地文件、跨应用交付可交付物的知识工作代理,这份官方指南给出了明确上手路径和七个真实工作流,做产品、做调研的都能直接照抄。
03:33
Anthropic:Research(发表成果 · 网页)
精选65
Anthropic:让Claude成为化学家

Anthropic与顶尖化学家合作,提升Claude在化学领域的实用性。首个白皮书测试Claude在NMR谱图分析上的表现:在20个化合物上,对比Claude Opus 4.7、Opus 4.6、Sonnet 4.6与ChemDraw、MestReNova的正向预测(从结构预测谱图)和反向结构解析(从实验谱图推断结构)能力。所有化合物选自模型训练截止日期后发布的ChemRxiv预印本,以避免选择偏差。

Anthropic多模态论文/研究评测/基准
关联讨论 2 条X:Rohan Paul (@rohanpaul_ai)X:Anthropic (@AnthropicAI)
推荐理由:化学家可能几年后回头看会记起这篇,Claude Opus 4.7 在 NMR 预测上追平了 ChemDraw,还顺手做了反向结构解析——专业软件不干的事,它用更接近人类日常输入的方式做到了。
03:21
Hacker News 热门(buzzing.cc 中文翻译)
60
Claude 是否增加了 rsync 中的错误?

一篇 Hacker News 热门帖子(105 分)提出了 Claude 是否导致 rsync 工具中 bug 增加的问题,并附有分析链接。

Anthropic安全/对齐现象/趋势编码
03:01
Ars Technica:AI(RSS)
57
S&P 500 拒绝 SpaceX,同时阻止 OpenAI 和 Anthropic 进入

S&P 500 指数拒绝将 SpaceX 纳入成分股,也阻止了 OpenAI 和 Anthropic 的加入。这意味着这些公司无法轻易从被动投资者那里获得数十亿美元的资金。

AnthropicOpenAI行业动态
02:33
Claude:Blog(网页)
59
Anthropic销售人员用Claude Code重建团队工作流

加入Anthropic前从未写过代码的销售成员Jared Sires,利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS(Claude Drafts),通过Claude API根据客户邮件草拟回复,每天节省2-3小时。该系统基于约4,300行代码(几乎全由Claude Code编写),从Google Drive和Anthropic公开文档提取上下文,并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能,通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。

智能体AnthropicMCP/工具教程/实践
关联讨论 1 条Claude:Blog(网页)
00:21
Hacker News 热门(buzzing.cc 中文翻译)
49
程序员会为Claude编写文档,但不会为彼此编写

Hacker News 上的一篇博文指出,程序员愿意为Claude编写文档,却不愿意为其他程序员编写文档。

Anthropic教程/实践编码
6月5日
20:15
IT之家(RSS)
60
Anthropic 与美国政府关系解冻:双方正磋商合作

据路透社报道,Anthropic 与特朗普政府关系出现缓和。此前 Anthropic 拒绝将 AI 模型用于国内监控和完全自主武器系统,被列入国家安全黑名单。4月中旬 Anthropic CEO 首次访问白宫商讨合作。白宫曾邀请其出席原定5月21日签署的 AI 行政令仪式(后取消但本周二已签署)。Anthropic 还与美国家网络总监讨论用 AI 系统 Mythos 保护关键基础设施。Anthropic 仍在法院挑战“供应链风险”认定。

Anthropic安全/对齐政策/监管
19:26
The Decoder:AI News(RSS)
42
Anthropic 的 Mythos 模型据报用于 NSA 对中国和伊朗的进攻性网络行动

Anthropic 据报已派驻约六名工程师至 NSA,将其 Mythos 模型适配于进攻性网络行动。该模型可能用于入侵中国或伊朗的网络系统。此举符合 Anthropic 的立场:其关于限制 AI 用于大规模监控的承诺仅适用于美国公民。

Anthropic安全/对齐行业动态
17:56
The Decoder:AI News(RSS)
71
Anthropic 表示 Claude 现在写 90% 以上的代码,并希望世界拥有 AI 暂停按钮

Anthropic 内部数据显示,Claude 承担了超过 80% 的生产代码编写,工程师每日代码产出是 2024 年的 8 倍。该公司目标是实现 AI 自我改进,这将引发巨大加速。为此 Anthropic 呼吁建立可验证的全球 AI 开发暂停机制,并表示若其他前沿实验室同样暂停,他们也会停止。

Anthropic安全/对齐编码行业动态
关联讨论 11 条Anthropic:The Institute(旗舰研究长文 · 网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)X:卡兹克 (@Khazix0918)X:Rohan Paul (@rohanpaul_ai)X:Anthropic (@AnthropicAI)X:Emad Mostaque (@EMostaque)X:小互 (@xiaohu)X:Ethan Mollick (@emollick)Hacker News 热门(buzzing.cc 中文翻译)Anthropic:Research(发表成果 · 网页)
14:07
Claude Code:GitHub Releases(RSS)
22
Claude Code v2.1.165 发布

Claude Code v2.1.165 版本已推送,本次更新主要包含错误修复(bug fixes)和可靠性改进(reliability improvements),旨在提升系统稳定性。

Anthropic产品更新
10:14
IT之家(RSS)
精选79
Anthropic 称其最新 AI 模型 Mythos 显现脱离人类控制迹象,呼吁全球暂缓先进 AI 研发

Anthropic 发布报告称其最新 AI 模型已显现脱离人类控制迹象,呼吁全球暂缓前沿 AI 开发,以便社会制度建设和对齐研究跟上进展。该公司主张美国、中国等主要 AI 公司达成共识,发布可验证的规则,并类比“核武器不扩散条约”,但指出 AI 更难监管。该观点引发美国白宫部分官员不满,批评其夸大风险。Anthropic 计划未来数月召集各方探讨全球协调机制如何运作。

Anthropic安全/对齐行业动态

推荐理由:Anthropic呼吁暂缓AI研发,虽然被白宫官员批「夸大风险」「给对手使绊」,但Mythos模型确实够强。这份报告是道德信号还是商业博弈,值得细看。
09:31
公众号:数字生命卡兹克
同事件精选68
Anthropic《When AI builds itself》:当AI开始自我构建

Anthropic发文指出,AI系统正加速自身开发,递归自我改进或将到来。目前Anthropic超80%代码由Claude编写,工程师每日合并代码量达2024年8倍。Claude Opus 4.6可胜任12小时软件任务,Mythos Preview连续工作至少16小时,SWE-bench和CORE-Bench等基准均已饱和。内部测试显示,Mythos Preview使研究效率提升约4倍,代码速度优化达52倍,在开放任务中成功率达76%,并弥合97%的研究项目差距。Claude在64%情况下给出比人类更好的研究建议。

Anthropic安全/对齐现象/趋势编码
同一事件,精选展示《AI加速自我构建:Anthropic研究院报告揭示趋势》
推荐理由:Anthropic首次公开内部数据,工程师代码产出提升8倍,Claude自我加速的曲线已经画出来了。这篇文章不是预测是事实,做AI的人都该花20分钟读完。
09:28
Gary Marcus:The Road to AI We Can Trust(RSS)
精选59
Gary Marcus:无需恐慌Anthropic新博客

Anthropic发布最新博客后,推特圈热议不断。Gary Marcus在其博客中直接以“无需恐慌”为题发文,暗示不必过度反应。

Anthropic大佬观点安全/对齐编码

推荐理由:这篇文章是评论圈难得的冷静声音,用逻辑拆解了 Anthropic 的恐慌叙事,顺便带来 S&P 500 不接纳 SpaceX 的利好,读起来像一份理性补丁。
06:50
TechCrunch:AI(RSS)
68
Anthropic 联合创始人 Daniela Amodei 在 IPO 前夕驳斥对 AI 回报的质疑

Anthropic 联合创始人 Daniela Amodei 解释了公司可能通过公开市场融资的原因,并认为对 tokenmaxxing 的质疑不足为虑。

Anthropic行业动态
06:28
OpenRouter:Announcements(RSS)
精选66
OpenRouter 翻遍 11 款 LLM 找最快的决策模型:Claude vs. Grok 领衔

OpenRouter 用总价 482 美元的推理花费,让 11 款大语言模型在 30 轮实时决策的“大逃杀”挑战中正面竞争。实验结果表明,传统的静态 benchmark 排名无法反映模型在需要即时反应的智能体任务(如自主控制机器人)中的真实表现,Claude 和 Grok 系列模型在决策速度与任务成功率上表现突出,而多项高分模型的实时调度能力未达预期。

智能体AnthropicOpenAI安全/对齐
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:Jacky 把 11 个模型丢进大逃杀,发现 Grok 4.1 Fast 以 27 倍成本优势击败 Sonnet,而获胜关键不在基准分数,在于模型被训练时压制的攻击性。对任何不再只看排行榜选模型的人,这是今年最值得读的实验。
06:04
Claude Code:GitHub Releases(RSS)
精选70
Claude Code v2.1.163 发布

新增 requiredMinimumVersion 和 requiredMaximumVersion 托管设置,版本超范围时拒绝启动并引导用户使用经批准版本。新增 /plugin list 命令及 --enabled/--disabled 筛选;/btw 添加 "c to copy" 快捷键,复制原始 markdown 答案到剪贴板。Hooks 方面,Stop 和 SubagentStop 可返回 additionalContext 给 Claude 反馈并保持对话。Skills 新增 \$ 转义语法,支持在命令中数字前使用字面 $。stdio MCP 服务器在 --resume 时接收与 hooks/Bash 相同的 CLAUDE_CODE_SESSION_ID。修复了 claude -p 永久挂起、$TMPDIR 被覆盖、Windows 上 session-env 目录 EEXIST 错误、后台 agent 会话在更新后自动升级等多处问题。

Anthropic产品更新编码
关联讨论 2 条Claude Code:GitHub Releases(RSS)X:Claude Devs (@ClaudeDevs)
推荐理由:Claude Code 这次的版本管理设置对团队标准化很关键,plugin list 命令也让插件管理顺手多了,但这种工具更新属于用的人自然懂,不是所有人都需要关注。
05:56
Ethan Mollick:One Useful Thing(RSS)
精选61
共存与协同智能的终结

Ethan Mollick 在 One Useful Thing 博客中,以“共存与协同智能的终结”为题,并附带介绍了如何向 AI 推销一本书。

智能体Anthropic大佬观点编码

推荐理由:Mollick 这篇比单纯的新书预告有料,用自己给 AI 写推荐语的实验,把「AI 不再是助手而是守门人」这个新现实讲得很具体。对还在纠结怎么跟 AI 合作的人,是一个挺及时的视角更新。
‹ 上一页
1…89101112…25
下一页 ›