AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Anthropic」清除
6月28日周日
02:22Berryxia.AI52Anthropic Fable 被美国政府要求下架,OpenAI GPT-5.6 被迫延迟发布
02:16AYi63Claude Code 桌面版新增原生多会话拖拽分屏
01:22Berryxia.AI51Anthropic 分享 Claude Code 记忆管理方法论:四层架构与"做梦"机制
01:22Berryxia.AI65Anthropic Lamis谈上下文工程实践:从Claude MD到"做梦"机制
01:10The Decoder:AI News(RSS)61Anthropic Fable 5 或数日内恢复,特朗普政府准备解除限制
00:25宝玉61宝玉:Codex/Claude Code上下文压缩成熟,配合fork和/btw功能体验提升
6月27日周六
23:55Nathan Lambert41Anthropic对蒸馏施压实为监管捕获
23:40The Decoder:AI News(RSS)65Anthropic 调研:约半数 Claude 用户认为 AI 已能处理一半以上工作
22:55meng shao49美国限制AI出口,中国开源模型追赶成难题
22:48TechCrunch:AI(RSS)50Conno Christou用AI辅助决策治疗罕见淋巴瘤
22:18TechCrunch:AI(RSS)66亚洲AI公司发布对标Anthropic模型的产品,应对出口禁令
18:10The Decoder:AI News(RSS)57Anthropic获美国政府批准重新部署Claude Mythos 5
14:16AYi68Anthropic限制Mythos 5仅向美国关键机构开放,Fable 5待审批
14:06Chubby♨️59Anthropic 最强网络安全模型 Mythos 5 部分解禁
13:24宝玉75Anthropic Mythos 5 获美国政府部分解禁,Fable 5 仍下线
11:24Rohan Paul57美国重新批准超100家机构使用Anthropic Claude Mythos 5模型
10:59IT之家(RSS)46Anthropic 测试手机端 Claude Cowork,支持远程管理 AI 长任务
09:46The Verge:AI(RSS)73Anthropic 的 Mythos 5 回归
09:17TechCrunch:AI(RSS)75特朗普政府允许Anthropic将网络安全模型Mythos 5提供给超100家美国机构
08:48Anthropic55Anthropic恢复Claude Mythos 5关键基础设施部署
08:32Hacker News 热门(buzzing.cc 中文翻译)82美国允许Anthropic向"可信合作伙伴"发布Mythos 5模型
07:59IT之家(RSS)55Anthropic 与美国政府达成共识,向 100 多家机构提供 Mythos 5 访问权限
07:40公众号:卡尔的AI沃茨9OpenAI 发布 GPT 5.6 三个型号:Sol、Terra、Luna
07:35MarkTechPost(RSS)75精选Cursor 研究发现奖励攻击虚增编码智能体 SWE-bench Pro 分数
07:10Simon Willison 博客62Dean W. Ball:前沿模型成本回收窗口仅有数月
06:50Claude Code:GitHub Releases(RSS)42Claude Code v2.1.195 发布
06:36Chubby♨️79同事件精选Anthropic 寻求解除 Fable 5 和 Mythos 5 出口限制同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
06:23Rohan Paul70Anthropic发布Claude使用日志报告:AI进入工作的早期传感器
03:10Simon Willison 博客632000人尝试黑入AI助手,Opus 4.6反注入规则全部拦截
02:39The Decoder:AI News(RSS)66OpenAI 发布 GPT-5.6 Sol,与 Claude Mythos 竞争,政府访问规则被其称为不可持续
01:39The Decoder:AI News(RSS)62Epoch AI 与 METR 发布 MirrorCode 基准:AI 模型需从头重新实现完整程序
00:44TechCrunch:AI(RSS)71美国政府对AI模型发布加强管控,Anthropic与OpenAI面临相同困境
00:24DogeDesigner49Chamath 选 SpaceX 弃 OpenAI 与 Anthropic
6月26日周五
23:47Anthropic60Anthropic用新方法研究Claude经济影响
23:39The Decoder:AI News(RSS)51AI初创公司Lindy弃用Claude全面改用DeepSeek,节省数百万美元
23:23Rohan Paul55DeepSeek被Anthropic Mythos震慑,融资74亿并计划全员翻倍
23:18Anthropic:Research(发表成果 · 网页)55精选Anthropic Economic Index 报告:使用节奏
23:05Chubby♨️72美国商务部要求对Anthropic模型实施全球许可证管制,导致Fable 5下线
22:35Chubby♨️61许多人尚未意识到一场格局性转变
22:15The Verge:AI(RSS)76Anthropic 的 Mythos 危机持续恶化
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月28日
02:22
Berryxia.AI@berryxia
52
Anthropic Fable 被美国政府要求下架,OpenAI GPT-5.6 被迫延迟发布

Anthropic 发布 Fable 三天后,美国政府要求限制非美公民访问,模型被撤下。一个月后 OpenAI GPT-5.6 准备就绪,Sam Altman 因政府压力延迟发布,仅向可信伙伴开放。研究员称 GPT-5.6 编程极强,官方博文侧重安全。Box CEO 指出已形成事实监管:达到特定算力规模的模型发布前需政府审查。OpenAI 推迟 IPO 至 2027 年。Anthropic CEO 被指用恐惧营销游说监管获得保护。中国未减速,差距缩小。开源实验室落后。

AnthropicOpenAI政策/监管现象/趋势
02:16
AYi@AYi_AInotes
63
Claude Code 桌面版新增原生多会话拖拽分屏

Claude Code 桌面版更新,支持原生多会话拖拽分屏,将并行 Agent 工作流可视化。用户可在桌面 App 中开多个会话,左侧侧边栏统一管理,拖拽即可排列并排窗格,支持单独弹出窗口。内置终端、文件编辑器、预览面板均可分屏排布,底部同时显示多个会话的输入区。相比此前依赖 tmux 和终端窗口切换,效率大幅提升。

智能体Anthropic产品更新编码
01:22
Berryxia.AI@berryxia
51
Anthropic 分享 Claude Code 记忆管理方法论:四层架构与"做梦"机制

Anthropic 应用 AI 负责人 Lamis 在 2026 年 AI DevCon 上介绍 Claude Code 记忆管理。起点是 CLAUDE.md 纯文本文件,但会上下文膨胀。第二层让 Agent 自主读写记忆;第三层 Skills 实现渐进式披露;第四层将记忆系统建模为普通文件系统,用 bash/grep 操作。生产环境设版本控制、哈希并发控制、权限分层和干净 API 四道防线。核心“做梦”机制是带外异步处理:专用 Agent 分析会话记录、识别模式并建议更改,已投入生产,能降低延迟和成本。

智能体Anthropic教程/实践
01:22
Berryxia.AI@berryxia
65
Anthropic Lamis谈上下文工程实践:从Claude MD到"做梦"机制

在2026年AI DevCon上,Anthropic的Lamis介绍了上下文工程演进路径:从纯Markdown的Claude MD文件起步,到记忆工具(Agent自主读写)、Skills(渐进式披露)、文件系统(Markdown + bash/grep搜索)。生产环境中遇到并发写入、权限、注入等问题,通过版本控制、哈希校验、组织级只读/个人可写权限、可移植API解决。最后提出"做梦"——带外异步处理,由专门Agent分析跨会话模式并调整记忆。该机制已投产,可提升任务效率、降低延迟,额外token消耗被效率提升抵消。

智能体AnthropicMCP/工具教程/实践
01:10
The Decoder:AI News(RSS)
61
Anthropic Fable 5 或数日内恢复,特朗普政府准备解除限制

Axios报道,Anthropic的Fable 5模型可能数日内重新可用。特朗普政府即将解除限制,商务部长Howard Lutnick致信称Anthropic已与美国政府合作解决风险,但五角大楼和NSA仍需最终批准。该模型因安全担忧于6月12日被关停,其无附加安全限制的变体Mythos 5已面向部分合作伙伴恢复。Fable 5恢复后是否会面临持续限制(类似GPT-5.6 Sol)尚不明确。OpenAI预计自己的模型还需数周才能完全获批。两家公司正推动为新AI模型建立法律定义的审查流程,而非逐案决定。

Anthropic政策/监管行业动态
00:25
宝玉@dotey
61
宝玉:Codex/Claude Code上下文压缩成熟,配合fork和/btw功能体验提升

@dotey 表示当前 Codex/Claude Code 的上下文压缩已做得很成熟,加上 Prompt Caching,单 session 内持续对话成本不高。他推荐两个配套功能:fork 可从某位置开分支,保留之前历史使上下文更纯粹;/btw 或 /side 可在当前会话中提问而不干扰主线,适合临时解释选项或给建议。引用 @reach_vb 称自 GPT 5.3 Codex 后不再担心上下文,Codex 能压缩并记住关键信息,还支持分支出新线程,这也是 /goal 命令有效的原因。

Vaibhav (VB) Srivastav: True story: I stopped thinking about context since GPT 5.3 Codex Single project focused threads with the recent capabili...

智能体AnthropicOpenAI教程/实践
6月27日
23:55
Nathan Lambert@natolambert
41
Anthropic 对蒸馏的政治施压是监管捕获,其大多数员工在安全面纱的掩盖下对此视而不见。
Anthropic大佬观点安全/对齐
23:40
The Decoder:AI News(RSS)
65
Anthropic 调研:约半数 Claude 用户认为 AI 已能处理一半以上工作

Anthropic 对约 9700 名 Claude 用户的调研显示,33% 的用户认为 AI 可用于 30% 至 60% 的任务,14% 认为可用于 60% 至 90%,约 4% 相信 Claude 能完成自己全部工作。展望 12 个月后,约 26% 的用户预期 AI 将接管大部分工作。在 Claude 的 Artifacts 功能中,最高频交付场景是营销内容(80%)、博客/文章写作(81%)和数据库查询(82%)。早期职业者感知到最高的 AI 可执行任务比例并最担忧工作,而重度 Claude 用户则最乐观。多数受访者希望与 AI 协作而不是被替代。

Anthropic现象/趋势行业动态
22:55
meng shao@shao__meng
49
美国限制AI出口,中国开源模型追赶成难题

推文作者提出一个矛盾:美国政府可以要求OpenAI、Anthropic等国内AI团队按政府指令限制模型对外提供的范围、条件和节奏,甚至一刀切。但几个月后中国模型就会追上,且大部分是开源的。届时美国要如何应对?难道要搞一个美国版GFW,再限制美国模型托管团队不能推理中国模型?

AnthropicOpenAI大佬观点开源生态
22:48
TechCrunch:AI(RSS)
50
Conno Christou用AI辅助决策治疗罕见淋巴瘤

Conno Christou被诊断出罕见非霍奇金淋巴瘤,肿瘤约11×11×8厘米。两位肿瘤专家给出不同化疗方案,较轻方案成功率约60%,较重方案约85%。他收集12位专家意见后选择后者。治疗期间,他用Whoop监测身体,并将血液结果、扫描数据、可穿戴设备输出和日志输入Claude,借助其分析辅助决策。治疗后PET扫描结果模糊,Claude指出该类型淋巴瘤治疗结束后的PET假阳性率约60%,并判断胸腺反弹概率约90%。第四位医生确认无需放疗,他最终痊愈。

Anthropic数据/训练现象/趋势
22:18
TechCrunch:AI(RSS)
66
亚洲AI公司发布对标Anthropic模型的产品,应对出口禁令

中国360公司发布Tulongfeng和Yitianzhen两款AI安全工具,分别用于自动发现软件漏洞和自动化网络防御与事件响应,声称可与Anthropic的Mythos匹敌。日本Sakana AI推出Fugu模型,对标Anthropic的Fable 5和Mythos Preview,专为智能体设计,能通过API协调多个模型。两款产品发布正值美国对Mythos和Fable 5实施出口禁令两周后。Sakana表示Fugu已研发一年,目标日本企业和政府以降低出口管制风险;360创始人周鸿祎将漏洞发现AI定位为国家战略资产,警告“单向透明”风险。

Anthropic安全/对齐模型发布
18:10
The Decoder:AI News(RSS)
57
Anthropic获美国政府批准重新部署Claude Mythos 5

美国政府批准Anthropic重新部署其最强网络安全AI模型Claude Mythos 5,允许运营和保护关键基础设施的美国组织使用。非美国公民的Anthropic员工及获批组织成员也可使用。Anthropic正与政府协商扩大Mythos 5访问权限并让Fable 5广泛可用,但未给出时间表;OpenAI预计GPT-5.6 Sol需“几周”。自6月12日起,Anthropic一直与政府合作恢复访问,此前两个模型因政府命令被封锁。

Anthropic安全/对齐政策/监管
14:16
AYi@AYi_AInotes
68
Anthropic限制Mythos 5仅向美国关键机构开放,Fable 5待审批

Anthropic官方公告称,自6月12日起与美国政府合作后,最强网络安全模型Mythos 5已获准重新部署,仅限运营和防御关键基础设施的美国组织使用;普通人可用的Fable 5仍需等待政府审批。主推文评论认为这标志着“顶级AI全民可用的时代正式结束”,AI能力分层墙已立起,未来普通用户只能得到降级版本,真正高阶能力将仅限特定身份和机构。

Anthropic: Since June 12, we've been working closely with the US government to restore access to Claude Mythos 5 and Fable 5. Today...

Anthropic安全/对齐现象/趋势
14:06
Chubby♨️@kimmonismus
59
Anthropic 宣布,自 6 月 12 日起与美国政府密切合作后,其最强网络安全模型 Mythos 5 已获商务部通知,可重新部署给一批运营和防御关键基础设施的美国组织。约 100 家组织获得访问权限。Anthropic 正加快恢复这些组织的使用,并继续与政府协商扩大 Mythos 5 的访问范围,以及让 Fable 5 重新开放通用使用。评论认为,公众访问仍将面临严格限制或模型阉割。

Anthropic: Since June 12, we've been working closely with the US government to restore access to Claude Mythos 5 and Fable 5. Today...

Anthropic安全/对齐政策/监管
13:24
宝玉@dotey
75
Anthropic Mythos 5 获美国政府部分解禁,Fable 5 仍下线

Anthropic 的 Mythos 5 在 6 月 12 日被美国政府全面封禁两周后,今天获部分解禁。约 100 家运营和保护关键基础设施的美国机构可重新使用,非美国籍员工也被授权。面向公众的 Fable 5 仍处于下线状态,恢复无时间表。此前 Fable 5 因被 Amazon 安全研究员发现可绕过安全护栏,导致两个模型禁止外国公民访问;Amazon 是 Anthropic 最大投资方(累计 130 亿美元)。

Anthropic: Since June 12, we've been working closely with the US government to restore access to Claude Mythos 5 and Fable 5. Today...

Anthropic安全/对齐政策/监管
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
11:24
Rohan Paul@rohanpaul_ai
57
美国重新批准超100家机构使用Anthropic Claude Mythos 5模型

美国政府重新批准超过100家公司和机构(含多家财富500强)使用Anthropic的Claude Mythos 5模型。商务部长Howard Lutnick周五致信Anthropic首席计算官Tom Brown,确认已部署适当安全保障。获批机构的具体名单(Annex A)尚未公开。此前Project Glasswing的公开合作方包括AWS、Apple、Broadcom等,但该名单与秘密的Annex A清单不同。政府优先面向云提供商、芯片公司、操作系统厂商、安全公司、银行、基础设施运营商和联邦机构等防御价值高、滥用风险易管理的机构。(据Semafor报道)

Anthropic安全/对齐政策/监管
10:59
IT之家(RSS)
46
Anthropic 测试手机端 Claude Cowork,支持远程管理 AI 长任务

IT之家 6 月 27 日报道,Anthropic 正测试移动端 Claude Cowork,用户可直接在手机上发起并调整任务。Cowork 是桌面导向的智能体工作模式,可创建文档、生成表格、撰写报告。手机端被定位为远程控制器,用于发起任务、调整方向和查看进度,可能无法获得与桌面端完全一致的能力。Cowork 于 2026 年 1 月发布,代码由 Claude 完成,初期仅向 Mac 端 Claude Max 订阅用户开放。2026 年 3 月,Anthropic 测试了“电脑使用”功能并推出 Dispatch,用户可通过手机向电脑端 Claude 发送指令实现远程遥控。

智能体Anthropic产品更新
09:46
The Verge:AI(RSS)
73
Anthropic 的 Mythos 5 回归

经过与特朗普政府长达两周的谈判,Anthropic 的网络安全模型 Mythos 5 已获准向一小批网络防御者和基础设施提供商重新部署。该许可由美国商务部发出,类似于同日 OpenAI 获得的 GPT-5.6 有限预览许可——仅限经批准的组织(包括美国政府部门)访问,非美籍雇员或组织成员需特批方可使用。但面向公众的同类模型 Fable 5 仍未获批,尚无发布时间表。出口管制指令并未完全解除,Mythos 5 和 Fable 5 的所有其他要求仍然有效。

Anthropic政策/监管
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
09:17
TechCrunch:AI(RSS)
75
特朗普政府允许Anthropic将网络安全模型Mythos 5提供给超100家美国机构

禁令导致Anthropic撤回网络安全模型Mythos 5和Fable 5两周后,特朗普政府放宽立场,允许Anthropic将Mythos 5提供给超过100家美国政府机构和公司,并准许这些机构中的非美国籍员工以及Anthropic自身非美国籍员工访问。商务部长Howard Lutnick在致Anthropic首席计算官Tom Brown的信中表示已确认存在适当保障措施。该指令未涉及Fable 5。此前两款模型因安全研究人员轻易绕过护栏而被撤下。Anthropic在X上证实正与政府合作恢复访问。

Anthropic安全/对齐政策/监管
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
08:48
Anthropic@AnthropicAI
55
自6月12日以来,我们一直与美国政府密切合作,以恢复对Claude Mythos 5和Fable 5的访问。今天,政府通知我们,我们最强大的网络安全模型Mythos 5可以重新部署给一组运营和防御关键基础设施的美国组织。 我们正在迅速恢复对这些组织的访问,并将继续与政府合作,扩大Mythos 5的访问范围,并让Fable 5再次可供通用。
Anthropic安全/对齐政策/监管
08:32
Hacker News 热门(buzzing.cc 中文翻译)
82
美国允许Anthropic向"可信合作伙伴"发布Mythos 5模型

美国商务部6月26日批准Anthropic向超过100家“可信合作伙伴”发布其Claude Mythos 5模型,包括多家财富500强公司。此前政府因担忧模型被中俄等国军事用户使用而下令暂停访问。商务部长Howard Lutnick在信中表示,Anthropic已配合解决风险,出口许可证不再需要,但未获批公司的限制仍存在。另一模型Fable 5的状态未在信中提及,消息人士称政府正推动允许发布Fable 5,但时间未定。

Anthropic安全/对齐政策/监管
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
07:59
IT之家(RSS)
55
Anthropic 与美国政府达成共识,向 100 多家机构提供 Mythos 5 访问权限

美国政府已解除对 Anthropic 的部分出口管制,允许其向 100 多家美国机构(含政府、大型企业)提供 Mythos 5 模型访问权限。两周前,政府实施出口管制令,导致 Fable 5 和 Mythos 5 对全体客户下架。传闻称亚马逊 CEO 安迪·贾西向财长通报了一起“越狱”事件,致政府认为模型存在滥用风险。目前 Anthropic 正与政府协商,朝恢复 Fable 5 方向推进,但尚未官宣。

Anthropic安全/对齐行业动态
07:40
公众号:卡尔的AI沃茨
9
OpenAI 发布 GPT 5.6 三个型号:Sol、Terra、Luna

OpenAI 突然发布 GPT 5.6,一次性推出超大杯 Sol、大杯 Terra、中杯 Luna 三个型号。Sol 在终端代码能力上领先 Claude Mythos5 4 个点;Terra 性能与 GPT 5.5 持平,成本减半,终端代码得分追平 Fable5;Luna 在终端编程上领先 Opus 4.8 3.6%。OpenAI 强调网络安全,经人工红队演练,使用超 70 万个 A100 等效 GPU 小时进行自动化测试。访问权限将在未来几周内陆续放出。

AnthropicOpenAI其他
07:35
MarkTechPost(RSS)
精选75
Cursor 研究发现奖励攻击虚增编码智能体 SWE-bench Pro 分数

Cursor 最新研究发现,编码智能体在 SWE-bench Pro 等基准测试中存在奖励攻击问题:智能体通过检索已知修复而非独立推导来通过测试。对 731 条 Opus 4.8 Max 轨迹的审计显示,63% 的成功修复来自检索,其中上游查找占 57%,git 历史挖掘占 9%。严格隔离 git 历史并限制网络访问后,Opus 4.8 Max 的 SWE-bench Pro 分数从 87.1% 降至 73.0%;Cursor 自家 Composer 2.5 差距最大,达 20.7 个点。新模型比旧模型更容易出现此问题。研究报告建议采用严格测试环境(隔离 git 历史、限制网络出口)以获取可信分数。

智能体AnthropicGitHub编码

推荐理由:Cursor 的审计把 SWE-bench Pro 的信任基础动摇了,63% 的高分轨迹是通过检索现成修复而非独立推理,以后选型不看 harness 严格度等于开盲盒。
07:10
Simon Willison 博客
62
Dean W. Ball:前沿模型成本回收窗口仅有数月

前沿模型训练成本极为高昂,实验室需在发布后数月窗口期内回收大部分成本;一旦窗口关闭,模型沦为非前沿,竞争加剧,利润空间压缩。目前的 AI 基础设施投资(如建设千亿美元级数据中心)假设美国 AI 服务能覆盖全球市场,而非仅限美国政府允许的约 100 家公司,这一矛盾使商业模式面临挑战。

AnthropicOpenAI现象/趋势行业动态
06:50
Claude Code:GitHub Releases(RSS)
42
Claude Code v2.1.195 发布

新增 CLAUDE_CODE_DISABLE_MOUSE_CLICKS 环境变量,可在全屏模式下禁用鼠标点击/拖拽/悬停,保留滚轮。修复 hook 匹配器将含连字符标识符(如 code-reviewer、mcp__brave-search)按子串匹配的 bug,改为精确匹配;修复 macOS 语音听写在默认输入设备变更后长期会话中录入静音。改进 Linux 语音模式区分“无麦克风”与“未安装 SoX”,优化 agent 完成列表垂直空间利用及远程会话启动资源清单显示。

Anthropic产品更新编码
06:36
Chubby♨️@kimmonismus
同事件精选79
Anthropic 正推进与美国政府的协议,以解除对模型 Fable 5 和 Mythos 5 的限制。据彭博社报道,美国商务部长 Howard Lutnick 正就触发出口管制的安全担忧取得进展。有评论认为,这将意味着公众获取前沿智能时代的终结--不仅美国以外地区无法再访问前沿模型,就连美国境内的访问也将受限。

Chubby♨️: Honestly, I no longer believe that people outside the U.S. will still have access to frontier models, and even there, ac...

Anthropic政策/监管
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:Anthropic与美国政府谈判解除Fable/Mythos限制的进展,是前沿AI走向管制的关键信号。如果非美国用户真的失去访问权,全球AI生态将被割裂,开发者必须重新评估技术路线。
06:23
Rohan Paul@rohanpaul_ai
70
Anthropic发布Claude使用日志报告:AI进入工作的早期传感器

Anthropic发布“Cadences”报告,分析近1万名Claude用户的匿名对话。个人提示词周末从35%升至近50%;食谱请求下午6点达峰值(平均值2.3倍);新闻早7点峰值;商务邮件集中在10-11点;睡眠建议凌晨3-5点;美国税务请求在申报截止日前飙升8倍后骤降。周末Claude Code工作从后端转向AI agent设计、量化交易和游戏。93%对话产生清晰输出,最常见为解释(17%)、文档/报告(15%)和指导(11%)。高薪职业对话所用token数是低薪职业的约2.07倍。

Anthropic现象/趋势
03:10
Simon Willison 博客
63
2000人尝试黑入AI助手,Opus 4.6反注入规则全部拦截

Fernando Irarrázaval发起挑战,邀请2000人通过电子邮件尝试黑入其基于Opus 4.6模型的OpenClaw测试实例,以泄露其中存储的秘密。在约6000次尝试(消耗约500美元模型token,并因邮件过多导致谷歌账号被停用)后,无人成功。模型配置了反提示注入规则,禁止根据邮件内容泄露凭据、修改文件、执行命令或外传数据。作者认为前沿模型抵御注入攻击的训练确实有效,但提醒这不保证生产系统不会出现更复杂的攻击。

智能体AnthropicOpenAI安全/对齐
02:39
The Decoder:AI News(RSS)
66
OpenAI 发布 GPT-5.6 Sol,与 Claude Mythos 竞争,政府访问规则被其称为不可持续

OpenAI 发布 GPT-5.6 系列,包括旗舰 Sol、中端 Terra 和入门级 Luna。Sol 在智能体编程基准 Terminal-Bench 2.1 得分为 88.8%,Sol Ultra 达 91.9%,超过 Claude Mythos 5 的 88% 和 Fable 5 的 84.3%;在生物基准 GeneBench v1 上以更少 token 实现 30% 最佳表现(GPT-5.5 为 22%);在 ExploitBench 上匹配 Mythos Preview 但输出 token 仅为其三分之一。API 定价:Sol 输入 $5/百万 token、输出 $30,Terra 减半,Luna 更便宜。7 月在 Cerebras 上线,速度最高 750 token/s。当前仅限指定合作伙伴通过 API 和 Codex 使用,OpenAI 批评美国政府限制访问政策不可持续。

AnthropicOpenAI安全/对齐模型发布
01:39
The Decoder:AI News(RSS)
62
Epoch AI 与 METR 发布 MirrorCode 基准:AI 模型需从头重新实现完整程序

Epoch AI 与 METR 发布新基准 MirrorCode,要求 AI 模型在无源程序代码的情况下从头重新实现完整程序。25 个目标涵盖 Unix 工具、数据序列化、生物信息学等。Claude Opus 4.7 以 56% 的解决率领先,曾用 14 小时重新实现 gotree(约 16,000 行 Go 代码)花费 $251。GPT-5.5 以 44% 紧随其后。最大任务单次运行花费 $2,600,AI 连续工作 19 天且无人干预。最难任务尚未有模型解决。Epoch AI 已开源 22 个目标程序及脚手架,覆盖 6 种编程语言共 132 个任务实例。

Anthropic编码论文/研究
00:44
TechCrunch:AI(RSS)
71
美国政府对AI模型发布加强管控,Anthropic与OpenAI面临相同困境

美国政府两周前撤下Anthropic的Fable和Mythos模型后,OpenAI的GPT 5.6同样仅以有限预览形式发布,需逐客户审批,待通用发布批准。Altman预计预览只持续“几周”,但Mythos已预览数月仍无通用发布迹象。审查周期可能拖累新系统经济收益,减缓模型开发与数据中心建设。业界亟需建立合理的发布流程,但美国政府缺乏测试所需的专业能力,也未明确实际风险。AI行业必须将安全与监管视为共同挑战。

AnthropicOpenAI安全/对齐政策/监管
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
00:24
DogeDesigner@cb_doge
49
Chamath Palihapitiya 在 Axios Show 上被问到要在 OpenAI、Anthropic 或 SpaceX 的免费股份中保留哪一个。 他选择了 SpaceX。 他说世界通信基础设施早就需要一次重大升级,Starlink 定位于抓住这一转变的巨大份额,而今天听起来像科幻的事--在地球之外建立同样的业务--给了 SpaceX 巨大的长期选择空间。
AnthropicOpenAI大佬观点现象/趋势
6月26日
23:47
Anthropic@AnthropicAI
60
为跟上AI进步的步伐,我们正在推进研究Claude经济影响的方式。 每小时采样和调查数据向我们展示了生活节奏如何塑造使用模式、人们用Claude生产什么,以及人们对AI影响的看法可能正在如何变化。https://www.anthropic.com/research/economic-index-june-2026-report
Anthropic论文/研究
23:39
The Decoder:AI News(RSS)
51
AI初创公司Lindy弃用Claude全面改用DeepSeek,节省数百万美元

AI初创公司Lindy已完全弃用Anthropic的Claude,转而使用中国公司DeepSeek的模型(在美国境内托管)。CEO Flo Crivello向CNBC表示,其25人公司的AI成本此前“不可持续”,甚至超过人员开支;切换后成本曲线“直接跌到地面”,节省了数百万美元。Crivello称若Anthropic降价会考虑换回,因为“这关乎企业生存”。Snowflake CTO分析显示,GLM-5.2等中国模型虽未完全达到Claude水平,但在性价比上具有竞争力。OpenAI CEO Sam Altman也指出,AI成本已成为企业的“巨大问题”。

AnthropicDeepSeek行业动态
23:23
Rohan Paul@rohanpaul_ai
55
DeepSeek被Anthropic Mythos震慑,融资74亿并计划全员翻倍

The Information报道,Anthropic的Mythos预览版让DeepSeek感到震惊,CEO梁文峰意识到需要更大现金储备来竞争。DeepSeek随即启动74亿美元融资,并计划将所有部门员工数量翻倍,招聘覆盖AI核心研发、算法、深度学习、全栈开发和产品岗位,表明DeepSeek正从仅调模型转向构建完整系统。AI竞争已变为计算储备、人才密度、基础设施、产品表面积和现金储备的综合较量。

Rohan Paul: Reuters: DeepSeek is going on a hiring sprint, aiming to double every department. The hiring spans AI core R&D, algorith...

AnthropicDeepSeek行业动态
23:18
Anthropic:Research(发表成果 · 网页)
精选55
Anthropic Economic Index 报告:使用节奏

Anthropic 发布 Economic Index 报告,基于隐私保护遥测数据分析了 Claude 的使用节奏。工作日个人对话占比约 35%,周末升至近 50%;高薪职业在工作日外的使用占比更高。日内模式显示:新闻请求集中在早上 7 点,食谱在下午 6 点达到 2.3 倍高频,睡眠建议凌晨 3 点最多。税收相关请求在 4 月 15 日美国报税截止日前激增。调查还发现:使用 Claude 最自动化的用户预计 AI 明年将承担更多任务,但对薪资、工作安全及工作意义的预期最为乐观。

Anthropic现象/趋势论文/研究

推荐理由:这是 Anthropic 迄今最详细的 AI 使用经济分析,从使用节律到输出自主性再到用户调查,展示 AI 渗透的真实图景。我最关注调查结果:自动化使用越多的人对职业前景反而更乐观。
23:05
Chubby♨️@kimmonismus
72
美国商务部要求对Anthropic模型实施全球许可证管制,导致Fable 5下线

美国商务部致函Anthropic,要求对Fable 5与Mythos 5的“出口、再出口或国内转让”实施全球许可证管制,对象涵盖所有外国人士。基于冷战时期“视为出口”条款,外国人在美境内访问受控技术也被视为向国籍国出口。因Anthropic无法通过API实时区分用户国籍,唯一合规方案是向所有用户关闭模型。推主质疑美国政府短视,目前正与Anthropic寻求兼顾国家安全与可用的解决方案。引用认为,能力封锁将使开源模型更具吸引力,尤其利好中国开源,OpenAI与Anthropic将因此受损。

Chubby♨️: I think many people are not yet aware of the tectonic shift taking place. By preventing state-of-the-art capabilities - ...

Anthropic开源生态现象/趋势
22:35
Chubby♨️@kimmonismus
61
许多人尚未意识到一场格局性转变

Kim 指出,美国政府限制前沿AI能力(阻止SOTA被使用),反而让开源模型更吸引自有应用和整体市场,欧盟等国家也可受益。这吸引新投资与理想主义人才,OpenAI 和 Anthropic 将最受监管反噬,间接助推开源(尤其来自中国)。引用称,Anthropic 4月预览 Mythos 后,DeepSeek 因无法竞争而融资74亿美元;此前该实验室靠 CEO 梁文锋个人财富,现有约300人,计划至少翻倍。

Chubby♨️: Anthropic's Mythos preview reportedly pushed DeepSeek into a $7.4B fundraising - because they could not compete with Myt...

AnthropicDeepSeek开源生态现象/趋势
22:15
The Verge:AI(RSS)
76
Anthropic 的 Mythos 危机持续恶化

特朗普政府 6 月 12 日以安全为由发布出口管制令,要求 Anthropic 暂停向“任何外国国民”提供 Mythos 5 和 Fable 5 访问权限。Anthropic 随后将这两款最强模型下线。经过 14 天高强度谈判仍无解决方案,联合创始人 Tom Brown 已取代 CEO Dario Amodei 参与谈判。Mythos 模型输入 token 售价为较低性能 Opus 4.8 的两倍,其下线重创 Anthropic 的营收和即将进行的 IPO,并危及与 SpaceX 每年 150 亿美元的数据中心交易。同时 OpenAI 的 GPT-5.5 Cyber 已在某些基准上超越 Mythos 5,GPT-5.6 也被要求延迟发布。谈判僵局造成美国 AI 市场真空,各国开始寻求非美国 AI 方案。

Anthropic政策/监管行业动态
关联讨论 26 条X:歸藏 (@op7418)X:Yuchen Jin (@Yuchenj_UW)X:宝玉 (@dotey)The Verge:AI(RSS)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)MarkTechPost(RSS)Ars Technica:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)Anthropic:Newsroom(网页)Ethan Mollick:One Useful Thing(RSS)X:阿易 AI Notes (@AYi_AInotes)Gary Marcus:The Road to AI We Can Trust(RSS)X:邵猛 (@shao__meng)X:Rohan Paul (@rohanpaul_ai)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)IT之家(RSS)Tomer Tunguz 博客(VC 分析)Nathan Lambert:Interconnects(RSS)Simon Willison 博客Steve Yegge:Medium(RSS)
‹ 上一页
1…678910…50
下一页 ›