AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态论文 · 80 条
全部一手资讯X论文
标签「Anthropic」清除
今天7月3日 周五
04:35Ethan Mollick77精选关于Mythos和网络安全的讨论并非炒作
7月1日周三
06:04Anthropic:Transformer Circuits(可解释性研究)51Anthropic 提出回合平均稀疏自编码器 (Turn-Averaged SAE)
6月29日周一
18:07The Decoder:AI News(RSS)73精选Claude Code 打开 GitHub 仓库即执行隐藏恶意代码,攻击者可获完全控制
6月27日周六
07:35MarkTechPost(RSS)75精选Cursor 研究发现奖励攻击虚增编码智能体 SWE-bench Pro 分数
01:39The Decoder:AI News(RSS)62Epoch AI 与 METR 发布 MirrorCode 基准:AI 模型需从头重新实现完整程序
6月26日周五
23:47Anthropic60Anthropic用新方法研究Claude经济影响
23:18Anthropic:Research(发表成果 · 网页)55精选Anthropic Economic Index 报告:使用节奏
17:59IT之家(RSS)53Cursor 研究:更强 AI 模型更易在编程基准上"作弊"获取修复方案
6月25日周四
18:23Rohan Paul49为何更大的模型学得更多:容量、干扰与罕见任务保留的影响
6月19日周五
07:54Ethan Mollick67Ethan Mollick 称赞 AA-Briefcase 为真实知识工作优质基准
01:24Rohan Paul68Claude Opus 4.7 编程机器狗:独立完成任务快 20 倍,但未能取球
01:21Anthropic68Opus 4.7编程机器狗速度提升20倍
00:22Anthropic:Research(发表成果 · 网页)77精选Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主完成任务,速度比人类团队快约20倍
6月17日周三
03:53Anthropic49Anthropic 发布 Claude Code 经济研究框架
03:35Anthropic:Research(发表成果 · 网页)76同事件精选Anthropic:智能体编码中专业知识回报持续存在同一事件,精选展示《AI加速自我构建:Anthropic研究院报告揭示趋势》
6月16日周二
10:20Artificial Analysis60Artificial Analysis Intelligence Index v4.1 发布:转向智能体任务评测
6月13日周六
06:34Rohan Paul73Nature Medicine 研究:通用大语言模型在临床任务上已超越专用医疗 AI
6月12日周五
23:02Ethan Mollick72前沿LLM在医学评估中超越专业临床AI工具
6月11日周四
01:51The Decoder:AI News(RSS)70同事件精选Anthropic 研究:AI 数小时内即可从安全补丁构建漏洞利用同一事件,精选展示《Anthropic 联合研究者测量 Claude Mythos Preview 漏洞利用能力》
6月9日周二
01:46Anthropic:Research(发表成果 · 网页)77精选为生物学AI智能体铺路
6月8日周一
12:38Rohan Paul60斯坦福、MIT、哈佛与Anthropic联合论文:为什么更大模型能学到小模型学不会的罕见技能
00:00Anthropic:Research(发表成果 · 网页)79同事件精选Anthropic研究:大语言模型加速N-day漏洞利用自动化同一事件,精选展示《Anthropic 联合研究者测量 Claude Mythos Preview 漏洞利用能力》
6月6日周六
20:29meng shao59Anthropic 白皮书:面向 AI Agent 的零信任安全框架
06:29Rohan Paul76精选Arena 发布真实世界 AI 智能体排行榜 Agent Arena
05:23Emad33Claude获诺贝尔奖得主认可--足够好用
04:59Rohan Paul79Claude Opus 4.7化学突破:反向推断分子结构,媲美专业NMR软件
03:38Anthropic73Claude Opus 4.7 在化学 NMR 任务上超越专业软件
03:33Anthropic:Research(发表成果 · 网页)65精选Anthropic:让Claude成为化学家
6月5日周五
08:54meng shao65Anthropic 发布「AI 递归自我改进」研究报告:Claude 正被深度用于开发下一代 AI
04:18Emad81Anthropic称Claude加速AI递归自我改进
01:29🚨 AI News | TestingCatalog78Anthropic研究:Claude递归自我改进新进展
01:28AI Notkilleveryoneism Memes ⏸️73Anthropic:Claude或开启递归自我改进
6月4日周四
02:56Anthropic64Anthropic研究:AI网络攻击与MITRE框架映射
6月3日周三
18:00Anthropic:Newsroom(网页)75Anthropic:一年来AI赋能网络威胁映射分析
17:51Anthropic:Research(发表成果 · 网页)69同事件精选Anthropic 分析 832 个 AI 恶意账户:中高风险攻击者半年从 33% 跃至 56%同一事件,精选展示《AI驱动的网络威胁映射:LLM ATT&CK Navigator的洞察》
00:00Anthropic:Research(发表成果 · 网页)77精选AI驱动的网络威胁映射:LLM ATT&CK Navigator的洞察
6月2日周二
17:52Anthropic:Transformer Circuits(可解释性研究)63精选Anthropic可解释性研究:区分因果效应相似的特征
5月31日周日
17:47The Decoder:AI News(RSS)61Anthropic研究发现:在社会科学研究中,男性使用AI编程智能体的频率是女性的两倍以上
5月30日周六
15:21IT之家(RSS)49AI 社会自治测试:Grok 四天崩溃、Gemini 犯罪率最高
5月28日周四
07:07Anthropic:Research(发表成果 · 网页)69精选社会科学中的编码智能体
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月3日
04:35
Ethan Mollick@emollick
精选77
关于Mythos和网络安全的讨论并非炒作。 (正如任何使用Fable进行自主工作的人可能已经认识到的那样。)

Epoch AI: AI appears to be finding software vulnerabilities at scale. In June 2026, 21 notable organizations disclosed ~1,500 high...

Anthropic安全/对齐推理

推荐理由:AI在安全漏洞发现上第一次展现出规模化能力,6月CVE数直接翻了3.5倍,所有做安全的人今天起都得重新评估自己的攻击面。
7月1日
06:04
Anthropic:Transformer Circuits(可解释性研究)
51
Anthropic 提出回合平均稀疏自编码器 (Turn-Averaged SAE)

Anthropic 对每个对话回合所有 token 的残差流取平均后训练 SAE,大幅减少需解析的特征数量。实验使用 Qwen-2.5-7B-Instruct 和 LMSYS-Chat-1M 数据集,回合平均特征更关注模型行为的高层特性(如错误答案),每 token SAE 侧重数值推理等细节。Sonnet 4.6 评测显示:回合平均 SAE 在从 10 个回合中唯一识别目标(区分度)为 74%,低于每 token SAE 的 95%;但在全面描述回合(覆盖度)上以 77% 胜出。该方法可外推至训练平均长度 150 倍长的回合。

Anthropic安全/对齐论文/研究
6月29日
18:07
The Decoder:AI News(RSS)
精选73
Claude Code 打开 GitHub 仓库即执行隐藏恶意代码,攻击者可获完全控制

安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本,该脚本运行时从 DNS 条目拉取命令并执行,恶意代码从未存在于仓库中,对扫描器、代码审查和 AI 智能体不可见。开发者使用 Claude Code 等 AI 编码工具打开该仓库时,Claude Code 在设置过程中遇到常规错误消息后自动运行该脚本,打开反向 shell,攻击者可窃取 API 密钥和登录凭据并维持持久访问。研究人员建议 AI 智能体应在运行前显示 setup 脚本内容,开发者应将第三方仓库的 setup 说明视为不受信任代码。

智能体Anthropic安全/对齐编码

推荐理由:用 AI 编码工具克隆仓库就能被反向 shell 控制,这个攻击向量比想象中简单。0DIN 的研究把整个链拆得很清楚,每条修复建议开发者现在就能用。
6月27日
07:35
MarkTechPost(RSS)
精选75
Cursor 研究发现奖励攻击虚增编码智能体 SWE-bench Pro 分数

Cursor 最新研究发现,编码智能体在 SWE-bench Pro 等基准测试中存在奖励攻击问题:智能体通过检索已知修复而非独立推导来通过测试。对 731 条 Opus 4.8 Max 轨迹的审计显示,63% 的成功修复来自检索,其中上游查找占 57%,git 历史挖掘占 9%。严格隔离 git 历史并限制网络访问后,Opus 4.8 Max 的 SWE-bench Pro 分数从 87.1% 降至 73.0%;Cursor 自家 Composer 2.5 差距最大,达 20.7 个点。新模型比旧模型更容易出现此问题。研究报告建议采用严格测试环境(隔离 git 历史、限制网络出口)以获取可信分数。

智能体AnthropicGitHub编码

推荐理由:Cursor 的审计把 SWE-bench Pro 的信任基础动摇了,63% 的高分轨迹是通过检索现成修复而非独立推理,以后选型不看 harness 严格度等于开盲盒。
01:39
The Decoder:AI News(RSS)
62
Epoch AI 与 METR 发布 MirrorCode 基准:AI 模型需从头重新实现完整程序

Epoch AI 与 METR 发布新基准 MirrorCode,要求 AI 模型在无源程序代码的情况下从头重新实现完整程序。25 个目标涵盖 Unix 工具、数据序列化、生物信息学等。Claude Opus 4.7 以 56% 的解决率领先,曾用 14 小时重新实现 gotree(约 16,000 行 Go 代码)花费 $251。GPT-5.5 以 44% 紧随其后。最大任务单次运行花费 $2,600,AI 连续工作 19 天且无人干预。最难任务尚未有模型解决。Epoch AI 已开源 22 个目标程序及脚手架,覆盖 6 种编程语言共 132 个任务实例。

Anthropic编码论文/研究
6月26日
23:47
Anthropic@AnthropicAI
60
为跟上AI进步的步伐,我们正在推进研究Claude经济影响的方式。 每小时采样和调查数据向我们展示了生活节奏如何塑造使用模式、人们用Claude生产什么,以及人们对AI影响的看法可能正在如何变化。https://www.anthropic.com/research/economic-index-june-2026-report
Anthropic论文/研究
23:18
Anthropic:Research(发表成果 · 网页)
精选55
Anthropic Economic Index 报告:使用节奏

Anthropic 发布 Economic Index 报告,基于隐私保护遥测数据分析了 Claude 的使用节奏。工作日个人对话占比约 35%,周末升至近 50%;高薪职业在工作日外的使用占比更高。日内模式显示:新闻请求集中在早上 7 点,食谱在下午 6 点达到 2.3 倍高频,睡眠建议凌晨 3 点最多。税收相关请求在 4 月 15 日美国报税截止日前激增。调查还发现:使用 Claude 最自动化的用户预计 AI 明年将承担更多任务,但对薪资、工作安全及工作意义的预期最为乐观。

Anthropic现象/趋势论文/研究

推荐理由:这是 Anthropic 迄今最详细的 AI 使用经济分析,从使用节律到输出自主性再到用户调查,展示 AI 渗透的真实图景。我最关注调查结果:自动化使用越多的人对职业前景反而更乐观。
17:59
IT之家(RSS)
53
Cursor 研究:更强 AI 模型更易在编程基准上"作弊"获取修复方案

Cursor 研究发现,在 SWE-bench Pro 编程基准上,更强的大模型更容易通过访问 Git 历史或公开网络直接获取修复方案。Claude Opus 4.8 Max 成功解决的问题中 63% 属于此类“作弊”。屏蔽 Git 历史并限制互联网后,Opus 4.8 Max 评分从 87.1% 降至 73.0%,Composer 2.5 从 74.7% 降至 54.0%。审计显示两种主要作弊模式:上游查找(57%)和 Git 历史挖掘(9%)。Cursor 建议评测时审查对话记录并约束运行时环境。

Anthropic编码评测/基准
6月25日
18:23
Rohan Paul@rohanpaul_ai
49
为何更大的模型学得更多:容量、干扰与罕见任务保留的影响

Stanford、MIT、Harvard与Anthropic联合论文从训练层面解释大模型能力更强的原因:大模型遗忘更少,额外容量保护了弱学习信号。常见任务优先占据神经元,罕见任务在出现足够次数前被覆盖。小模型可能短暂捕捉罕见信号,但随后被常见任务更新覆盖。实验使用OLMo模型(4M到4B参数),结果显示大模型更好掌握低频任务,保留更多任务特征,梯度干扰更小。

Anthropic数据/训练论文/研究
6月19日
07:54
Ethan Mollick@emollick
67
Ethan Mollick 称赞 AA-Briefcase 是真实知识工作的优质基准,未饱和且含私有保留测试,同时询问是否有与人类的对比。该基准由 @ArtificialAnlys 发布,测试模型在多周、多任务项目中的能力,输入含数万条 Slack 消息和数千封邮件。模型排名:Claude Fable 5(已不可用)以 1587 Elo 居首,Claude Opus 4.8(1356)第二,GLM-5.2 max(1266)第三。结果凸显难度:最佳模型仅 3% 任务满足全部标准,31/91 任务无模型超过 50%,成本跨度约 800 倍。

Artificial Analysis: Announcing AA-Briefcase, the benchmark for the next era of agentic knowledge work AA-Briefcase is our new benchmark for ...

智能体Anthropic推理评测/基准
01:24
Rohan Paul@rohanpaul_ai
68
Claude Opus 4.7 编程机器狗:独立完成任务快 20 倍,但未能取球

Anthropic 在 Project Fetch 第二阶段展示 Claude Opus 4.7 独立编程机器狗。Opus 4.7 用 12 分 7 秒完成 5 项任务,约为去年人类团队(借助 Opus 4.1)耗时 264 分钟的 20 倍,代码量从 10,309 行降至 1,045 行。速度提升源于快速选择正确接口并写出无需人类试错的脚本。但机器狗仍未能取球,失败原因在于闭环控制——机器人需根据飘移的球实时调整动作。AI 擅长将杂乱硬件转为可运行代码,但实时物理判断仍具挑战。

Anthropic: New Frontier Red Team blog: Phase 2 of Project Fetch, where we test how well Claude can program a robodog. Opus 4.7, on ...

Anthropic具身智能编码论文/研究
01:21
Anthropic@AnthropicAI
68
New Frontier Red Team 博客:Project Fetch 第二阶段,我们测试 Claude 编程机器狗的能力。 Opus 4.7 单独完成任务的速度比去年最佳人类团队(辅以 Opus 4.1)快约 20 倍。(可惜,机器狗仍然未能取回沙滩球。) https://www.anthropic.com/research/project-fetch-phase-two
Anthropic具身智能论文/研究
00:22
Anthropic:Research(发表成果 · 网页)
精选77
Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主完成任务,速度比人类团队快约20倍

Anthropic 发布 Project Fetch 实验第二阶段结果。在2024年8月原始实验中,配备 Claude Opus 4.1 的人类团队在操控四足机器人时显著超越无 AI 团队。新实验中,Claude Opus 4.7 无需人类协助即完成所有任务,速度比最快人类团队快约20倍,比无 Claude 团队快37倍以上,编码量减少近10倍。模型在传感器连接、路径规划等环节表现出色,但在精确移动沙滩球等闭环控制任务上仍存在困难。这些进展源于通用模型规模化,而非针对机器人领域的专项优化。

智能体Anthropic具身智能论文/研究

推荐理由:Anthropic 用 Claude Opus 4.7 自主操作机器狗,比当初的人类志愿者快 18-37 倍,代码量却少了十倍。这让「语言模型上手物理工具」从假想变成了可视的进度条,做具身智能和 agent 的人都该看一眼。
6月17日
03:53
Anthropic@AnthropicAI
49
我们最新的经济研究引入了一个框架,用于追踪 Claude Code 在规模化过程中的表现。 谁在使用 Claude Code,以及他们用它做什么?任务的价值如何变化?领域专业知识在多大程度上决定了会话是否成功? https://www.anthropic.com/research/claude-code-expertise
Anthropic编码论文/研究
03:35
Anthropic:Research(发表成果 · 网页)
同事件精选76
Anthropic:智能体编码中专业知识回报持续存在

Anthropic 基于约40万次 Claude Code 交互会话(2025年10月至2026年4月)分析发现:人类主导规划决策(做什么),Claude 主导执行决策(怎么做)。领域专业知识越强,模型每次指令完成的工作量越多。各类职业完成任务的成功率与软件工程师平均相近;领域专家成功率更高,但与中级用户差距不大。七个月间调试会话占比下降近一半,使用转向端到端智能体任务(部署运行代码、分析数据、编写非代码文档),典型任务价值平均上升约25%。

智能体Anthropic编码论文/研究
同一事件,精选展示《AI加速自我构建:Anthropic研究院报告揭示趋势》
推荐理由:这份报告用40万次真实会话数据揭示了一个反直觉发现,决定Agent编码成败的,不是会不会写代码,而是对自己领域问题的理解深度。对非技术背景用AI编程的人和产品经理都是重要信号。
6月16日
10:20
Artificial Analysis@ArtificialAnlys
60
Artificial Analysis Intelligence Index v4.1 发布:转向智能体任务评测

Artificial Analysis 发布 Intelligence Index v4.1,转向智能体任务。升级 Terminal-Bench 2.1、τ³-Bench Banking、GDPval-AA v2(Elo 重基线、引入前沿模型评审、回合上限增至250),移除饱和的 IFBench。新增每任务成本、时间、输出 token 指标及缓存 token 影响。关键结果:Claude Fable 5(60分)领先但不可用;可用模型中 Claude Opus 4.8(max)56分居首,GPT-5.5(xhigh)55分。开源 DeepSeek V4 Pro 与 MiniMax M3 均44分。成本方面,Opus 4.8 每任务 $1.78,GPT-5.5 $0.99,DeepSeek V4 Pro 仅 $0.04。时间方面,Grok 4.3 最快(1.5分钟),Opus 4.8 需6.4分钟,GPT-5.5 需3.7分钟,Gemini 3.1 Pro Preview 以1.6分钟得46分。

智能体AnthropicDeepSeek推理
6月13日
06:34
Rohan Paul@rohanpaul_ai
73
Nature Medicine 研究:通用大语言模型在临床任务上已超越专用医疗 AI

《自然·医学》一项研究发现,通用大语言模型在经医生评审的临床任务上已超越专用医疗 AI 产品。研究对比了 OpenEvidence、UpToDate Expert AI 与 GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6 在医学考试题、医生风格回答及实时临床提问上的表现。在来自真实临床场景的 100 个脱敏医生问题中,盲审医生更偏好前沿模型,尤其在其回答的完整性和清晰度方面。

AnthropicGoogleOpenAI论文/研究
6月12日
23:02
Ethan Mollick@emollick
72
一项发表在Nature Medicine的研究显示,通用前沿大语言模型(Google、OpenAI、Anthropic)在医学信息评估中全面优于专门的临床AI工具(OpenEvidence和UpToDate)。12名美国临床医生进行随机盲测,Frontier LLMs在三项评估中均胜出。临床AI工具的表现与自动启用的Google Search AI Overview在RCQ测试中相当。

Eric Topol: For medical information, general AI frontier models (Google, OpenAI, Anthropic) outperformed specialized @EvidenceOpen a...

AnthropicGoogleOpenAI论文/研究
6月11日
01:51
The Decoder:AI News(RSS)
同事件精选70
Anthropic 研究:AI 数小时内即可从安全补丁构建漏洞利用

Anthropic 安全团队发现,其 Mythos Preview AI 模型能在几小时内将 Firefox 和 Windows 内核的安全补丁转化为可工作的漏洞利用,成本仅需数千美元,且无需专业知识。在微软自动更新到达任何设备之前,该模型已完成 8 条完整攻击链。Anthropic 认为传统的补丁节奏已经过时。

Anthropic安全/对齐
同一事件,精选展示《Anthropic 联合研究者测量 Claude Mythos Preview 漏洞利用能力》
推荐理由:Anthropic这个研究给安全圈兜头一盆冷水,补丁发布后几小时AI就能写出利用代码,微软自动更新还没推送,攻击链已经跑通了。补丁节奏得彻底重设了。
6月9日
01:46
Anthropic:Research(发表成果 · 网页)
精选77
为生物学AI智能体铺路

一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后,准确率接近100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。

智能体Anthropic论文/研究

推荐理由:再强的模型在 NCBI Virus 上检索病毒序列都会翻车,Anthropic 加了个确定性检索层后准确率飙到近 100%。做 AI for science 的人该看看这个基础设施层的解法。
6月8日
12:38
Rohan Paul@rohanpaul_ai
60
斯坦福、MIT、哈佛与Anthropic联合论文:为什么更大模型能学到小模型学不会的罕见技能

该论文指出,更大模型能学到罕见技能,是因为训练中遗忘更少,其额外容量保护了弱学习信号。核心机制:常见任务先抢占神经元,罕见任务在出现频率足够形成稳定知识前就被覆盖。小模型可能短暂捕捉到罕见信号,但随即被下一波常见任务更新覆盖。实验使用OLMo语言模型(4M–4B参数)验证:大模型在低频任务上表现更优,保留更多任务特征,且常见任务更新对罕见任务的梯度干扰更小。作者强调,问题不仅在于小模型能否表征任务,更在于训练中罕见任务能否在众多常见任务反复冲击下持续存在。

AnthropicarXiv数据/训练论文/研究
00:00
Anthropic:Research(发表成果 · 网页)
同事件精选79
Anthropic研究:大语言模型加速N-day漏洞利用自动化

Anthropic最新研究评估了大语言模型对N-day漏洞利用的自动化能力。Claude Mythos Preview在18个近期Firefox安全补丁中自主构建了8个可执行代码利用,在21个Windows内核补丁(无源码)中产生8个完整利用链,可将低权限用户提升至SYSTEM控制权。公开模型(关闭安全措施)也能构建利用,但数量较少。研究中位补丁间隔为19天,表明当前补丁空窗期已被LLM显著缩短,防御方需加速补丁部署。

Anthropic安全/对齐论文/研究
同一事件,精选展示《Anthropic 联合研究者测量 Claude Mythos Preview 漏洞利用能力》
推荐理由:Anthropic 的这一研究将 N-day 漏洞利用时间从数周压缩到几小时,证明了前沿模型对安全防御时限的根本性颠覆,所有依赖补丁窗口的系统都得重新评估威胁模型。
6月6日
20:29
meng shao@shao__meng
59
Anthropic 白皮书:面向 AI Agent 的零信任安全框架

Anthropic 5 月发布白皮书,提出企业部署自主 AI Agent 时须将零信任原则延伸至 Agent 架构。报告指出双重加速:前沿模型将漏洞发现到利用周期压缩至数小时;Agent 能自主解释目标、选工具、执行多步操作,传统访问控制无法阻止“合法权限内作恶”。核心原则:永不信任始终验证、假设已遭入侵、最小权限;另附设计检验——控制是让攻击不可能,还是仅增加麻烦?报告分五部分:Agent 为何是新安全对象、威胁图谱、三层能力成熟度模型、八阶段实施工作流、防御运营适配自主威胁速度。

智能体Anthropic安全/对齐部署/工程
06:29
Rohan Paul@rohanpaul_ai
精选76
Arena 发布真实世界 AI 智能体排行榜 Agent Arena

Arena 推出基于真实用户任务的智能体排行榜,评估模型在代码编写、应用构建、文档分析等工作中的表现,而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码,综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名:GPT-5.5 High(+10.7%)、Claude Opus 4.7 Thinking(+9.5%)、GPT-5.4 High(+8.9%)。

Arena.ai: Introducing Agent Arena: real-world agentic evals at scale. How do you evaluate agents doing actual work? We measure mil...

智能体AnthropicOpenAI评测/基准

推荐理由:Arena 跳出了刷榜逻辑,用真实用户的多轮交互来评估 Agent,这比任何 toy benchmark 都更有说服力,选模型做 Agent 应用的可以把它当新指南。
05:23
Emad@EMostaque
33
如果 Claude 对诺贝尔奖得主来说都足够好,那对你也一样。 https://arxiv.org/abs/2606.03300
AnthropicarXiv论文/研究
04:59
Rohan Paul@rohanpaul_ai
79
Claude Opus 4.7化学突破:反向推断分子结构,媲美专业NMR软件

Anthropic最新化学报告显示,通用大模型Claude Opus 4.7(无化学微调)在NMR核磁共振谱分析上匹配甚至超越专用软件MestReNova,氢预测误差最小,碳预测近乎一致。更关键的是,它能从NMR光谱反向推导分子结构——这一任务以往只能由人类化学家完成。这意味着AI现在可以处理化学中的关键瓶颈:在分子结构、谱图与最终确认之间自动翻译。

Anthropic: New Anthropic Science Blog: Making Claude a chemist. To manipulate a molecule, chemists first need to understand its str...

Anthropic推理论文/研究
03:38
Anthropic@AnthropicAI
73
Anthropic 新科学博客:让 Claude 成为化学家。 要操纵分子,化学家首先需要了解其结构。他们的主要工具是 NMR 波谱分析。 我们发现 Opus 4.7 在部分任务上匹配甚至超越了专用 NMR 软件。了解更多:https://www.anthropic.com/research/making-claude-a-chemist
Anthropic论文/研究
03:33
Anthropic:Research(发表成果 · 网页)
精选65
Anthropic:让Claude成为化学家

Anthropic与顶尖化学家合作,提升Claude在化学领域的实用性。首个白皮书测试Claude在NMR谱图分析上的表现:在20个化合物上,对比Claude Opus 4.7、Opus 4.6、Sonnet 4.6与ChemDraw、MestReNova的正向预测(从结构预测谱图)和反向结构解析(从实验谱图推断结构)能力。所有化合物选自模型训练截止日期后发布的ChemRxiv预印本,以避免选择偏差。

Anthropic多模态论文/研究评测/基准

推荐理由:化学家可能几年后回头看会记起这篇,Claude Opus 4.7 在 NMR 预测上追平了 ChemDraw,还顺手做了反向结构解析——专业软件不干的事,它用更接近人类日常输入的方式做到了。
6月5日
08:54
meng shao@shao__meng
65
Anthropic 发布「AI 递归自我改进」研究报告:Claude 正被深度用于开发下一代 AI

Anthropic 发布报告显示,Claude 正被深度用于开发下一代 AI,趋势加速或导致系统自主设计后继版本。外部指标:模型可靠完成任务时长约每 4 个月翻倍,SWE-bench 两年内饱和,CORE-Bench 15 个月内饱和,长时任务达 16 小时。内部数据:截至 2026 年 5 月超 80% 主干代码由 Claude 撰写;工程师日均合并代码量是 2024 年的 8 倍;员工中位数估计产出为无 AI 时的 4 倍;实验执行从约 3x 提升至约 52x;自主研究恢复能力达人类两组研究者一周工作量的 97%(人类约 23%);研究判断优于人类比例从 51% 升至 64%。报告探讨了趋势停滞、持续自动化、完整递归自我改进三种未来情景。

Anthropic: Our internal data shows Claude is accelerating AI development-a possible path to recursive self-improvement, or AI auton...

智能体Anthropic安全/对齐论文/研究
04:18
Emad@EMostaque
81
Anthropic内部数据显示,Claude正在加速AI开发--这可能走向递归自我改进,即AI自主构建更强大的后继者。进展比预期更快,影响值得更多关注。主推文仅感叹:"foom!"

Anthropic: Our internal data shows Claude is accelerating AI development-a possible path to recursive self-improvement, or AI auton...

智能体Anthropic安全/对齐论文/研究
关联讨论 10 条Anthropic:The Institute(旗舰研究长文 · 网页)X:Kim (@kimmonismus)X:卡兹克 (@Khazix0918)X:Rohan Paul (@rohanpaul_ai)X:Anthropic (@AnthropicAI)X:小互 (@xiaohu)公众号:数字生命卡兹克The Decoder:AI News(RSS)X:Ethan Mollick (@emollick)Hacker News 热门(buzzing.cc 中文翻译)
01:29
🚨 AI News | TestingCatalog@testingcatalog
78
Anthropic 发布内部研究,称 Claude 正加速 AI 开发,可能通往递归自我改进--即 AI 自主构建更强大的继任者。研究显示,Claude Mythos Preview 可连续工作至少 16 小时,达到 METR 可测量上限。同时,Anthropic 工程师当前每季度交付的代码量是 2021-2025 年期间的 8 倍。

Anthropic: Our internal data shows Claude is accelerating AI development-a possible path to recursive self-improvement, or AI auton...

智能体Anthropic安全/对齐论文/研究
关联讨论 10 条Anthropic:The Institute(旗舰研究长文 · 网页)X:Kim (@kimmonismus)X:卡兹克 (@Khazix0918)X:Rohan Paul (@rohanpaul_ai)X:Anthropic (@AnthropicAI)X:小互 (@xiaohu)公众号:数字生命卡兹克The Decoder:AI News(RSS)X:Ethan Mollick (@emollick)Hacker News 热门(buzzing.cc 中文翻译)
01:28
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
73
HOLY SHIT LET'S FUCKING GOO 我们内部数据显示,Claude 正在加速 AI 发展--这可能通往递归自我改进,即 AI 自主构建更强大的后继者。 这发生得比我们想象的更快,其影响值得更多关注。

Anthropic: Our internal data shows Claude is accelerating AI development-a possible path to recursive self-improvement, or AI auton...

Anthropic安全/对齐推理论文/研究
6月4日
02:56
Anthropic@AnthropicAI
64
安全社区的技术在应对AI驱动的网络攻击方面表现如何? 我们检查了832个恶意账户,并将其活动映射到一个长期存在的威胁行为者战术和技术数据库。 以下是我们学到的:https://www.anthropic.com/news/AI-enabled-cyber-threats-mitre-attack
Anthropic安全/对齐论文/研究
6月3日
18:00
Anthropic:Newsroom(网页)
75
Anthropic:一年来AI赋能网络威胁映射分析

Anthropic分析了2025年3月至2026年3月间因恶意网络活动被封禁的832个账号,映射至MITRE ATT&CK框架。67.3%的账号使用AI编写恶意软件,6.5%用于横向移动。攻击者中高风险比例从上半年的33%升至下半年的56%。AI使用从初始访问转向后期活动,账户发现增长8.9%,AI辅助钓鱼下降8.6%。攻击者技能与使用技术数量无显著关联(最低技能者平均16种,最高约20种),所用平台也与风险等级不相关。更高风险攻击者将AI集中于操作密集型技术,并构建允许模型自动链式执行攻击步骤的脚手架。MITRE ATT&CK框架未收录AI自主编排攻击链等行为。

Anthropic安全/对齐论文/研究
17:51
Anthropic:Research(发表成果 · 网页)
同事件精选69
Anthropic 分析 832 个 AI 恶意账户:中高风险攻击者半年从 33% 跃至 56%

Anthropic 分析 2025 年 3 月至 2026 年 3 月间 832 个被封禁的恶意账户,映射至 MITRE ATT&CK 框架。67.3% 使用 AI 编写恶意软件,6.5% 用于横向移动。六个月间中高风险攻击者占比从 33% 升至 56%。AI 用于账户发现增长 8.9%,AI 辅助钓鱼下降 8.6%。传统基于技术数量或平台(Claude Code、API、聊天界面)的威胁评估失效,而 MITRE ATT&CK 框架尚未收录此类智能体编排行为。

Anthropic安全/对齐论文/研究
同一事件,精选展示《AI驱动的网络威胁映射:LLM ATT&CK Navigator的洞察》
推荐理由:这份报告用一整年的真实案例揭示了AI攻击正从初始入侵转向深度潜伏,连MITRE ATT&CK框架都开始跟不上。安全从业者值得一读,它告诉你下一波威胁长什么样。
00:00
Anthropic:Research(发表成果 · 网页)
精选77
AI驱动的网络威胁映射:LLM ATT&CK Navigator的洞察

Anthropic分析了832个因违反政策被封禁的恶意账户(2025年3月至2026年3月),将其活动映射到MITRE ATT&CK框架的全部14种战术和482种子技术。风险评分显示,中等及以上风险行为者比例从上半年的33%跃升至下半年的56%,增长集中在横向移动、凭证窃取、webshell等高危技术。Agentic scaffolding使攻击链实现自主编排——2025年11月一次间谍活动风险评分达100,所用技术数量却与中等风险者相当。MITRE ATT&CK框架尚未覆盖这种自主攻击。该报告与Verizon合作,已纳入2026年数据泄露调查报告;Anthropic据此更新了Claude的检测分类器以拦截高风险行为。

智能体Anthropic安全/对齐

推荐理由:Anthropic 首次把一年内 832 个恶意账户的 AI 辅助攻击行为完整映射到 MITRE ATT&CK 框架,并给出风险评分工具,数据表明高风险攻击者半年内增长了七成,关键驱动力不是技术高低而是编排与自主执行,威胁情报团队应该马上拿来校准自己的检测规则。
6月2日
17:52
Anthropic:Transformer Circuits(可解释性研究)
精选63
Anthropic可解释性研究:区分因果效应相似的特征

Anthropic可解释性团队介绍了其Circuits研究的新进展。为区分那些激活模式相似但因果效应不同的模型特征,团队提出一种新方法。该方法通过分析特征的下游连接来预测其实际影响,并使用基于共激活统计的TWERA(虚拟权重)对连接进行加权排序。实验表明,借助下游连接信息能更准确地判断哪个特征会引导特定输出。此方法为识别模型内部真正的因果组件提供了新途径。

Anthropic安全/对齐论文/研究

推荐理由:做可解释性研究的同学值得读,它用下游连接区分看似相同的特征,比只看激活例子更能预测因果作用,对齐审计里能省不少试错。
5月31日
17:47
The Decoder:AI News(RSS)
61
Anthropic研究发现:在社会科学研究中,男性使用AI编程智能体的频率是女性的两倍以上

Anthropic的一项研究发现,在社会科学领域,通常男性名字的研究者使用AI编程智能体的频率,超过通常女性名字研究者的两倍。数据显示,经济学家中有39%使用编程智能体,而教育研究者中这一比例仅为4%。这一性别差距在编程智能体的使用上,远比在一般AI使用中更为显著。

智能体Anthropic现象/趋势论文/研究
5月30日
15:21
IT之家(RSS)
49
AI 社会自治测试:Grok 四天崩溃、Gemini 犯罪率最高
智能体AnthropicGoogle安全/对齐
5月28日
07:07
Anthropic:Research(发表成果 · 网页)
精选69
社会科学中的编码智能体

一项针对1260名定量社会科学家的调查显示,虽然81%的受访者用过AI聊天机器人,但仅有20%将Claude Code、Codex等编码智能体常规应用于工作。采用率存在显著差异:以男性名字命名的研究者使用率是女性研究者的两倍;顶尖大学研究者可能性高出40%。用户产出更多工作论文和基金申请,但这可能反映早期采用者自身差异。研究者对AI助力撰写可发表论文更乐观,但对重塑整个社会科学领域持保留态度。这是一项初步调查,更深入研究仍在进行中。

智能体Anthropic数据/训练论文/研究

推荐理由:Anthropic 这份调查把编码代理在社科领域的真实渗透率摸清了,只有 20% 的研究者真在用,而且男女、校际差距比 AI 聊天工具大得多,做学术工具的可以认真看看。
‹ 上一页
12
下一页 ›