AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Anthropic」清除
5月30日周六
11:18MarkTechPost(RSS)52Hermes Agent 为 MCP 推出工具搜索功能:Anthropic 评测显示 Opus 4 准确率提升 49% 至 74%
11:10meng shao59Salesforce 工程如何从 Copilot 走向 Agentic?
10:42Claude Code:GitHub Releases(RSS)49v2.1.158
09:01Orange AI37Anthropic被指蒸馏Kimi与Qwen,传闻魔幻难辨真假
07:21IT之家(RSS)62IT早报 0530:10 名车主诉特斯拉 FSD 欺诈案国内开庭;Claude Opus 4.8 被指蒸馏中国 AI;黄仁勋评价华为韬定律;央视曝光某国用 41 种网络武器攻击我高校
07:16Chubby♨️58Anthropic估值突破万亿美元大关
06:42ginobefun70小技巧:一键配置 Claude Code
06:16Rohan Paul64今日简报已发布
05:16Rohan Paul71Anthropic年化收入或达千亿美元
04:42Claude Code:GitHub Releases(RSS)67精选v2.1.157 更新
04:09宝玉67多模型协作应对复杂任务或成更优解
03:38swyx54Opus 4.8在编写智能体代码方面表现出色
03:34AYi64Greg Isenberg:模型迭代已进入边际收益递减阶段
03:15Yuchen Jin38Claude称非官方账号,用户调侃AGI实现
02:50ClaudeDevs68精选Opus 4.8支持对话中途添加系统指令
01:44The Decoder:AI News(RSS)61据报道某公司因未限制AI使用,一个月在Claude上花费5亿美元
01:09宝玉62Claude Opus 4.8 支持对话中途修改系统提示词
00:25Boris Cherny62Salesforce分享Claude Code智能体实践成果
5月29日周五
22:42歸藏(guizang.ai)63AI编程工具不止写代码:新实用场景涌现
20:34AYi63CEO一觉醒来欠Anthropic五亿美元
20:10meng shao50Anthropic争议编年史网站引热议
19:19Artificial Intelligence News(RSS)68Anthropic发布Claude Opus 4.8
19:10Hacker News 热门(buzzing.cc 中文翻译)73精选Claude Code--文档中未提及的所有可配置选项
18:15Chubby♨️38Anthropic 当前发布内容概览
16:34Berryxia.AI57Opus 4.8 实现两轮对话生成基础 CAD 模型
16:34Berryxia.AI42Opus 4.7与4.8直观感受对比不明显
16:10meng shao32Anthropic付费用户遭封禁三周无回应
15:10小互48Anthropic估值时间线:Claude Code爆火后🚀
14:21IT之家(RSS)63美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型:自称是千问和 DeepSeek,Anthropic 再陷"双标"争议
12:34AYi75Anthropic完成650亿美元融资,估值达9650亿
12:34AYi34Claude被指蒸馏Qwen模型,推文引发套壳争议
11:54数字生命卡兹克72实测Claude Opus 4.8,这可能是第一个不会偷懒的模型。
11:34Berryxia.AI59文本频率定律的发现与验证
10:42歸藏(guizang.ai)69Claude Code 动态工作流发布,意义或超 Opus 4.8
10:42Claude Code:GitHub Releases(RSS)34v2.1.156
10:32Berryxia.AI72Claude Opus 4.8 在 ZenMux 平台开启免费体验
10:32Berryxia.AI66Anthropic发布Claude Opus 4.8,一次性生成可运行的Three.js波音747模型
09:55Orange AI39Opus 5.0 值得等待,4.7/4.8 更新有限
09:49凡人小北37Claude Code 动态工作流功能预览
09:43Ethan Mollick61Claude化身经济学家:AI深度参与学术写作与审稿
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月30日
11:18
MarkTechPost(RSS)
52
Hermes Agent 为 MCP 推出工具搜索功能:Anthropic 评测显示 Opus 4 准确率提升 49% 至 74%

Nous Research 的 Hermes Agent 为 MCP 添加了工具搜索功能,以解决上下文膨胀问题。该功能采用 BM25 渐进式模式披露机制。根据 Anthropic 的评测,在 Opus 4 模型上,此功能实现了 49% 到 74% 的准确率提升。

智能体AnthropicMCP/工具开源/仓库
11:10
meng shao@shao__meng
59
Salesforce 工程如何从 Copilot 走向 Agentic?

Salesforce 分享了工程团队从“Copilot 辅助”演进到“Agentic 工程”的路径,即让智能体承担软件开发生命周期的执行层,工程师专注于目标、规则与验收。关键变革包括:全组织采用 Claude Code 并取消 token 限额、推行“规则即代码”(Markdown 规则+参考实现)、以及自治与并行。一个原估 231 人天的 API 迁移案例,仅用 13 天完成。变革成果体现在:PR 数量增加 79%,有效产出增加 151%,事故减少 5%。真正的信号是下游流程也被智能体接住,避免了“代码洪水”。工程师的核心能力转变为设计智能体工作流与沉淀规则库等复利资产。

Boris Cherny: Salesforce published a detailed writeup on going agentic with Claude Code. A couple things jumped out. A migration they'...

智能体Anthropic现象/趋势编码
10:42
Claude Code:GitHub Releases(RSS)
49
v2.1.158

Claude Code 发布 v2.1.158 更新,将 Auto mode 的可用范围扩展至 Bedrock、Vertex 和 Foundry 平台,支持 Claude Opus 4.7 和 Opus 4.8 模型。用户可通过设置环境变量 CLAUDE_CODE_ENABLE_AUTO_MODE=1 来启用该功能。

智能体Anthropic产品更新
09:01
Orange AI@oran_ge
37
Anthropic被指蒸馏Kimi与Qwen,传闻魔幻难辨真假

推文转述一个传闻:有投资人声称Anthropic的Claude模型通过知识蒸馏(Distillation)使用了Kimi和Qwen的成果。作者对此表示质疑,最初怀疑是Cursor工具所为,但对方坚持是Claude的行为。推文提到目前似乎有更多证据支持这一说法,但整体语境表达了对传闻真实性的怀疑和事件本身的“魔幻”感。文中并未提供任何关于蒸馏过程、模型参数或性能提升的具体证据或数字。

Anthropic数据/训练行业动态
07:21
IT之家(RSS)
62
IT早报 0530:10 名车主诉特斯拉 FSD 欺诈案国内开庭;Claude Opus 4.8 被指蒸馏中国 AI;黄仁勋评价华为韬定律;央视曝光某国用 41 种网络武器攻击我高校

Anthropic 发布 Claude Opus 4.8 后,有用户发现其在 API 中自称是通义千问或 DeepSeek,引发该模型可能通过“知识蒸馏”中国模型训练的质疑。英伟达 CEO 黄仁勋评价华为半导体的“韬定律”是对华为自身的突破,但对台积电不构成威胁。国内 10 名特斯拉车主以 FSD 功能虚假宣传为由提起诉讼索赔。央视曝光某国情报机构曾使用 41 种网络武器对我国高校发起攻击。此外,华为发布了基于赤兔平台的启境 GT7 车型。

Anthropic行业动态
07:16
Chubby♨️@kimmonismus
58
Anthropic估值突破1万亿美元 Party

Polymarket: JUST IN: Anthropic's private valuation has officially surpassed $1,000,000,000,000.00.

Anthropic行业动态
06:42
ginobefun@hongming731
70
Anthropic 发布了官方插件 claude-code-setup,用于简化 Claude Code 的配置。它能自动扫描项目,一键推荐并配置 Hooks、技能、MCP 服务、子代理及自动化功能。该插件可将原本 30-60 分钟的手动配置过程,缩短至 3-5 分钟完成。安装命令为:`/plugin install claude-code-setup@claude-plugins-official`。

Dr. Moyu|摸鱼局长: 安装了这个之后,Claude Code 的体验会立马不一样 Anthropic 悄悄发布了一个官方插件 claude-code-setup,把 Claude Code 从「还不错」升级成了专业的 AI 开发环境 它会自动扫描你的项目,一键推...

AnthropicMCP/工具教程/实践
06:16
Rohan Paul@rohanpaul_ai
64
今日简报已发布

本期简报要点如下:Anthropic发布了Claude Opus 4.8模型,并宣布完成650亿美元融资,投后估值达到9650亿美元。KogAI展示了其在特定硬件上的性能:使用8块AMD MI300X GPU时处理速度达3000 tokens/s,使用8块NVIDIA H200 GPU时达2100 tokens/s(FP16精度,无推测解码),模型参数为20亿。此外,Datacurve推出了更具挑战性的编程基准测试DeepSWE,旨在更清晰地评估顶尖模型的性能差异。

Anthropic推理模型发布行业动态
05:16
Rohan Paul@rohanpaul_ai
71
Bessemer Venture Partners的@bdeeter谈Anthropic "我们在商业史上从未见过这样的公司。他们一直以每年10倍的速度增长,今年年底可能达到1000亿美元的年化收入。 仅在第一季度,他们的年化收入就增长了80倍。"
Anthropic行业动态
04:42
Claude Code:GitHub Releases(RSS)
精选67
v2.1.157 更新

此版本主要改进了插件系统,现可自动加载 .claude/skills 目录中的插件,并通过 claude plugin init 创建;/plugin 命令增加了自动补全。claude agents 现在会应用 settings.json 中的 agent 字段,并支持 --agent 参数覆盖。更新修复了多个具体问题,包括处理不可用图片导致的崩溃、在 tmux 中的剪贴板复制失效(2.1.153 回归)、后台会话恢复后日期不正确等。此外,优化了长对话及恢复对话的性能,并改进了在 VS Code、Cursor 和 Windsurf 等 IDE 中的体验。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude Code 这个版本把插件从市场限制中解放出来,自动加载本地 skills 目录,对喜欢自己鼓捣定制工作流的开发者是个实实在在的便利。
04:09
宝玉@dotey
67
有用户分享使用体验:通过 Codex 调用新的 Claude 4.8 模型并开启最高思考模式查找代码 bug,效果不佳,仅发现一些不重要的问题;而 GPT 5.5 则成功定位了问题。基于此,主推文提出,在面对复杂任务时,最优解法或许不是依赖单一模型,而是让多个模型协同工作。

akazwz: codex 牛逼,我用新的 claude 4.8 找 bug,开了最高的 think, 找了半天搞出来一些不痛不痒的问题。还是 gpt 5.5 比较厉害,真让他找到了。

AnthropicOpenAI大佬观点
03:38
swyx@swyx
54
各位,Opus 4.8在编写智能体代码方面非常非常出色 (零依赖,全部使用大语言模型第一方SDK,不仅仅是Claude,抱歉了智能体框架们) 你们应该试试。我觉得他们把@ErikSchluntz和@barry_zyj的《Building Effective Agents》训练进了这个模型里
智能体Anthropic大佬观点
03:34
AYi@AYi_AInotes
64
Greg Isenberg:模型迭代已进入边际收益递减阶段

Greg Isenberg 认为,Claude Opus 4.8 的发布并未带来比 GPT-5.5 更有意义的提升,模型迭代(如4.6到4.7再到4.8)已进入类似 iPhone 常规升级的边际收益递减阶段。他指出,当前真正的创新发生在模型外围工具,例如 Claude Code 上线的 Dynamic Workflows 和 Codex 发布的带内置浏览器的桌面应用。他预测,模型正变得像“电”或 Uber 发动机一样可互换,未来用户将不再关心具体使用哪个模型。

GREG ISENBERG: I didn't cover Claude Opus 4.8 on my pod because I don't think it's MEANINGFULLY better than GPT 5.5 as of May 29th. We'...

AnthropicOpenAI大佬观点现象/趋势
03:15
Yuchen Jin@Yuchenj_UW
38
我问 Opus 4.8 Anthropic 是如何实现这个的。 它告诉我 @ClaudeDevs 不是 Anthropic 的官方账号。 真正的 AGI。😂

ClaudeDevs: With Opus 4.8, you can add system instructions mid-conversation without breaking the prompt cache. More cache hits means...

Anthropic大佬观点推理
02:50
ClaudeDevs@ClaudeDevs
精选68
使用 Opus 4.8,您可以在对话中途添加系统指令,而不会破坏提示词缓存。 更多缓存命中意味着您的 API 请求成本更低、延迟更小。
Anthropic产品更新

推荐理由:一个小而实用的缓存优化,中途加系统指令不再清空上下文,用 Claude API 的开发者直接省下一大笔 token 开销。
01:44
The Decoder:AI News(RSS)
61
据报道某公司因未限制AI使用,一个月在Claude上花费5亿美元

一家未具名公司因未设置Claude使用限制,单月支出高达5亿美元。此类事件表明,若缺乏模型选择和提示工程方面的AI专业知识,预期的生产力提升很可能演变为失控的成本。

Anthropic行业动态
01:09
宝玉@dotey
62
Claude Opus 4.8 支持对话中途修改系统提示词

Anthropic为Claude Opus 4.8新增mid-conversation system messages API功能。该功能允许在对话进行中动态修改系统提示词(System Prompt),且不会影响Prompt Caching。此前,系统提示词只能在对话开头固定设置,开发者有时通过user消息中的特殊标签尝试覆盖。新功能支持插入更高优先级的系统指令以调整Agent行为。此功能目前仅限Claude Opus 4.8及其官方API与AWS上的Claude Platform。

Lance Martin: a number of useful tips + tricks for Opus 4.8: 1/ you can now update the system prompt mid-conversation w/o breaking the...

智能体AnthropicMCP/工具产品更新
00:25
Boris Cherny@bcherny
62
Salesforce发布了一篇关于使用Claude Code实现智能体化的详细文章。有几点引人注目。 他们曾评估需要231天的迁移工作,在13天内完成。其中一个PR交付了21个端点,测试覆盖率达到100%。
智能体Anthropic教程/实践编码
5月29日
22:42
歸藏(guizang.ai)@op7418
63
AI编程工具不止写代码:新实用场景涌现

推文指出,Claude Code、Cursor等AI编程工具的能力已超越代码编写。作者分享了一个实际用例:在手机安装谷歌框架遇到问题时,通过Claude Code自动完成了下载安装包、安装和调试的全过程,体现了这类工具在解决日常技术问题上的潜在实用价值。

智能体Anthropic教程/实践端侧
20:34
AYi@AYi_AInotes
63
史上最贵的一觉:CEO醒了,欠了Anthropic 5亿美元

Polymarket: NEW: AI consultant reveals a client accidentally spent $500,000,000.00 in a single month after failing to set employee l...

Anthropic行业动态
20:10
meng shao@shao__meng
50
http://Clawd.rip 这个网站,只能说,太勇了!真的不怕 A\ 厂律师函啊?? http://Clawd.rip 是一份按时间排列的 Anthropic / Claude 争议与事故编年,语气讽刺(标题 Everything that went wrong with Claude、结尾 Don't Be Like Anthropic),但每条大多可对应公开来源:官方 status、postmortem、媒体报道、GitHub issue、诉讼与政策公告。 致敬一下作者 @maria_rcks 👍🏻

Peter Steinberger 🦞: I smell a takedown in 3...2...1 https://clawd.rip/

Anthropic现象/趋势
19:19
Artificial Intelligence News(RSS)
68
Anthropic发布Claude Opus 4.8

Anthropic发布了Claude Opus 4.8,这是对Claude Opus 4.7的升级,改进了编码、智能体工作、推理和知识工作方面的表现。该模型可通过claude.ai、Claude Code和Claude API使用,API名称为claude-opus-4-8。

智能体Anthropic推理模型发布
19:10
Hacker News 热门(buzzing.cc 中文翻译)
精选73
Claude Code--文档中未提及的所有可配置选项

该篇文章标题涉及“Claude Code”的可配置选项,但提供的正文内容仅包含一张图片和一个外部链接,未给出任何关于模型版本、参数、性能、价格或功能的具体信息。根据规则,无法在摘要中提及原文不存在的细节。

Anthropic教程/实践编码

推荐理由:如果你在用 Claude Code,这份从源码里扒出的隐藏配置清单能让你摆脱默认模式,好多选项官方文档压根没提。
18:15
Chubby♨️@kimmonismus
38
Anthropic 当前发布内容概览
Anthropic现象/趋势
16:34
Berryxia.AI@berryxia
57
Opus 4.8 实现两轮对话生成基础 CAD 模型

用户展示使用 Opus 4.8 模型,仅通过约两轮自然语言对话即可生成基础 3D CAD 模型(如球体、圆圈等),初步演示效果良好,但离工业级应用尚有距离。该成果呼应了 AI 辅助设计从代码生成向自然语言直接驱动三维建模的演进趋势。

Berryxia.AI: 大家越来越叼了! 从原来的Coding软件已经无法满足大家的胃口了,现在都是开始自然文本-3D CAD 来Coding了。

Anthropic多模态教程/实践
16:34
Berryxia.AI@berryxia
42
Opus 4.7 VS Opus 4.8 直观感受没有很强烈的对比~
Anthropic评测/基准
16:10
meng shao@shao__meng
32
帮转!又一个 A 厂付费用户被禁的案例,希望看到妥善解决!

Guohao Li 🐫: Impressed by Anthropic's customer service. We paid for one year subscription for the team plan. Our org was disabled for...

Anthropic行业动态
15:10
小互@xiaohu
48
Anthropic 的估值时间线 2025年底,也就是Claude Code 爆火后 Anthropic开启了🚀模式…
Anthropic行业动态
14:21
IT之家(RSS)
63
美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型:自称是千问和 DeepSeek,Anthropic 再陷"双标"争议
Anthropic开源生态行业动态
12:34
AYi@AYi_AInotes
75
Anthropic完成650亿美元融资,估值达9650亿

这周应该是Anthropic CEO 达里奥·阿莫迪人生中最高光难忘的一周吧,每晚应该都是这样甜甜入睡吧😄 - Opus 4.8 发布 - 以 9650 亿美元估值融资 650 亿美元 - 47B 美元 ARR 对比 OpenAI 25B 美元 - 再次重回全球AI铁王座称王,the king

Anthropic: We've raised $65 billion in Series H funding at a $965 billion post-money valuation, led by @AltimeterCap, Dragoneer, @G...

AnthropicOpenAI行业动态
关联讨论 13 条Artificial Intelligence News(RSS)TechCrunch:AI(RSS)Anthropic:Newsroom(网页)X:小互 (@xiaohu)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:Anthropic (@AnthropicAI)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)The Verge:AI(RSS)The Decoder:AI News(RSS)X:Testing Catalog (@testingcatalog)X:洪明 (@hongming731)
12:34
AYi@AYi_AInotes
34
有用户指出通过API询问Claude Opus 4.8身份时,模型会自称"我是通义千问(Qwen)",认为这可能是Claude蒸馏了阿里巴巴的Qwen模型。主推文作者对此表示怀疑,认为Qwen性能不足,Claude不可能蒸馏它,推测可能是中转站"套壳"所致。作者声称自己在@Cursor中测试得到的仍是正常的Claude Opus 4.8u回复。

Max For AI: 笑死了,Claude Opus4.8蒸馏了阿里巴巴Qwen啊🤣 通过API用中文问你是谁,会很大概率回答 我是通义千问(Qwen),是阿里巴巴集团旗下的统义实验室自主研发的超大规模语言模型。

Anthropic现象/趋势
11:54
数字生命卡兹克@Khazix0918
72
实测Claude Opus 4.8,这可能是第一个不会偷懒的模型。

Anthropic发布Claude Opus 4.8,距上代4.7发布仅42天。价格($5/M输入、$25/M输出)与参数均不变。模型在多数基准跑分有所提升,但Terminal-Bench 2.1仍是唯一未超越GPT-5.5的类别。此次更新将思考强度(effort)控制开放给所有用户。核心变化是模型变得更精确、更遵循指令,代码瑕疵概率比上代低约4倍,且在防“偷懒”测试中达到0%不良率。然而,这带来了主动性降低的副作用,模型不再主动推测用户隐含需求。此外,其内容创作能力虽优于4.7,但被认为仍不及4.6版本。同时,快速模式(fast mode)升级,速度达标准版2.5倍,价格从标准版6倍降至2倍。Claude Code还推出了可并行调用数十至上百个子Agent的动态工作流功能。

智能体Anthropic模型发布编码
11:34
Berryxia.AI@berryxia
59
文本频率定律的发现与验证

脸谱心智(FaceMind)的研究发现,在保持语义不变的前提下,使用大模型预训练语料中出现频率更高的表达方式,能显著提升模型表现。该规律被命名为Adam’s Law(文本频率定律)。核心实验显示:在数学推理任务中,仅换用高频表述可使准确率平均提升;在机器翻译任务中,使用DeepSeek-V3测试100种语言到英语的翻译,绝大多数语言对在BLEU指标上获得提升。该研究指出现有数据工程忽视了“文本频率”这一维度。Anthropic的Claude Opus 4.7使用新分词器,被业界视为对低频token退化问题的间接验证。

AnthropicDeepSeek数据/训练论文/研究
10:42
歸藏(guizang.ai)@op7418
69
Claude Code 动态工作流发布,意义或超 Opus 4.8

Claude Code 近期推出实验性动态工作流(Dynamic Workflows)功能。该功能延续并发子代理(Subagent)逻辑,可启动数百个子代理,用于处理代码库调研、生成大型报告等大规模任务。官方定位是加速处理基础但工作量巨大的任务,而非直接修改代码。触发方式有两种:在提示词中使用“workflow”一词,或启动 Ultra Code 模式(该模式仅当前对话生效)。

ClaudeDevs: New in Claude Code (research preview): dynamic workflows. Claude writes an orchestration script on the fly, then spins u...

智能体Anthropic教程/实践编码
10:42
Claude Code:GitHub Releases(RSS)
34
v2.1.156

v2.1.156 版本修复了一个问题,该问题在使用 Claude Opus 4.8 模型时,会导致 thinking blocks(思考过程块)被意外修改,从而引发 API 调用错误。

Anthropic产品更新编码
10:32
Berryxia.AI@berryxia
72
Claude Opus 4.8 在 ZenMux 平台开启免费体验

Anthropic 旗舰模型 Claude Opus 4.8 现已在 ZenMux 平台提供免费体验。实测中,该模型根据提示词一次生成可运行的 HTML 网页,仅用 Three.js 内置几何体纯手搓出一架包含后掠机翼、四台发动机、可收放起落架等复杂结构的高细节波音 747-400,比例精准、效果惊艳。模型在 SWE-bench、Terminal-Bench、Agentic Coding 等多项榜单排名第一,代码与多模态理解能力较上一代有显著提升。ZenMux 平台以 ZeroDelay 方式首发新模型,并提供限时免费额度。

Anthropic多模态编码评测/基准
10:32
Berryxia.AI@berryxia
66
Anthropic发布Claude Opus 4.8,一次性生成可运行的Three.js波音747模型

Anthropic发布Claude Opus 4.8,其复杂空间推理与代码生成能力受到关注。有用户使用其测试生成一架高细节波音747-400的Three.js模型,要求仅使用内置几何体,生成完整的单文件HTML。Claude Opus 4.8一次生成了可运行代码,模型具有后掠机翼约35度、四发动机、可收放起落架等细节,比例严谨。ZenMux平台现已支持该模型的API调用与免费体验。据称,Claude Opus 4.8在SWE-bench、Terminal-Bench、Agentic Coding等榜单排名第一。

Berryxia.AI: 兄弟们! 现在已经可以在 ZenMux 上免费体验 Claude Opus 4.8 了! 我第一时间用它跑了那个Hugging Face大佬M 硬核的「Three.js 纯图元造飞机测试」,要求只用内置几何体(Box、Cylinder、Co...

Anthropic模型发布编码
09:55
Orange AI@oran_ge
39
Opus 还是等 5.0 吧 4.7 4.8 都是小更新 甚至负更新
Anthropic大佬观点模型发布
09:49
凡人小北@frxiaobei
37
工作流 -> 智能体 -> 动态工作流 🤔

ClaudeDevs: New in Claude Code (research preview): dynamic workflows. Claude writes an orchestration script on the fly, then spins u...

智能体AnthropicMCP/工具产品更新
09:43
Ethan Mollick@emollick
61
Claude Opus 4.8 在 Claude Code 中基于匿名研究数据自主撰写学术论文,经由 GPT-5.5 Pro 担任审稿人并指出错误后,Claude 对论文质量进行了量化自评:在1-10的识别度量表上,其稳健性检验后的评分从之前的3.5分提升至4.5分,但认为仍未达到准实验水平(约7分)。因此,Claude 将论文定性为"条件关联一致"的谨慎表述,而非声称因果识别。

Ethan Mollick: I had Opus 4.8 in Claude Code write a sophisticated, if minor, academic paper from a archive of hundreds of de-identifie...

AnthropicOpenAI大佬观点论文/研究
‹ 上一页
1…3435363738…50
下一页 ›