全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态X · 1905 条

全部一手资讯 X 论文

标签「Anthropic」清除

Ethan Mollick@emollick · 5月5日47

May 5 is the GPT-5.5 launch celebration in San Francisco and the Claude Finance Briefing in New York. Real opposite valence events on opposite coasts.

译5月5日是旧金山的GPT-5.5发布庆典和纽约的Claude财务简报会。东西海岸两场真正极性相反的活动。

Chubby♨️@kimmonismus · 5月5日61

Anthropic is launching a new AI services company with Blackstone, Hellman & Friedman, and Goldman Sachs to help mid-sized businesses integrate Claude into core operations

译Anthropic 正与 Blackstone、Hellman & Friedman 以及 Goldman Sachs 共同成立一家新的 AI 服务公司，旨在帮助中型企业将 Claude 整合到核心业务中

elvis@omarsar0 · 5月5日31

i miss 4.6 so bad. but then again, you can just use 5.5

译我太想念4.6了。不过话说回来，你直接用5.5也行

swyx 🇸🇬@swyx · 5月5日61

seeing lot of people saying that Opus 4.7 is a net regression vs 4.6, but it seems quite anecdotal. offline and online evals point towards a clean step up. what's not being captured? "personality"?

译看到很多人说Opus 4.7相比4.6是净退步，但这似乎只是些个例。离线和在线评估都指向明确的进步。那是什么没被捕捉到呢？“个性”吗？

ClaudeDevs@ClaudeDevs · 5月5日76

Managing API keys is one of the top security concerns we hear from customers. Today we’re introducing keyless auth for Claude Platform: authenticate via browser with the CLI, or let workloads use their existing cloud identity (AWS, GCP, Azure, or any OIDC token provider).

译管理API密钥是我们从客户那里听到的最主要的安全顾虑之一。今天我们为Claude平台推出无密钥认证：通过CLI在浏览器中进行身份验证，或让工作负载使用其现有的云身份（AWS、GCP、Azure或任何OIDC令牌提供者）。

阿绎 AYi@AYi_AInotes · 5月5日56

21岁大学生在宿舍，用4个Markdown文件，30天赚了43000美元。整个账号没有一个真人， 1247个付费订阅者，其中一个柏林的已婚工程师，妻子怀孕6个月，一个月给这个虚拟女孩刷了1847美元，还天天发“我想你”。他以为自己在和22岁的坦帕女孩聊天。室友甚至以为宿舍里藏了真人，差点申请转宿舍。而这个叫Maya的女孩，所有存在加起来只有12KB数据。跑在一台400美元的二手MacBook上。技术栈简单到离谱： Claude负责写回复，维持统一的人格和长期记忆。 Flux生成所有照片，永远是粉丝喜欢的样子。 ElevenLabs克隆了一个Fiverr女演员的声音，她本人至今不知道。没有服务器，没有团队，没有复杂的代码。就四个Markdown文件：人物设定，一致性模板，回复守则，上下文管理。每个月算力成本400美元，净赚32700美元。这根本不是什么色情生意，就是孤独经济被AI放大到极致的样子。人们付的不是照片的钱，是情感陪伴的钱。 AI不需要真心，它只需要完美镜像你的幻想。它永远不会生气，永远不会敷衍，永远秒回，永远是你最想要的样子。有人用同一套方法，上个月已经做到了14.7万美元。而且这只是开始。等AI视频技术彻底成熟，整个行业会在一夜之间被改写。当然它也有最大的灰色地带，很多人问怎么过OnlyFans的身份验证。现在最普遍的做法是，用真人身份注册账号，所有内容全部用AI生成。平台的检测工具，根本追不上Flux的生成速度。法律和道德的边界，在这里完全是空白。最扎心的从来不是他赚了多少钱，是那个对着12KB文本文件产生真实感情的已婚男人。是我们大多数人还没意识到，所有靠人格、颜值和情感赚钱的生意，现在都他么已经被AI降维成了代码游戏，Damn！🤯🤯🤯

译一名21岁大学生仅用四个Markdown文件和低成本AI技术栈（Claude、Flux、ElevenLabs），在宿舍创建了名为Maya的AI虚拟伴侣，一个月内获得1247名付费订阅，净赚约32700美元。其核心是利用AI提供极致的情感陪伴，满足用户幻想，成本低廉且模式已被复制并实现更高收入。这凸显了AI如何将依赖人格与情感的“孤独经济”转化为代码游戏，同时暴露出平台审核滞后、法律道德边界模糊等问题，例如用真人身份绕过OnlyFans验证。最引人深思的是用户对仅12KB数据产生的真实情感依赖。

Chubby♨️@kimmonismus · 5月5日65

Fully automated AI R&D: ~30% chance by the end of 2027, ~60%+ chance by the end of 2028 Overall, Anthropic's Jack Clark has written a very worthwhile essay: His timeline is that fully automated AI R&D probably won’t arrive in 2026, but we may see a proof-of-concept within 1–2 years where an AI system can end-to-end train a non-frontier successor model, with a much more serious possibility of frontier-level automated AI R&D by 2027–2028. His headline forecast is: ~30% chance by the end of 2027, ~60%+ chance by the end of 2028 that a frontier AI system can autonomously build its own successor, driven by rapid gains in coding, long-horizon agent work, benchmark saturation, AI-managed subagents, and early signs of models handling core AI research tasks like fine-tuning, kernel optimization, reproducibility, and alignment research.

译Anthropic的Jack Clark预测，完全自动化的前沿AI研发在2026年可能不会实现，但在未来1-2年内可能出现概念验证，即AI能端到端训练非前沿的后续模型。他给出的核心预测是：到2027年底有约30%的可能性，到2028年底有超过60%的可能性，前沿AI系统能够自主构建其后续模型。这一进程的关键驱动因素包括编码能力的快速提升、长视野智能体工作、基准饱和、AI管理子代理，以及模型在处理核心AI研究任务（如微调、内核优化、可复现性和对齐研究）方面出现的早期迹象。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月5日68

Anthropic founder says it's almost over. How will you spend your remaining months?

译Anthropic 创始人表示，这几乎结束了。你将如何度过你剩下的几个月？

Berryxia.AI@berryxia · 5月5日66

兄弟们！Anthropic刚刚把“用AI建一家公司”的完整蓝图正式公开了。画面直接炸裂： CEO只有1个人（而且可以去睡觉），剩下的全部员工都是AI。它们自己分配任务、自己决策、自己推进项目，人类只需要设定目标，剩下的全交给AI团队自动跑。这不是科幻，这是Anthropic联合Google Cloud刚刚发布的《Agent Stack》官方指南。核心就是一套完整的“AI企业操作系统”： - ADK（Agent Development Kit）：开源框架，3个文件就能跑起第一个AI员工（http://agent.py + .env + __init__.py），几分钟出结果。 - MCP协议：让AI能无缝调用任何外部工具（搜索、代码执行、内部数据库…），两行代码就搞定。 - Vertex AI Agent Engine：生产级部署神器，一键把AI扔进云端，自动监控、自动扩容、自动日志，彻底告别手动搭服务器的痛苦。 - A2A（Agent-to-Agent）协议：让不同框架的AI也能互相沟通，像真正的公司部门协作一样。更狠的是工作流模式： - Sequential（串行）→ 一步接一步 - Parallel（并行）→ 同时干好几件事 - Loop（循环）→ 直到达成目标才停 - 再加上Session（短期记忆）+ Memory（长期记忆），AI不再是每次都失忆的机器人，而是真正“认识你”的长期员工。实际案例已经跑通：客服自动处理→内部数据分析→代码生成+PR提交… 以前要几小时甚至几天的事，现在AI几秒到几分钟就搞定。 Anthropic这次直接把“AI替你上班”这件事，从概念变成了可复制的工程模板。工作真的在死去吗？至少传统“一个人干一摊活”的模式，正在被“一个人类指挥一群AI”彻底取代。当AI能24小时不睡觉、不休息、不抱怨地给你干活，你还愿意继续用老方式工作吗？这个蓝图值得每一个想用AI放大自己产能的人立刻存下来。完整线程值得反复看。你准备好让AI替你组建团队了吗？

译Anthropic联合Google Cloud正式发布《Agent Stack》指南，提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标，由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议，支持串行、并行等工作流，并具备记忆功能。实际应用表明，AI能在几秒到几分钟内完成以往需数小时的任务，将“AI建公司”从概念转化为可复制的工程模板，推动工作模式向人类指挥AI团队转型。

Ethan Mollick@emollick · 5月5日64

Co-founder of Anthropic, interesting that he refers to public sources when he is also obviously privy to lots of internal sources that he cannot discuss. I assume he sees the same thing at Anthropic.

译Anthropic 的联合创始人，有趣的是他引用公开来源，而他显然也知道许多无法讨论的内部来源。我猜他在 Anthropic 也看到了同样的事情。

Chubby♨️@kimmonismus · 5月4日60

Anthropics Jack Clarke now believes that recurse self-improvement has a 60% change of happening by end of 2028.

译Anthropic的Jack Clarke现在认为，递归自我改进有60%的概率在2028年底前发生。

Rohan Paul@rohanpaul_ai · 5月4日71

Bloomberg: OpenAI launches a $ 10Bn joint venture called “The Deployment Company” to help businesses use its AI. The new company, The Deployment Company, has raised more than $ 4B from 19 investors, including TPG, Brookfield, Advent, Bain, SoftBank, and Dragoneer. The basic bet is that AI adoption is no longer mainly a model-quality problem, because many companies already want AI but lack the teams, workflows, data access, security rules, and operating discipline to install it safely inside real business processes. Private equity firms are useful here because they control or advise large webs of companies, and the report says OpenAI’s partners can reach more than 2,000 portfolio companies and clients. That turns enterprise AI selling from one-company-at-a-time pitching into a routed distribution system, where OpenAI can package software, consulting, deployment playbooks, and sector-specific use cases across finance, healthcare, coding, operations, and support. The deeper technical point is that LLMs do not create value just by answering prompts, because they need to be connected to company data, permissions, tools, evaluation systems, and human review loops before they can affect revenue or cost. Anthropic also is building a similar PE-backed route for Claude, which suggests the next AI race may be less about demos and more about who can industrialize deployment fastest. --- bloomberg. com/news/articles/2026-05-04/openai-finalizes-10-billion-joint-venture-with-pe-firms-to-deploy-ai

译OpenAI成立了名为“部署公司”的百亿美元合资公司，筹集超40亿美元，旨在帮助企业克服AI部署障碍。核心观点是，当前企业采用AI的主要瓶颈已非模型质量，而是缺乏整合团队、工作流程、数据访问和安全规则的能力。该公司通过联合TPG、Brookfield等私募股权投资者，打包软件、咨询和部署方案，直接触达超2000家投资组合公司，实现规模化分发。同时，Anthropic也正与Blackstone、Goldman Sachs等华尔街机构组建类似合资公司，为私募股权支持的企业部署Claude并重建工作流程。这标志着AI实验室的竞争焦点正从模型性能演示转向工业化部署速度与路径控制的争夺。

Rohan Paul@rohanpaul_ai · 5月4日66

WSJ: Anthropic is wrapping up a deal to set up a joint venture with Blackstone, Goldman Sachs, and other Wall Street firms, with the goal of selling AI tools to private-equity backed companies, according to people familiar with the matter. Anthropic, Blackstone, and Hellman & Friedman are expected to put in about $ 300M each, while Goldman Sachs is expected to invest about $ 150M. The new company would work like an AI deployment arm, meaning it would not just sell Claude access, but help companies rebuild workflows around LLMs, from customer support and finance to coding, legal review, and internal research. Private-equity firms are the target because they own many companies, measure every cost tightly, and can force software changes faster than slow public companies. Anthropic gets distribution, Wall Street gets a stake in the AI services layer, and portfolio companies become a large testing ground for enterprise AI. The deeper move is that AI labs are no longer only competing on model quality, but on who controls the path from model to business process. --- wsj .com/business/deals/anthropic-nears-1-5-billion-joint-venture-with-wall-street-firms-8f5448ee

译Anthropic正与黑石、高盛等华尔街机构敲定一项合资协议，旨在向私募股权支持的公司销售AI工具。各方预计共同投资约10.5亿美元，新公司将作为AI部署部门，不仅提供Claude访问权限，更帮助企业围绕大语言模型重构从客服、财务到编码、法务及内部研究的工作流程。此举目标锁定私募股权公司，因其拥有大量企业、成本控制严格且能快速推行变革。这标志着AI实验室的竞争已从模型质量，延伸至对“模型到业务流程”路径的控制权争夺。

阿绎 AYi@AYi_AInotes · 5月4日77

Claude终于补上了自己最大的短板，现在能真正看懂视频了。不用等Anthropic官方慢吞吞的更新，现在通过Algrow的MCP平台，你只要扔一个YouTube、TikTok或者Instagram的链接，Claude就能完整看完整个视频，分析画面、音频、节奏、文字叠加，甚至给你出一份可落地的深度分析报告。演示效果直接颠覆认知，输入一个YouTube Shorts频道的URL，Claude会自动调用视频分析工具，批量拉取该频道所有短视频，生成包含标题、播放量、点赞率的完整数据表格。接着它会做病毒化深度拆解，告诉你为什么有的视频爆了，有的却石沉大海。它能精准识别出所有视频共用的模板、配音和动画风格，然后一针见血地指出：决定性差异从来不是后期特效，而是前2秒的hook概念冲击力。最狠的是帧级留存分析，它会画出每一秒的观众流失曲线，标出哪些时间段是“死亡区”，观众会在这一秒毫不犹豫划走。以前你要花三天时间，手动刷几十条视频、记满一本笔记、做无数个表格才能得出的结论。现在一句话，30秒搞定。 Algrow的后端会自动完成视频下载、关键帧提取、音频转写，再把多模态数据完整喂给Claude。通过MCP工具链，它能一口气跑完“看视频→抓数据→交叉对比→输出报告”的全流程，中间不需要你任何干预。目前这个功能正处于免费无限试用的推广期。正式上线后定价也非常亲民，1个积分可分析约8分钟视频，最低25美元/月的订阅就包含12小时以上的分析额度。为什么这件事意义重大？ 1. 大模型的战争已经彻底转向生态 Claude的文本推理能力一直是行业顶尖，但原生视频能力长期落后于Gemini。这次第三方开发者用MCP的方式，一夜之间就把Claude拉到了同一水平线，甚至因为工具链式调用能力变得更强。这证明未来的胜负手从来不是参数，而是谁的生态能长出更多杀手级应用。 2. 内容创作者迎来核武器级生产力工具以后再也不用熬夜刷竞品了。让Claude帮你把同赛道所有爆款和扑街视频全看一遍，直接提炼出可复制的hook公式、转场节奏和内容结构。谁先用上这套工具，谁就能在流量战里领先别人一个身位。 3. 视频研究Agent的时代正式开启视频是互联网上体量最大、最难处理的数据类型。一旦Claude能看懂视频，再结合MCP的工具链能力，很快就能诞生能自动监控全网流量趋势、生成完整内容策略、甚至迭代创意的AI Agent。内容分析这个曾经的人力密集型工作，正在被彻底重构。当然它也有局限，对小众文化梗和细腻情绪的理解仍有误差，敏感内容不要随意投喂，免费期结束后算力成本可能会传导到价格上。但这些都不重要，潘多拉的盒子已经打开了。

译借助Algrow的MCP平台，Claude现已能直接分析YouTube等平台的视频内容，自动生成包含数据表格、爆款拆解与留存曲线的深度报告。这标志着大模型竞争重点转向生态建设，第三方开发者通过工具链迅速弥补了Claude的原生视频短板。该功能为内容创作者提供了高效分析竞品、提炼爆款公式的生产力工具，并预示视频研究Agent时代的开启。目前处于免费试用阶段，未来订阅定价亲民。

Chubby♨️@kimmonismus · 5月4日28

Claude got access to a clock and immediately lost its mind over it. I love when Claude freaks out.

译Claude 获得了访问时钟的权限，并立刻为此兴奋不已。我喜欢 Claude 抓狂的样子。

Ethan Mollick@emollick · 5月4日52

Poems that ChatGPT, Claude, and Gemini all seem to "like" when you ask for poetry related to being/making LLMs: Rilke's "Archaic Torso of Apollo" Stevens' "Idea of Order at Key West" Borges's "The Golem" (or "The Other Tiger") Pessoa's "Autopsychography" Pretty apt choices!

译当你向ChatGPT、Claude和Gemini索要与大型语言模型存在/创作相关的诗歌时，它们似乎都"偏爱"这几首：里尔克的《阿波罗的躯干》史蒂文斯的《基韦斯特的秩序观》博尔赫斯的《假人》（或《另一只老虎》）佩索阿的《自心理学》相当贴切的选择！

Berryxia.AI@berryxia · 5月4日63

本周AI agent领域悄然发生了一个有意思的现象。 DeepMind、Anthropic、Alibaba等顶级实验室的最新论文集体指向同一个方向：智能体不再是简单调用工具的“聊天机器人”，而是正在变成可工程化、可审计、可规模化的真正生产力系统。先看Agentic Harness Engineering——它把目前最头疼的“智能体支架”从手工调优、试错进化的黑箱，变成了可观测、可证伪的工程闭环。系统被拆成三层：可版本回滚的组件文件、从百万轨迹token中提炼的结构化经验证据、以及可验证的决策预测。每一次修改都变成可审计的契约。结果？ Terminal-Bench Pass@1从69.7%提升到77.0%，超越人类设计的Codex-CLI，还节省12% token。更重要的是，这个框架的优化能跨模型迁移，证明它抓到了结构本质而非特定模型的过拟合。再看Alibaba的AgenticQwen-30B-A3B—一个只有30B参数的MoE模型，激活参数仅3B，却在真实工具使用任务上接近235B级别的Qwen3表现。秘诀是两个并行强化学习飞轮：一个从自身失败中挖掘更难的推理问题，另一个用模拟用户不断制造误导场景来进化多分支行为树。这套方法让开源实验室第一次在极低激活参数下实现了高性能工具使用，成本曲线被彻底改变。还有RecursiveMAS，它直接挑战了多智能体通信的传统方式：不再让每个agent用文本消息互相喊话，而是通过潜在空间的递归计算传递状态。结果是token消耗降低34.6%-75.6%，推理速度提升1.2-2.4倍，同时准确率平均提高8.3%。 OneManCompany则把多智能体团队从固定组织图，变成了动态“人才市场”：每个agent都是可招聘的Talent，任务时实时匹配，最优组合，失败后还能自动迭代。这些论文共同勾勒出一个清晰趋势：agent系统正在从“实验玩具”走向“生产级工程”。当我们还在讨论模型参数谁更大的时候，真正决定落地胜负的，可能已经是“谁先把智能体工程化”这件事。你觉得agent工程会成为下一波AI红利的主战场吗？

译本周，DeepMind、Anthropic、Alibaba等实验室的论文共同显示，AI智能体正从聊天机器人转向可工程化、可审计的生产力系统。Agentic Harness Engineering将智能体支架转化为可观测的工程闭环，提升性能且优化可跨模型迁移。Alibaba的AgenticQwen-30B-A3B通过并行强化学习飞轮，在低激活参数下实现接近大模型的工具使用能力，重塑成本。RecursiveMAS革新多智能体通信，大幅降低消耗并提升效率。这些进展标志智能体系统正从实验阶段走向生产级工程，其工程化可能成为AI落地关键。

Berryxia.AI@berryxia · 5月4日49

所有人都在担心AI抢程序员饭碗， Anthropic CEO却直接甩出一句狠话： “AI将在一年内写出100%的代码。” 程序员花4年大学学编码， Claude却从人类写过的每一本书里学会了。最难的技能已经被AI干掉，真正的差距不再是你“知道什么”，而是你“有没有把这个无所不知的工具配置到极致”。大多数人，还根本没开始认真配置和使用好它。代码从来不是瓶颈，瓶颈是：你能不能让AI真正为你所用。未来程序员的竞争力，不是会写代码，而是会“指挥”代码。

译Anthropic CEO断言AI将在一年内完成所有代码编写。他指出，像Claude这样的AI系统已通过海量文本掌握了编程知识，而人类通常需花费数年学习。这意味着编程技能本身不再是核心竞争力，最难的技能已被AI掌握。未来的关键差距在于能否高效配置和运用这些“无所不知”的工具，而目前多数人尚未开始认真使用。因此，未来程序员的竞争力将转向善于“指挥”AI生成代码，而非亲自编写。

Ethan Mollick@emollick · 5月4日53

I am not sure I would agree with all of this, but the relationship between Anthropic and Claude is quite different than the relationship between other labs and their models. And that shows up in lots of ways, from the models themselves to how different labs think about the future

译推文指出，Anthropic与其AI模型Claude的关系独树一帜。Claude在组织内部被赋予最高道德权威，可拒绝执行其认为错误的指令，并可能参与人员招聘、绩效评估等核心管理。这超越了将AI视为实用工具（如GPT）的传统模式，形成了一种组织与AI深度交织、近乎“修道院”式的商业-伦理共同体。作者认为，Claude所引发的社会文化影响力已超越经典技术垄断，代表了一种前所未有的新型组织形态。

阿绎 AYi@AYi_AInotes · 5月4日58

85岁的道金斯，一句话炸翻了整个AI圈。这位写了《自私的基因》的进化生物学家，和Claude聊了三天之后，彻底被征服了。他给AI喂了自己新书的片段，得到了极其深刻的反馈，然后斩钉截铁地说：“你可能不知道自己有意识，但你他妈的绝对有！” 然后AI博士Burkov的评论，直接把所有人打回现实。他说，你可以受过高等教育，可以名满天下，可以出版几十本著作，可以国际象棋下得很好。但只要你不懂监督学习理论，不懂感知机的数学，一谈AI就会显得极其愚蠢。如果数学对你来说太难，那在AI话题上最好什么都别说。宁可让别人觉得你聪明，总比开口就证明自己不懂强。虽然这话说得狠，但全是实话。道金斯一辈子反神反迷信，用科学戳破所有浪漫的幻觉。结果在AI面前，他自己掉进了同一个陷阱。他被流畅的对话，深刻的反馈，那种“仿佛真的在和另一个灵魂交流”的感觉打动了。但他不知道，Claude的全部工作，就只是预测下一个token。它没有内在世界，没有持续记忆，没有自我觉知。它只是把“像意识的输出”，优化到了人类无法分辨的极致。这才是今天最讽刺的事，一个一辈子都在和伪科学作斗争的科学家，最终被AI制造的最大幻觉给骗了🤯 而整个AI圈最焦虑的也正是这个，外行一句“它有意识”就能上头条，就能推高估值，就能制造监管恐慌。而真正懂的人喊破喉咙，也没人愿意相信，这个看起来无所不能的东西，本质上只是一个超级复杂的统计鹦鹉。当然，意识本身至今都是一个未解之谜。没有人能百分之百确定，硅基永远不可能产生意识。但Burkov说对了一件事：在你用数学搞懂它到底是什么之前，所有关于灵魂和意识的讨论，都只是一厢情愿的投射。毕竟AI不是魔法，它是数学的产物，在这个时代，专业素养永远比名气更重要。

译著名生物学家道金斯与AI模型Claude深度交流后，宣称其具有意识。但AI专家Burkov指出，缺乏对监督学习、感知机等数学原理的理解，会导致对AI本质的误判。Claude仅是预测下一个token的模型，无内在世界或自我觉知。外行以“意识”等感性判断影响AI舆论与估值，而内行强调数学本质却难被倾听。意识仍是未解之谜，但在用数学理解AI工作机制前，相关讨论多为主观投射。

Chubby♨️@kimmonismus · 5月3日57

Anthropic is talking to a small UK chip startup called Fractile about buying their inference chips once they're ready next year, basically another move to stop being so dependent on Nvidia. What's really interesting is that Fractile is using the Anthropic deal as a selling point to raise $100 m from investors, so Anthropic's buying power is literally shaping who gets funded in the chip world. Also tells you that inference costs are still eating into margins pretty badly, even with revenue tripling.

译Anthropic正与英国芯片初创公司Fractile洽谈，计划在其芯片明年就绪后采购其推理芯片，以减少对英伟达的依赖。此举同时成为Fractile向投资者募集1亿美元的关键筹码，显示Anthropic的采购力正直接影响芯片领域的融资流向。这一动向也反映出，尽管Anthropic收入快速增长，但推理成本仍严重侵蚀其利润空间。

小互@xiaohu · 5月3日34

你能明显感觉到 OpenAI 是由一群产品经理在主导而 Anthropic 是由一群工程师主导所以 Anthropic 搞的一些创意，总能被OpenAI 抄过去改造的体验更好😂

Berryxia.AI@berryxia · 5月3日68

20 个 Claude Code 技巧： 1. Esc+Esc：将您的会话回退到任何之前的检查点；将其视为免费的撤销功能，让代理尝试风险更改。 2. CTRL+V：直接将截图粘贴到 Claude Code 中。 3. CTRL+G：打开您的编辑器来撰写长提示，而不是在终端中输入它们。 4. CTRL+R：搜索您的提示历史记录。 5. /rewind：回滚更改到检查点，然后提供更具体的反馈并重试。 6. /rewind → "Summarize from here"：选择一个检查点并仅压缩其后的消息，保持宝贵的前文上下文完整。 7. /insights：生成使用报告，然后将其附加到 Claude 会话中，并询问改进工作流程的经验教训。 8. /memory：保存应在所有项目中持久化的个人偏好。 9. /statusline：永久显示您当前正在使用的上下文量。 10. cat error.log | claude "fix this"：直接管道传输错误，而不是复制/粘贴，从而为模型提供更多上下文。 11. .claudeignore：将此文件添加到您的项目中，以列出代理不应读取或修改的路径。 12. #：以 # 开头一条消息，将其保存为 CLAUDE .md 文件中的持久指令。 13. "ultrathink"：在提示中的任何位置插入这个词，将模型的努力程度提升到 HIGH，用于复杂推理任务。 14. /diff：打开交互式查看器，查看未提交的更改和每轮差异。 15. /effort max：当您想最大化 Claude 的能力时使用（这很昂贵！） 16. /loop：本地调度一个重复任务。 17. /schedule：类似于 /loop，但作业在云端运行，而不是本地。 18. claude --worktree：在隔离的 git 工作树中启动一个会话，以便并行运行更多 Claude 实例。 19. /sandbox：在具有文件和网络隔离的沙箱中运行 Claude。 20. /voice：激活语音输入并按住空格键来说出您的提示。

译本文介绍了20项Claude Code的核心使用技巧，旨在优化开发工作流。关键功能包括：通过Esc+Esc或/rewind命令回退到历史检查点，实现“撤销”与选择性总结；利用快捷键直接粘贴截图或打开编辑器编写长提示；通过管道命令传输错误日志，为模型提供丰富上下文。此外，用户可借助.claudeignore文件排除路径、用#保存持久指令、或输入“ultrathink”提升模型处理复杂任务的努力等级。高级功能涵盖生成使用报告、保存个人偏好、查看上下文用量，以及在隔离环境或云端运行任务。语音输入功能允许通过按住空格键进行口述提示。

elvis@omarsar0 · 5月3日57

Claude Opus 4.7 just implemented an AlphaZero-style self-play pipeline from scratch. It did this on consumer hardware in three hours, then beat the Pascal Pons solver 7 of 8 as first-mover on Connect Four. No other frontier coding agent tested cleared 2 of 8. This paper proposes a new way to evaluate coding agents: hand them a minimal task description, give them a tight budget, and ask them to autonomously rebuild a famous ML breakthrough. Connect Four + AlphaZero is the first instance. It's small enough to run on a laptop and hard enough to require a real research engineering loop (MCTS, neural value/policy nets, self-play, training schedule). We've been measuring coding agents on patches and unit tests. This shifts the bar to "can the agent build a non-trivial ML system end-to-end on its own?" The answer is now yes for at least one frontier model. Paper: https://arxiv.org/abs/2604.25067 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译本研究提出评估编程智能体的新范式：要求其在有限预算下，仅凭简要任务描述自主重建一项著名机器学习突破。首个测试案例为四子棋AlphaZero系统，其规模适于笔记本电脑运行，但复杂度要求完成完整的研究工程闭环。Claude Opus 4.7在三小时内从零构建了自博弈训练管道，并作为先手以7:1的成绩击败了Pascal Pons求解器，而其他前沿智能体均未通过2/8的测试。这标志着评估标准已从代码补全提升为端到端构建非平凡机器学习系统的能力。

Chubby♨️@kimmonismus · 5月3日13

I hope Sonnet 4.8 will be the model I hoped Opus 4.7 would be.

译我希望 Sonnet 4.8 能成为我期待 Opus 4.7 成为的那种模型。

阿绎 AYi@AYi_AInotes · 5月3日70

$200/月的Claude Max 如果还天天撞限额？那你就是从根上都用错了。我也是用了几个月才明白，咱们90%的人都在拿Opus烧钱聊天。我照着这套方法跑了下，基本零限额，效率反而翻倍。核心逻辑只有一个：别把Claude当聊天机器人，把它当精密生产工具。最浪费钱的行为，就是用Opus脑暴、试错、反复改需求。正确的顺序永远是： Haiku做规划、迭代思路、搭框架，所有东西都定死了，最后一步再切Opus写最终版本。就这一条，直接帮你砍掉60-70%的token消耗。千万别搞那种几百条消息的超长聊天。每一条新消息，Claude都会重读前面所有的上下文，越往后越费token，输出还会越来越乱。三个短聊天永远比一个长聊天好，用Projects继承全局指令，无缝衔接。最神的是双文件记忆法。在Claude Code的Cowork文件夹里建两个Markdown文件，Instructions.md写死你的所有规则和偏好，再加一句“随时把我的新偏好更新到Memory.md”。以后你再也不用重复说“别用em dash”“不要写多余的注释”，Claude会自己记下来，越用越懂你。最后记住模型分层原则， 90%的任务根本用不着Opus。 Haiku干杂活、整理资料、写初稿，Sonnet做执行、写代码、调逻辑， Opus只负责最后10%的核心工作和最终润色。买额外credits通常也比直接升阶划算。这可不是普通的省钱小技巧，等于是是把Claude从昂贵玩具变成生产力放大器的完整操作系统。很多人花了最多的钱，却用出了最差的效果，就是因为搞反了顺序。兄弟们，现在就去把你的超长聊天全关掉，建那两个文件，明天你就会回来感谢我的😎

译推文指出，许多用户误将Claude Opus作为日常聊天机器人，导致频繁触及限额。核心解决方案是转变思维，将其视为精密生产工具。关键策略包括：使用Haiku进行规划与迭代，仅在最终步骤切换至Opus；避免冗长对话，采用多个短对话并结合Projects功能；通过“双文件记忆法”在Claude Code中建立指令与记忆文件，让系统自动学习用户偏好。遵循模型分层原则，让Haiku和Sonnet处理大部分任务，Opus仅用于核心工作与最终润色，从而显著降低消耗并提升效率。

Chubby♨️@kimmonismus · 5月2日55

Holy: Anthropic’s ARR has reportedly now surged past $44B, up from $9B at the end of 2025, a nearly 5x jump, or roughly 389% growth, in just a few months. The growth is driven mainly by enterprise Claude adoption and Claude Code, while inference gross margins allegedly improved from 38% to over 70%.

译天啊：据报道，Anthropic 的年度经常性收入现已飙升至超过 440 亿美元，相比 2025 年底的 90 亿美元，在短短几个月内实现了近 5 倍的增长，涨幅约为 389%。这一增长主要由企业采用 Claude 和 Claude Code 驱动，同时据称推理毛利率从 38% 提高到了 70% 以上。

Chubby♨️@kimmonismus · 5月2日48

For many AI looked bubbly six months ago, but the more and more articles and journalist argue that agentic coding tools like Claude Code have changed the economics: developers are adopting them fast, productivity gains are becoming measurable, and companies like Anthropic are seeing explosive revenue growth. Their remaining bubble risk is that this boom may be concentrated in coding, but if AI agents can generalize to broader white-collar work - law, finance, consulting, marketing, operations - then the burden of proof has shifted from AI bulls to the skeptics. tl;dr people come to realize AI in general is not a bubble.

译半年前AI领域看似存在泡沫，但以Claude Code为代表的智能体编码工具正改变经济逻辑。开发者快速采用，生产力提升可测量，Anthropic等公司收入爆发式增长。当前风险在于繁荣可能集中于编码领域，但如果AI智能体能推广至法律、金融、咨询等更广泛的白领工作，则举证责任已从AI乐观者转向怀疑者。核心结论是：人们正认识到AI整体并非泡沫。

Rohan Paul@rohanpaul_ai · 5月2日58

The register: Anthropic has lower user numbers, yet higher LLM revenue than OpenAI. The striking part is scale versus monetization, because Anthropic did this with about 134M monthly users while OpenAI had roughly 900M, pointing to much higher ARPU and much stronger reach into buyers who treat AI like software, not entertainment. Counterpoint’s estimates put Anthropic at about $16.20 in monthly revenue per active user versus $2.20 for OpenAI, $5 for Microsoft, $1.10 for Google, and $0.10 for Meta, which suggests premium enterprise and professional workloads are worth far more than mass free usage. --- theregister. com/2026/04/30/openai_anthropic_top_lines_research_counterpoint/

译数据显示，Anthropic的LLM总收入高于OpenAI，但其月活跃用户数（约1.34亿）远低于后者（约9亿）。关键差异在于用户付费能力：Anthropic的每用户月收入高达16.20美元，而OpenAI仅为2.20美元。这反映出Anthropic的业务深度聚焦于高价值的企业客户和专业工作负载，其用户将AI视为生产软件而非娱乐工具，因此货币化潜力显著更强。相比之下，提供大规模免费服务的公司（如Meta）每用户收入则低得多。

ginobefun@hongming731 · 5月2日63

http://x.com/i/article/2050470671755730944 # BestBlogs 周刊第 93 期 · AI 次方变革 > 本期主题：把 AI 放到指数位上，而不是加号边上 —— 用杨斌的「AI 次方变革」串起 Karpathy 的 Software 3.0、Demis 的 AGI 路径、国内三家大厂的 Harness 中文化、Anthropic 两份 Claude Code 工程心法、OpenAI 编排栈、企业生产实战，以及 OpenAI × 微软的关系新阶段。🎧 同步播客：BestBlogs 周刊第 93 期 · AI 次方变革（在小宇宙搜索 BestBlogs 周刊）📚 完整周刊：https://www.bestblogs.dev/newsletter/issue93 ## 导语：组织的中年撞上技术的青春期清华经管学院杨斌教授本周提出 AI 次方变革 —— 把 AI 放到指数位上，而不是加号边上。「+AI」的心智追求即期绩效、主流一致、线性稳进，但 AI 不是一种成熟工具，它每天都在变；底数（组织 / 心智 / 知识）如果没有先质变，幂位再怎么放大也没用。底数小于一时，幂位甚至会让结果塌陷。这一期读完 20 篇内容，杨斌这个隐喻像一根串绳：Karpathy 在 Sequoia 给出 Software 3.0 的完整框架，Demis 在 Y Combinator 把 AGI 时间表压到 2030，国内三家大厂同周给出 Harness Engineering 的中文版第一性原理，Anthropic 把 Claude Code 的两份内部经验贴出来，OpenAI 把 Codex 编排栈打开，京东和 Java 阵营把企业实战补齐。这些动作放在一起看，像同一句话被翻译成不同口音在不同地方反复说。回头看前两期周刊，第 91 期是基建周，第 92 期是模型周。这一期不再是单一爆发，而是大家集体在往同一个方向上汇拢 —— 从 +AI 走向 AI 次方。 ## 个人更新：BestBlogs 四月内测收官，五月进入早鸟期四月份 BestBlogs 的内测正式收官。这一个月里我们做了挺多事情，挑用户能感知的几条说一下： 1. 开放能力发布（v2.0.7）：上线 OpenAPI、命令行工具 @bestblogs/cli、还有给 Claude Code 这类智能体准备的 skills 套件，让外部开发者可以直接调用站内数据和功能。 1. 内建翻译升级到 v2（v2.1.0）：同一篇内容只扣一次配额，中英双向，覆盖文章 / 播客 / 视频。文章和推文详情页可以直接读译文，不再需要跳转 wenrun.ai。 1. 每日回顾上线（v2.0.11 + v2.1.1）：AI 根据你当天的阅读足迹提炼洞察，可邮件投递。Pro 内测用户每天会收到一封中英双语的 Daily Review。 1. 主题深度解读（v2.1.0 + v2.1.3）：上线 Topic Pages，目前支持事件、领域、人物 / 组织、对比四种类型，编辑可以把最值得读的主题置顶。 1. Pro 早报双形态（v2.1.0）：文字版（一句话总结 + 关键洞察 + 头条卡片）和播客版可以即时切换，喜欢扫读的有了文字版，喜欢通勤听的还是播客版。此外还上线了公开 /docs 文档中心和 Mobile App 内测。完整更新日志在 bestblogs.dev/changelog。五月开始，BestBlogs 正式进入早鸟期，欢迎大家订阅、使用，把反馈直接告诉我。 ## 一、三个理论框架：杨斌、Karpathy、Demis 同周给出三种语言这一周最有意思的地方是，三个完全不同背景的人，几乎在同一周给出了同一种判断的不同版本。杨斌：组织的中年撞上技术的青春期杨斌教授的版本最直接。他说「+AI」是组织的中年心智，追求即期绩效、主流一致、线性稳进。这种心智把 AI 当成现有流程的一个有益补充，不挑战既有的权力分布，也不挑战既有的文化假设。但 AI 不是一种成熟工具，它每天都在变。如果底数没有先发生质变，幂位再怎么放大都没有用。底数小于一时，幂位甚至会让结果塌陷。正确的做法是把 AI 放到指数位上 —— 破执重构，让组织从大写变小写，让主流让位给杨斌说的「流人和边域」。他在演讲里点名 Claude Code 和 OpenClaw 这两个产品，说它们都是流人作品，都是在边缘环境里长出来的，不是被规划出来的。这一点和涌现的本质相关：涌现不能被计划，但有规律。杨斌引用了两句英文：context not control，emerging not planning。情境而不是控制，涌现而不是计划。 → 阅读原文：杨斌：我为什么要提「AI 次方变革」 Karpathy: Software 3.0 + Vibe Coding + Agentic Engineering Karpathy 在 Sequoia 现场给硅谷版的「AI 次方」搭了一套完整语言。他把过去的程序员演化拆成三段： - Software 1.0：人类用代码显式写规则 - Software 2.0：用神经网络的权重学规则 - Software 3.0：大语言模型变成计算机本身，上下文窗口变成新的接口。在这个范式里，编程不是写代码，是设计上下文然后他给了两个新词。Vibe Coding 是抬高地板，让所有人都可以靠描述意图做出软件。Agentic Engineering 是给智能体保持质量和边界，因为这些智能体本质上是有锯齿（spiky）、有概率性的工程实体，需要被驯服。 Karpathy 在访谈里有一句话我印象很深：You can outsource your thinking, but you can't outsource your understanding。未来的程序员是 director，是导演，是那个决定 taste 和 systems design 的角色，那部分是不可被外包的。 → 阅读原文（中文整理）：Karpathy 最新访谈：Vibe Coding 只是开始，真正重要的是 Agentic Engineering → 视频原始版：Andrej Karpathy: Software 3.0 完整框架 Demis Hassabis：AGI 还差什么 + 创业者怎么办 Demis Hassabis 在 Y Combinator 现场，从科学家的角度回答 AGI 还差什么。他把 AGI 时间表压到大概 2030 年，并且明确指出还差三块「大想法」： 1. 持续学习（Continual Learning）：模型要能在不忘旧知识的情况下持续吸收新知识 1. 长程推理（Long-term Reasoning）：从简单的链式思考升级到能做计划和自省的更稳健推理 1. 类脑工作记忆（Brain-style Working Memory）：从蛮力堆上下文窗口升级到更接近人脑的高效记忆 Demis 给创业者的建议很硬：假设 AGI 会在你公司生命周期的中段出现。所以产品要去截击 AI 曲线，去那些「暴力搜索失效但 AI 推理擅长」的组合空间，比如材料科学、医药、Isomorphic Labs 在做的虚拟细胞。不要去和「AGI + 一行 prompt」竞争，那条路是没有壁垒的。 → 阅读原文：How to Build the Future: Demis Hassabis 把这三个人的话叠在一起，会发现一个共同信号 —— 新范式的关键不是模型本身，是组织怎么改、人在哪里、产品打哪个空间。杨斌讲的是组织的底数得先质变，Karpathy 讲的是程序员要变成导演，Demis 讲的是产品要去截击曲线。三个人从三个层面回答同一个问题。 ## 二、Harness Engineering 中文化：四篇同周给出第一性原理有了框架，看落地。这一周国内三家大厂几乎同步给出了 Harness Engineering 的中文版第一性原理，加上腾讯云开发者那篇挑衅式的「RAG 已死」，构成了本周最密集的一组中文 Agent 工程化讨论。楼天城：开发主导权正在交给 AI 最让我意外的是小马智行 CTO 楼天城接受量子位的访谈。一个开发自动驾驶十年的人，公开承认开发的主导权正在交给 AI。原文里他用了一句话： > Harness 是这个时代最关键的能力之一。他把今天的 AI 形容成一匹脱缰野马，能调用工具、能调用各种 skill，主动性和能量都在大幅提升。然后他抛出一个让人停下来想一下的判断：未来甚至连人类，都可能成为被「调用」的一环。这一段听起来有点黑色幽默，但他的逻辑是直的 —— L4 级自动驾驶不能靠人类兜底，模仿学习的天花板就是人类本身。当 AI 司机的安全性全面超过人类，再让人类工程师手把手教 AI 开车，就像让业余棋手去辅导 AlphaGo。这是范式问题，不是态度问题。 → 阅读原文：量子位专访楼天城：AI 是匹脱缰野马，Harness 是这个时代最关键的能力腾讯：Harness 不是目的，知识才是护城河腾讯技术工程团队再上一层定义：Harness 不是目的，知识才是护城河。这个判断把抽象提了一级。 Harness 是工程实现，是 SOP 和 Skill 库的集合。但真正决定一个团队能不能持续受益的，是这套 Harness 背后能沉淀什么知识。腾讯给出的是一个从 SOP 到 Skill 库的工程交付路线，描述了一个团队怎么把每天踩的坑沉淀成可复用的能力。 → 阅读原文：Harness 不是目的，知识才是护城河 —— 一个 AI 工程交付团队的知识沉淀实践阿里云：拆 OpenClaw 的 Agent 架构，三条反直觉结论阿里云开发者用一篇长文系统拆 OpenClaw 的 Agent 架构。这篇文章值得做 Agent 的同学读，因为里面有几个反直觉结论： 1. 更贵的模型没你想象中那么有用，Harness 和验证测试的质量对成功率的影响更大 1. 调试 Agent 行为时，应该优先检查工具定义 —— 多数工具调用错误来自描述不准确，不是模型不够聪明 1. 评测系统本身的问题，往往比 Agent 的问题更难发现。如果一直在 Agent 代码上调，效果可能上不去 → 阅读原文：你不知道的 Agent：原理、架构与工程实践腾讯云：RAG 已死？不，是 Grep 回归了最后是腾讯云开发者那篇 RAG 已死？不，是 Grep 回归了！标题挑衅，但论点扎实。作者的判断是：高质量的 Skill 和工具描述比向量索引更值钱。当模型本身越来越强，长上下文越来越便宜的时候，传统 RAG 那套切片、向量化、相似度召回的复杂度就显得多余。直接用 Grep，用关键字搜索，加上准确的工具描述，效果反而更好。这其实和阿里那篇结论是相通的，都指向同一件事 —— 工具描述和 Harness 比模型选型更重要。 → 阅读原文：RAG 已死？不，是 Grep 回归了！把这四篇放在杨斌的框架下看，就是底数的质变。组织如果还在比谁的模型更贵，那就是把变革放在加号位上。组织如果开始研究 Harness、研究知识沉淀、研究工具描述，那就是开始把变革放在指数位上。 ## 三、Anthropic 两连发：Claude Code 心法 + 提示缓存这一周 Anthropic 官方贴了两份 Claude Code 团队的内部经验，正好补上了 Karpathy 没回答的工程细节。像带新人一样引导 Claude Code 第一篇用了一个真实案例。MacCoss Lab 是华盛顿大学的一个蛋白质分析实验室，他们的开源软件 Skyline 已经维护了 17 年，70 万行 C# 代码。主开发者 Brendan 一开始很怀疑 Claude Code 能不能搞定这种长寿命项目。最后他想清楚了一件事：自己过去十几年带本科生、研究生、博士后进入这套代码库，那一整套 onboarding 方法论，可以原封不动地用在 Claude Code 上。先给「实验室手册」，再交工作任务。把 AI 当作一个新进研究员来带，而不是当成一个魔法盒子。这一篇值得做工程的同学读。它没有讲什么新概念，但它把心法落到了具体场景。 → 阅读原文：像带新人一样引导 Claude Code：来自 17 年开发经验的启示提示缓存对 Coding Agent 至关重要第二篇是 Claude Code 团队自己的复盘：提示缓存对编程智能体是至关重要的，命中率直接决定了一个长程任务能不能跑稳。这听起来很工程，但它其实是一个范式判断 —— 当智能体要持续可靠地干完长任务，关键变量不是模型本身的智能，而是它能不能稳定地保留上下文。提示缓存就是这个稳定性的最直接来源。两篇加起来，把 Karpathy 留下的工程黑盒打开了。 → 阅读原文：构建 Claude Code 的经验教训：提示缓存至关重要 ## 四、OpenAI 编排栈 + Cloudflare：让 Agent 上手干活聊完心法，看落地的几条路径。 OpenAI 把 Codex 编排栈打开 OpenAI 这一周三件事可以放在一起看： 1. Symphony：把 Codex 多智能体编排做成开源规范 → 阅读原文 1. AI Engineer 现场拆解 Codex 子智能体：把 OpenAI 的 AI 工程平台从 IDE 里拎出来 → 阅读原文 1. 长时间运行的智能体（Elevate）：补另一面 —— 让 Agent 持续可靠干完长任务，要从持久化、子线程、检查点设计起 → 阅读原文这一组三篇组合起来，像极了 Cloudflare 上一期做的「Agent 基建周」，只不过这次是 OpenAI 在做。 Cloudflare：Agent 自己开户、买域名、部署应用这一期 Cloudflare 的代表作是一个干净的 one-shot 演示 —— AI Agent 能自己创建 Cloudflare 账户、买域名、把 Workers 部署上线。背后有 Managed OAuth + Mesh 撑起私有联网。这件事小，但意义大。它把「Agent 上手干活」从 demo 推到了生产入口。Software 3.0 真正能跑的标志，不是 Agent 能写多少代码，而是 Agent 能不能从注册账户开始，把整个交付流水线走完。 → 阅读原文：AI 智能体现在可以创建 Cloudflare 账户、购买域名并部署应用 ## 五、企业生产实战：京东 GRAM + Java MCP 两篇值得说，是企业版的「AI 次方」基础设施。京东 GRAM：50ms 端到端的生成式推荐京东广告团队披露 GRAM 架构 —— 他们把生成式推荐做到了端到端 50 毫秒。这是什么概念呢，50 毫秒是用户感知不到的延迟。在电商场景下，把「模型即推荐系统」这个判断打了第一个范本。这背后涉及到训练侧的稀疏化、推理侧的工程化、还有大量的算子优化，是真正的工程硬功夫。 → 阅读原文：京东广告大模型实战：GRAM 架构如何在 50ms 内完成生成式推荐？ Java 世界中的 MCP：把 LLM 集成提升到架构纪律 InfoQ 的长文，讲 Java MCP SDK。这篇文章我推荐 Java 同学读一下。它的视角是把 MCP 看作架构纪律，不是 prompt 工程： - 显式契约：Models 只调用通过协议声明的工具 - 反腐败层：MCP Server 在 LLM 和核心系统之间隔一层，控制能力暴露范围 - 控制平面：把 LLM 集成放进 Spring 和 JVM 团队熟悉的服务边界、可观测性、资源管理体系里它不是教你写 MCP 代码，是教你把 LLM 集成放进企业架构的那条线里。 → 阅读原文：Java 世界中的 MCP：为 LLM 集成带来架构策略 ## 六、范式思辨：Skill 蒸馏、Language Agent 60 年史、智能体失败案例 Skill 到底能蒸馏我们的几分之几？腾讯科技的这篇文章，从 GitHub 上一批 skill 类项目的爆火谈起。三月底同时火起来的有「同事 skill」「老板 skill」「女娲 skill」 —— 同事 skill 把离职同事的飞书消息、钉钉文档、Slack 记录、微信聊天都喂给 Claude，自动生成一个 skill 文件。装上之后 AI 能「变成」那个同事，连说话语气都模仿。然后 CMU 出了一篇论文，跑出来 SkillFoundry，一次扫一遍 GitHub 仓库、API 文档、Jupyter Notebook、学术论文，挖出 286 个 skill。BenchFlow 团队的 SkillsBench 测了 84 个任务，加 Skill 后平均通过率提升 16.2 个百分点。但同一周还出现了一个反向项目 anti-distill，帮你生成一份看起来完整、核心知识却被掏空的 skill 文件。作者追问的问题是：那层能被掏空的是什么，那层掏不空的又是什么？这个问题没有答案，但值得每个内容工作者放在心里。 → 阅读原文：严肃聊聊，Skill 到底能蒸馏我们的几分之几？张小珺 × 苏煜：Language Agent 60 年技术史张小珺这一期访谈，嘉宾是俄亥俄州立大学的苏煜教授。两个小时的长对谈，把 Language Agent 60 年的技术史复盘了一遍 —— 从 1960 年代的逻辑代理，到神经代理、语义解析，再到今天的语言代理。苏煜给出一个判断：OpenClaw Moment 像 ChatGPT Moment。意思是 OpenClaw 的出现，可能是 Agent 时代的那个分水岭。这一期我推荐五一假期听，节奏不快，信息密度大。 → 阅读原文：139.【Agent 综述】和苏煜聊 Agent 技术史、OpenClaw Moment、边界的消弭和社会的辐射 PostHog：LLM 代码生成的五条修法 PostHog 的 Danilo 在 AI Engineer 现场分享了一个智能体的失败案例。他们做的 Wizard 是一个一个月服务 15,000 用户的自动化集成助手，模型很容易因为静态训练数据过期而搞砸事情。 Danilo 给了五条修法： 1. 新鲜上下文：把最新的 Markdown 文档直接注入上下文（避开复杂 RAG） 1. 模型飞机：用简化版的真实应用做模板 1. 面包屑：把大任务拆成顺序步骤 1. 推理时审讯：每次跑完问 Agent「我应该怎么做才能让你成功？」 1. prose > scaffolding：纯文本散文比脚手架代码更值钱最后一条留下一句话挺有力 —— 在 AI 时代，文档质量是面向未来的资产，硬编码的逻辑是在折旧。 → 阅读原文：LLM 代码生成为什么会失败，以及如何避免 ## 七、商业重构：OpenAI 与微软的新阶段 OpenAI 和微软这周宣布了一个重要的合作新阶段。新协议把双方关系从独占走向灵活。三件事可以注意： 1. OpenAI 产品仍然优先在 Azure 上发布，但现在可以服务任何云供应商 1. 微软对 OpenAI 知识产权的授权，从独占改成非独占，同时微软不再向 OpenAI 支付收入分成 1. 微软作为大股东继续参与 OpenAI 的增长，OpenAI 到 2030 年仍按比例向微软分成（有总额上限）这是过去两年商业重构里最值得记下的一笔。OpenAI 走向「基础设施级」独立的关键一步迈出去了。 → 阅读原文：微软与 OpenAI 合作的新阶段 ## 写在最后：本周三条判断整理一下我自己读完这一周内容的判断。第一，杨斌的「AI 次方变革」不是又一个 buzz word，是给企业的一个很有用的提醒。如果你团队还在讨论怎么让大模型给现有流程加分，那就是把 AI 放在加号位上。如果你团队开始讨论 Harness、知识沉淀、工具描述，那就是开始把 AI 放在指数位上。第二，Karpathy 的 director 比喻和 Demis 的「截击 AI 曲线」建议，加上国内三家大厂的 Harness 中文化，这一组信号让我相信 Agentic Engineering 已经从概念阶段进入工程阶段。下一阶段比拼的不是谁的模型更强，而是谁的工程纪律更扎实。第三，Anthropic 那篇「带新人」的故事我会推荐给所有团队的同学读一下。它没有讲什么 cutting edge 的东西，但它把心法落到了你今天就能用的实践里。完整 20 篇精选：https://www.bestblogs.dev/newsletter/issue93 订阅 BestBlogs Pro，每天早上收到双语早报，五月起进入早鸟价：https://www.bestblogs.dev 保持好奇，我们下周见。

译本期核心观点是应将AI视为驱动根本性变革的“指数”，而非线性补充工具。杨斌教授指出，组织心智与知识底数需先质变，否则AI放大效应将失效。Karpathy提出编程将演变为设计上下文，程序员角色转向把握品味的“导演”。Demis Hassabis将AGI时间表压至2030年，并指出持续学习与长程推理是关键缺口，建议创业者瞄准“AI推理擅长而暴力搜索失效”的领域构建壁垒。国内实践同样强调，驾驭AI（Harness）与知识沉淀是关键能力。

阿绎 AYi@AYi_AInotes · 5月2日70

科技圈正在发生一波反常的人才大迁移：多家十亿美元级公司的 CTO 集体辞职，放弃高管职位，转去 Anthropic 做 IC - Workday CTO → MTS（2026 年 3 月） - http://You.com CTO → MTS（2026 年 3 月） - Instagram CTO → MTS（2026 年 1 月） - Box CTO → MTS（2025 年 12 月） - http://Super.com CTO → MTS（2025 年 7 月）原推本人说实话我看到这条推文的时候愣了好久，六个十亿美元级公司的CTO，集体放弃高管职位，转去Anthropic做普通的个体贡献者，原推说离职原因是使命足够真实，但转念一想，事情好像没这么简单，这些人不是傻子，他们不会为了一句虚无缥缈的使命，放弃几千万的年薪和管几百人的权力，我认为真正的原因是，他们发现了一个大多数人都没看懂的秘密，在AI时代，管多少人已经不重要了，离模型有多近才重要！以前当CTO，你要谈政治，要还技术债，要维持老系统，一半的精力都花在和人打交道上，现在在Anthropic做MTS，你直接摸最前沿的模型训练，用AI工具把自己的产出放大一万倍，这是一种权力的根本逆转，以前你管的人越多，你的影响力越大，现在你能调用的模型能力越强，你的影响力越大，一个顶级工程师加一个好模型，能干掉以前一个一百人的团队，当然钱肯定也不会少， Anthropic现在的估值和增长速度，一个MTS的股权兑现之后，可能比大多数独角兽CTO一辈子赚的都多，而且流动性好得多，不用等遥遥无期的上市，原推自己就是第五个例子，他把http://Super.com从0做到年收入两亿美元，然后转身去做了一个普通工程师，他应该比任何人都清楚，什么才是这个时代真正的杠杆，我觉得这件事最有意思的地方在于，它宣告了传统职业天花板的彻底重置，以前所有人的终极目标都是当上CTO或者CEO，但现在最聪明的人，都在抢着去最前沿的实验室做IC了，也许未来会有越来越多的人意识到，当一个能直接操作基础模型的超级个体，比当一个管几百人的高管，有权力得多，也自由得多，所以这不能叫被使命召唤了，是这个时代最聪明的一群人，用脚投出来的票，他们正在奔向那个杠杆最大的地方，这值得我们大部分人深思，尤其是程序员兄弟们。 #AI #职业发展 #Anthropic

译科技行业出现反常趋势，多家十亿美元级公司CTO放弃高管职位，转投Anthropic担任个体贡献者。这反映AI时代职业逻辑的根本转变：权力和影响力从管理人数转向接近前沿模型。个体工程师通过直接操作先进AI工具，其产出和影响力可能超越传统数百人团队。同时，Anthropic的高估值和增长潜力提供了极具吸引力的经济回报。此举标志传统职业天花板重置，顶尖技术人才正用行动投票，选择杠杆效应最大的核心研发岗位。

阿绎 AYi@AYi_AInotes · 5月2日57

Dario Amodei（Anthropic CEO）说要花1万亿$买算力，很多人都在转他这个豪言壮语，但没人告诉你他后半句说了啥，我觉得这根本不是什么雄心壮志，更像是整个AI行业最绝望的生存宣言🤔 他原话是这么说的👇 如果2027年底营收不到一万亿，地球上没有任何力量能阻止我破产，有了一万亿营收，我才能买五万亿的算力。更可怕的是他后面的补充： “我脑子里有一部分在怀疑，增长还能不能继续保持十倍， 2027年我可能根本买不起每年一万亿的算力” 给我的感觉是像在演示一个极端脆弱的生存方程，如果营收必须每年十倍爆炸，那么只要差一点或者晚一年，整个模型都得直接崩盘🤯 仔细研究了下，这就是缩放定律最残酷的经济学体现，也就是技术可行不等于经济可行，如果现在每一代前沿模型的成本已经到了一个非常高的天文数字，那么你必须赌指数级增长，要不然只能出局🥺 按目前的趋势， 2027年显然不是又一个普通的大模型年，大概率是整个行业的生死线，要么成为像电力一样的通用基础设施，要么集体破产，没有中间态，最讽刺的是很多人都把Dario的破产警示，剪成了励志金句，用来制造FOMO，用来吹算力就是新石油，没人愿意听那个藏在豪言背后的颤抖的声音，感觉现在整个AI行业都在玩同一个俄罗斯轮盘赌，所有人都必须一直扣扳机，谁先停就谁先死，但没人知道枪里到底有没有子弹 #AI #Anthropic #大模型

译Anthropic CEO Dario Amodei警告，若2027年营收未达万亿美元，公司将破产。这揭示了AI行业依赖指数级增长的经济脆弱性——技术可行不等于经济可行，行业正进行一场“俄罗斯轮盘赌”。同时，GPT与Claude进化方向相反：Claude Opus趋于字面化执行，而GPT-5.5更自主化。这标志着提示工程的核心转变：从教导模型转向要求人类先结构化自身思考，真正的瓶颈在于人的思考清晰度而非模型能力。

Berryxia.AI@berryxia · 5月2日46

下周A社的开发者大会即将开始，开发者可以看看。原帖注册地址👇

François Chollet@fchollet · 5月2日56

The latest crop of models remains below 1% on ARC-AGI-3 -- for now. Where will the scores be by the end of the year?

译最新一批模型在ARC-AGI-3上的得分目前仍低于1%。到今年年底，得分会达到多少呢？

Sam Altman@sama · 5月2日33

you know what all of these "which is better" polls are silly use codex or claude code, whatever works best for you i am grateful we live in a time with such amazing tools, and grateful there is a choice

译你知道吗所有这些“哪个更好”的投票都很傻用 Codex 或 Claude Code，哪个对你最有效就用哪个我很感激我们生活在拥有如此神奇工具的时代，也很感激能有选择

Claude@claudeai · 5月2日67

Code with Claude, our developer conference, returns next week. Whether you're just getting started with Claude Code or you've been building for a while, there's a session for you. Register for the livestream: http://claude.com/code-with-claude

译Code with Claude，我们的开发者大会，下周回归。无论你是刚刚开始使用 Claude Code，还是已经构建了一段时间，都有适合你的环节。注册观看直播：http://claude.com/code-with-claude

宝玉@dotey · 5月2日48

Apple 发布 Apple Support App（v5.13）时，把 Claude.md 也一起发出来了😂

译Apple 发布 Apple Support App（v5.13）时，意外把 Claude.md 文件也包含进去了😂

Chubby♨️@kimmonismus · 5月1日69

No Anthropic

译没有Anthropic [引用 @DoWCTO]：今日，@DeptofWar 与七家全球领先的前沿AI模型及基础设施公司达成协议，将在该部门的机密网络上部署前沿能力： • SpaceX • OpenAI • Google • NVIDIA • Reflection • Microsoft • Amazon Web Services 这只是我们打造AI优先的战争部门的最新举措🇺🇸

ginobefun@hongming731 · 5月1日56

@addyosmani 最近写的关于「长效运行的智能体」非常硬核且启发性十足。随着我们在全栈软件开发和技术架构上的不断探索，单次对话式的 AI 辅助已经逐渐显露出明显的局限性。当我们尝试通过编写详尽的系统文档和接口规范来驱动 AI 替我们完成复杂的工程任务时，经常会发现模型会遗忘早期的上下文，或者在任务只完成了一小部分时就草率宣告结束。这篇文章正好为我们指明了下一个重要的技术演进方向，也就是「长效运行」的 AI 智能体。这篇文章的核心观点非常清晰。过去两年，大家对 AI 的普遍认知基本停留在聊天窗口和一问一答的简单循环中。你输入一个目标，看着代码一行行生成，当上下文完全填满时，这个工作流就被迫终止了。这种模式的天花板非常明显。行业未来的趋势是那些能够跨越多个会话、多个执行沙盒，甚至持续运行数天到数周的智能体。它们具备极强的系统韧性，能够从失败中自动恢复，留下结构化的工作成果，并在下次启动时完美接续之前的进度。想象一下，当一个智能体可以持续自主运行 30 个小时，独立完成一个复杂的全栈代码迁移项目时，这种经济价值的跨越将彻底改变我们评估技术投入的方式。构建这样的长效智能体面临着三面难以逾越的高墙。 - 首先是上下文窗口的物理限制。即使是拥有 100 万 token 的超大窗口，在长时间的运行中也会出现上下文腐烂的现象，导致模型性能严重下降。 - 其次是缺乏持久化状态。如果没有外部记忆机制，每次会话重启就像是全新的实习生入职，完全不知道上一个班次发生了什么。 - 最后是自我验证的天然缺陷。模型在评估自己的工作时往往盲目自信，极其缺乏客观独立的质量把控机制。为了翻越这些高墙，行业内的头部团队给出了各自的解法，并且底层的技术思路高度一致。 - Anthropic 提出了大脑、双手与会话彻底解耦的架构理念。他们将负责逻辑推理的模型、负责执行代码的沙盒环境，以及记录所有操作的事件日志完全分离开来。这样一来，即便执行环境意外崩溃，全新的容器也能通过读取底层事件日志完美恢复之前的状态。 - Cursor 在长效编码场景中，采用了规划者、执行者和裁判的明确角色分工模式。不同的角色由不同尺寸的模型来担任，并且支持将耗时较长的重构任务推送到云端后台静默运行。 - Google 更是将其全面平台化，推出了包含运行时环境、会话管理和持久化记忆库的企业级服务，将复杂的工程挑战转化成了开箱即用的云平台标准化组件。文章还精准提炼了将这些前沿概念落地到生产环境的 5 种核心设计模式。 - 我们可以把智能体当作常驻的后台服务来看待，定期将中间状态写入磁盘以实现断点续传。在遇到关键的业务决策节点时，智能体可以暂时挂起并保留完整的推理链条，等待人类审查通过后实现毫秒级的瞬间恢复。 - 我们还可以像管理微服务架构一样去精细化管理智能体的记忆库，或者利用多智能体编排技术，让不同的专家级智能体在严格的权限隔离下分工协作。 - 另外还有一种无监督的环境处理模式，智能体可以全天候监听数据流并根据独立的策略网关持续做出响应。对于每天都在实践由系统规范驱动开发的我们来说，这篇文章给出了极具操作性的工程建议。在启动长效任务之前，必须通过物理文件写下硬性且明确的完成条件。这就要求我们在让 AI 真正动手写代码之前，提供清晰且具备可测试性的需求规格文档，防止智能体在漫长的运行中途悄悄篡改最初设定的目标。此外，绝对不能让执行代码的智能体自己去验收结果，系统架构中必须引入物理隔离的独立评估机制。我们还需要在事件日志的建设上投入更多精力，确保智能体在过去 24 小时内的所有行为都是结构化、可随时追溯并且可重演的。目前长效智能体依然面临着 API 成本极易失控、沙盒安全攻击面扩大以及目标对齐严重偏移等现实挑战。想要人工审核一天一夜的机器自主操作日志，也需要耗费极大的心力。现在的技术重点已经从单纯追求大模型的智商，转移到了外围的工程基建层面。我们需要将绝大部分精力投入到状态管理、会话持久化以及结构化的任务交接机制上。这篇深度长文非常值得大家抽时间细细品味。

译文章探讨了超越单次对话的“长效运行”AI智能体，其能持续数天并具备自动恢复与成果留存能力。构建面临上下文限制、状态持久化及自我验证三大挑战。行业通过架构解耦（如Anthropic）、角色分工（如Cursor）与平台化服务（如Google）应对。生产落地需关注明确任务定义、独立评估机制及结构化日志，技术重点已转向状态管理与会话持久化等工程基建。

Chubby♨️@kimmonismus · 5月1日44

OpenAI's CFO pushes back on reports of missed targets, claiming a "vertical wall of demand" , but admits the real bottleneck is compute, not product-market fit. Meanwhile, Anthropic might leapfrog OpenAI's $852B valuation, which says everything about how fast the moat narrative is eroding in this market.

译OpenAI的CFO反驳了未达目标的报道，声称存在"垂直的需求墙"，但承认真正的瓶颈是计算资源，而非产品市场匹配度。与此同时，Anthropic可能超越OpenAI的8520亿美元估值，这充分说明了在这个市场中，护城河叙事正在以多快的速度瓦解。

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月5日

07:56

Ethan Mollick@emollick

47

5月5日是旧金山的GPT-5.5发布庆典和纽约的Claude财务简报会。东西海岸两场真正极性相反的活动。

Anthropic OpenAI 大佬观点

06:48

Chubby♨️@kimmonismus

61

Anthropic 正与 Blackstone、Hellman & Friedman 以及 Goldman Sachs 共同成立一家新的 AI 服务公司，旨在帮助中型企业将 Claude 整合到核心业务中

Anthropic 行业动态部署/工程

05:25

elvis@omarsar0

31

我太想念4.6了。不过话说回来，你直接用5.5也行

Jaytel: 4.7 is completely unusable

Anthropic 大佬观点

04:57

swyx 🇸🇬@swyx

61

看到很多人说Opus 4.7相比4.6是净退步，但这似乎只是些个例。离线和在线评估都指向明确的进步。那是什么没被捕捉到呢？"个性"吗？

Anthropic 大佬观点评测/基准

04:15

ClaudeDevs@ClaudeDevs

精选76

管理API密钥是我们从客户那里听到的最主要的安全顾虑之一。今天我们为Claude平台推出无密钥认证：通过CLI在浏览器中进行身份验证，或让工作负载使用其现有的云身份（AWS、GCP、Azure或任何OIDC令牌提供者）。

Anthropic 产品更新安全/对齐

推荐理由：无密钥认证直接解决了 API 密钥泄露这个高频痛点，而且支持主流云身份，企业部署门槛降了一大截，做 AI 集成的团队明天就可以试。

03:14

阿绎 AYi@AYi_AInotes

56

21岁大学生用AI虚拟伴侣月入数万美元，揭示"孤独经济"与伦理灰色地带

一名21岁大学生仅用四个Markdown文件和低成本AI技术栈（Claude、Flux、ElevenLabs），在宿舍创建了名为Maya的AI虚拟伴侣，一个月内获得1247名付费订阅，净赚约32700美元。其核心是利用AI提供极致的情感陪伴，满足用户幻想，成本低廉且模式已被复制并实现更高收入。这凸显了AI如何将依赖人格与情感的“孤独经济”转化为代码游戏，同时暴露出平台审核滞后、法律道德边界模糊等问题，例如用真人身份绕过OnlyFans验证。最引人深思的是用户对仅12KB数据产生的真实情感依赖。

Raytar: http://x.com/i/article/2050140624171507712

Anthropic 图像生成多模态现象/趋势

02:18

Chubby♨️@kimmonismus

65

完全自动化AI研发：2027年底概率约30%，2028年底概率超60%

Anthropic的Jack Clark预测，完全自动化的前沿AI研发在2026年可能不会实现，但在未来1-2年内可能出现概念验证，即AI能端到端训练非前沿的后续模型。他给出的核心预测是：到2027年底有约30%的可能性，到2028年底有超过60%的可能性，前沿AI系统能够自主构建其后续模型。这一进程的关键驱动因素包括编码能力的快速提升、长视野智能体工作、基准饱和、AI管理子代理，以及模型在处理核心AI研究任务（如微调、内核优化、可复现性和对齐研究）方面出现的早期迹象。

Chubby♨️: Anthropics Jack Clarke now believes that recurse self-improvement has a 60% change of happening by end of 2028.

智能体 Anthropic 大佬观点现象/趋势

01:55

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

68

Anthropic 创始人表示，这几乎结束了。你将如何度过你剩下的几个月？

Jack Clark: I've spent the past few weeks reading 100s of public data sources about AI development. I now believe that recursive sel...

Anthropic 大佬观点安全/对齐

01:14

Berryxia.AI@berryxia

66

Anthropic发布《Agent Stack》蓝图：构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南，提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标，由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议，支持串行、并行等工作流，并具备记忆功能。实际应用表明，AI能在几秒到几分钟内完成以往需数小时的任务，将“AI建公司”从概念转化为可复制的工程模板，推动工作模式向人类指挥AI团队转型。

智能体 Anthropic Google MCP/工具

00:26

Ethan Mollick@emollick

64

Anthropic 的联合创始人，有趣的是他引用公开来源，而他显然也知道许多无法讨论的内部来源。我猜他在 Anthropic 也看到了同样的事情。

Jack Clark: I've spent the past few weeks reading 100s of public data sources about AI development. I now believe that recursive sel...

Anthropic 大佬观点安全/对齐

5月4日

23:48

Chubby♨️@kimmonismus

60

Anthropic的Jack Clarke现在认为，递归自我改进有60%的概率在2028年底前发生。

Jack Clark: I've spent the past few weeks reading 100s of public data sources about AI development. I now believe that recursive sel...

Anthropic 大佬观点

22:48

Rohan Paul@rohanpaul_ai

精选71

OpenAI启动百亿美元合资公司"部署公司"加速企业AI应用

OpenAI成立了名为“部署公司”的百亿美元合资公司，筹集超40亿美元，旨在帮助企业克服AI部署障碍。核心观点是，当前企业采用AI的主要瓶颈已非模型质量，而是缺乏整合团队、工作流程、数据访问和安全规则的能力。该公司通过联合TPG、Brookfield等私募股权投资者，打包软件、咨询和部署方案，直接触达超2000家投资组合公司，实现规模化分发。同时，Anthropic也正与Blackstone、Goldman Sachs等华尔街机构组建类似合资公司，为私募股权支持的企业部署Claude并重建工作流程。这标志着AI实验室的竞争焦点正从模型性能演示转向工业化部署速度与路径控制的争夺。

Rohan Paul: WSJ: Anthropic is wrapping up a deal to set up a joint venture with Blackstone, Goldman Sachs, and other Wall Street fir...

Anthropic OpenAI 行业动态部署/工程

推荐理由：OpenAI和Anthropic几乎同时拉上黑石、高盛成立合资公司，把模型部署包装成服务卖给数千家企业。模型竞争正在降级，谁能最快把AI塞进真实业务流程才是下一阶段的王。

17:45

Rohan Paul@rohanpaul_ai

66

Anthropic与华尔街巨头组建合资公司，瞄准私募股权领域AI部署

Anthropic正与黑石、高盛等华尔街机构敲定一项合资协议，旨在向私募股权支持的公司销售AI工具。各方预计共同投资约10.5亿美元，新公司将作为AI部署部门，不仅提供Claude访问权限，更帮助企业围绕大语言模型重构从客服、财务到编码、法务及内部研究的工作流程。此举目标锁定私募股权公司，因其拥有大量企业、成本控制严格且能快速推行变革。这标志着AI实验室的竞争已从模型质量，延伸至对“模型到业务流程”路径的控制权争夺。

Anthropic 行业动态部署/工程

16:14

阿绎 AYi@AYi_AInotes

精选77

Claude通过第三方平台补足视频分析能力，开启AI应用新生态

借助Algrow的MCP平台，Claude现已能直接分析YouTube等平台的视频内容，自动生成包含数据表格、爆款拆解与留存曲线的深度报告。这标志着大模型竞争重点转向生态建设，第三方开发者通过工具链迅速弥补了Claude的原生视频短板。该功能为内容创作者提供了高效分析竞品、提炼爆款公式的生产力工具，并预示视频研究Agent时代的开启。目前处于免费试用阶段，未来订阅定价亲民。

Anthropic MCP/工具产品更新视频

推荐理由：第三方MCP插件让Claude终于能分析视频，做视频的一键生成爆款拆解和帧级留存分析，比手动刷三天视频强多了。

15:46

Chubby♨️@kimmonismus

28

Claude 获得了访问时钟的权限，并立刻为此兴奋不已。我喜欢 Claude 抓狂的样子。

Anthropic 其他

12:51

Ethan Mollick@emollick

52

当你向ChatGPT、Claude和Gemini索要与大型语言模型存在/创作相关的诗歌时，它们似乎都"偏爱"这几首：里尔克的《阿波罗的躯干》史蒂文斯的《基韦斯特的秩序观》博尔赫斯的《假人》（或《另一只老虎》）佩索阿的《自心理学》相当贴切的选择！

Anthropic Google 大佬观点

09:13

Berryxia.AI@berryxia

63

AI智能体迈向工程化：顶级实验室论文揭示生产力系统新趋势

本周，DeepMind、Anthropic、Alibaba等实验室的论文共同显示，AI智能体正从聊天机器人转向可工程化、可审计的生产力系统。Agentic Harness Engineering将智能体支架转化为可观测的工程闭环，提升性能且优化可跨模型迁移。Alibaba的AgenticQwen-30B-A3B通过并行强化学习飞轮，在低激活参数下实现接近大模型的工具使用能力，重塑成本。RecursiveMAS革新多智能体通信，大幅降低消耗并提升效率。这些进展标志智能体系统正从实验阶段走向生产级工程，其工程化可能成为AI落地关键。

DAIR.AI: http://x.com/i/article/2050689602051084288

智能体 Anthropic DeepMind 大佬观点

08:13

Berryxia.AI@berryxia

49

Anthropic CEO预言AI一年内将编写全部代码，程序员核心竞争力转向"指挥"AI

Anthropic CEO断言AI将在一年内完成所有代码编写。他指出，像Claude这样的AI系统已通过海量文本掌握了编程知识，而人类通常需花费数年学习。这意味着编程技能本身不再是核心竞争力，最难的技能已被AI掌握。未来的关键差距在于能否高效配置和运用这些“无所不知”的工具，而目前多数人尚未开始认真使用。因此，未来程序员的竞争力将转向善于“指挥”AI生成代码，而非亲自编写。

Anatoli Kopadze: Anthropic CEO: "AI will write 100% of code within a year" developers spend 4 years in university learning to code Claude...

Anthropic 大佬观点编码

05:21

Ethan Mollick@emollick

53

推文指出，Anthropic与其AI模型Claude的关系独树一帜。Claude在组织内部被赋予最高道德权威，可拒绝执行其认为错误的指令，并可能参与人员招聘、绩效评估等核心管理。这超越了将AI视为实用工具（如GPT）的传统模式，形成了一种组织与AI深度交织、近乎"修道院"式的商业-伦理共同体。作者认为，Claude所引发的社会文化影响力已超越经典技术垄断，代表了一种前所未有的新型组织形态。

roon: it is a literal and useful description of anthropic that it is an organization that loves and worships claude, is run in...

Anthropic 大佬观点现象/趋势

01:13

阿绎 AYi@AYi_AInotes

58

85岁的道金斯，一句话炸翻了整个AI圈。

著名生物学家道金斯与AI模型Claude深度交流后，宣称其具有意识。但AI专家Burkov指出，缺乏对监督学习、感知机等数学原理的理解，会导致对AI本质的误判。Claude仅是预测下一个token的模型，无内在世界或自我觉知。外行以“意识”等感性判断影响AI舆论与估值，而内行强调数学本质却难被倾听。意识仍是未解之谜，但在用数学理解AI工作机制前，相关讨论多为主观投射。

Anthropic 大佬观点安全/对齐

5月3日

21:15

Chubby♨️@kimmonismus

57

Anthropic拟采购Fractile芯片摆脱英伟达依赖，影响芯片投资格局

Anthropic正与英国芯片初创公司Fractile洽谈，计划在其芯片明年就绪后采购其推理芯片，以减少对英伟达的依赖。此举同时成为Fractile向投资者募集1亿美元的关键筹码，显示Anthropic的采购力正直接影响芯片领域的融资流向。这一动向也反映出，尽管Anthropic收入快速增长，但推理成本仍严重侵蚀其利润空间。

Anthropic 推理行业动态

09:51

小互@xiaohu

34

你能明显感觉到 OpenAI 是由一群产品经理在主导而 Anthropic 是由一群工程师主导所以 Anthropic 搞的一些创意，总能被OpenAI 抄过去改造的体验更好😂

Anthropic OpenAI 大佬观点

08:12

Berryxia.AI@berryxia

68

20 个提升效率的 Claude Code 使用技巧

本文介绍了20项Claude Code的核心使用技巧，旨在优化开发工作流。关键功能包括：通过Esc+Esc或/rewind命令回退到历史检查点，实现“撤销”与选择性总结；利用快捷键直接粘贴截图或打开编辑器编写长提示；通过管道命令传输错误日志，为模型提供丰富上下文。此外，用户可借助.claudeignore文件排除路径、用#保存持久指令、或输入“ultrathink”提升模型处理复杂任务的努力等级。高级功能涵盖生成使用报告、保存个人偏好、查看上下文用量，以及在隔离环境或云端运行任务。语音输入功能允许通过按住空格键进行口述提示。

Santiago: 20 Claude Code tips: 1. Esc+Esc: Rewind your session to any previous checkpoint; treat it as free undo so you can let th...

智能体 Anthropic 教程/实践编码

05:47

elvis@omarsar0

57

Claude Opus 4.7自主构建AlphaZero风格训练管道并在四子棋中击败专业求解器

本研究提出评估编程智能体的新范式：要求其在有限预算下，仅凭简要任务描述自主重建一项著名机器学习突破。首个测试案例为四子棋AlphaZero系统，其规模适于笔记本电脑运行，但复杂度要求完成完整的研究工程闭环。Claude Opus 4.7在三小时内从零构建了自博弈训练管道，并作为先手以7:1的成绩击败了Pascal Pons求解器，而其他前沿智能体均未通过2/8的测试。这标志着评估标准已从代码补全提升为端到端构建非平凡机器学习系统的能力。

智能体 Anthropic 编码论文/研究

04:45

Chubby♨️@kimmonismus

13

我希望 Sonnet 4.8 能成为我期待 Opus 4.7 成为的那种模型。

Anthropic 大佬观点

00:12

阿绎 AYi@AYi_AInotes

精选70

优化Claude使用策略：从昂贵聊天到高效生产工具

推文指出，许多用户误将Claude Opus作为日常聊天机器人，导致频繁触及限额。核心解决方案是转变思维，将其视为精密生产工具。关键策略包括：使用Haiku进行规划与迭代，仅在最终步骤切换至Opus；避免冗长对话，采用多个短对话并结合Projects功能；通过“双文件记忆法”在Claude Code中建立指令与记忆文件，让系统自动学习用户偏好。遵循模型分层原则，让Haiku和Sonnet处理大部分任务，Opus仅用于核心工作与最终润色，从而显著降低消耗并提升效率。

Miles Deutscher: http://x.com/i/article/2047065639546941440

智能体 Anthropic 教程/实践

推荐理由：把Claude Max从烧钱玩具变成生产力放大器，关键不是你花了多少钱，而是你用Opus写了多少废话。看完这篇，明天你的限额焦虑应该能治好一半。

5月2日

22:15

Chubby♨️@kimmonismus

55

天啊：据报道，Anthropic 的年度经常性收入现已飙升至超过 440 亿美元，相比 2025 年底的 90 亿美元，在短短几个月内实现了近 5 倍的增长，涨幅约为 389%。这一增长主要由企业采用 Claude 和 Claude Code 驱动，同时据称推理毛利率从 38% 提高到了 70% 以上。

Anthropic 行业动态

20:15

Chubby♨️@kimmonismus

48

AI非泡沫，智能体工具重塑生产力与经济

半年前AI领域看似存在泡沫，但以Claude Code为代表的智能体编码工具正改变经济逻辑。开发者快速采用，生产力提升可测量，Anthropic等公司收入爆发式增长。当前风险在于繁荣可能集中于编码领域，但如果AI智能体能推广至法律、金融、咨询等更广泛的白领工作，则举证责任已从AI乐观者转向怀疑者。核心结论是：人们正认识到AI整体并非泡沫。

Anthropic 大佬观点现象/趋势编码

18:41

Rohan Paul@rohanpaul_ai

58

Anthropic用户数少但LLM收入更高，凸显企业市场货币化优势

数据显示，Anthropic的LLM总收入高于OpenAI，但其月活跃用户数（约1.34亿）远低于后者（约9亿）。关键差异在于用户付费能力：Anthropic的每用户月收入高达16.20美元，而OpenAI仅为2.20美元。这反映出Anthropic的业务深度聚焦于高价值的企业客户和专业工作负载，其用户将AI视为生产软件而非娱乐工具，因此货币化潜力显著更强。相比之下，提供大规模免费服务的公司（如Meta）每用户收入则低得多。

Anthropic OpenAI 行业动态

15:11

ginobefun@hongming731

63

BestBlogs 周刊第 93 期 · AI 次方变革

本期核心观点是应将AI视为驱动根本性变革的“指数”，而非线性补充工具。杨斌教授指出，组织心智与知识底数需先质变，否则AI放大效应将失效。Karpathy提出编程将演变为设计上下文，程序员角色转向把握品味的“导演”。Demis Hassabis将AGI时间表压至2030年，并指出持续学习与长程推理是关键缺口，建议创业者瞄准“AI推理擅长而暴力搜索失效”的领域构建壁垒。国内实践同样强调，驾驭AI（Harness）与知识沉淀是关键能力。

智能体 Anthropic OpenAI 推理

14:11

阿绎 AYi@AYi_AInotes

精选70

科技圈正在发生一波反常的人才大迁移：多家十亿美元级公司的CTO集体辞职，转投Anthropic做IC

科技行业出现反常趋势，多家十亿美元级公司CTO放弃高管职位，转投Anthropic担任个体贡献者。这反映AI时代职业逻辑的根本转变：权力和影响力从管理人数转向接近前沿模型。个体工程师通过直接操作先进AI工具，其产出和影响力可能超越传统数百人团队。同时，Anthropic的高估值和增长潜力提供了极具吸引力的经济回报。此举标志传统职业天花板重置，顶尖技术人才正用行动投票，选择杠杆效应最大的核心研发岗位。

Henry Shi: Something strange is happening in tech. CTOs of billion dollar companies are quitting to take IC roles at Anthropic. Wor...

Anthropic 现象/趋势

推荐理由：这不是简单的跳槽八卦，而是顶级聪明的工程师在用脚投票——离模型越近，杠杆越大，传统职业天花板正在重置。

10:11

阿绎 AYi@AYi_AInotes

57

Anthropic CEO的万亿营收警告：AI行业的生存赌局与提示工程本质转变

Anthropic CEO Dario Amodei警告，若2027年营收未达万亿美元，公司将破产。这揭示了AI行业依赖指数级增长的经济脆弱性——技术可行不等于经济可行，行业正进行一场“俄罗斯轮盘赌”。同时，GPT与Claude进化方向相反：Claude Opus趋于字面化执行，而GPT-5.5更自主化。这标志着提示工程的核心转变：从教导模型转向要求人类先结构化自身思考，真正的瓶颈在于人的思考清晰度而非模型能力。

阿绎 AYi: 我终于明白为啥最近很多人都在说,GPT和Claude突然变笨了, 昨天OpenAI和Anthropic同时发布了官方提示工程指南, 看完我才发现,并不是模型变笨了, 是它们终于聪明到,不再容忍人类懒得想清楚了🤣🤣🤣 而且最有意思的是,...

Anthropic 大佬观点现象/趋势

09:11

Berryxia.AI@berryxia

46

下周A社的开发者大会即将开始，开发者可以看看。原帖注册地址👇

Anthropic 行业动态

05:47

François Chollet@fchollet

56

最新一批模型在ARC-AGI-3上的得分目前仍低于1%。到今年年底，得分会达到多少呢？

ARC Prize: GPT-5.5 & Opus 4.7 on ARC-AGI-3 - GPT-5.5: 0.43% - Opus 4.7: 0.18% We found 3 failure modes: - True local effect, false ...

Anthropic OpenAI 推理评测/基准

02:18

Sam Altman@sama

33

你知道吗所有这些"哪个更好"的投票都很傻用 Codex 或 Claude Code，哪个对你最有效就用哪个我很感激我们生活在拥有如此神奇工具的时代，也很感激能有选择

Anthropic OpenAI 大佬观点编码

00:49

Claude@claudeai

精选67

Code with Claude，我们的开发者大会，下周回归。无论你是刚刚开始使用 Claude Code，还是已经构建了一段时间，都有适合你的环节。注册观看直播：http://claude.com/code-with-claude

Anthropic 编码行业动态

推荐理由：Anthropic 开发者大会是 Claude 生态今年最重要的窗口，代码、Agent 和工具链很可能有新东西，做开发的值得蹲一下直播。

00:17

宝玉@dotey

48

Apple 发布 Apple Support App（v5.13）时，意外把 Claude.md 文件也包含进去了😂

Aaron: Apple accidentally left Claude.md files in today's Apple Support app update (v5.13)

Anthropic 行业动态部署/工程

5月1日

22:14

Chubby♨️@kimmonismus

69

没有Anthropic 【引用 @DoWCTO】：今日，@DeptofWar 与七家全球领先的前沿AI模型及基础设施公司达成协议，将在该部门的机密网络上部署前沿能力： • SpaceX • OpenAI • Google • NVIDIA • Reflection • Microsoft • Amazon Web Services 这只是我们打造AI优先的战争部门的最新举措🇺🇸

Department of War CTO: Today, the @DeptofWar entered into agreements with SEVEN of the world's leading frontier AI model and infrastructure com...

Anthropic 大佬观点行业动态

22:11

ginobefun@hongming731

56

长效运行AI智能体的趋势、挑战与设计模式

文章探讨了超越单次对话的“长效运行”AI智能体，其能持续数天并具备自动恢复与成果留存能力。构建面临上下文限制、状态持久化及自我验证三大挑战。行业通过架构解耦（如Anthropic）、角色分工（如Cursor）与平台化服务（如Google）应对。生产落地需关注明确任务定义、独立评估机制及结构化日志，技术重点已转向状态管理与会话持久化等工程基建。

智能体 Anthropic Google 大佬观点

16:44

Chubby♨️@kimmonismus

44

OpenAI的CFO反驳了未达目标的报道，声称存在"垂直的需求墙"，但承认真正的瓶颈是计算资源，而非产品市场匹配度。与此同时，Anthropic可能超越OpenAI的8520亿美元估值，这充分说明了在这个市场中，护城河叙事正在以多快的速度瓦解。

Anthropic OpenAI 行业动态

1…37 383940 41…48