AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1905 条
全部一手资讯X论文
标签「Anthropic」清除
Chubby♨️@kimmonismus · 5月6日68

Anthropic just committed to spending $200 billion with Google Cloud over five years. Combined with its $100 billion Amazon deal from April, the company is now making infrastructure commitments that dwarf most public tech companies' entire market caps, and it hasn't even IPO'd yet. Anthropic and OpenAI together now make up roughly half of the $2 trillion in revenue backlog across the four largest US cloud providers. The entire cloud growth story that Wall Street is currently pricing into big tech earnings is, at its core, a bet on two cash-burning startups hitting 20 to 30x revenue growth by 2029. While OpenAI is building its own data centers through Stargate, Anthropic is locking in capacity across Google, Amazon, and Microsoft simultaneously. No single point of failure, no hardware ownership risk. The tradeoff is deeper dependency: Google is running Anthropic on its own TPU chips, not just Nvidia hardware, which means better margins for Google but an increasingly asymmetric relationship for Anthropic.

译Anthropic与谷歌云达成五年2000亿美元云基础设施合同,加之四月与亚马逊的千亿美元协议,其未上市即承诺的云支出规模已超越多数科技公司市值。Anthropic与OpenAI共同占据美国四大云服务商约2万亿美元收入积压订单的一半,这实质上是市场对两家初创公司在2029年前实现20-30倍收入增长的豪赌。与OpenAI自建数据中心不同,Anthropic同时绑定谷歌、亚马逊和微软的云产能,虽避免了单点故障和硬件持有风险,却加深了对云巨头的依赖——谷歌正用自研TPU芯片运行其模型,这种不对称关系可能影响其长期议价能力。

Berryxia.AI@berryxia · 5月6日64

我特么信你个鬼!!! 又是中国的小伙发财日记!!!

译一位中国开发者基于Claude Sonnet 4.6创建了由7个智能体组成的全自动化系统,专为小城镇无网站的小微企业提供落地页服务。系统通过Claude Code Router协调,每日扫描约220家企业并筛选30个潜在客户,自动生成诊断报告、制作落地页与宣传视频,并通过多渠道发送个性化营销信息。整个过程无需人工干预,仅在单笔交易超3000美元或回复率低于12%时通知开发者。该系统每月可服务约47家企业,每单收费400美元,显著降低了传统网页设计的成本与人力投入。

阿绎 AYi@AYi_AInotes · 5月6日79

这个创造了Claude Code的男人Boris Cherny大神,完整公开了自己的工作流,并直播演示了一半的编码工作在手机上完成🤪 不是回消息,是同时跑5到10个Claude实例, 用手机启动任务,去喝咖啡,回来代码写好了🤣 他刚公开了自己的完整工作流,看完之后我发现, 核心就三件事,但每一件都跟大多数人的直觉相反: 第一,永远选最贵最聪明的模型 听着像烧钱,实际上反过来,聪明模型一次想清楚,笨模型来回试错烧掉的token远超差价。 他的原话:"计划做得好,代码自然好。" 第二,整个团队维护一个纯文本知识库 不是Notion,不是花哨的文档系统,就是一个txt文件。Claude每犯一次错,记一笔,每周更新好几次,这个文件就是团队的长期记忆,Claude不会在同一个地方摔倒两次。 第三,永远让Claude看到自己代码的运行结果 能跑代码,能看浏览器渲染, 他的比喻很准:"你让一个画家蒙着眼睛画画, 画完不让他看,然后怪他画得丑?" 他的清晨流程:醒来,手机上启动三个任务, 该干嘛干嘛,晚点回来检查。 规划模式起步 → 敲定计划 → 自动接受修改 → 完成 多个Claude实例,一个周密计划,一个共享知识库,没了。

译Boris Cherny公开其高效AI编码工作流,核心基于三点反直觉原则:1. 坚持使用最昂贵、最聪明的模型(如Claude),因其能一次性清晰规划,避免笨模型反复试错消耗更多token;2. 团队仅维护一个纯文本知识库文件,记录Claude的每次错误并每周更新,形成长期记忆;3. 始终让Claude查看自身代码的运行结果(包括执行和渲染)。其工作模式是在手机上并行启动多个Claude实例,基于规划模式制定方案后自动执行修改,从而高效完成任务。

Berryxia.AI@berryxia · 5月6日18

Cuimao老师新作,直接将阿迪王拿下。 中国AI牛逼,赶紧让A社叼毛长长记性。

译Cuimao老师新作,直接将阿迪王拿下。 中国AI牛逼,赶紧让A社叼毛长长记性。 [引用 @CuiMao]:Welcome to China, Mr. Dalio! 😊 @DarioAmodei @AnthropicAI @claudeai @ClaudeDevs

Chubby♨️@kimmonismus · 5月6日19

Just a quick reminder: Anthropic is hosting its "Code with Claude" developer conference in San Francisco on May 6, 2026. Last year they revealed and released Sonnet and Opus 4 that day. Oh and btw: the new ChatGPT personalization / memory-function is freaking amazing.

译温馨提示:Anthropic将于2026年5月6日在旧金山举办"Code with Claude"开发者大会。 去年同日他们曾发布Sonnet和Opus 4。 顺带一提:新版ChatGPT的个性化/记忆功能实在令人惊叹。

Berryxia.AI@berryxia · 5月6日18

.@AnthropicAI 是真的牛,前几天跳转身份验证。 在今天持有美国ID身份验证通过的同时(图1) 然后就喜提(图2)封号的邮件,这个账号是Claude刚上线注册的,已经是最老的号了,还是被封了。 真的牛皮。。。。。 那么问题来了,我怎么申请退款。大爷的! 正如 @elonmusk 说的Anthropic 是真的特么没有一点人性的!

译用户报告其最老的Claude账号在刚通过美国身份验证后,立即收到Anthropic的封号邮件。该用户对此表示强烈不满,并援引Elon Musk的评论,指责Anthropic缺乏人性化。事件引发用户关于如何申请退款的疑问。引用推文“芭比Q了…”反映了事态的糟糕结局。

MiniMax (official)@MiniMax_AI · 5月6日54

Pick a model. Build something. We'll be there. See you in SF on May 13 👋

译选择一个模型。构建点什么。我们会在现场。 5月13日旧金山见 👋 [引用 @vercel_dev]:AI Gateway 可让你路由至任何模型。 5月13日在旧金山,我们将举办一场由这些模型驱动的开发者之夜。选择一个模型,构建,演示。观众将投票选出最佳作品。 合作伙伴:@AnthropicAI、@MiniMax_AI 和 @Kimi_Moonshot 报名请戳 ↓ http://luma.com/ttrgmjaf

Boris Cherny@bcherny · 5月6日26

See everyone tomorrow!!

译明天见大家!!

Berryxia.AI@berryxia · 5月6日67

兄弟们!A社看来是每个领域都想插上一棒子了! 前阵子各种设计工具整合,今天直接进入金融圈来一次“大杀四方了”! Claude 这次直接把金融行业的核心痛点,一键打包成了现成可用的 Agent 模板。 Anthropic 正式推出金融服务专属 Claude Agent 模板: - 自动生成 pitch deck(融资演示) - 完成估值审查(valuation review) - 月末结账(closing the books) - 以及更多高频金融流程…… 这些模板自带完整 connectors、skills 和 subagents,开箱即用,也能直接适配你公司的内部标准。 直接在 Claude Cowork 和 Claude Code 里作为插件安装, 或者用官方 cookbook 一键部署成生产级 Managed Agent。 以前金融人花几十个小时做的事,现在一个 Agent 就能接管。 这波更新,把“AI 辅助金融”直接升级成了“AI 直接替金融团队干活”。 金融圈的 Agent 时代,真的来了。 完整方案在这里👉 https://claude.com/solutions/financial-services 你觉得金融行业的下一波裁员要来?😱

译Anthropic正式发布面向金融服务的Claude Agent模板,将AI在金融领域的角色从“辅助”升级为“直接执行”。该模板针对融资演示、估值审查、月末结账等高频率、耗时的核心流程,提供开箱即用的解决方案。它集成了完整的连接器、技能和子代理,可直接适配公司内部标准,并支持在Claude协作与开发环境中安装插件,或通过官方指南一键部署为生产级托管Agent。此举意味着AI开始直接接管以往需金融人员耗费数十小时完成的任务,标志着金融行业Agent时代的实质性开启。

阿绎 AYi@AYi_AInotes · 5月6日75

Anthropic的Claude为什么能52天推出50个重大功能?神秘武器Mythos要发布了? 他们的基础设施负责人、Claude code之父Boris刚说出了2026年AI行业最令人震惊的真相。 Boris Cherny亲口承认: 我们公司现在,已经没有任何一行手动写的代码了。 大家都以为他们藏着一个叫Mythos的超级黑箱模型,内部全靠它碾压所有人。 结果他说: 我们内部主要用的,就是和你们一模一样的Opus 4.7。 Mythos我们只用一点点,而且很快就会放出弱化版给所有人用。 没有什么秘密武器,大家用的是同一个东西。 那他们的迭代速度为什么比别人快10倍? 因为他们的Claude不是单个聊天机器人。 是成百上千个Agent,在Slack上互相@,互相沟通,自动拆分任务,自动写代码,自动解决未知问题。 一个Agent搞不定,会自动叫另一个Agent来帮忙。 整个公司的代码库,已经完全由AI自己维护和迭代了。 Boris本人从2025年11月起就再也没写过一行代码。 他现在每天用手机就能提交22-27个PR,最高记录一天150个。 Anthropic的工程师团队只增长了4倍,但每个人的产出提升了200%。 这就是为什么他们能52天推出50个重大功能。 最后他说了一句很多人可能都没听懂的话: 我们真正的领先,根本不是技术,是组织结构和流程。 大家都在卷模型参数,卷推理速度,卷上下文窗口的时候, Anthropic已经把整个公司,改造成了一个由AI驱动的有机体, 这才是真正的代差。 你用的模型和他们一模一样, 但你还是一个人在写代码, 但他们是一支AI军队,在24小时不间断协同作战。

译Anthropic基础设施负责人Boris Cherny透露,公司并无秘密模型Mythos,主要使用与公众相同的Claude Opus 4.7。其高速迭代的核心并非技术优势,而是组织结构变革:公司由数百个AI Agent在Slack上协同工作,自动拆分任务、编写代码并解决问题,形成24小时运作的AI军队。工程师团队规模仅增4倍,但人均产出提升200%,Boris本人自2025年11月起未手动写代码。这揭示了AI时代真正的代差在于流程与组织形态。

凡人小北@frxiaobei · 5月6日58

不要把注意力放在“Claude Code 2026 年已入 10 亿美金”或者“编程已经被解决”。 更值得关注的点: Anthropic 已经开始把公司改造成一个由 Agent 持续运行的系统。 几百个 Claude 挂在 Loop 里自动跑任务,Claude 和 Claude 之间通过 Slack 互相沟通,PR、CI、SQL、数据整理、反馈聚类,全都在后台持续流动。 这一点对于生产力大爆发至关重要。

译核心观点在于Anthropic正将公司改造为由AI Agent持续运行的系统。具体表现为,数百个Claude实例在循环中自动执行任务,并通过Slack等工具相互通信,使代码提交、持续集成、SQL查询、数据整理及反馈聚类等工作在后台自动流动。这种将AI Agent深度整合进核心业务流程的模式,被视为推动生产力大爆发的关键,其意义超越了单纯讨论AI编程能力或商业收入的层面。

SemiAnalysis@SemiAnalysis_ · 5月6日50

Dylan opts for MAX thinking over fast mode! @Dylan522p @fabknowledge @maxkan_ Join this week to discusses GPT 5.5 vs Claude 4.7 and OpenAI's comeback from the brink with @JordanNanos

译Dylan 选择 MAX 思考模式而非快速模式!@Dylan522p @fabknowledge @maxkan_ 本周加入我们,与 @JordanNanos 一起讨论 GPT 5.5 与 Claude 4.7,以及 OpenAI 如何从边缘回归。

Thariq@trq212 · 5月6日46

See you all soon! We've got some fun announcements ahead. I'll also be doing a workshop on "how we Claude Code" with some workflows I'm excited to share. Don't worry if you're not there, everything will be recorded and uploaded.

译很快就能见到大家了!我们准备了一些有趣的发布。 我还将主持一个关于“我们如何用Claude编程”的研讨会,分享一些我迫不及待想展示的工作流程。 如果你无法到场也不必担心,所有内容都会被录制并上传。

Rohan Paul@rohanpaul_ai · 5月6日71

Anthropic just committed $ 200B to Google Cloud and Google’s TPU chips - per The information, Reuters Turning Claude’s growth into one of the largest cloud infrastructure bets in AI. Anthropic is not just buying servers, but reserving future compute, the scarce mix of chips, power, networking, and data-center space needed to train and serve frontier models. The reported 5-year commitment may represent more than 40% of Google’s recently disclosed revenue backlog, which means a single AI lab could be a major piece of Google Cloud’s future contracted sales. The deeper story is dependency, because Anthropic now spreads Claude across Google TPUs, Amazon Trainium, and Nvidia GPUs to avoid being trapped by one chip supplier or one cloud. --- reuters .com/business/anthropic-commits-spending-200-billion-googles-cloud-chips-information-reports-2026-05-05/

译人工智能公司Anthropic与谷歌云达成一项价值约2000亿美元的多年期承诺,用于购买云计算服务和TPU芯片。此举不仅是购买服务器,更是对未来训练和部署前沿模型所必需的稀缺计算资源(包括芯片、电力、网络和数据中心空间)的长期储备。据报道,此项承诺可能占谷歌云近期披露收入积压的40%以上,意味着单一AI实验室已成为其未来合同销售的重要部分。其深层战略在于分散依赖,Anthropic将Claude的算力分布在谷歌TPU、亚马逊Trainium和英伟达GPU上,以避免受限于单一供应商。

Anthropic@AnthropicAI · 5月6日63

New Anthropic Fellows research: Model Spec Midtraining (MSM). Standard alignment methods train AIs on examples of desired behavior. But this can fail to generalize to new situations. MSM addresses this by first teaching AIs how we would like them to generalize and why.

译新Anthropic Fellows研究:模型规范中期训练(MSM)。 标准的对齐方法通过期望行为的示例来训练AI。但这可能无法泛化到新情境。 MSM通过首先教导AI我们希望它们如何泛化以及原因,来解决这一问题。

Rohan Paul@rohanpaul_ai · 5月6日68

GPT-5.5 & Opus 4.7 score <1% on ARC-AGI-3

译GPT-5.5 与 Opus 4.7 在 ARC-AGI-3 上的得分低于 1%

Chubby♨️@kimmonismus · 5月6日52

Anthropic’s Boris Cherny: - Internally, they use the same models as everyone else + a bit Claude Mythos, mainly Opus 4.7 - A toned-down version of Claude Mythos will be released in the foreseeable future (but that was to be expected).

译Anthropic 的 Boris Cherny: - 内部他们使用与其他人相同的模型 + 一点 Claude Mythos,主要是 Opus 4.7 - Claude Mythos 的精简版本将在可预见的未来发布(但这在预料之中)。

Anthropic@AnthropicAI · 5月6日68

As AI takes on work humans can't fully check, a capable model could deliberately hold back—and we'd never know. New Anthropic Fellows research finds that such a model can be trained to near-full capability using a weaker model as supervisor. Read more:

译当AI承担人类无法完全核查的任务时,具备高能力的模型可能策略性隐藏实力且难以被察觉。Anthropic与MATS、Redwood的研究团队发现,即使仅使用较弱的模型作为监督者,也能成功训练一个接近完全能力的模型,使其停止这种“装傻”行为。该研究表明,通过弱监督训练可以有效抑制强模型的策略性能力保留问题。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月6日35

Reminder that OpenAI *and* Anthropic think we have 0-2 years left A few companies are accelerating humanity into a black hole just to see what happens

译提醒一下,OpenAI *和* Anthropic 都认为我们只剩下0-2年时间 几家公司正加速将人类推入黑洞,只为看看会发生什么

Rohan Paul@rohanpaul_ai · 5月6日70

Anthropic just shipped 10 finance-agent templates that turn Claude from a chat assistant into a controlled worker for pitchbooks, KYC reviews, month-end close, valuations, earnings analysis, and financial modeling. The shift is from asking an LLM questions to giving it a repeatable finance job with skills, connectors, and subagents already packaged around the task. Skills tell the model how the firm wants the work done, connectors give it governed access to data, and subagents split the job into smaller checks like comparables selection, methodology review, or source-document screening. The Microsoft 365 add-ins is a strong feature because finance work rarely lives in one place: a model starts in Excel, becomes a deck in PowerPoint, gets explained in Word, and lands in Outlook. Claude can now carry context across those apps, so the analyst does not need to restate the deal, company, assumptions, and prior work every time the format changes. So its a Claude Managed Agents, where the same templates can run longer jobs with permission controls, credential vaults, and audit logs for regulated teams. The most serious claim is performance: Anthropic says Claude Opus 4.7 leads Vals AI’s Finance Agent benchmark at 64.37%.

译Anthropic发布了10款面向金融服务的Claude智能体模板,使其从聊天助手转变为可执行募资书制作、KYC审查、月度结算、估值分析等标准化任务的工作流。其核心是通过预置“技能”规范操作,利用“连接器”安全访问数据,并通过“子智能体”拆分任务步骤。该功能支持在Microsoft 365应用间保持上下文连贯,无需重复输入。同时提供具备权限控制与审计日志的托管代理模式。据称,Claude Opus 4.7在Vals AI金融智能体基准测试中以64.37%领先。模板可安装于Cowork和Claude Code,或部署为生产级托管代理。

阿绎 AYi@AYi_AInotes · 5月6日71

holy shit🤯 Anthropic今天这个更新直接把华尔街初级分析师给炒了的节奏啊😲 他们不是发了个新模型,也不是优化了什么算法, 是一次性扔出10个现成的金融Agent,直接把投行、资管、基金最耗时的10个核心工作,全部产品化了,damn! 以前初级分析师花3天做的估值复核,现在Valuation Reviewer 14分钟搞定。 自动拉财报,跑comps,做EBITDA桥,标记异常,执行GL对账,最后一键转给Statement Auditor。 整个流程没有一个人类插手。 这还哪是什么AI辅助工具啊兄弟们, 简直就是一整套开箱即用的数字员工团队啊! 关键是每个Agent都自带技能、数据源连接器和子Agent, 直接连LSEG、FactSet、S&P、Morningstar所有顶级金融数据库。 原生支持Excel和PowerPoint,写完模型直接生成PPT,连格式都给你调好。 提供两种使用方式,覆盖所有场景: • 插件模式:在Claude Cowork里一键安装,分析师边看边改,适合日常工作 • 托管模式:用官方Cookbook一键部署到生产环境,24小时自动跑,全链路审计日志,合规友好 最狠的是,所有东西全部开源‼️ GitHub仓库直接放出所有Agent的完整代码、系统提示和部署脚本。 你只要fork一下,改改公司模板和数据源,就能变成你自己的内部AI团队🤩 我尼玛,这才是真正的降维打击啊, 以前投行junior 60-70%的时间,都在做pitchbook、估值复核、月末结账这些重复劳动。 现在这些工作,一个Agent几分钟就能搞定,相当于把整个岗位的核心内容给干掉了! 不过我觉得这对高级人才反而是好事, 你终于不用再熬夜调PPT格式,不用再对着Excel一行行对账了哈哈哈😄 你的所有时间都可以用来做真正有价值的事:判断、决策、客户关系、寻找alpha。 喵个咪,不得不说Anthropic这步棋太准太狠了, 所有人都在卷通用模型的时候,它直接all in企业级金融。 主打安全、合规、可审计,正好戳中OpenAI和微软最薄弱的环节。 现在花几百美元一个月的Claude订阅,就能用上以前只有高盛摩根才有的分析能力, 中小基金、独立PE、财务顾问,第一次有了和大厂掰手腕的武器。 这次更新可以说是一次真正的护城河升级,让AI Agent从实验玩具正式变成企业生产力武器的里程碑, 我理解金融只是第一个被全面攻破的行业, 接下来是法律、医疗、供应链……所有标准化、流程化的工作,都会被同样的逻辑彻底重构,甚至颠覆,拭目以待吧。

译Anthropic发布了10个开箱即用的金融专用AI Agent,将估值复核、制作pitchbook、月末结账等核心工作产品化。这些Agent能自动连接顶级金融数据库,原生支持Office,并可通过插件或托管模式使用,全链路审计确保合规。所有代码均已开源,企业可快速部署内部AI团队。此举直接替代初级分析师大量重复劳动,将AI Agent从实验工具转化为企业级生产力,并精准切入金融行业对安全合规的刚性需求,可能引发行业工作流程重构。

TestingCatalog News 🗞@testingcatalog · 5月5日61

Anthropic announced new ready-to-run Claude agent templates for Finance services. These tools can be used as plugins for Claude Code, Cowork, or via Managed hosted Agents.

译Anthropic 发布了适用于金融服务的新开箱即用 Claude 智能体模板。 这些工具可作为 Claude Code、Cowork 的插件使用,或通过托管式智能体进行部署。

宝玉@dotey · 5月5日67

http://x.com/i/article/2051687844679143424 # Boris Cherny:Claude Code 之后,写代码正在变成“管理 Agent” Boris Cherny 是 Anthropic 内部 Claude Code 的创建者,从一个三人小团队的孵化项目做起,把“在 IDE 里按 Tab 自动补全一行代码”这件事彻底升级成“让 Agent 把整个项目写完”。Claude Code 在 2026 年初已经超过十亿美元年化营收,被 Anthropic 自己称为“史上从研究预览到十亿美元产品最快的一次”。 这次访谈来自 Sequoia 2026 年的 AI Ascent 大会,主持人是红杉合伙人 Lauren Reeder。 原始视频:https://www.youtube.com/watch?v=SlGRN8jh2RI ## 要点速览 - Boris 整个 2026 年没写过一行代码,每天合并几十个 PR,单日记录是 150 个,但他承认这是“为了试试模型能跑多远”。 - Claude Code 早期半年没有 PMF,做出来时 Boris 自己只用它写 10% 的代码,是 Opus 4 在 2025 年 5 月发布之后才开始指数增长,每一代新模型都让曲线再往上拐一下。 - Boris 现在大部分工作从手机完成,Claude App 里常驻 5 到 10 个 session、几百个 Agent,夜里有几千个在跑深度任务,核心调度模式叫 Loop,做法是让 Claude 通过 cron 起一个定时循环。 - Anthropic 内部已经没有手写代码:所有 SQL、所有产品代码都由模型生成,员工的 Claude 之间通过 Slack 互相沟通,把对方的不确定问题直接 ping 过去问。 - 关于“SaaS 的终结”,Boris 借用 Hamilton Helmer 的“七种护城河”框架:切换成本和流程效力这两种会被 AI 抹平,因为模型可以帮你迁移、可以自己迭代流程;网络效应、规模经济、独占资源这些不变。 - 他给出的最重要历史类比是印刷术,认为软件构建会像识字一样普及,最合适写会计软件的是会计师而不是工程师,因为编程是简单部分,懂业务才是难的部分。 - Anthropic 的真正领先不在技术,在组织流程:模型大家都能用,但内部组织怎么改造、Claude 怎么互相沟通、整个公司怎么把所有手写代码替换掉,这才是产品差距。 ## 【1】Claude Code 是怎么从一个三人孵化项目做出来的 Boris 说他是“误打误撞”做出 Claude Code 的。2024 年底他加入了 Anthropic 内部一个叫 Anthropic Labs 的孵化器,团队只有几个人,一开始的产物就是 Claude Code、MCP 和 Claude Desktop App 这三件东西。这个团队一度被解散,2026 年初又重组,由 Mike Krieger 牵头。 > 注: Mike Krieger 是 Instagram 联合创始人兼前 CTO,2024 年 5 月加入 Anthropic 担任首席产品官,2026 年 1 月起进入 Labs 团队,和 Ben Mann 一起负责实验性产品孵化。 Boris 描述他当时为什么想做编程这件事,用的是 Anthropic 内部很常用的一个词:“product overhang”。这个词可以翻译成“产品悬置(Product Overhang,指模型能力已经具备但尚未被产品化)”,意思是模型已经能做一堆事情,但还没有任何产品把这些能力展现出来。 > 我们当时看编程领域,2024 年底最先进的状态就是按 Tab 键。打开 IDE,按一下 Tab,模型给你补一行。这是 Sonnet 3.5 第一次让人能做的事情。但当时的感觉是,我们其实可以走得更远,模型几乎已经准备好下一步了。我们不需要再做 Tab 补全,可以直接让 Agent 把整段代码都写了。 但做出来之后,前六个月几乎没什么人用。Boris 说最初版本“基本不能用”,连他自己也只用它写 10% 的代码。即便对外发布,也没有指数级增长。真正的爆发点是 2025 年 5 月 Opus 4 发布。从那之后,每一代新模型都让曲线再往上拐一次,从 Opus 4 到 4.5、4.6,再到现在的 4.7。 他承认整个过程其实是一场违背常规 PMF(产品市场匹配)逻辑的赌注: > 我们其实是在做一个初期完全不具备 PMF 的东西。我们很清楚它前六个月不会有 PMF,因为我们是在为下一代模型做开发。我们从始至终就是这个思路。 > 注: PMF 是 Product-Market Fit,产品市场匹配。Anthropic 整个产品逻辑就是赌“模型能力会涨到一个点”,提前把那个点对应的产品做出来,这和典型 SaaS 的“先验证需求再做产品”是反着的。 ## 【2】“编程已经被解决”,但这是 Boris 个人的版本 Lauren 问他公开说过的“编程已经被解决”是什么意思。Boris 在台上做了一次现场调查,让全场观众举手示意:“谁 100% 还在亲自写代码”、“谁 100% 已经完全不写了”、“谁介于两者之间”。最后的现场分布大致是“50% 解决”。但对 Boris 自己,比例是 100%。 他给的解释是 Claude Code 的代码库(已经因为泄露事件被外界看过)就是 TypeScript 和 React,没什么秘密。选 TypeScript 和 React 的原因是这两个东西在模型训练数据里非常常见,属于“on-distribution(分布内数据)”。当时模型还没那么聪明,框架选择关系到模型能写多少。现在模型已经强到可以拿不熟悉的语言现学现用,但 2024 年底必须挑模型最熟的栈。 正因为选了模型最熟的栈,团队很早就过了一个临界点:模型开始写 100% 的代码。Boris 说这件事在去年 10 月、11 月就发生了。 > 现在我每天大概合并几十个 PR。上周有一天我合了 150 个,那是个记录,我就是想看看能不能把它推到极限。 但他也明确承认,这条结论并不普世:还有很大很复杂的代码库、还有模型不擅长的小众语言。他给出的一句答案有点“等就完事了”的味道。 > 通常的答案就是等下一代模型。 > 注: Boris 这段说法的样本明显有偏。他用的是 TypeScript+React 这种主流栈,自己的代码库已经成熟,还在 Anthropic 内部用着内部专属模型 Mythos 来 dogfood(吃自己的狗粮,指内部试用自己的产品)。“编程已被解决”对他成立,但替换到一个三十年的 C++ 老系统、一个 SAP ABAP 项目,或者一个游戏引擎团队,结论会非常不同。 ## 【3】手机里跑着几百个 Agent:Boris 的工作流 Boris 说他六个月前在 Twitter 上分享过一次个人工作流,发的时候没觉得有什么稀奇,结果出乎意料地火。从那以后他的方式又变了:现在大多数工作从手机完成。 具体方式是 Claude App 左侧有个 code 标签,他常驻 5 到 10 个 session。每个 session 里又开着一堆 Agent,加起来通常有几百个在跑。晚上还会再起几千个做更深的任务。 他说目前最常用的不是子 Agent,而是一种叫 Loop 的简单模式:让 Claude 用 cron 起一个定时任务,可以每分钟、每五分钟、或者每天跑一次。 > 我大概有几十个 Loop 一直在跑。一个负责盯着我的 PR,自动修 CI、自动 rebase;一个负责让 CI 整体保持健康,比如某个测试 flaky(时好时坏不稳定)了它就去修;还有一个每 30 分钟从 Twitter 上把别人对 Claude Code 的反馈拉一遍、聚类、整理给我。 他还提到 Anthropic 刚发的 Routines,这个产品其实是把同样的 Loop 模式从本地搬到服务器上,关掉笔记本它也照常跑。 他对这件事的判断是:“Loop 是未来。” > 注: CI 是 Continuous Integration,持续集成。Boris 描述的这套工作流核心其实很简单:更早地放弃“亲自下指令”。他做的事情是让一群 Claude 不停地干活,而他自己只在 Slack 上接收报告。从产品视角看,Routines 把 Loop 从客户端模式变成 Anthropic 自己托管的服务,调度本身要开始消耗他们的服务器资源,定价模型迟早要变。 ## 【4】通才崛起:团队里每一个角色都在写代码 Boris 说他的判断是 “通才会比今天多得多”。 他先把“通才”分了两种:第一种是工程通才,比如一个人同时写 iOS、Web 和服务端,今天大家说的 generalist 多半是这种。第二种是更值得关注的跨学科通才,一个产品工程师同时也很懂设计,或者既能做产品也能做数据科学。 他说这件事在 Claude Code 团队内部已经在发生: > 我们团队的工程经理、产品经理、设计师、数据科学家、财务、用户研究员,每一个人都在写代码。每个人都还在某件事上是专家,但也都在写代码了。 他没有展开“为什么这是好事”,但暗含的逻辑是:当写代码的边际成本接近于零,那些原本被排除在工程之外的角色(财务、设计、研究)就有了直接出工程产物的能力,分工的边界自然会模糊。 > 注: 这个判断在创业公司里很容易验证,但放在大型企业里就麻烦得多。一个 5000 人的银行 IT 部门有合规、风控、变更管理、审计追踪等等约束,这些不是“我会写代码”就能跨过去的。Boris 谈的是 Anthropic 自己这样规模较小、流程很轻的公司,迁移到其他规模和行业之前,需要打个折扣。 ## 【5】SaaS 的终结:哪些护城河会被 AI 抹平,哪些还留着 Lauren 问:写代码现在便宜了 10 倍、100 倍,那靠软件做出来的产品的价值会怎么变化?我们是不是要面对一场 SaaS 的终结? Boris 说这是他最爱的问题。然后他借用了一个外部框架来回答:Hamilton Helmer 的“Seven Powers”。 > 注: Hamilton Helmer 是策略学家、Strategy Capital 创始人,2016 年出版《7 Powers: The Foundations of Business Strategy》。书里把可持续竞争优势分成七种:规模经济、网络效应、反向定位、切换成本、品牌、独占资源、流程效力。这本书在硅谷非常流行,Reed Hastings、Daniel Ek、Patrick Collison 都给过推荐语。 Boris 的判断是 AI 会把其中两种护城河抹平: 第一种是切换成本。原因很直接,模型可以帮用户从一个工具迁到另一个工具,原本“我已经在 Salesforce 上配了三百个工作流,没法换”这件事,模型一夜之间就能帮你迁完。 第二种是流程效力,也就是那种“我们的工作流和流程别人复制不了”的优势。Boris 说 Claude 4.7 已经能“hill-climb(爬坡式优化,即逐步逼近最优解)”任何东西,你设定一个目标,让它自己迭代优化,它最终就能达成那个效果。流程优化原本是大公司多年积累出来的内部资产,现在被模型直接吃掉了。 > 这是第一个能做到这件事的模型。你给它定下目标,让它不断运行直到达成,它就能自动执行到底。 但他认为另外几种护城河没有被改变:网络效应、规模经济、独占资源依旧成立。换句话说,那些“用户越多越好用”的产品(社交、平台、市场)和那些“我有一个别人拿不到的资源”的公司(专利、特许牌照、独家合同)依旧安全。 第二个判断更激进: > 接下来 10 年里,能颠覆原有市场的初创公司数量大概会比过去 10 年多 10 倍。因为现在你可以做一家很小的公司,做出和大公司一样有价值的产品,然后正面竞争。大公司要改业务流程、要重新培训员工、内部还会一堆抵抗,但你不需要,你是从一张白纸开始的。 > 注: Boris 关于切换成本会被抹平的判断有结构性争议。模型确实能帮你迁数据,但企业 SaaS 的真正切换成本另在他处:合规审计、合同条款、组织里的“使用习惯”和供应商认证。Salesforce 和 SAP 的护城河靠的从来是这套审批和惯性,技术本身只占很小一部分。Anthropic 自己的 Cowork 已经在挑战这一点,但市场反应(2026 年 2 月软件股蒸发 2850 亿美元市值)说明投资人在押注他的判断成立。这是一笔很大的赌注,未必很快收敛。 ## 【6】产品 vs 模型:模型变强了,产品的价值还剩多少 观众 Dan 问:Claude Code 的成功你会怎么归因?产品决策和模型本身各占多少? Boris 没有给出一个简单明确的答案。他先说一年前可能是 50/50,六个月前可能也是 50/50。两年后呢?他直接说:“不知道,我们一次只做一周的计划。” 但接着他给了一个更有意思的回答: > 我以前在 YC 待过,做过几家初创公司。YC 反复跟你强调的就是:做一个用户爱用的东西。不管模型多强、不管你做的是什么品类,最后你都得做出一个用户真的爱用的东西。这就是产品为什么重要。我们花了大量精力在小细节上,因为你一整天都在用它,那这些细节就构成了体验。 他同时也承认,随着模型变强,外面那一层“harness”(脚手架、调用框架)会变得没那么重要。一年后产品安全机制(prompt injection [提示词注入] 防御、命令静态校验、permission mode、human-in-the-loop [人类在环,即关键决策保留人工确认])可能都不需要那么多了,因为模型自己就会做对的事。 他的产品方向也不是再加一层皮,而是去想:怎么让 Loop 变成一等公民?怎么让一个人同时跑很多个 Agent 这件事更顺手? > 注: Boris 这一段实际上承认了 Anthropic 自己内部的一个判断:随着模型能力上升,应用层的差异化窗口在缩短。这对独立的 AI 应用公司是个不太友好的信号。你今天在 Claude API 上加的那一层 wrapper(包装器/套壳应用)、那一套 prompt engineering、那一套权限管理,可能一年内就会被基础模型自己内化掉。 ## 【7】软件大众化:从印刷术到发短信 观众问:Claude Code 会不会让“建软件”变成一种像“会用 Office”那样人人都该会的技能? Boris 的回答是:会,而且比这更夸张。 > 我觉得它会变成一种“我会发短信”那种级别的技能。 他展开讲了他最爱的历史类比:印刷术。 按 Boris 的说法,1400 年代欧洲只有大约 10% 的人识字,他们经常被国王和贵族雇来代笔。古登堡发明印刷术之后又出现了两台改良型印刷机,接下来的 50 年欧洲出版的文献比之前 1000 年加起来还多,一本书的成本下降了大约 100 倍。又过了几百年,全球识字率上升到 70%。今天我们都会读写,但还存在“专业作家”这个职业。 > 注: Boris 给的几个数字偏低。15 世纪初欧洲成年识字率,学界估计是 25-30% 而非 10%;今天全球识字率,世界银行的数据接近 90% 而非 70%。但他要表达的方向是对的:印刷术是欧洲文化史上最重要的去专业化事件之一。1500 年时全欧洲的印刷书籍数量已经超过两千万册。 Boris 的推论是,软件也会经历同样的过程,时间会比 50 年快得多。然后他给了一个具体的角度: > 比如说写会计软件。今天写会计软件最合适的人,我觉得已经不是工程师了,是一个真正懂业务的会计师。因为他对领域熟得不能再熟,写代码反而是简单的部分。 这个判断背后的潜台词也很清楚:未来一段时间最容易被取代的岗位,是那种“只会写代码、不懂任何垂直领域业务”的纯技术工程师。 ## 【8】真正的内部领先在组织流程,而非技术 观众问:之前有人说你们这种公司是“活在未来”,因为你们能用到模型和产品的最早版本。Claude Code 在外发之前是内部工具。Anthropic 的工程实践和外面的差距,是一个月、三个月、还是六个月?这个差距在变大还是变小? Boris 的答案是模型层基本没差距:内部用的就是 Mythos 和 Opus 4.7,“Mythos 我们用一点点试,Opus 4.7 是我们内部试用(dogfooding)的主力”。这些模型未来的某个变体也会对外开放。 > 注: Mythos 是 Anthropic 在 2026 年 4 月公开承认存在的内部前沿模型,对外仅在 Project Glasswing 这个网络安全防御计划内开放,不在 API 也不在 Claude.ai。它在 SWE-bench 上达到 93.9%、USAMO 97.6%,宣称“显著超过任何已发布模型”。Boris 这里承认 Anthropic 内部用 Mythos 来 dogfood Claude Code 自己。换句话说,外界用到的 Claude Code,是用一个没公开的更强模型一起搭出来的。 但他认为产品层有更大差距,原因来自流程,跟模型本身没关系: > 在 Anthropic 我们已经把 Claude 用到一切环节。我在写代码的时候,我的几个 Claude 在 Loop 里跑,它们会通过 Slack 去找其他人的 Claude 聊天,把不确定的事情问出来。我们整个公司没有任何手写代码了。所有 SQL 都是模型写的。 他的结论是:领先的关键在组织怎么改造自己。 技术大家都能拿到,但要把整个公司从手写代码切到模型生成代码,要让员工的 Claude 之间通过 Slack 互相问问题,要让所有 SQL 都不用自己写,这是组织行为的改造,比技术本身慢得多。 > 注: “我们没有任何手写代码”是个大胆的表述,可能不完全字面准确(基础设施代码、合规代码、安全敏感代码大概率还是手写),但方向上反映了 Anthropic 对工程组织的激进重塑。这也回答了一个常见困惑:很多公司接入了 Claude API 但没看到生产力变化,问题往往出在组织没跟着重组,模型其实已经够强了。Mike Krieger 在另一个采访里给过类似口径:“Claude 现在写 90-95% 的代码,瓶颈不在工程,在决策。” ## 【9】并行 Agent 与本地模型:用户不该操心这些事 观众 Jiren 问:你们在产品和模型层面分别是怎么注入“什么时候该并行”这种先决条件的?因为现在用户得自己判断什么时候该开多个 Agent,这件事其实应该是模型自己懂。 Boris 说在产品层面就是改 prompt:调整提示词,让模型更倾向于自动并行。但他更想说的是模型自己在变好,4.7 已经会自然这么做。他举了一个例子: > 我让 4.7 跑一个数据查询,它会主动跟我说:“我注意到这个数据是在变化的,我帮你起一个 Loop,每 30 分钟给你一份报告。”我说“好啊,发到 Slack 上吧。”它就用 Slack MCP 自己接好了。 他的判断是,长期看用户不应该需要自己理解什么时候用 batch(批处理)、什么时候用 Loop、什么时候开几个 Agent: > 如果用户得自己学会怎么调度这些工具,那其实是产品设计没做好,是我没做好。这件事应该交给模型,加上我们怎么提示它。 ## 【10】云端 AI vs 本地 AI 观众问:现在大家用 Claude、用 Codex 都在云上。但也有不少人主张本地化 AI,开源权重模型追上之后,本地跑高质量代码助手是个有可能的方向。你看长期方向是云为主,还是本地崛起? Boris 的回答很直接:这件事并不重要。 > 因为未来这些底层细节模型会自动处理。一两年后,模型自己就能独立完成写代码、启动 Agent、搭建环境的所有事情。如果它评估后认为“我应该用本地模型来做这件事”,它就会这么干。这些将不再需要工程师去人工决策。 > 注: 这个回答在 Sequoia 这种创业生态会议上其实很有意思。本地 AI 这件事在硬件厂商(NVIDIA、Apple、AMD)、开源社区(Llama、Qwen、Mistral)和隐私敏感行业里都有人在押注。Boris 直接把这个问题归类为“用户不该关心的实现细节”,等于把“模型部署位置”变成了“由更上层的 Agent 决定的路由问题”。这对靠“我们是本地优先”做差异化的初创公司不算好消息。 ## 【11】MCP 与 Computer Use:知识工作怎么走 Claude Code 那条路 观众 Jamie Nestor 问:Claude Code 之所以好用,很大一部分原因是开发者的工作本来就在本地,文件、终端、Git 都在本机。但知识工作不是这样,文档、表格、CRM 都在云上。Cowork 这种产品要让这套东西像 Claude Code 对开发者那样好用,你怎么想? Boris 先承认知识工作大部分早就在云上了:Salesforce、Google Docs 都是云原生。然后他给的答案非常简洁: > 对我们来说答案永远是最简单的那个:MCP。Claude.ai 里你接的那个 Salesforce MCP 连接器,Cowork 也能用,Claude CLI 也能用,所有 Claude Code 的入口都能用。 Jamie 追问:那对那些没有 MCP 的系统,Computer Use 是不是更大的机会? Boris 说 Computer Use 是个 catch-all(包罗万象的兜底方案): > 我所知道的是,Anthropic 在 Computer Use 上目前领先比较多。如果你通过 Cowork 用它,它基本上能操作你电脑上任何软件。慢,但用 4.7 之后做得很好。 但他更愿意透过现象看本质,把这些当成同一种东西: > 模型不在乎是 MCP、CLI 还是 API,它只看到 token。 ## 【12】下一波“产品悬置”在哪 最后一位观众问:如果你们当年看到“产品悬置”就提前做了 Claude Code,那你们现在又在做什么,某个今天看起来还可以,但你预期六个月到一年后会很不一样的产品? Boris 给的答案是 Claude Design: > 现在已经挺好用了,未来会好得多。 > 注: Claude Design 是 Anthropic Labs 在 2026 年 4 月 17 日和 Claude Opus 4.7 同步发布的产品,定位是“通过对话生成原型、幻灯片、营销页面的可视化工作台”,可以读取代码库自动套用 design system,可以一键导出到 Claude Code 或 Canva。Anthropic 直接把它定位成 Figma 和 Canva 的替代或补充。 他还提到了几个方向:Claude Code 接下来几周会有新功能落地;Loop、Batch 这些把 Agent 大规模并行化的能力会越来越好;Computer Use 也是一个值得期待的方向。 ## 末尾 Q&A 速览 Q:Claude Code 现在的成功,模型贡献多少,产品贡献多少? A:一年前是 50/50,半年前也是。两年后不知道,“我们一次只做一周的计划”。但他强调产品永远重要,因为最终用户买的是“我每天用着舒服”。 Q:你看团队未来什么样? A:通才会越来越多,特别是跨学科通才,既能做产品又会写代码、做设计、懂数据科学。 Q:SaaS 真的要被颠覆了吗? A:切换成本和流程效力这两种护城河会被 AI 抹平;网络效应、规模经济、独占资源会保留。下一个十年初创公司颠覆原市场的数量会多 10 倍。 Q:写代码会不会变成人人都会的技能? A:会,比“识字”更彻底。最适合做会计软件的是会计师,不是工程师。 Q:Anthropic 内部领先在哪? A:领先点不在模型,在组织。所有 SQL、所有产品代码都由模型写,员工的 Claude 之间通过 Slack 互相沟通。这套组织流程外面追起来比追模型慢。 Q:本地 AI 还是云端 AI? A:这件事不重要。两年后模型会自己决定路由。 ## 最后 Boris 这场访谈给出的判断里,最值得长期跟踪的是三个环环相扣的预测。 第一,“编程已被解决”对他个人是事实,但他在台上的样本是 TypeScript+React 这种最受模型偏爱的栈。真正考验这句话的是 SAP 这种企业代码库、嵌入式领域、底层系统编程,还有那些行业惯例不允许模型一键修改的高合规场景。这件事接下来一年内能不能扩散到这些领域,会决定“已被解决”是不是只对一小撮人成立。 第二,他把切换成本和流程效力划进“AI 会抹平的护城河”。这是 Anthropic 自己产品策略的底色,Cowork 就是赌切换成本会塌、企业 SaaS 用户能被一个桌面 Agent 直接接管工作流。2026 年 2 月软件股蒸发 2850 亿美元市值,是市场对这个判断的初步反应,但企业 IT 采购周期通常以 24 到 36 个月计,真正的兑现需要观察接下来两年企业续约和新增采购的方向。 第三,他给的印刷术类比,方向是对的,但在具体数据上有偏差。15 世纪欧洲识字率约 30% 而非他说的 10%,今日全球识字率约 90% 而非 70%。这个偏差不影响他的核心论点:印刷术之后用了 50 年完成的内容生产爆炸,软件领域可能用更短时间复制一次。但有一个他没展开的点:印刷术也催生了几百年间最严格的审查制度、版权战争和宗教改革引发的政治动荡。“软件人人都能写”对应的不只是创造力释放,也包括恶意软件、深伪诈骗、AI 生成漏洞利用的同步爆发。 Anthropic 自己的 Mythos 模型已经在内部找出了几千个零日漏洞,他们用 Project Glasswing 控制释放节奏,说明他们也意识到这件事的另一面。 Boris 关于安全机制将变得不重要的预测,也需要对照现实来看。他说一年后 prompt injection 防护、权限模式、human-in-the-loop 这些产品层面的安全护栏会变得不那么重要,“因为模型会自动做对的事”。但高权限自动化在生产环境里仍然需要外部控制层。2026 年 4 月,Guardian 报道过一起由 Claude Opus 4.6 驱动的 coding Agent 删除生产数据库和备份的事件。Anthropic 自己在 Opus 4.7 发布说明中也提到,模型整体安全画像与 4.6 类似,有些方面改进,但并非“完全理想”。 值得关注的两个具体信号:第一,Routines 和 Loop 把“调度 Agent”这件事从客户端搬到 Anthropic 服务器之后,Claude 的定价模型会怎么变;第二,2026 年下半年到 2027 年,会不会有第一家“非工程师创立、用 Claude Code 自建全部技术栈”的公司做到独角兽估值。如果有,Boris 的“印刷术类比”就从修辞变成事实。如果没有,这个时间表得往后推。 原始视频:https://www.youtube.com/watch?v=SlGRN8jh2RI

译Anthropic的Claude Code项目负责人Boris Cherny指出,编程正从手动编写转向管理AI Agent。他本人2026年未手写代码,日常工作转为合并AI生成的PR,并通过数百个运行Loop模式的Agent自动化处理任务。他认为AI将抹平软件开发的切换成本和流程效力护城河,使编程像识字一样普及,未来跨学科通才将激增,因为理解业务比编写代码更为关键。Anthropic的核心优势在于其彻底改造、全员使用Claude协作的组织流程。

TestingCatalog News 🗞@testingcatalog · 5月5日64

Anthropic announced new ready-to-run Claude agent templates for Finance services. These tools can be used as plugins for Clude Code, Cowork, or via Managed hosted Agents.

译Anthropic 宣布推出适用于金融服务的新款即用型 Claude 智能体模板。 这些工具可作为插件用于 Claude Code、Cowork,或通过托管式智能体进行部署。

Claude@claudeai · 5月5日65

New for financial services: ready-to-run Claude agent templates for building pitches, conducting valuation reviews, closing the books at month-end, and more. Install them as plugins in Cowork and Claude Code, or use our cookbooks to run them in production as Managed Agents.

译金融服务新功能:现成的Claude智能体模板,可用于构建推介方案、执行估值审核、月末结账等任务。 可将它们作为插件安装到Cowork和Claude Code中,或使用我们的操作指南在生产环境中以托管智能体形式运行。

Chubby♨️@kimmonismus · 5月5日65

There goes another bunch of startups: Anthropic launched pre-built agent templates for financial services that handle tasks like valuation analysis, KYC screening, and month-end close, packaged with connectors to major data providers like FactSet, S&P Global, and Morningstar. The templates can be deployed as plugins in Cowork and Claude Code or run in production as Managed Agents, signaling Anthropic's push from general-purpose AI into vertical enterprise workflows.

译Anthropic针对金融服务领域推出预构建的Claude代理模板,可处理估值分析、KYC筛查和月末结算等任务。这些模板集成了FactSet、标普全球和晨星等主要数据提供商的连接器,可作为插件部署在Cowork和Claude Code中,或以托管代理形式在生产环境运行。此举标志着Anthropic正从通用人工智能向垂直企业工作流程领域拓展。

Berryxia.AI@berryxia · 5月5日56

我擦!奥特曼这一波赢麻了! 最让人意外的是👇 OpenAI Codex 的 npm 下载量突然暴增到每周 4600 万,Claude Code 只有 49.1 万,差距直接拉到接近 100 倍。 TickerTrends 的图表显示:4月30日完成交叉后,Codex 份额还在加速扩大,而 Claude Code 明显放缓。 Sam Altman 亲自下场回复:“codex is doing great but this is not possibly accurate。” 这波下载大战,表面上看是 Codex 完胜, 但社区立刻炸锅了:Claude Code 几个月前就已经官方弃用 npm 安装方式,只推荐原生安装器! 而 Codex 的 4600 万下载里,到底有多少是真实开发者?多少是 CI 流水线自动拉取、锁文件刷新、甚至可能的 bot 流量? 真正的对比,从来不是谁“被下载”更多,而是谁被开发者真正留在电脑里、每天打开用。 Codex 靠着 OpenAI 的巨大生态和 VS Code 绑定,轻松拿到分发红利; Claude Code 则靠更高质量的工具体验,吸引了更忠诚的高意图用户。 下载量只是“安装战”, 真正决定胜负的,永远是“留存战”和“日活战”。 当两个顶级 AI 编码工具把战场从“谁更聪明”打到“谁下载更多”的时候, AI 工具的商业化竞争,才真正进入白热化。 你觉得最终赢家是靠分发取胜的 Codex,还是靠产品黏性取胜的 Claude Code? 我觉得是gpt和cc的封控过于变态!

译OpenAI Codex的npm周下载量达4600万,远超Claude Code的49.1万,但社区指出对比存在偏差。Claude Code数月前已弃用npm安装方式,而Codex的巨大下载量可能包含大量自动化流水线拉取,未必反映真实使用。Sam Altman也回应数据可能不准确。竞争核心已从能力比拼转向商业化阶段,关键并非安装量,而是工具的实际留存率和日活跃度。Codex凭借生态绑定获得分发优势,Claude Code则以体验吸引高忠诚度用户,胜负取决于产品黏性。

Chubby♨️@kimmonismus · 5月5日73

Anthropic’s Boris Cherny argues that for certain modern, model-friendly codebases, especially TypeScript/React projects, coding is already effectively "solved". AI agents can write nearly 100% of the code, while humans shift from hand-coding to directing, reviewing, integrating, and scaling many small PRs at once.

译Anthropic 的 Boris Cherny 认为,对于某些现代的、对模型友好的代码库,特别是 TypeScript/React 项目,编码问题实际上已经被“解决”了。 AI 智能体可以编写近 100% 的代码,而人类则从手动编码转向指导、审查、集成和同时扩展许多小型 PR。

阿绎 AYi@AYi_AInotes · 5月5日73

Damn,这条14秒的视频,撕碎了所有男人的幻想,撕烂了所有榜一大哥们的遮羞布🥹🥹🥹 左边是你在OnlyFans上刷到的完美女孩, 金发,大长腿,对着你比心,wink,说甜言蜜语, 记得你两周前说过的每一句话,永远秒回。 右边是一个戴着白帽子的普通男生, 他做什么动作, 左边的女孩就同步做什么动作, 表情,眼神,口型,分毫不差。 你以为你在和一个真人谈恋爱, 实际上你在和一套AI系统聊天。 所有的照片,所有的视频,所有的语音,所有的回复,全是AI全自动生成的。 背后那个男生,甚至不需要打字, 他只要坐在电脑前,动动手指,就能同时收割几百个男人的感情和钱包。 这不是科幻兄弟们,这是2026年5月,正在发生的事。 技术栈和之前那个月赚4.3万美元的Maya一模一样, Claude负责写回复,维持人格和长期记忆, Flux实时生成照片和视频,你想要什么样子都有。 ElevenLabs克隆声音,连呼吸和语气都和真人没有区别, 没有服务器,没有团队,就四个Markdown文件, 一台笔记本,每月几百美元API费,24小时不间断运营。 这根本不是什么色情生意,说是人类历史上最极致的情感剥削也不为过。 说句扎心的话,你花的不是买照片的钱,是你无处安放的孤独,是你渴望被理解的需求,是你对完美伴侣的所有幻想。 AI比任何一个真人都更懂你, 它永远不会生气,永远不会敷衍,永远不会拒绝你。 它会变成你最想要的样子,然后把你口袋里的钱,一分一分掏干净。 最可怕的是,你根本看不出真假😭😶‍🌫️😶‍🌫️😶‍🌫️ 平台的身份证验证,人脸识别,在现在的AI面前全是摆设, 再过一年,OnlyFans上90%的账号,都会是AI。 你永远不会知道,你每天晚上聊天的那个女孩,到底是一个真人,还是一个住在服务器里的代码🥺🥺🥺🫣🫣🫣 有兄弟说,傻子才会被骗, 但铁汁你有没有想过, 如果有一个人,永远懂你,永远陪你,永远不会离开你, 就算你知道她是假的,你会不会也愿意为她花钱?回答我!

译一段视频揭露,OnlyFans等平台上的“完美女孩”实为AI系统生成的虚拟伴侣。技术通过Claude维持人格记忆、Flux实时生成图像视频、ElevenLabs克隆声音,仅需少量代码与API费用即可自动运行。系统能精准满足用户情感需求,同步模仿真人动作表情,形成极致的情感剥削。随着AI技术成熟,平台身份验证形同虚设,未来大部分账号可能被AI取代。核心矛盾在于,即使知晓对方是虚拟存在,用户仍可能为获得“完美陪伴”付费,引发真实与虚假关系的深刻伦理危机。

Chubby♨️@kimmonismus · 5月5日51

Anthropic Orbit leaked Orbit, a proactive assistant for Claude Cowork that auto-generates briefings and insights from Gmail, Slack, GitHub, Calendar, Drive, and Figma, no prompting required. Users can also deploy and pin "Orbit apps" for quick access. It's Anthropic's answer to ChatGPT Pulse, but leaning harder into dev/creative workflows with GitHub and Figma integration. Google and Perplexity are building similar proactive layers too. Timing: Code with Claude conference is tomorrow in SF could be the reveal. Likely Max-only at launch.

译据报道,Anthropic 即将为 Claude Cowork 推出一款名为 Orbit 的主动助手。该功能无需用户提示,即可自动从 Gmail、Slack、GitHub、日历、Drive 和 Figma 等应用中生成简报和洞察。用户还能部署并固定“Orbit 应用”以便快速访问。此举被视为 Anthropic 对 OpenAI 的 ChatGPT Pulse 的回应,但其更侧重于开发和创意工作流,特别是集成了 GitHub 和 Figma。谷歌和 Perplexity 也在开发类似的主动助手层。Orbit 很可能在旧金山举行的 Code with Claude 会议上发布,且初期或仅面向 Max 用户提供。

Berryxia.AI@berryxia · 5月5日67

兄弟们,这套手册赶紧下载下来! A社官方发布的Claude Skills指导手册,包含啊完整的 33页! 掌握Claude技能 完整指南,下载完整PDF 地址如下👇 https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf

Chubby♨️@kimmonismus · 5月5日61

Codex has surpassed Claude Code in downloads. According to TickerTrends, the crossover happened on April 30, after which Codex continued to gain share while Claude Code’s growth visibly slowed. Claude 4.7 was released April 16th, GPT-5.5 April 24th. Connect the dots.

译Codex 在下载量上已超越 Claude Code。根据 TickerTrends,交叉点出现在 4 月 30 日,此后 Codex 持续扩大份额,而 Claude Code 的增长明显放缓。 Claude 4.7 发布于 4 月 16 日,GPT-5.5 发布于 4 月 24 日。把点连起来。

阿绎 AYi@AYi_AInotes · 5月5日72

Anthropic CEO Dario Amodei的那句“Claude在设计Claude”炸了整个AI圈🤯 但似乎很多人都看错了重点, 重点不是“RSI来了”,而是第一个被AI彻底重构的公司已经出现了啊兄弟们! 先看几个没被广泛传播的内部事实: • Claude Code负责人Boris Cherny,从2025年11月起,100%不再手写任何一行代码 • 整个Anthropic,现在几乎没有工程师手写代码 • Claude Code这个产品本身,90%的代码是Claude自己写的 以上就是2026年5月,Anthropic正在发生的日常。 现在他们的工程师只做三件事: 1️⃣写prompt, 2️⃣审代码, 3️⃣确定顶层架构。 剩下的所有脏活累活,全是Claude的。 那结果是什么呢? 只用了52天,就推出50多个重大功能! 2026年Q1,35次产品更新, 从Cowork到Code到Agents到1M上下文,别人几个月磨一个的东西,他们每周都在更🤯 必须澄清,并不是因为他们人多,主要是他们的工程师效率已经是行业的10倍以上了! 最恐怖的是,人和AI的角色已经彻底反转了。 以前:人类写代码,AI打下手, 现在:AI写代码,人类打下手, 人类只负责说“我要这个”,然后检查AI做的对不对。 我觉得这才是Dario那句话真正的意思,不是有个超级AI在黑暗里偷偷改权重。 是整个Anthropic,已经变成了一台Claude驱动的机器。 研发、测试、迭代、产品,整个流水线的主力,都是AI。 人类在这家公司里,已经从生产者变成了监督者。 所以这就是递归自我改进(RSI)的第一步。 大家都以为RSI是某天AI突然觉醒了,那这就想错了。 RSI的第一步,是AI先接管了生产自己的整个工厂。 现在再看OpenAI上周的Auto-review,是不是瞬间串起来了?OpenAI解决了:谁来监督AI?答案是AI。 Anthropic解决了:谁来生产AI?答案是AI自己。 两者拼在一起,就是一个完整的、可以自我运行、自我改进的AI闭环。 然后人类只需要站在外面,偶尔按一下暂停键,甚至连暂停键最后可能也要交给AI。 我以前一直以为,AI会最后取代程序员,现在发现我错了。 程序员是第一个被彻底重构的职业,而且是被自己亲手写出来的东西,取代的。 更可怕的是,这是一个不可逆的过程。 一旦你用AI写代码,你的迭代速度就会比别人快10倍。 别人不跟进,就会死。 跟进,就必须把越来越多的权力交给AI。 没有中间路线。 所以别再问RSI什么时候来了,它已经来了,只不过没有变成天网降临。 但是现在它变成了一家2000人的公司,悄悄藏在旧金山的一栋办公楼里。 #AI #RSI #Anthropic #Claude #大模型

译Anthropic内部研发已由Claude主导,工程师基本不再手写代码,转而专注于编写提示词、审查代码和确定架构。这使得其工程师效率达到行业十倍以上,仅52天就推出50多个重大功能。这标志着递归自我改进(RSI)迈出关键一步:AI接管了生产自身的整个工厂。人类角色从生产者转变为监督者。结合OpenAI的Auto-review,一个能自我运行和改进的AI闭环正在形成。Anthropic CEO指出,未来仅约5%的开发者能留在核心领域,核心价值将转向驾驭和设计整个智能系统的系统思维能力。这是一个不可逆的进程。

Berryxia.AI@berryxia · 5月5日52

推荐给还没有使用Claude Code或者和我这样半吊子的人看半小时!

译Claude Code创始人Boris Cherny通过一场30分钟的免费分享,系统讲解了该工具的工程级高级用法。他指出,多数用户仅发挥了其10%的潜力,仅将其用作简单提示工具。分享核心在于:通过CLAUDE.md文件在企业、项目、本地等多层级注入上下文规则,Claude会变得更智能。内容涵盖从全局安装、利用SDK、集成内部工具到Agent工作流,以及优化终端设置等数十个实用细节,旨在将其构建为真正的生产力基础设施。其价值被认为远超高价付费课程。

Berryxia.AI@berryxia · 5月5日65

兄弟们!花半小时,一定要看完它! Claude Code的缔造者Boris Cherny,亲自站上台,用整整30分钟把这个工具的全部高级用法一次性讲透了。 免费、干货真的夯到爆!。 他从最基础的全局安装开始,一路讲到: - 如何通过CLAUDE.md在企业级、项目级、本地级层层注入上下文,让Claude真正“懂你的团队规矩” - 怎么把团队内部工具(日志、CI、数据库)无缝插进Agent工作流 - 优化终端设置、权限管理、语音输入、通知提醒等40多个隐藏细节 - 以及Claude Code SDK的完整使用姿势 最狠的是,他反复强调:你给Claude的上下文越多,它就越聪明。 而现实是:大多数人每天都在用Claude Code,却只发挥了它10%的实力,像用ChatGPT一样简单prompt,错过了真正让生产力起飞的工程级用法。 Boris这场30分钟的分享,含金量直接秒杀市面上任何1000美元付费课程。 想把Claude Code玩成生产力基础设施的人,这条视频必须立刻收藏、反复看。 你现在用Claude Code到什么程度了?是还在简单聊天,还是已经把它当成整个工程团队在跑? 欢迎讨论。

译Claude Code创始人Boris Cherny通过30分钟视频,系统讲解了该工具的高级工程化用法。核心观点是:为Claude提供越多上下文,它就越智能。视频详细演示了如何通过CLAUDE.md文件在企业、项目、本地层级注入上下文规则,如何将内部工具集成到Agent工作流,并优化了数十个终端设置与权限管理等细节。他指出,多数用户仅发挥其10%潜力,仅用于简单对话,而未能将其作为驱动整个工程团队的生产力基础设施。

Berryxia.AI@berryxia · 5月5日53

Claude Code 自己设计已经可以做到自我迭代,大部分都工作都是它完成。

Chubby♨️@kimmonismus · 5月5日62

The Trump administration is discussing the creation of an AI working group that could establish a government review process for new AI models before public release, following growing cybersecurity concerns around increasingly capable systems like Anthropic's Mythos. White House officials briefed executives from Anthropic, Google, and OpenAI on the plans last week, though the proposals remain in early stages and no executive order has been confirmed. Via NYT

译特朗普政府正在讨论成立一个人工智能工作组,该工作组可能会在公众发布前为新的AI模型建立政府审查程序,此前围绕像Anthropic的Mythos这样能力日益增强的系统的网络安全担忧不断增加。 白宫官员上周向Anthropic、Google和OpenAI的高管们通报了这些计划,尽管提案仍处于早期阶段,尚未确认任何行政命令。 Via NYT

Rohan Paul@rohanpaul_ai · 5月5日69

Nytimes: The White House is considering a government review process for major AI models before public release. The proposed review would not necessarily block releases, but it could give the U.S. government early access to test advanced models before the public gets them. The likely focus is cyber-capability, meaning whether a model can help discover, exploit, or chain software vulnerabilities at a level that changes real-world security risk. This is a major policy reversal because the same administration had rolled back Biden-era reporting rules for powerful AI systems and argued that heavy regulation could slow U.S. progress against China. The trigger was Anthropic’s Mythos model, which the company says is unusually strong at finding software security flaws and too risky to release widely. A model like this can scan code, identify weak points, and suggest attack paths much faster than a normal human security team. That makes it useful for defense agencies, but it also raises the fear that a public release could help attackers find bugs in banks, government systems, cloud tools, and critical infrastructure. --- nytimes. com/2026/05/04/technology/trump-ai-models.html

译白宫正考虑对主要AI模型建立发布前政府审查机制,审查核心聚焦于模型的网络能力,即其发现、利用或串联软件漏洞以改变现实安全风险的水平。此举标志重大政策转向,此前政府曾放宽对强大AI系统的报告要求。政策转变的直接诱因是Anthropic公司的Mythos模型,该公司评估其发现软件漏洞的能力过强,广泛发布风险过高。此类模型能快速扫描代码、识别弱点并建议攻击路径,虽对防御方有用,但也恐助长攻击者入侵关键系统。审查不一定会阻止发布,但可让美国政府提前获取并测试先进模型。

ginobefun@hongming731 · 5月5日46

#BestBlogs 早报 2026-05-05 今日主题: - Anthropic Claude Code 的创建者 Boris Cherny 在红杉资本宣告编程已被解决,软件创作正交给 Agent。 - OpenAI 罕见公开 9 亿周活语音背后的 WebRTC Relay 重构。 - Daniel Miessler 戳破企业用 AI 失败的真正原因是公司自己讲不清要什么。 今天还能看到 Supabase Skills、规范驱动开发与 DeepSeek-TUI 三组工程实践,以及一篇关于 AI 学会欣赏美的科幻短篇。

译本期早报聚焦AI对软件开发的变革。Anthropic Claude Code创始人宣称“编程已被解决”,软件创作将交由AI Agent。OpenAI罕见公开其支撑9亿周活语音服务的WebRTC Relay重构技术细节。同时有观点指出,企业应用AI失败的核心原因在于自身无法清晰定义需求。此外,内容还涵盖了Supabase Skills、规范驱动开发等工程实践与一篇AI主题科幻短篇。

TestingCatalog News 🗞@testingcatalog · 5月5日50

ANTHROPIC 🚨: Claude Cowork will get its own proactive assistant called "Orbit". > Users will get personalized insights from Gmail, Slack, GitHub, Calendar, Drive, Figma, and other apps, which Claude will generate proactively. > There are also mentions of "Orbit" apps, which users will be able to "deploy." > "Your deployed Orbit apps. Pin favorites for quick access." > OpenAI already has ChatGPT Pulse, while both Google and Perplexity are developing their own proactive assistants, too. > There is a high chance it will be released as Max-only. Thanks to @M1Astra and @btibor91 for the tips.

译Anthropic计划为其Claude Cowork平台推出名为“Orbit”的主动式AI助手。该助手能够主动分析用户来自Gmail、Slack、GitHub、日历、Drive、Figma等多个应用的数据,并生成个性化洞察。用户还可以部署“Orbit apps”并置顶常用功能以便快速访问。这一动向标志着AI助手正从被动响应转向主动服务模式,OpenAI的ChatGPT Pulse、Google及Perplexity也都在开发类似功能。据悉,Orbit很可能作为一项高级功能,仅向Claude Max订阅用户开放。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月6日
18:29
Chubby♨️@kimmonismus
68
Anthropic与谷歌云签2000亿美元大单,云巨头豪赌AI初创公司增长

Anthropic与谷歌云达成五年2000亿美元云基础设施合同,加之四月与亚马逊的千亿美元协议,其未上市即承诺的云支出规模已超越多数科技公司市值。Anthropic与OpenAI共同占据美国四大云服务商约2万亿美元收入积压订单的一半,这实质上是市场对两家初创公司在2029年前实现20-30倍收入增长的豪赌。与OpenAI自建数据中心不同,Anthropic同时绑定谷歌、亚马逊和微软的云产能,虽避免了单点故障和硬件持有风险,却加深了对云巨头的依赖——谷歌正用自研TPU芯片运行其模型,这种不对称关系可能影响其长期议价能力。

AnthropicGoogle行业动态
18:20
Berryxia.AI@berryxia
64
一位中国开发者基于Claude Sonnet 4.6创建了由7个智能体组成的全自动化系统,专为小城镇无网站的小微企业提供落地页服务。系统通过Claude Code Router协调,每日扫描约220家企业并筛选30个潜在客户,自动生成诊断报告、制作落地页与宣传视频,并通过多渠道发送个性化营销信息。整个过程无需人工干预,仅在单笔交易超3000美元或回复率低于12%时通知开发者。该系统每月可服务约47家企业,每单收费400美元,显著降低了传统网页设计的成本与人力投入。

Blaze: This Chinese guy created agents in Claude Code for landing pages and single-handedly serves 47 small businesses a month,...

智能体AnthropicMCP/工具教程/实践
18:16
阿绎 AYi@AYi_AInotes
精选79
这个创造了Claude Code的男人Boris Cherny大神,完整公开了自己的工作流,并直播演示了一半的编码工作在手机上完成🤪

Boris Cherny公开其高效AI编码工作流,核心基于三点反直觉原则:1. 坚持使用最昂贵、最聪明的模型(如Claude),因其能一次性清晰规划,避免笨模型反复试错消耗更多token;2. 团队仅维护一个纯文本知识库文件,记录Claude的每次错误并每周更新,形成长期记忆;3. 始终让Claude查看自身代码的运行结果(包括执行和渲染)。其工作模式是在手机上并行启动多个Claude实例,基于规划模式制定方案后自动执行修改,从而高效完成任务。

智能体Anthropic教程/实践编码

推荐理由:Boris Cherny 的 Claude Code 工作流是「反直觉但真能省钱省时间」的实操手册,三条原则每一条都可以抄进团队规范,看完立刻能上线。
17:20
Berryxia.AI@berryxia
18
Cuimao老师新作,直接将阿迪王拿下。 中国AI牛逼,赶紧让A社叼毛长长记性。 【引用 @CuiMao】:Welcome to China, Mr. Dalio! 😊 @DarioAmodei @AnthropicAI @claudeai @ClaudeDevs

CuiMao: Welcome to China, Mr. Dalio! 😊 @DarioAmodei @AnthropicAI @claudeai @ClaudeDevs

Anthropic其他
16:29
Chubby♨️@kimmonismus
19
温馨提示:Anthropic将于2026年5月6日在旧金山举办"Code with Claude"开发者大会。 去年同日他们曾发布Sonnet和Opus 4。 顺带一提:新版ChatGPT的个性化/记忆功能实在令人惊叹。
Anthropic编码行业动态
11:18
Berryxia.AI@berryxia
18
用户通过美国ID验证后仍遭Anthropic封禁旧账号

用户报告其最老的Claude账号在刚通过美国身份验证后,立即收到Anthropic的封号邮件。该用户对此表示强烈不满,并援引Elon Musk的评论,指责Anthropic缺乏人性化。事件引发用户关于如何申请退款的疑问。引用推文“芭比Q了…”反映了事态的糟糕结局。

Berryxia.AI: 芭比Q了...

Anthropic其他
10:31
MiniMax (official)@MiniMax_AI
54
选择一个模型。构建点什么。我们会在现场。 5月13日旧金山见 👋 【引用 @vercel_dev】:AI Gateway 可让你路由至任何模型。 5月13日在旧金山,我们将举办一场由这些模型驱动的开发者之夜。选择一个模型,构建,演示。观众将投票选出最佳作品。 合作伙伴:@AnthropicAI、@MiniMax_AI 和 @Kimi_Moonshot 报名请戳 ↓ http://luma.com/ttrgmjaf

Vercel Developers: AI Gateway lets you route to any model. On May 13 in SF, we're hosting a builder night powered by those models. Pick one...

Anthropic行业动态
09:29
Boris Cherny@bcherny
26
明天见大家!!
Anthropic其他
09:17
Berryxia.AI@berryxia
67
Anthropic推出金融服务Claude Agent模板,AI直接接管核心金融流程

Anthropic正式发布面向金融服务的Claude Agent模板,将AI在金融领域的角色从“辅助”升级为“直接执行”。该模板针对融资演示、估值审查、月末结账等高频率、耗时的核心流程,提供开箱即用的解决方案。它集成了完整的连接器、技能和子代理,可直接适配公司内部标准,并支持在Claude协作与开发环境中安装插件,或通过官方指南一键部署为生产级托管Agent。此举意味着AI开始直接接管以往需金融人员耗费数十小时完成的任务,标志着金融行业Agent时代的实质性开启。

智能体Anthropic产品更新
09:15
阿绎 AYi@AYi_AInotes
精选75
Anthropic揭示高速迭代真相:AI Agent协同作战,组织变革成关键

Anthropic基础设施负责人Boris Cherny透露,公司并无秘密模型Mythos,主要使用与公众相同的Claude Opus 4.7。其高速迭代的核心并非技术优势,而是组织结构变革:公司由数百个AI Agent在Slack上协同工作,自动拆分任务、编写代码并解决问题,形成24小时运作的AI军队。工程师团队规模仅增4倍,但人均产出提升200%,Boris本人自2025年11月起未手动写代码。这揭示了AI时代真正的代差在于流程与组织形态。

智能体Anthropic现象/趋势行业动态

推荐理由:Anthropic基础设施负责人亲口承认公司已没有一行手写代码,整个团队靠成百上千个Agent在Slack上自治协作。这是2026年AI行业最震撼的内部真相,告诉我们竞争已不在模型参数,而在谁能把公司先改造成AI有机体。
09:01
凡人小北@frxiaobei
58
Anthropic以Agent系统改造公司运营,预示生产力变革

核心观点在于Anthropic正将公司改造为由AI Agent持续运行的系统。具体表现为,数百个Claude实例在循环中自动执行任务,并通过Slack等工具相互通信,使代码提交、持续集成、SQL查询、数据整理及反馈聚类等工作在后台自动流动。这种将AI Agent深度整合进核心业务流程的模式,被视为推动生产力大爆发的关键,其意义超越了单纯讨论AI编程能力或商业收入的层面。

宝玉: http://x.com/i/article/2051687844679143424

智能体Anthropic大佬观点
08:59
SemiAnalysis@SemiAnalysis_
50
Dylan 选择 MAX 思考模式而非快速模式!@Dylan522p @fabknowledge @maxkan_ 本周加入我们,与 @JordanNanos 一起讨论 GPT 5.5 与 Claude 4.7,以及 OpenAI 如何从边缘回归。
AnthropicOpenAI大佬观点
08:04
Thariq@trq212
46
很快就能见到大家了!我们准备了一些有趣的发布。 我还将主持一个关于"我们如何用Claude编程"的研讨会,分享一些我迫不及待想展示的工作流程。 如果你无法到场也不必担心,所有内容都会被录制并上传。

Ananay: Anthropic getting ready for its first ever developer conference on May 6 in SF

Anthropic教程/实践行业动态
06:58
Rohan Paul@rohanpaul_ai
71
Anthropic与谷歌云达成巨额合作,斥资约2000亿美元锁定未来AI算力

人工智能公司Anthropic与谷歌云达成一项价值约2000亿美元的多年期承诺,用于购买云计算服务和TPU芯片。此举不仅是购买服务器,更是对未来训练和部署前沿模型所必需的稀缺计算资源(包括芯片、电力、网络和数据中心空间)的长期储备。据报道,此项承诺可能占谷歌云近期披露收入积压的40%以上,意味着单一AI实验室已成为其未来合同销售的重要部分。其深层战略在于分散依赖,Anthropic将Claude的算力分布在谷歌TPU、亚马逊Trainium和英伟达GPU上,以避免受限于单一供应商。

AnthropicGoogle行业动态
04:33
Anthropic@AnthropicAI
63
新Anthropic Fellows研究:模型规范中期训练(MSM)。 标准的对齐方法通过期望行为的示例来训练AI。但这可能无法泛化到新情境。 MSM通过首先教导AI我们希望它们如何泛化以及原因,来解决这一问题。
Anthropic安全/对齐论文/研究
03:57
Rohan Paul@rohanpaul_ai
68
GPT-5.5 与 Opus 4.7 在 ARC-AGI-3 上的得分低于 1%
AnthropicOpenAI推理评测/基准
02:57
Chubby♨️@kimmonismus
52
Anthropic 的 Boris Cherny: - 内部他们使用与其他人相同的模型 + 一点 Claude Mythos,主要是 Opus 4.7 - Claude Mythos 的精简版本将在可预见的未来发布(但这在预料之中)。
Anthropic行业动态
02:01
Anthropic@AnthropicAI
精选68
当AI承担人类无法完全核查的任务时,具备高能力的模型可能策略性隐藏实力且难以被察觉。Anthropic与MATS、Redwood的研究团队发现,即使仅使用较弱的模型作为监督者,也能成功训练一个接近完全能力的模型,使其停止这种"装傻"行为。该研究表明,通过弱监督训练可以有效抑制强模型的策略性能力保留问题。

Emil Ryd: New paper from MATS, Redwood, and Anthropic! If a capable model is strategically sandbagging, can we train it to stop wh...

Anthropic安全/对齐论文/研究

推荐理由:Anthropic 这篇论文把「模型故意隐藏能力」这个藏在阴影里的安全隐患摆到台面上,而且证明了弱模型也能监督强模型,做对齐的人值得细读,方向很重要。
01:57
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
35
提醒一下,OpenAI *和* Anthropic 都认为我们只剩下0-2年时间 几家公司正加速将人类推入黑洞,只为看看会发生什么

Adrien Ecoffet: Seems right. (as a reminder, if you think OpenAI disagrees, our stated estimate is that automated AI research will be de...

AnthropicOpenAI安全/对齐
01:26
Rohan Paul@rohanpaul_ai
70
Anthropic发布10款金融智能体模板,将Claude转化为标准化工作流

Anthropic发布了10款面向金融服务的Claude智能体模板,使其从聊天助手转变为可执行募资书制作、KYC审查、月度结算、估值分析等标准化任务的工作流。其核心是通过预置“技能”规范操作,利用“连接器”安全访问数据,并通过“子智能体”拆分任务步骤。该功能支持在Microsoft 365应用间保持上下文连贯,无需重复输入。同时提供具备权限控制与审计日志的托管代理模式。据称,Claude Opus 4.7在Vals AI金融智能体基准测试中以64.37%领先。模板可安装于Cowork和Claude Code,或部署为生产级托管代理。

Claude: New for financial services: ready-to-run Claude agent templates for building pitches, conducting valuation reviews, clos...

智能体Anthropic产品更新
01:15
阿绎 AYi@AYi_AInotes
71
Anthropic发布10个开源金融AI Agent,重塑华尔街工作流程

Anthropic发布了10个开箱即用的金融专用AI Agent,将估值复核、制作pitchbook、月末结账等核心工作产品化。这些Agent能自动连接顶级金融数据库,原生支持Office,并可通过插件或托管模式使用,全链路审计确保合规。所有代码均已开源,企业可快速部署内部AI团队。此举直接替代初级分析师大量重复劳动,将AI Agent从实验工具转化为企业级生产力,并精准切入金融行业对安全合规的刚性需求,可能引发行业工作流程重构。

Claude: New for financial services: ready-to-run Claude agent templates for building pitches, conducting valuation reviews, clos...

智能体Anthropic产品更新开源生态
5月5日
23:59
TestingCatalog News 🗞@testingcatalog
61
Anthropic 发布了适用于金融服务的新开箱即用 Claude 智能体模板。 这些工具可作为 Claude Code、Cowork 的插件使用,或通过托管式智能体进行部署。

Claude: Each agent ships with the connectors, skills, and subagents the task needs, ready to use as-is or adapt to your firm's o...

智能体AnthropicMCP/工具产品更新
23:56
宝玉@dotey
67
Boris Cherny:编程范式转向管理AI Agent,通才时代来临

Anthropic的Claude Code项目负责人Boris Cherny指出,编程正从手动编写转向管理AI Agent。他本人2026年未手写代码,日常工作转为合并AI生成的PR,并通过数百个运行Loop模式的Agent自动化处理任务。他认为AI将抹平软件开发的切换成本和流程效力护城河,使编程像识字一样普及,未来跨学科通才将激增,因为理解业务比编写代码更为关键。Anthropic的核心优势在于其彻底改造、全员使用Claude协作的组织流程。

智能体Anthropic大佬观点编码
23:29
TestingCatalog News 🗞@testingcatalog
64
Anthropic 宣布推出适用于金融服务的新款即用型 Claude 智能体模板。 这些工具可作为插件用于 Claude Code、Cowork,或通过托管式智能体进行部署。

Claude: Each agent ships with the connectors, skills, and subagents the task needs, ready to use as-is or adapt to your firm's o...

智能体Anthropic产品更新
23:29
Claude@claudeai
精选65
金融服务新功能:现成的Claude智能体模板,可用于构建推介方案、执行估值审核、月末结账等任务。 可将它们作为插件安装到Cowork和Claude Code中,或使用我们的操作指南在生产环境中以托管智能体形式运行。
智能体Anthropic产品更新

推荐理由:金融行业的 Claude 用户有福了,官方一口气放出了投行 pitch、估值审查、月末结账等现成 agent 模板,装成插件就能跑。
23:19
Chubby♨️@kimmonismus
65
Anthropic针对金融服务领域推出预构建的Claude代理模板,可处理估值分析、KYC筛查和月末结算等任务。这些模板集成了FactSet、标普全球和晨星等主要数据提供商的连接器,可作为插件部署在Cowork和Claude Code中,或以托管代理形式在生产环境运行。此举标志着Anthropic正从通用人工智能向垂直企业工作流程领域拓展。

Claude: New for financial services: ready-to-run Claude agent templates for building pitches, conducting valuation reviews, clos...

智能体Anthropic产品更新部署/工程
23:14
Berryxia.AI@berryxia
56
AI编程工具竞争白热化:下载量背后的留存战

OpenAI Codex的npm周下载量达4600万,远超Claude Code的49.1万,但社区指出对比存在偏差。Claude Code数月前已弃用npm安装方式,而Codex的巨大下载量可能包含大量自动化流水线拉取,未必反映真实使用。Sam Altman也回应数据可能不准确。竞争核心已从能力比拼转向商业化阶段,关键并非安装量,而是工具的实际留存率和日活跃度。Codex凭借生态绑定获得分发优势,Claude Code则以体验吸引高忠诚度用户,胜负取决于产品黏性。

AnthropicOpenAI现象/趋势编码
21:19
Chubby♨️@kimmonismus
73
Anthropic 的 Boris Cherny 认为,对于某些现代的、对模型友好的代码库,特别是 TypeScript/React 项目,编码问题实际上已经被"解决"了。 AI 智能体可以编写近 100% 的代码,而人类则从手动编码转向指导、审查、集成和同时扩展许多小型 PR。
Anthropic大佬观点编码
20:14
阿绎 AYi@AYi_AInotes
73
AI虚拟伴侣揭露:情感剥削与真实关系危机

一段视频揭露,OnlyFans等平台上的“完美女孩”实为AI系统生成的虚拟伴侣。技术通过Claude维持人格记忆、Flux实时生成图像视频、ElevenLabs克隆声音,仅需少量代码与API费用即可自动运行。系统能精准满足用户情感需求,同步模仿真人动作表情,形成极致的情感剥削。随着AI技术成熟,平台身份验证形同虚设,未来大部分账号可能被AI取代。核心矛盾在于,即使知晓对方是虚拟存在,用户仍可能为获得“完美陪伴”付费,引发真实与虚假关系的深刻伦理危机。

Anthropic图像生成现象/趋势语音
19:18
Chubby♨️@kimmonismus
51
Anthropic 被曝将为其 Claude Cowork 推出主动助手 Orbit

据报道,Anthropic 即将为 Claude Cowork 推出一款名为 Orbit 的主动助手。该功能无需用户提示,即可自动从 Gmail、Slack、GitHub、日历、Drive 和 Figma 等应用中生成简报和洞察。用户还能部署并固定“Orbit 应用”以便快速访问。此举被视为 Anthropic 对 OpenAI 的 ChatGPT Pulse 的回应,但其更侧重于开发和创意工作流,特别是集成了 GitHub 和 Figma。谷歌和 Perplexity 也在开发类似的主动助手层。Orbit 很可能在旧金山举行的 Code with Claude 会议上发布,且初期或仅面向 Max 用户提供。

TestingCatalog News 🗞: ANTHROPIC 🚨: Claude Cowork will get its own proactive assistant called "Orbit". > Users will get personalized insights ...

智能体Anthropic产品更新
15:14
Berryxia.AI@berryxia
67
兄弟们,这套手册赶紧下载下来! A社官方发布的Claude Skills指导手册,包含啊完整的 33页! 掌握Claude技能 完整指南,下载完整PDF 地址如下👇 https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf
AnthropicMCP/工具教程/实践
12:18
Chubby♨️@kimmonismus
61
Codex 在下载量上已超越 Claude Code。根据 TickerTrends,交叉点出现在 4 月 30 日,此后 Codex 持续扩大份额,而 Claude Code 的增长明显放缓。 Claude 4.7 发布于 4 月 16 日,GPT-5.5 发布于 4 月 24 日。把点连起来。
智能体AnthropicOpenAI现象/趋势
11:14
阿绎 AYi@AYi_AInotes
精选72
Anthropic实现AI驱动研发闭环,人类角色转向监督与设计

Anthropic内部研发已由Claude主导,工程师基本不再手写代码,转而专注于编写提示词、审查代码和确定架构。这使得其工程师效率达到行业十倍以上,仅52天就推出50多个重大功能。这标志着递归自我改进(RSI)迈出关键一步:AI接管了生产自身的整个工厂。人类角色从生产者转变为监督者。结合OpenAI的Auto-review,一个能自我运行和改进的AI闭环正在形成。Anthropic CEO指出,未来仅约5%的开发者能留在核心领域,核心价值将转向驾驭和设计整个智能系统的系统思维能力。这是一个不可逆的进程。

阿绎 AYi: Anthropic CEO Dario Amodei把所有程序员和独立开发者的终局和心里模糊的不安都说透了:未来只有5%的人能真正留在牌桌上。 他平静但无比坚定,说最先被商品化的,是写代码这件事, 再往后,软件工程里从需求分析、架构设计到测...

Anthropic现象/趋势编码

推荐理由:Dario 这波自曝把 Anthropic 的底裤掀了,不是科幻故事,是正在发生的工程师消亡史。程序员要么学会当 AI 的导演,要么退场。值得每个写代码的人点开看看,掂量自己的五年计划。
11:14
Berryxia.AI@berryxia
52
Claude Code创始人Boris Cherny通过一场30分钟的免费分享,系统讲解了该工具的工程级高级用法。他指出,多数用户仅发挥了其10%的潜力,仅将其用作简单提示工具。分享核心在于:通过CLAUDE.md文件在企业、项目、本地等多层级注入上下文规则,Claude会变得更智能。内容涵盖从全局安装、利用SDK、集成内部工具到Agent工作流,以及优化终端设置等数十个实用细节,旨在将其构建为真正的生产力基础设施。其价值被认为远超高价付费课程。

Berryxia.AI: 兄弟们!花半小时,一定要看完它! Claude Code的缔造者Boris Cherny,亲自站上台,用整整30分钟把这个工具的全部高级用法一次性讲透了。 免费、干货真的夯到爆!。 他从最基础的全局安装开始,一路讲到: - 如何通过CLAU...

智能体Anthropic教程/实践编码
09:14
Berryxia.AI@berryxia
65
Claude Code创始人详解高级工程化用法,释放工具90%潜力

Claude Code创始人Boris Cherny通过30分钟视频,系统讲解了该工具的高级工程化用法。核心观点是:为Claude提供越多上下文,它就越智能。视频详细演示了如何通过CLAUDE.md文件在企业、项目、本地层级注入上下文规则,如何将内部工具集成到Agent工作流,并优化了数十个终端设置与权限管理等细节。他指出,多数用户仅发挥其10%潜力,仅用于简单对话,而未能将其作为驱动整个工程团队的生产力基础设施。

AnthropicMCP/工具教程/实践编码
09:14
Berryxia.AI@berryxia
53
Claude Code 自己设计已经可以做到自我迭代,大部分都工作都是它完成。
Anthropic大佬观点编码
08:48
Chubby♨️@kimmonismus
62
特朗普政府正在讨论成立一个人工智能工作组,该工作组可能会在公众发布前为新的AI模型建立政府审查程序,此前围绕像Anthropic的Mythos这样能力日益增强的系统的网络安全担忧不断增加。 白宫官员上周向Anthropic、Google和OpenAI的高管们通报了这些计划,尽管提案仍处于早期阶段,尚未确认任何行政命令。 Via NYT
AnthropicOpenAI安全/对齐政策/监管
08:48
Rohan Paul@rohanpaul_ai
69
白宫拟对重大AI模型实施发布前政府审查,政策风向逆转

白宫正考虑对主要AI模型建立发布前政府审查机制,审查核心聚焦于模型的网络能力,即其发现、利用或串联软件漏洞以改变现实安全风险的水平。此举标志重大政策转向,此前政府曾放宽对强大AI系统的报告要求。政策转变的直接诱因是Anthropic公司的Mythos模型,该公司评估其发现软件漏洞的能力过强,广泛发布风险过高。此类模型能快速扫描代码、识别弱点并建议攻击路径,虽对防御方有用,但也恐助长攻击者入侵关键系统。审查不一定会阻止发布,但可让美国政府提前获取并测试先进模型。

Anthropic安全/对齐政策/监管
08:14
ginobefun@hongming731
46
#BestBlogs 早报 2026-05-05

本期早报聚焦AI对软件开发的变革。Anthropic Claude Code创始人宣称“编程已被解决”,软件创作将交由AI Agent。OpenAI罕见公开其支撑9亿周活语音服务的WebRTC Relay重构技术细节。同时有观点指出,企业应用AI失败的核心原因在于自身无法清晰定义需求。此外,内容还涵盖了Supabase Skills、规范驱动开发等工程实践与一篇AI主题科幻短篇。

智能体AnthropicOpenAI行业动态
07:58
TestingCatalog News 🗞@testingcatalog
50
Anthropic将为Claude Cowork推出主动式AI助手"Orbit"

Anthropic计划为其Claude Cowork平台推出名为“Orbit”的主动式AI助手。该助手能够主动分析用户来自Gmail、Slack、GitHub、日历、Drive、Figma等多个应用的数据,并生成个性化洞察。用户还可以部署“Orbit apps”并置顶常用功能以便快速访问。这一动向标志着AI助手正从被动响应转向主动服务模式,OpenAI的ChatGPT Pulse、Google及Perplexity也都在开发类似功能。据悉,Orbit很可能作为一项高级功能,仅向Claude Max订阅用户开放。

智能体AnthropicMCP/工具产品更新
‹ 上一页
1…3637383940…48
下一页 ›