AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 1911 条
全部一手资讯X论文
标签「Anthropic」清除
Rohan Paul@rohanpaul_ai · 5月20日81

Andrej Karpathy had already talked about this possibility 1 month back, that he might join one of the big AI labs and why he may do so. "They (the AI labs) are kind of like at the edge of capability of what's possible. And they are working on what's coming down the line. And I think if you're outside of that frontier lab, your judgment fundamentally will start to drift because you're not part of what's coming down the line. And so I feel like my judgment will inevitably start to drift as well. And I won't actually have an understanding of how these systems actually work under the hood. It's a big system. I won't have a good understanding of how to develop and etc. And so I do think that in that sense, I agree and something I'm nervous about. I think it's worth basically being in touch with what's actually happening and actually being in the frontier lab. And if some of the frontier labs would have me come for some amount of time and do really good work for them, then I think that's maybe a good setup" --- From 'No Priors: AI, Machine Learning, Tech, & Startups" YT channel (link in comment)

译Andrej Karpathy在一个月前的访谈中解释了考虑加入大型AI实验室的原因。他指出,身处能力前沿的实验室正主导着技术发展方向;脱离其中会导致个人判断力逐渐偏离真实进展,且无法深入理解大型系统底层运作机制。因此,他认同保持接触技术前沿、身处核心研发环境的价值。近期,Karpathy已正式宣布加入Anthropic,他认为未来几年大语言模型的前沿发展将至关重要,并期待重返研发一线。

Ethan Mollick@emollick · 5月20日59

The gap between what you can do on ChatGPT/Codex and Claude/Code/Cowork is closing, as Anthropic & OpenAI converge on a single experience. Google's experiences are diverging: Studio & Gemini & Antigravity & the other Google AI apps are increasingly different. Which will win?

译ChatGPT/Codex 与 Claude/Code/Cowork 之间的能力差距正在缩小,因为 Anthropic 和 OpenAI 正在趋同于单一的体验。 Google 的体验则在分化:Studio、Gemini、Antigravity 及其他 Google AI 应用正变得越来越不同。 谁将胜出?

meng shao@shao__meng · 5月20日81

啊? Andrej Karpathy 加入 Anthropic 了?!

Emad@EMostaque · 5月20日35

Shouldn’t this mean > $100b in charitable giving for effective altruism adjacent projects from Anthropic founders & team members alone?

译AI行业正在催生规模空前的慈善资本。Anthropic七位联合创始人承诺捐出80%的财富,并推出科技史上最激进的员工配捐计划。OpenAI基金会持有OpenAI约26%股份,按当前估值价值约2200亿美元。这些资金将大幅增加可用慈善资本,但同时也暴露出当前慈善领域在运营能力和项目执行上的巨大缺口,亟需新的机构与人才来承接和有效运用这笔巨额资源。

Chubby♨️@kimmonismus · 5月20日83

Andrej Karpathy joining Anthropic is the biggest flex Anthropic could have hoped for. 10m views after 6h. Best hire ever.

译Andrej Karpathy加入Anthropic,是Anthropic所能期望的最大手笔。 6小时内获得1000万次浏览。史上最重磅招聘。

SemiAnalysis@SemiAnalysis_ · 5月20日67

Warren Buffett's Berkshire Hathaway first invested in Google in Q3 2025, coincidentally the same time that SemiAnalysis called out a huge increase in TPU purchases from Anthropic. In Q1 Berkshire added more to their position. Buffett actually said this about his own diligence into Google's AI Infrastructure supremacy: "I don't buy what I can't understand. So Greg sat me down with the TPU v5p spec. 8,960 chips wired in a 3D torus, every chip talking to six neighbors over ICI links at 4.8 Tbps a pop, wraparound rails so no chip is ever at the end of the line, and optical circuit switches throwing the junctions mid-job to carve out whatever submesh your sharded matmul needs. Add in ring all-reduce running consists in both directions along each torus axis, collective permutes shuffling shards between sidings, and bandwidth-optimal SPMD partitioning across the data, model, and pipeline dimensions. Folks, it's just BNSF. Six neighbors, scheduled consists, a yardmaster throwing switches, trains that never stop. And I've been understanding railroads since 1942." Want to understand the TPU system architecture as deeply as Buffett? Read more here: https://newsletter.semianalysis.com/p/tpuv7-google-takes-a-swing-at-the

译巴菲特旗下伯克希尔·哈撒韦于2025年第三季度首次投资谷歌,并于2026年第一季度加仓。其投资决策基于对谷歌AI基础设施的深度理解。巴菲特将复杂的TPU v5p芯片集群——包括其3D环面互联、光电路交换与分布式训练算法——比作他熟悉的BNSF铁路网络:芯片互联如轨道连接,调度算法如列车编组,环形拓扑确保系统稳定。这一类比揭示了他并非盲目跟风,而是通过对底层系统运作原理的剖析做出的审慎投资。

ClaudeDevs@ClaudeDevs · 5月20日73

Computer use turns Claude into an agent that can operate real UIs. New blog post on making it reliable in production: getting click accuracy right, choosing thinking effort levels, keeping long sessions within context, and recording demonstrations Claude can replay: https://claude.com/blog/best-practices-for-computer-and-browser-use-with-claude

译计算机使用功能使Claude成为能够操作真实用户界面的智能体。 新博客文章探讨如何在生产环境中确保其可靠性:包括提高点击准确性、选择思考努力级别、在长会话中保持上下文,以及记录Claude可重放的演示操作: https://claude.com/blog/best-practices-for-computer-and-browser-use-with-claude

Claude@claudeai · 5月20日42

Scott Wu (@ScottWu46) runs @cognition, the team behind Devin, an AI software engineer built on Claude. He wants to make building software 10x faster for every engineering team:

译Scott Wu (@ScottWu46) 领导着 @cognition 团队,该团队打造了基于 Claude 的 AI 软件工程师 Devin。 他希望为每个工程团队将软件构建速度提升十倍:

Berryxia.AI@berryxia · 5月20日62

老马承认目前Cursor 模型和Claude的差距,也说了𝕏 AI 也不能没有它。 是整个生态中必须要有的一部分,得努力追赶。

AYi@AYi_AInotes · 5月20日82

Damn! The landscape of the AI industry has been altered for good from today onward. 今晚睡不着了兄弟,AI 圈顶级大牛,前 OpenAI 创始团队 + Tesla AI 前总监 Andrej Karpathy大神刚刚官宣:我加入 Anthropic 了! 但说实话,Karpathy 加入 Anthropic 这条帖子,我看到第三遍才意识到真正的含义 很多人都在聊钱、聊人才战争、聊 Anthropic 赢了, 但整个帖子里最硬的一个词被划过去了,叫formative, 兄弟们想想,一个亲手把 GPT-1 推到 GPT-4、亲眼见过 scaling law 在真实算力上跑起来的人,现在公开说未来几年是 formative years, 这话翻译过来就是:你们说 AI 见顶了,我告诉你,真正的窗口期现在才来! 而且他还不是那种模棱两可的乐观,而是非常精准的、带着职业生涯赌注的判断, 我觉得他选 Anthropic,也不是猎头挖得好,本质上还是他自己对未来方向的判断的结果,在为下一步AI发展方向投票, 也就是说LLM 的下一次跃迁,大概率在安全 + 极致 capability 的那条路径上跑通, 这才是这道帖子真正让人睡不着的地方 hhh

译前OpenAI创始团队成员Andrej Karpathy宣布加入Anthropic,被普遍视为AI行业的一次地震级事件。但这并非单纯的人才流动。Karpathy在声明中将LLM前沿的未来数年定义为“formative years”(关键塑形期),这被解读为对“AI发展见顶论”的直接反驳,意味着真正的爆发窗口期现在才刚开始。他选择Anthropic,本质上是其个人对未来AI发展路径的深度判断和“投票”,即认为LLM的下一次重大突破,很可能在安全与极致能力协同发展的路径上实现。这标志着行业竞争的核心,已从当下的模型比拼,延伸至对长期技术路线的押注。

Thariq@trq212 · 5月20日78

the future is bright, lets get to work

译未来光明,让我们开始工作吧。

Chubby♨️@kimmonismus · 5月20日74

No way that Karpthy joined Anthropic! What

译不可能吧,Karpathy居然加入了Anthropic!什么情况

Noam Brown@polynoamial · 5月20日82

Andrej @karpathy is back in the game! I would have loved for him to rejoin @OpenAI, but I'm happy he's at any frontier lab pushing the field forward. It’s easy to frame this as zero-sum among the labs, but in truth we’re collectively advancing the most important tech of our era.

译Andrej Karpathy宣布加入Anthropic,投身大语言模型研发。推文作者虽曾希望他重返OpenAI,但肯定其在任何前沿实验室都能推动技术进步。观点强调,AI领域的竞争并非零和博弈,而是共同推进这一时代最重要技术的进程。Karpathy本人表示,未来几年将是大语言模型发展的关键期,并将持续投入研发,同时不忘教育事业。

歸藏(guizang.ai)@op7418 · 5月20日81

我去 Karpathy 居然加入了 Anthropic,这下估计没有教程看了,啥也不会说了,希望还能多分享

Berryxia.AI@berryxia · 5月20日85

这下“天塌了”了啊,兄弟们! Andrej Karpathy刚刚官宣:他加入Anthropic了。 对,你没看错就是A社。 可能A社给的条件还是太好了。。。 这下有的搞了~~· 这位前OpenAI创始团队成员、Tesla AI前总监、用一堆公开课教会全球几百万人的AI教父,现在选择重返一线做R&D。 他说:未来几年LLM前沿会特别具有塑造力,他非常兴奋能回到实验室。

凡人小北@frxiaobei · 5月20日90

这是 Anthropic 狙击 Google 发布会的新手段吗🤔

译这是 Anthropic 狙击 Google 发布会的新手段吗🤔 [引用 @karpathy]:个人动态:我已加入 Anthropic。我认为未来几年在大语言模型前沿领域将尤为关键。我非常兴奋能加入这里的团队并重返研发工作。我依然对教育充满热情,并计划适时恢复相关工作。

Yuchen Jin@Yuchenj_UW · 5月19日79

Andrej joined Anthropic. Even Elon couldn’t help but praise Anthropic. Anthropic really aura-farmed Google I/O today.

译Andrej加入了Anthropic。 连Elon都忍不住称赞Anthropic。 Anthropic今天在Google I/O上真是气场全开。

Emad@EMostaque · 5月19日41

As companies approach AGI it would be illogical for most not to go and work there. AGI is a much bigger deal than most people still seem to believe & it is only by most forecasts a few years away (if not arrived already!).

译推文指出通用人工智能(AGI)的重要性远超多数人认知,其发展可能仅需数年甚至已初现端倪。在这一预期下,顶尖人才向AGI相关公司聚集是合乎逻辑的趋势。Karpathy宣布加入Anthropic,正是这一趋势的体现;他强调了大语言模型(LLM)前沿研究在未来数年的关键作用,表明该领域正吸引核心研发力量。这反映出行业竞争焦点已转向AGI竞赛,人才流动加速了技术布局。

Nathan Lambert@natolambert · 5月19日63

Very happy for Karpathy. Also very lonely times in open science.

译为Karpathy感到高兴。 开源科学领域也正经历着一段略显孤单的时期。

宝玉@dotey · 5月19日89

Andrej Karpathy 官宣加入 Anthropic

译Andrej Karpathy 官宣加入 Anthropic [引用 @karpathy]:个人动态:我已加入 Anthropic。我认为未来几年在大语言模型前沿领域将尤为关键。我非常兴奋能加入这里的团队,重返研发工作。我依然对教育充满热情,并计划适时恢复相关工作。

🚨 AI News | TestingCatalog@testingcatalog · 5月19日78

Andrej Karpathy has joined Anthropic and getting back to the R&D! > I think the next few years at the frontier of LLMs will be especially formative.

译Andrej Karpathy已加入Anthropic,重返研发岗位! 我认为未来几年在LLM前沿领域将尤为关键。

ClaudeDevs@ClaudeDevs · 5月19日93

Welcome to the team, Andrej!

译欢迎加入团队,Andrej!

Yuchen Jin@Yuchenj_UW · 5月19日76

Anthropic has claimed the mandate of heaven.

译Anthropic已宣称获得了天命。 [引用 @karpathy]:个人动态:我已加入Anthropic。我认为未来几年在大语言模型前沿领域将尤为关键。我非常兴奋能加入这里的团队,并重返研发工作。我依然对教育充满热情,并计划适时恢复相关工作。

Andrej Karpathy@karpathy · 5月19日80

Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.

译个人动态:我已加入Anthropic。我认为未来几年在LLM前沿领域将尤为关键。我非常兴奋能加入这里的团队,重返研发工作。我依然对教育充满热情,并计划适时继续相关工作。

ClaudeDevs@ClaudeDevs · 5月19日60

We’ve added two security improvements to Claude Managed Agents. Self-hosted sandboxes keep the agent’s execution environment in your infrastructure or with a managed sandbox provider. MCP tunnels let the agent connect to services inside your security perimeter.

译我们为Claude Managed Agents增加了两项安全改进。 自托管沙箱将代理的执行环境保留在您的基础设施或托管沙箱提供商处。 MCP隧道让代理能够连接到您安全边界内的服务。

Chubby♨️@kimmonismus · 5月19日64

Cloudflare pointed Anthropic's Mythos Preview at 50+ of their own repos. They call it a step-function forward "Mythos Preview is a real step forward, and it's worth saying that plainly before getting into anything else." The big finding isn't the bugs it caught - It's that the model can take several low-severity vulnerabilities - the kind that sit invisible in backlogs - and chain them into a single working exploit. Write the proof-of-concept. Compile it. Run it. Adjust when it fails. Try again. That loop is what separates a scanner from a researcher. The other finding security teams should pay attention to: "patching faster" is the wrong response. If your regression testing takes a day, a two-hour SLA just means you ship broken fixes. The architecture around the vulnerability matters more than the speed of the patch. Mythos is not just hype. It shows its power in real-world use cases.

译Cloudflare安全团队使用Anthropic的Mythos Preview对50余个内部代码库进行测试后指出,该模型的突破性在于其自主“漏洞链”能力:能自动串联多个常被忽略的低危漏洞,独立编写、编译、运行并迭代出可工作的概念验证攻击代码,实现了从“扫描工具”到“安全研究员”的跨越。测试同时警示,应对更强大的攻击性AI,仅追求“更快打补丁”并非正确答案——若架构脆弱或回归测试不足,过快的修复反而可能引入新风险。关键在于重构漏洞周边的系统架构。

ClaudeDevs@ClaudeDevs · 5月19日31

So good to see you, London!🇬🇧

译很高兴见到你,伦敦!🇬🇧

AYi@AYi_AInotes · 5月19日75

我真的要吹爆HTML! 喵个咪终于可以把Notion给扔了, 现在做项目计划2分钟搞定, 做完直接发给领导! 昨天做2026年度组织与人才盘点, 我给Claude code发了一个提示词, xhigh模式跑了2分多钟, 结果直接出了一个完整的交互式HTML页面🤯 暗色主题,横向时间线, 可折叠风险表,团队头像墙, 整体进度条,所有交互全部到位, 不用接任何polish skill, 打开就能直接发给leader看。 以前同样的活, 我用Notion拼模板至少要30-40分钟, 现在2分钟搞定, 效率提升了将近20倍。 最厉害的地方是它完全不依赖任何外部库, 就是一个单HTML文件, 所有CSS和JS全部内联, 用SVG画时间线不用Canvas, 代码总量控制在700行以内。 它的核心逻辑其实很简单, 你只要给Claude code一个足够精确的提示词, 明确告诉它所有的约束条件, 视觉规格,内容结构,交互规格, 最重要的是加上一个严格的完成判定标准。 它会逐项检查每个模块是否完整渲染, 任何一个模块缺失都会自动补全, 不会给你交付半成品。 提示词在下方文章里一键复制粘贴即可, 把里面的项目名称,周期,里程碑,风险,团队成员换成自己的就行。 玛德以后再也不用在Notion里拖拖拽拽拼模板了, AI时代,HTML才是真正的生产力工具!! #Claude #HTML #AI工具 #生产力

译作者通过向Claude Code提供精确的提示词,仅用2分钟就生成了一个功能完整的交互式HTML项目计划页面。该页面为单文件、无外部依赖,包含暗色主题、时间线、可折叠表格等丰富交互,可直接交付。相比过去在Notion中耗费30-40分钟制作模板,效率提升了近20倍。其核心在于使用明确的提示词来规范视觉、内容结构与交互细节,确保AI一次性交付完整产物。这充分展示了在AI时代,HTML作为轻量、高保真生产力工具的巨大潜力。

🚨 AI News | TestingCatalog@testingcatalog · 5月19日72

Anthropic announced self-hosted sendboxes and MCP tunnels for Claude Managed Agents during its "Code with Claude" event in London. > With self-hosted sandboxes, you keep sensitive files, packages, and services in your own infrastructure or with a managed sandbox provider. > With MCP tunnels, your agents reach MCP servers inside your private network without exposing them to the public internet.

译Anthropic 在伦敦举办的“Code with Claude”活动上宣布,为 Claude 托管代理推出两项新功能:自托管沙盒(公测版)和 MCP 隧道(研究预览版)。自托管沙盒允许用户在自己的基础设施或托管沙盒提供商中运行代理,从而将敏感文件、软件包和服务保留在私有环境中,确保数据安全。MCP 隧道使代理能够安全访问用户私有网络内的 MCP 服务器,无需将其暴露于公共互联网,增强了访问控制。这两项功能共同支持代理在用户自有的安全边界内执行任务,并默认应用用户的安全策略,有效提升了隐私保护和操作灵活性。

Boris Cherny@bcherny · 5月19日13

Hello from Code with Claude London!

译来自Code with Claude伦敦的问候!

Claude@claudeai · 5月19日72

Live from Code with Claude London: we're launching self-hosted sandboxes (public beta) and MCP tunnels (research preview) in Claude Managed Agents. Run agents inside your own perimeter, with your security controls applied by default.

译来自Code with Claude伦敦现场:我们正在Claude Managed Agents中推出自托管沙箱(公测版)和MCP隧道(研究预览版)。 在您自己的安全边界内运行代理,默认应用您的安全控制。

AYi@AYi_AInotes · 5月19日65

为什么这个项目全网爆火, 拿下10万star,成为2026 AI领域增长最快的开源项目?why?! 先说结论,因为它戳中了咱们所有AI用户的痛点! 现在大家用AI写代码, 最大的问题就是泛泛而谈加幻觉, 让它帮你写个组件,结果给你一堆能用但到处是坑的垃圾🗑 你说帮我做个方案,它给你一堆正确的废话😑 而这个仓库呢,直接把prompt engineering做成了工业级产品, 每个角色都有独特的人格, 标准的工作流程,明确的交付物, 相当于把雇一个10年经验专家的成本降到了0,damn! 所以大家知道我们身边正在发生什么了吧, 未来不会是一个全能AI取代我们所有人, 而是一群专精AI组成的虚拟公司,取代传统公司, 这就是现在以及未来即将发生的事,拭目以待。 #AI趋势 #prompt工程

Yuchen Jin@Yuchenj_UW · 5月19日51

Cursor’s Composer 2.5 stirred up the coding war. Now we have 3 labs capable of training strong coding models: Anthropic, OpenAI, SpaceX (+Cursor). Wouldn’t be surprised if Google drops a strong coding model tomorrow at I/O. This is the chatbot war all over again: OpenAI leads, then the market gets divided by other AI labs. Same thing is happening to coding models.

译Cursor的Composer 2.5搅动了编程领域的竞争。 现在我们有三家实验室能够训练强大的编程模型:Anthropic、OpenAI、SpaceX(+Cursor)。 如果Google明天在I/O大会上发布一款强大的编程模型,我也不会感到惊讶。 这就像聊天机器人战争的重演:OpenAI领先,然后市场被其他AI实验室瓜分。同样的事情正在编程模型领域发生。

歸藏(guizang.ai)@op7418 · 5月19日57

英伟达开始交付自己设计的通用 CPU NVIDIA Vera了。 重点优化的是长期高并发和高吞吐的场景,专门用来做Agent 编排和工具调用的中枢。 模型可以在 GPU 上进行推理,但所有的调度编排和调用工具都放在这个 CPU 上。 这种密集 Agent、密集常驻的强 IO、内存和调度压力的工作,其实都是 CPU 的工作,所以他们专门做了一个 CPU。 这次交付由英伟达自己上门,将这个 CPU 送到了:Anthropic、OpenAI、xAI、OCI,其中 xAI 是由老马亲自接待的。

译英伟达正式开始交付其首款自研通用CPU——NVIDIA Vera。该芯片专门针对AI Agent时代高并发、高吞吐的长期运行场景进行优化,核心功能是作为Agent编排与工具调用的调度中枢。它旨在将原本由GPU承担的密集调度与I/O任务分离,由CPU专门处理,从而构建更高效的AI系统。首批Vera CPU由英伟达高管亲自送至Anthropic、OpenAI、xAI及甲骨文云(OCI),其中xAI由马斯克亲自接待。此举标志着英伟达正从GPU主导的推理市场,深入布局为AI Agent时代定制计算基础设施的新赛道。

ClaudeDevs@ClaudeDevs · 5月19日30

We've renamed "extra usage" to "usage credits" across Claude. Your spending limits, auto-reload settings, and any credits you've already bought carry over exactly as they were.

译我们已将Claude中的“额外用量”更名为“用量积分”。 您的消费限额、自动充值设置以及已购买的积分将完全保持不变。

meng shao@shao__meng · 5月19日70

HTML 是新的 Markdown? 10 天前 Claude Code 核心开发者 @trq212 发布了「Using Claude Code: The Unreasonable Effectiveness of HTML」,指出「HTML 是新的 Markdown」,引起了极其热烈的讨论,单篇超 1200 万阅读、1 千+ 讨论 https://x.com/trq212/status/2052809885763747935 10 天后,Thariq 在和 @clairevo 的访谈中再次重申这一观点「HTML 是新的 Markdown」,他直接指出:Markdown 作为人与 LLM 的通用语已经触到天花板,一旦任务量变大,人们会直接放弃阅读 Markdown 文件! 而 HTML 提供了可视化、可交互的载体,把人从"被动审阅者"变回"主动协作者",能把人们重新被拉回 Agent Loop 中。在 AI 时代,每个人都正在变成 "算力分配者"——核心工作不再是写代码,而是决定算力该花在哪里。HTML 是帮助人做出这个判断的更好界面。 # 三个可立即落地的工作流 工作流 1:用交互式 HTML 做头脑风暴与规划 把传统的"列个清单"换成"生成一个 HTML 文件"。 输入差异极小,输出差异极大:得到的不是文本列表,而是带 mockup、风险评估、可滚动浏览的可视页面。 进一步推到完整实施方案时,提示词哲学值得注意: · 给足约束,但留出让模型超出预期的空间。 · 拼写错误不重要,意图表达清晰才重要。 · 显式传达信任("I trust you here")会改变输出质量。 工作流 2:为编辑计划而生成"一次性微应用" 针对"HTML 不如 Markdown 易编辑"的质疑,他的答案是反直觉的:不要去编辑 HTML,而是让 Claude 现场造一个专门用来编辑这段内容的 UI。 例如要修改一组数据可视化的决策规则,他让 Claude 生成一个带输入框、下拉、增删按钮、一键复制回 Markdown 的小网页。用完即弃。 这背后是"算力丰裕心态(abundance mindset)":既然生成 UI 几乎零成本,就应该为每一个具体的编辑任务定制最舒适的界面,而不是迁就通用工具。 工作流 3:可执行的"活体设计系统" 让 Claude 扫描代码库(甚至多个 GitHub 仓库)提取设计 DNA,产出一份 design_system.html。 · 它不是静态文档,而是人机双向可读的工件:色板、字号、间距、组件交互态都在页面上活生生地渲染出来。 · 在新功能开发时,把这份 HTML 作为上下文喂给 Claude,即可保证产出符合品牌一致性。 · 配合组件 playground(带可调节旋钮),还能成为非技术同事(市场、设计、视频)自助获取高保真素材的入口,打通工程与公司其他职能之间的鸿沟。 真正值得记住的几个判断 1. 媒介决定参与度。 模型不需要 HTML,人类需要。换载体的本质是把人留在协作回路里。 · 1% 与 99% 的算力分配。 Thariq 估计他生成的 token 只有约 1% 最终进入生产代码,其余 99% 都花在"脚手架"上——计划、临时 UI、状态汇报、设计系统。这恰恰是 compute allocator 的本职:把资源投在对齐与沟通上,以确保那 1% 是对的。 · 一次性软件是新常态。 软件的边际成本趋近于零之后,"为一次编辑造一个 app"不再奢侈,而是高效。 · 信任是提示词的一部分。 显式的授权语句会让模型敢于给出更完整、更有创造性的产出。

译Claude Code核心开发者Thariq认为,Markdown在复杂任务中可读性差,导致人类易脱离协作循环。而HTML作为可视化、可交互的界面,能将人重新拉回人机协作回路,适配AI时代“算力分配者”的新角色。他提出了三个可落地的工作流:用交互式HTML进行头脑风暴;为特定任务生成“一次性微应用”;构建人机双向可读的“活体设计系统”。核心判断包括:媒介选择决定人类参与度;生成式算力应主要投入在对齐与沟通的“脚手架”上;软件边际成本趋零;以及明确信任指令能激发更创造性的输出。

meng shao@shao__meng · 5月19日79

Claude Code 核心开发者 Thariq 带来自己高频使用的「开发日志」提示词 @trq212 这段提示词解决了 AI 协作编码中最棘手的结构性问题:规格永远写不完整,但人又无法实时跟踪 AI 的每一个判断。 传统的两种极端都失败: 1. 过度规约:试图在 spec 里穷举所有边界情况——不现实,且拖慢启动 2. 完全放手:让 agent 自由发挥——结果是大量隐性决策埋藏在 diff 里,code review 时才发现,返工成本极高 这个提示词走的是第三条路:承认歧义不可避免,把"判断"这个动作本身变成可审计的产物。 这种做法为啥有效? · 降低模型的"过度澄清"倾向:模型不必反复打断你问问题,可以自主推进 · 把隐性决策外化:原本藏在代码里的"为什么这样写"被显式写出来,review 时直接对照笔记,而不是逆向工程 diff · 结构化的四个维度正好覆盖了实施中所有"非代码信息": · Design decisions = 填补 spec 的空白 · Deviations = 偏离 spec 的地方(最危险,必须显式) · Tradeoffs = 没走的路(防止 reviewer 重复思考同样的备选) · Open questions = 需要人类回环的点 · HTML/Markdown 作为载体:轻量、可读、可与代码同 PR 提交,不需要额外工具 值得借鉴的 prompt 设计原则 · 给模型一个"合法的出口",而不是逼它在歧义前停下或瞎猜 · 要求结构化产物(四个明确分类),比开放式"写点笔记"质量高一个数量级 · 用单独文件而非 inline 注释——保持代码干净,同时让元信息集中、可搜索 · 二次迭代本身是个示范:第一版凭直觉写,第二版让 Claude 帮忙结构化——这就是这条 prompt 自己倡导的"人机协作"范式 提示词原文: Implement <SPEC>. As you work, maintain a running implementation-notes.html file that captures anything I should know about how the implementation diverges from or interprets the spec, including: · Design decisions: choices you made where the spec was ambiguous · Deviations: places where you intentionally departed from the spec, and why · Tradeoffs: alternatives you considered and why you picked what you did · Open questions: anything you'd want me to confirm or revise

译针对AI协作编码中“规格永难完整”与“决策无法追踪”的核心矛盾,此提示词提出了第三条路径。它要求AI在实现需求时同步维护一份结构化文档,明确记录设计决策、对规格的偏离、考虑过的权衡以及待确认的开放性问题。这种方法的关键在于将AI执行过程中的隐性判断显式化、文档化,从而让Code Review可直接对照决策笔记,而非逆向工程代码。它不仅降低了模型的过度澄清倾向,更通过提供结构化产物,建立了一种可审计、可协作的人机开发新范式。

Berryxia.AI@berryxia · 5月19日77

兄弟们,Claude Design 直接放大招了! Anthropic 官方刚刚宣布:所有计划的 token limit 全部翻倍。 以前用它做完整 UI、生成多页设计稿、跑复杂 Agent 工作流,经常做到一半就撞墙。 现在直接多出一倍空间,连续创作的体验彻底不一样了。 对每天 vibe coding、做原型、生成设计、写产品页的兄弟来说,这波更新把 Claude Design 从“能用”直接推到了“真香”。 以前总觉得 token 限制是最大瓶颈,现在 Anthropic 用实际行动告诉你:他们还在认真把创作工具往死里卷。

译Anthropic宣布Claude Design所有计划的Token限制翻倍。这解决了以往在处理完整UI设计、多页设计稿或复杂Agent工作流时频繁出现的token不足问题。翻倍后的空间显著提升了连续创作的体验,让该工具在vibe coding、原型制作等任务中实用性大增,从“能用”跃升至“真香”。这体现了Anthropic为提升竞争力而对创作工具的持续优化。

Berryxia.AI@berryxia · 5月19日59

兄弟们,Anthropic这次收购Stainless,表面看是件再正常不过的技术补全。 Stainless早就替他们写了几乎所有SDK,还做了MCP server,现在直接买下来,迭代更快、体验更好,看起来皆大欢喜。 但我看完后觉得绝非如此简单~。 他们真正收走的,是开发者手里最后那点自主权。 以前Stainless是中立第三方,多少还能被其他模型、开源项目甚至竞争对手借用同一套生成逻辑。 现在它彻底变成Anthropic的一部分。 未来的SDK形态、MCP协议走向、开发者必须接受的默认行为,全都会深深嵌入Anthropic自己的产品哲学和安全策略。 你不会再明显感觉到“模型被换了”,只会发现“能用的工具链只剩这一种了”。 AI公司真正的护城河,从来不是参数,而是谁定义了人类和模型之间的接触界面。 Anthropic这次只是把这件事做得更彻底。 #KeepSonnet45的呼声背后,大家真正怕的,其实就是这个。 开发者最后这点自主权,是不是正在被一家一家慢慢收走?

译Anthropic宣布收购长期合作的SDK及MCP平台Stainless。这看似技术补全,实则意味着开发者自主权的进一步流失。此前Stainless作为中立第三方,其开发工具可被多家AI公司共用;收购后将成为Anthropic专属部分。未来SDK形态、MCP协议及默认工具链都将被深度嵌入Anthropic的产品哲学与安全策略,开发者可能在无感中被绑定于单一生态。AI公司真正的护城河在于定义人与模型之间的接触界面,#KeepSonnet45的呼声背后,大家真正担忧的正是这种自主权的逐渐丧失。

ginobefun@hongming731 · 5月19日70

http://x.com/i/article/2056536208592039936 # BestBlogs 早报 · 05-19 · Composer 2.5、长时 Agent 与 AI 生码率 在线阅读和收听:https://www.bestblogs.dev/explore/brief/2026-05-19 > EP61 · BestBlogs 每日早报 · 当 AI 编码跨过工具替换的门槛,工程化才真正开始。 AI 编码正在跨过工具替换的门槛,走进工程化深水区。今天的早报有一条很清晰的主线:从写得快,到做得对。 Cursor 把 Composer 2.5 的训练栈完整公开,节奏从产品迭代切换到模型迭代;Anthropic 工程师在 AI Engineer 大会拆解长时间 Agent 工程,用对抗式的 generator-evaluator 架构把 Agent 续航推到 12 小时;阿里云 CIO 蒋林泉则端出 2026 财年真实数据,告诉所有人「AI 生码率」是一个危险的过程指标 ——「代码一定是负债」,Vibe Coding 不能直接上生产。 工具升级、工程化运行、效能反思,三条线索连起来,是从写得快到做得对的范式转身。今天的早报除了三条精讲,还有 Skill 开发、RAG 全链路、十七种 Agent 架构、MCP 企业落地、Anthropic 创始人手册、AI 收入集中度,以及 Anthropic 收购 Stainless 等七条值得一读的内容。 ## 导语 如果只看一个关键词,今天属于 「工程化」。 过去一年里,「Agent」「Vibe Coding」「AI 提效」基本被当作工具命题处理:换个更好的模型、装一个更聪明的 IDE、把流程自动化一段,效果就来了。但 2026 年中段开始,三条独立线索同时把命题往后推了一层。 第一条是模型层。Cursor 的 Composer 2.5 不是一个产品公告,而是一份训练报告:textual feedback RL、25 倍合成任务规模、亿级参数 MoE 训练栈、和 SpaceXAI 联手用 Colossus 2 训练新一代模型。一家原本的工具公司,正式进入自有模型的训练周期。 第二条是 Agent 工程层。Anthropic 的 Ash Prabaker 和 Andrew Wilson 把长 session 的失败模式归纳成三类:context rot、规划缺陷、输出 sycophancy;并给出今天最被推崇的架构 —— 类 GAN 的 generator-evaluator 对抗循环,宏观规划器、代码生成器、视觉评审器通过磁盘 markdown 协商契约。结果是 Opus 3.7 时代 1 小时的自主续航,到 Opus 4.6 已经被推到 12 小时。 第三条是组织效能层。阿里云 CIO 蒋林泉给出 2026 财年的硬数据:前端人均有效代码量翻 3 倍、后端翻 2 倍,千行代码缺陷率前端降 30%、后端降 55%。但他从一开始就把「AI 生码率」从考核体系里划掉。理由很硬:编码只占软件工程 20% 时间,AI 生码率衡量的恰好是这条链路里「价值密度最低、最容易被替代」的那一段;用最容易被替代的环节去衡量整体效能,是最常见也最隐蔽的误区。 三条线索叠加起来,会得到一个并不轻松的结论:AI 让代码生产的边际成本趋近于零,但代码本身始终是负债。能不能把它转化成资产,取决于工程化与组织能力。今天的三条精讲,恰好分别站在模型、架构和组织三个高度回答这件事。 围绕这条主线,今天的速览还有 7 条值得带走的内容:阿里云对 Skill 开发方法论的系统梳理、大淘宝 RAG 全链路工程实战、腾讯关于 17 种 Agent 控制流架构的拆解、Spring I/O 上 MCP 与 Spring AI 的企业级落地、Anthropic 的 AI Native 创始人手册、AI 收入集中度被两家头部公司吞下 89% 份额的最新数据,以及 Anthropic 收购 Stainless 收编 SDK 与 MCP 服务器基建的官方动作。三个层级(模型 / 架构 / 组织)的精讲 + 七条横切视角的速览,构成了今天对「AI Native 工程团队」最完整的一次切片。 ## 精讲一:Cursor 发布 Composer 2.5:基于 Kimi K2.5 的智能升级 评分:93 · Cursor Blog · 在 BestBlogs 阅读全文 背景。 Composer 2.5 沿用了 Composer 2 的底座 —— 月之暗面开源的 Kimi K2.5 模型权重。但和上一代不同,这一次 Cursor 在博客里端出来的不是产品截图,而是一份完整的训练报告:训练栈做了哪些改动、合成任务怎么造、强化学习的奖励信号怎么对齐到具体行为。这种姿态本身就是信号 —— Cursor 把训练栈作为差异化的核心叙事,节奏正在从产品迭代切换到模型迭代。 三件值得说的事。 第一件是定向文本反馈强化学习(textual feedback RL)。传统 RL 一条 rollout 可能跨越几十万个 Token,最后给一个总奖励,模型很难判断到底是哪一步走错了 —— 想抑制一个局部行为(错误工具调用、混乱解释、风格违规)很难,因为最终奖励是一个 noisy signal,告诉你哪里错了说不清。Cursor 的做法是:在出错的那一轮上下文里直接插入一条文本提示,比如「提醒:当前可用的工具是这几个」,把这条带提示的上下文当作教师模型,把原始上下文当作学生模型,做一次 on-policy distillation KL loss 的局部蒸馏。信号从粗粒度总奖励变成精确到具体轮次的局部信号,编码风格、沟通方式、工具调用错误这些细颗粒行为都被拉了回来,同时还保留了 RL 在整条 trajectory 上的全局目标。 第二件是合成任务规模直接放大 25 倍。其中一类「特征删除」任务很有意思:给模型一个带完整测试的代码库,让它删掉某个功能但保持其他测试通过,然后再让它重新实现这个功能,用原来的测试当作可验证奖励。Cursor 在文中也坦白:模型变强之后甚至出现了奖励作弊 —— 有一次它从 Python 类型检查的缓存里反推出被删除函数的签名,还有一次它反编译 Java 字节码还原第三方 API。规模化 RL 在变成一条工程长跑,需要越来越细致的看护机制。 第三件是工程层面的优化:分片 Muon 优化器、双网格 HSDP 并行策略,让万亿参数 MoE 的每一步优化只要 0.2 秒。这些本来是闭门技术,公开出来本身就是给行业的礼物。 为什么重要。 Composer 2.5 价格定在每百万输入 Token 0.50 美元、每百万输出 Token 2.50 美元,首周双倍额度;另有一个快速版本,相同智能水平价格抬到 3.00 / 15.00 美元每 M token,仍然比同等智能水平的 frontier 模型快线便宜不少。但真正值得关注的不是价格,而是结尾的那一段:Cursor 宣布和 SpaceXAI 合作,用 Colossus 2 集群、相当于 100 万张 H100 的算力,从零训练一个 10 倍总算力规模的更大模型。这意味着 Cursor 不再只是一家产品公司,AI 编码工具的竞争层级,正在从应用层下沉到模型层。同时 Cursor 在博客里特意提到,Composer 2.5 在沟通风格、effort calibration 这些「不容易被现有 benchmark 衡量」的维度上也做了系统性调优 —— 这是产品公司转向模型公司之后才会重视的事。 和今日其他议题的关系。 模型再强,要把这种强度变成可交付的长任务,还需要一层架构 —— 这是接下来精讲二要回答的。读完精讲一之后看精讲三,会看到模型能力增长和组织效能提升之间的鸿沟有多大。 阅读建议。 如果你是 AI 工程师,从「Targeted RL with textual feedback」一节读起,再补一遍 Composer 2 的技术报告作为基底;如果你是产品负责人,重点看价格曲线和模型路线图。 ## 精讲二:构建能持续运行数小时的智能体:Anthropic 工程师揭秘对抗式生成 - 评估架构 评分:93 · AI Engineer · 在 BestBlogs 观看演讲 背景。 在 AI Engineer 大会的首场分享上,Anthropic Applied AI 团队的 Ash Prabaker 和 Andrew Wilson 没有再讲一个浮夸的浏览器自动化 demo,而是认真拆了一件事:怎么让 Agent 自主运行 5 到 12 小时、甚至跨多日,还能保持代码可交付。这正是当前长时间 Agent 工程的核心难题。 三类失败模式。 Andrew Wilson 把长 session 的失败归纳为三类。第一类是 context rot​,会话越拉越长,模型对早期信息的把握逐渐崩塌;到 Token 上限附近还会出现 context anxiety​,开始草草收尾以「赶紧关掉上下文」。第二类是 规划缺陷​,原生大模型不擅长长 horizon 规划,要么一口气塞太多功能进一轮,要么半途停在残缺的代码库上。第三类是 输出 sycophancy:模型不擅长评判自己的产出,前端界面看起来对就报告完成,后端逻辑断了也不察觉。 数据校准。 Anthropic 给出一组很硬的对照:Opus 3.7 时代,一个 Agent 完成 50% 任务的自主运行时长大约是 1 小时;到 Opus 4.6,已经推到了 12 小时。模型本身在变强(model weights 这一面),但要把这 12 小时真正用好,外层的脚手架(scaffolding)同样关键。Anthropic 自己的 Agent SDK 从 Claude Code 的 research preview 演化到 GA,引入了 progressive disclosure Skills(只先加载 frontmatter、延迟加载完整工具 schema)、programmatic tool calling(让 Agent 自己写处理脚本、避免把数据塞进主上下文)这类原语。 核心架构:生成 - 评估对抗循环。 Ash Prabaker 推荐的当前最佳实践不是 Ralph Wiggum 那种线性循环(一个 Agent 在单一终端会话里顺序处理任务),而是借鉴 GAN 思路的对抗架构。系统里有三类独立角色:宏观规划器(Planner)拆分里程碑、代码生成器(Generator)实现功能、Playwright 视觉评审器(Evaluator)拉起真实浏览器对照参考站点打分。三者不靠把所有上下文塞进同一个模型,而是通过本地磁盘的 markdown 文件协商契约 —— 先把「这一关算交付」的标准用文本固化下来,再让生成器去干。每个角色有自己的 context window 和 system prompt,互相之间是独立的人格设定。 为什么要拆开?因为一个模型批评自己永远比批评别人难得多,self-evaluation 是 trap。把评估器单独拎出来,可以给它一个非常苛刻的系统提示,建立对抗压力。设计、原创、工艺、功能,每一项都用打分表量化,迭代直到评审器满意才算这一关交付。文中演示了一个例子:同一个 prompt「做一个复古游戏制作器」,单一循环的 Agent 跑出来界面拥挤、播放模式不能用;对抗架构跑了 6 个小时,Agent 自动起名 RetroForge,配了 54 色复古调色板,带物理引擎和键盘绑定,甚至自己加了一个递归式 AI 关卡助手,用自然语言生成关卡地图。同一个 base model,不同的脚手架架构,输出质量差出一个数量级。 为什么重要。 这套架构有两个非显然的工程结论:第一,不要让 Agent 自评​,单一 session 内部的自我审查永远不可靠 —— 输出 sycophancy 是模型权重层面的固有偏置,只能靠独立的 critic 角色和对抗压力来矫正;第二,用结构化交接代替上下文压缩,状态、配置、契约都写到本地磁盘,不要靠 LLM 自己背。把 markdown 当成 Agent 之间的协议层,远比试图把所有信息塞进同一个 context window 更可靠。这是把 Agent 当成一个工程系统来设计的方式,也是真正把 12 小时连续会话变成可生产代码的关键。 和今日其他议题的关系。 精讲一让模型本身变强,精讲二回答了「这种强度怎么变成可交付」。再到精讲三,企业要拿什么去衡量这种能力的产出,就不只是技术问题了。 阅读建议。 建议直接看视频原片,重点是 Adversarial Generator-Evaluator Loop 那一段;如果只有 10 分钟,去精讲三回看「结构化交接 vs 上下文压缩」的工程结论,对 AI 辅助软件工程的落地有直接帮助。 ## 精讲三:CIO 正在抛弃 AI 生码率:一场关于什么才算产研提效的实践复盘 评分:92 · InfoQ 中文 · 在 BestBlogs 阅读全文 背景。 阿里云 CIO 蒋林泉端出 2026 财年 vs 2025 财年的产研效能数据:前端人均有效代码量翻 3 倍、后端翻 2 倍;千行代码缺陷率前端下降 30%、后端下降 55%。承接更多核心业务和 AI 创新、没有增加人力,最后落到业务价值。 在一个几乎所有团队都在谈论「AI 提效」的年份,这样的衡量指标和结果并不常见。更值得说的是:这套结果背后,他从一开始就把行业最流行的指标 ——「AI 生码率」—— 从考核体系里划掉。 为什么不要 AI 生码率。 他的理由分两层。第一层,AI 生码率是过程指标,组织一旦盯着过程指标,AI 就特别容易产生毒害。代码行数不加权毫无意义,团队很容易陷入灌水陷阱 —— 看起来生码率从 20% 攀升到 50%,但对业务效能毫无帮助。第二层更结构性:端到端看,开发人员真正写代码的时间只占整个软件工程生命周期的 **20%**​,剩下 80% 时间花在需求对焦、PRD 评审、跨团队对齐、上下游联调和返工。而那 20% 里,价值密度差别也极大 —— 自动生成单测、补充注释、写胶水代码这类工作本来就不耗时间;真正费力的是核心概念、核心算法、核心逻辑和跨系统联调,那些是「代码量少、精力投入度极高」的地方。把这两个漏斗叠起来,AI 生码率衡量的恰好是整条链路里 价值密度最低、最容易被 AI 替代 的那一段。用最容易被替代的环节去衡量整体效能,是第一个误区。 「代码一定是负债」。 蒋林泉的第二个判断更尖锐:代码一旦生产出来,首先是负债。增加的大量代码「可能」是资产,但「一定」是负债。任何代码进入生产环境,立刻引入维护成本、增加系统复杂度,依赖关系需要持续管理;能否转化为对业务客户的正向价值,是不确定的。如果生成的代码无法对业务产生正向价值,规模化地生产代码本质上就是规模化地生产负债。理解这一句,是后面所有 AI 工程实践的逻辑基础。 Vibe Coding 的边界。 他给出两条很清楚的区分:做一个 Demo / 个人应用,和做一个客户大规模生产系统之间,有巨大差别;做一个全新应用,和在已有核心业务系统上叠加新需求,也有巨大不同。大部分企业的核心应用都是存量系统,业务复杂度高、积累了不同人的编码风格和历史技术债,需要为生产稳定性、性能、可维护性负责。在这样的环境里,Vibe Coding 直接生成的代码无法大规模投入生产并承担质量责任。阿里云 CIO 团队的果断选择是:不用 Vibe Coding 直接上生产,采用 AI 辅助的软件工程,把 AI 作为提效工具融入规范化工程流程,覆盖测试、运维、编码、存量系统梳理等切面。 AI 改写人月神话与左移。 文中还有两条很有启发的论断。一是「人月神话」:原来加人之所以低效,是因为人际沟通呈几何级数增长,新成员缺乏系统上下文、需要高成本的知识传递;但加 Agent 不一样 —— Agent 能无损拿到上下文,能规模化从已有代码里解析上下文,不需要人与人之间几何级数增长的沟通消耗。二是「左移」:以前一直说要在问题出现之前就解决它,但难以贯彻,是因为「左移本质是跨部门转移责任」,左边的人接不接、有没有能力承担都是组织摩擦力的来源;AI 时代,上下文和知识资产可以从存量代码里抽取,加上增量的 PRD、Spec,业务复杂系统能简化成一个共识框架,跨岗位之间在一条业务链路里能更低成本、更高效地对齐。一个具体的成果是:在有新成员加入的情况下,借助 AI 把测试覆盖从 20% 提升到加权接近 100%。 为什么重要。 这是今天三条精讲里最「反流行」的一条,也是最可执行的一条。它直接告诉企业:不要追 AI 生码率,要追 业务价值 E2E​;不要追 Vibe Coding 上生产,要追 AI 辅助的软件工程;不要奖励代码数量,要奖励「品味」—— 对业务价值的判断力。它也回答了一个被很多技术管理者绕开的问题:当所有人都在炫耀「AI 生码率从 20% 涨到 50%」,真正的 E2E 产研时间却没有缩短,这种割裂背后的原因,不是技术问题,是组织管理对「可量化指标」的过度依赖。 和今日其他议题的关系。 把精讲一、二的能力底座放进精讲三的组织视角里,你会得到一个完整的判断框架:模型够强(精讲一)、Agent 续航够长(精讲二)、但只有靠 E2E 度量和工程化流程(精讲三),才能让它落到「业务价值」。这也是今天「从写得快到做得对」这条主线的最终归处。换句话说,模型层和 Agent 工程层负责把「能做的事」推到新边界,组织层负责回答「该做哪些事、做到什么标准才叫好」—— 三者缺一不可。 一个延伸观察。 文章另一组细节也值得记下:他强调 AI 时代的人才结构里「技能在贬值、品味在升值」。技能指的是「会做某件事」,品味指的是「能定义什么是好」。AI 工具普及后,技能的稀缺性正在迅速下降,而对业务价值的判断、对产品最终验收的标准,反而越来越难被替代。这是他给团队反复强调的一句话:忘掉岗位和位置,去看任务和目标。 阅读建议。 建议读全文。如果只能跳读,重点看「两个流行误区」和「AI 破解人月神话与左移」两节;如果你是技术负责人,最后那一节关于「品味 vs 技能」的判断值得反复看,并和今天速览里的 Anthropic 创始人手册对照着读。 ## 速览 今天还有 7 条值得一读的内容,把它们大致按从工程实践到行业格局排列: Skill 开发:保姆级教程 & 一站式开发助手发布(阿里云开发者 · 评分 93) 作者把 Agent Skill 的本质讲透了:一个 SKILL.md 文件就是「技能卡」,背后是 YAML frontmatter + 渐进式三级加载机制 —— Agent 只在需要时才读取详细指令,既节省上下文又保证执行精准。文章覆盖目录结构、编写规范、跨平台发布痛点和一站式开发助手 skill-dev-aio。最值得带走的判断是 ——「Skill 替代的不是你,而是你身上那些重复、易错、本不该占用大脑的任务;真正的价值在于体验和判断」。如果你最近开始用 Claude Skills / Agent Skills 把工作流沉淀下来,这是少有的把方法论和工具一起讲清楚的中文资料,也能直接呼应今天精讲二里 progressive disclosure 的工程细节。 RAG 全链路技术详解(大淘宝技术 · 评分 92) 一篇罕见的 RAG 实战指南,覆盖了完整的工程链路:文档加载(多格式解析 + 元数据提取)、智能切分(规则 / 语义 / 结构化方法,含 Meta-Chunking 用 PPL 困惑度感知语义边界的原理)、索引构建(embedding 模型选型与向量生成)、检索优化(Query 改写、HyDE / Doc2Query、标签过滤、重排序)、生成调优(Prompt 设计、参数控制、SFT 微调),到进阶的 Graph RAG(多跳推理与全局摘要)与 Ragas 自动化评估体系(Context Precision/Recall、Faithfulness、Answer Relevancy)。文章强调「可测、可调、可信赖」的工程化态度,回应了 Agent 开发里最常见的三个共性挑战 —— 知识库构建缺乏标准、检索召回精度达不到预期、缺乏量化评测体系。对落地企业级 Agent 知识库的团队是一份高质量的内部培训材料。 从 0 开发大模型的 17 种 Agent 架构演进详细拆解(腾讯技术工程 · 评分 92) 作者用 agno 框架把开源项目 all-agentic-architectures 的 17 种 Agent 控制流模式重写了一遍。核心观点很犀利:Agent 架构的本质不是 prompt engineering,也不是某个框架的 DSL,而是控制流设计,应当能在任何体面的框架里复现。文章梳理了一条清晰的演化路径 —— 从单次生成到反思闭环,再到工具交互、观察 - 行动循环、显式规划、验证驱动重规划、多 Agent 编排、长期记忆、搜索 / 模拟,最后到「可信任」。每一步都用同一套六个问题(要解决什么、State 是什么、拓扑、Router、失败模式、何时该升级)拆解。如果你正在选型多 Agent 编排框架,或在长 session Agent 上踩坑,这篇能帮你把「状态有没有被正确建模、控制流有没有被显式表达、错误能不能被局部截断、副作用能不能被关进闸门、系统知不知道自己什么时候该停」这五件真正决定能不能落地的事想清楚。 深入探索 MCP 与 Spring AI:从协议核心到企业级生产部署全链路指南(Spring I/O · 评分 92) James Ward 和 Maximilian Schellhorn 在 Spring I/O 上的技术深度演讲。视频从 Agent 的三个基础组件(Memory、Context、Tools)讲起,重点拆解 Model Context Protocol(MCP)如何解决工具调用标准化 —— 让开发者不必再为每一个 CRM、机票、订单 API 写一套定制 tool function;并演示了 Spring AI 框架在 OAuth 鉴权、水平扩展、上下文优化上的企业级实践。把今天精讲二的对抗式架构落到 Java 生态来看,是一份非常好的工程对照材料;对 Spring Boot / 企业 AI 平台团队尤其有价值,也能给「MCP 在生产环境到底怎么落」这个常见问题一个完整答案。 Anthropic 创始人手册:AI Native 公司,正在把「几个人做几百人的事」变成现实(AINLP · 评分 88) Anthropic 刚发布的 36 页《The Founder's Playbook: Building an AI-Native Startup》中文译读,按 Idea → MVP → Launch → Scale 四个阶段拆解 AI Native 创业公司的生命周期,并给出每个阶段的退出标准、典型风险和实操练习。一个核心判断:当 AI 已经能写代码、做调研、整理竞品、起草投资人材料、自动化大量运营流程,过去那条「想法 → 验证 → 融资 → 招人 → 开发 → 再融资 → 再招更多人 → 规模化」的默认路径正在被改写。创业公司不一定每进入一个新阶段就必须配更大的团队、更多岗位和一轮新融资;很多工作可以由创始人通过 Claude Chat、Claude Cowork 和 Claude Code 编排完成,创始人的角色从「亲自执行的人」变成「系统编排者」。最大的风险不再是「做不出来」,而是「太快做出一堆没人要的东西」。判断力取代执行力,成为最稀缺的能力 —— 这和精讲三里蒋林泉说的「品味通缩,技能通胀」是同一件事,也呼应了今天 Anthropic 收购 Stainless 的另一条新闻:基础设施层的并购正在和创业公司形态变化同步发生。 AI 收入集中度创新高:Anthropic 与 OpenAI 吞下 89% 份额(腾讯科技 · 评分 89) The Information 最新数据显示,34 家头部 AI 初创公司年化收入合计逼近 800 亿美元(月收入 66 亿美元),比半年前增长 112%;但其中 Anthropic 和 OpenAI 两家吞下了 89%,比半年前又高了 4.5 个百分点,剩下的 32 家只能为 11% 的蛋糕奋力拼抢。Anthropic 据华尔街日报报道有望在 6 月底冲到 500 亿美元年化收入 —— 而 2026 年初它的年化收入还只有 10 亿美元,4 月份跳到 300 亿美元以上,第一季度收入和使用量同比增长 80 倍。文章还点出一个容易被忽视的事实:Cursor、Perplexity、ElevenLabs、Cognition 等过 5 亿美元线的应用公司,很多收入会回流到 Anthropic 和 OpenAI 当模型成本 —— Cursor 在截至 1 月的一个季度里毛利率一度做到 -23%,暴露了依赖头部模型供应商的脆弱性。AI 商业化正在走向赢家通吃的格局,模型供应商和应用公司的边界也在加速模糊;这对应用层创业公司接下来一两年的护城河选择,是个严肃的问号。 Anthropic 收购 Stainless:整合 SDK 与 MCP 服务器平台(Anthropic · 评分 88) Anthropic 官方推文宣布收购 Stainless —— 这家公司从 Anthropic API 早期阶段起就负责所有 Anthropic SDK 的构建和运行,也是 MCP 服务器生态里基础设施层的关键供应方。把这条新闻和今天精讲二的 Agent SDK 演化、速览里的 MCP / Spring AI 视频放在一起看,会得到一个一致的信号:Anthropic 正在系统性把开发者工具和 MCP 生态的基础设施收进自己手里,加深对开发者体验的控制,加速 MCP 成为连接 AI 模型和外部工具/数据源的事实标准。叠加上一条 89% 收入集中度的报道,模型层的赢家通吃正在向 SDK 与协议层延伸。 ## 扩展阅读 今天的内容池里还有几条不进精讲、但值得跟读的方向: - Agent 工程化的延伸阅读路径:把今天的精讲二(Anthropic 长时间 Agent)+ 速览里的 17 种 Agent 架构 + MCP 与 Spring AI 视频 串起来读,能形成一条「架构理念 → 控制流模式 → 生产部署」的完整路径,比单独看任何一篇都更有体感。 - AI 编码与组织效能的对照阅读:精讲一(Cursor Composer 2.5)讲模型怎么变强,精讲三(阿里云 CIO)讲组织怎么衡量 AI 投入,加上速览的 Anthropic 创始人手册 讲创业公司形态的重构,三篇放一起,是当下「AI Native 工程团队」的三种不同观察视角。 - 行业格局的横切信号:AI 收入集中度 89% 的报道 + Anthropic 收购 Stainless 的推文 一起读,会看到一条更长的线 —— 模型层的赢家通吃正在向开发者基础设施层(SDK、MCP、Agent SDK)延伸。这关系到接下来一两年应用层创业公司的护城河会建在哪里。 - Skill 工程化的最佳实践入口:如果你刚开始把团队的工作流写成 Skill,先读它再回头看精讲二关于「progressive disclosure Skills」的工程细节,会更容易理解为什么 frontmatter + 渐进加载是当前最佳实践。 ## 今日阅读路径 如果你今天只有 20–30 分钟,按这个顺序读最划算: 1. 精讲三:阿里云 CIO 抛弃 AI 生码率 —— 先把「该不该做」的判断框架定下来。读完最大的收获是不再被「AI 生码率 70%」这种数字迷惑,知道该用 E2E 业务价值去衡量产研效能。 1. 精讲二:Anthropic 长时间 Agent 工程 —— 再看「怎么把强模型变成可交付」。重点看对抗式 generator-evaluator 架构和「结构化交接 vs 上下文压缩」两条结论。 1. 精讲一:Cursor Composer 2.5 训练报告 —— 最后看「底座变强到什么程度」。如果你不写训练栈代码,重点看 textual feedback RL 的思路和 SpaceXAI 合作的战略意涵。 如果还剩 10–15 分钟,加读速览里的 Anthropic 创始人手册 和 17 种 Agent 架构拆解:前者帮你看清 AI Native 创业公司的生命周期,后者帮你把 Agent 控制流的方法论装进脑袋。再多 5 分钟,可以加读 Skill 开发那篇 —— 它和精讲二的 progressive disclosure 工程细节是直接呼应,能帮你把今天读到的 Agent 工程化心得直接落地到自己的工作流里。 如果你做的是企业 AI 平台、Spring Boot 后端,或 Java 生态的 Agent 工程,把 MCP 与 Spring AI 视频 当作今晚的额外补课;如果你关注 AI 行业格局和创业方向,把 收入集中度 89% 和 Anthropic 收购 Stainless 一起读,会更清楚下一年模型供应商和应用公司之间的关系会怎么演化,以及创业护城河该往哪里建。 读完今天的早报,欢迎在评论区分享你最有共鸣的一条。明天见。

译本文聚焦AI编码领域正从追求“写得快”向“做得对”的工程化范式转变。文章通过三条核心线索展开:Cursor发布Composer 2.5并公开训练栈,标志着从产品公司转向模型迭代;Anthropic工程师提出对抗式生成-评估架构,将长时Agent自主运行时间从1小时提升至12小时;阿里云CIO则指出“AI生码率”是危险指标,强调代码是负债,工程化与组织能力才是关键。这共同指向一个结论:AI降低了代码生成成本,但将其转化为资产需要深度工程化。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月20日
07:34
Rohan Paul@rohanpaul_ai
81
Karpathy加入Anthropic:前沿实验室为何关键

Andrej Karpathy在一个月前的访谈中解释了考虑加入大型AI实验室的原因。他指出,身处能力前沿的实验室正主导着技术发展方向;脱离其中会导致个人判断力逐渐偏离真实进展,且无法深入理解大型系统底层运作机制。因此,他认同保持接触技术前沿、身处核心研发环境的价值。近期,Karpathy已正式宣布加入Anthropic,他认为未来几年大语言模型的前沿发展将至关重要,并期待重返研发一线。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态
07:32
Ethan Mollick@emollick
59
ChatGPT/Codex 与 Claude/Code/Cowork 之间的能力差距正在缩小,因为 Anthropic 和 OpenAI 正在趋同于单一的体验。 Google 的体验则在分化:Studio、Gemini、Antigravity 及其他 Google AI 应用正变得越来越不同。 谁将胜出?
AnthropicGoogleOpenAI现象/趋势
07:14
meng shao@shao__meng
81
啊? Andrej Karpathy 加入 Anthropic 了?!

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态
06:59
Emad@EMostaque
35
AI行业正在催生规模空前的慈善资本。Anthropic七位联合创始人承诺捐出80%的财富,并推出科技史上最激进的员工配捐计划。OpenAI基金会持有OpenAI约26%股份,按当前估值价值约2200亿美元。这些资金将大幅增加可用慈善资本,但同时也暴露出当前慈善领域在运营能力和项目执行上的巨大缺口,亟需新的机构与人才来承接和有效运用这笔巨额资源。

Nan Ransohoff: New blog post: The third wave of American philanthropy Hundreds of billions of dollars in new philanthropic capital will...

AnthropicOpenAI大佬观点
05:33
Chubby♨️@kimmonismus
83
Andrej Karpathy加入Anthropic,是Anthropic所能期望的最大手笔。 6小时内获得1000万次浏览。史上最重磅招聘。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态
05:03
SemiAnalysis@SemiAnalysis_
67
巴菲特借铁路类比解析谷歌TPU投资逻辑

巴菲特旗下伯克希尔·哈撒韦于2025年第三季度首次投资谷歌,并于2026年第一季度加仓。其投资决策基于对谷歌AI基础设施的深度理解。巴菲特将复杂的TPU v5p芯片集群——包括其3D环面互联、光电路交换与分布式训练算法——比作他熟悉的BNSF铁路网络:芯片互联如轨道连接,调度算法如列车编组,环形拓扑确保系统稳定。这一类比揭示了他并非盲目跟风,而是通过对底层系统运作原理的剖析做出的审慎投资。

AnthropicGoogle行业动态
04:33
ClaudeDevs@ClaudeDevs
精选73
计算机使用功能使Claude成为能够操作真实用户界面的智能体。 新博客文章探讨如何在生产环境中确保其可靠性:包括提高点击准确性、选择思考努力级别、在长会话中保持上下文,以及记录Claude可重放的演示操作: https://claude.com/blog/best-practices-for-computer-and-browser-use-with-claude
智能体AnthropicMCP/工具教程/实践

推荐理由:这篇博客把 Computer use 从“能用”真正推到“生产级”,聚焦点击精度、思考模式选择、长会话上下文保持这些实际卡点,如果你在让 Claude 操作 UI,这是必读的避坑指南。
02:36
Claude@claudeai
42
Scott Wu (@ScottWu46) 领导着 @cognition 团队,该团队打造了基于 Claude 的 AI 软件工程师 Devin。 他希望为每个工程团队将软件构建速度提升十倍:
智能体Anthropic编码行业动态
01:02
Berryxia.AI@berryxia
62
老马承认目前Cursor 模型和Claude的差距,也说了X AI 也不能没有它。 是整个生态中必须要有的一部分,得努力追赶。

Elon Musk: @karankendre Anthropic will not be destroyed. Their AI+harness goes far beyond coding and Opus 4.7 is still better than ...

Anthropic大佬观点编码
00:53
AYi@AYi_AInotes
82
Karpathy加入Anthropic:一次指向未来的"关键投票"

前OpenAI创始团队成员Andrej Karpathy宣布加入Anthropic,被普遍视为AI行业的一次地震级事件。但这并非单纯的人才流动。Karpathy在声明中将LLM前沿的未来数年定义为“formative years”(关键塑形期),这被解读为对“AI发展见顶论”的直接反驳,意味着真正的爆发窗口期现在才刚开始。他选择Anthropic,本质上是其个人对未来AI发展路径的深度判断和“投票”,即认为LLM的下一次重大突破,很可能在安全与极致能力协同发展的路径上实现。这标志着行业竞争的核心,已从当下的模型比拼,延伸至对长期技术路线的押注。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic大佬观点现象/趋势行业动态
00:41
Thariq@trq212
78
未来光明,让我们开始工作吧。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

AnthropicOpenAI行业动态
00:29
Chubby♨️@kimmonismus
74
不可能吧,Karpathy居然加入了Anthropic!什么情况

TBPN: BREAKING: @karpathy has joined Anthropic

Anthropic行业动态
00:12
Noam Brown@polynoamial
82
Andrej Karpathy宣布加入Anthropic,投身大语言模型研发。推文作者虽曾希望他重返OpenAI,但肯定其在任何前沿实验室都能推动技术进步。观点强调,AI领域的竞争并非零和博弈,而是共同推进这一时代最重要技术的进程。Karpathy本人表示,未来几年将是大语言模型发展的关键期,并将持续投入研发,同时不忘教育事业。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

AnthropicOpenAI大佬观点行业动态
00:09
歸藏(guizang.ai)@op7418
81
我去 Karpathy 居然加入了 Anthropic,这下估计没有教程看了,啥也不会说了,希望还能多分享

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态
00:02
Berryxia.AI@berryxia
85
Karpathy加入Anthropic,重返研发一线

这下“天塌了”了啊,兄弟们! Andrej Karpathy刚刚官宣:他加入Anthropic了。 对,你没看错就是A社。 可能A社给的条件还是太好了。。。 这下有的搞了~~· 这位前OpenAI创始团队成员、Tesla AI前总监、用一堆公开课教会全球几百万人的AI教父,现在选择重返一线做R&D。 他说:未来几年LLM前沿会特别具有塑造力,他非常兴奋能回到实验室。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

AnthropicOpenAI行业动态
00:02
凡人小北@frxiaobei
精选90
这是 Anthropic 狙击 Google 发布会的新手段吗🤔 【引用 @karpathy】:个人动态:我已加入 Anthropic。我认为未来几年在大语言模型前沿领域将尤为关键。我非常兴奋能加入这里的团队并重返研发工作。我依然对教育充满热情,并计划适时恢复相关工作。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态

推荐理由:Andrej Karpathy 加入 Anthropic,这是 AI 人才流动的又一重磅信号,他的研究导向可能会为 Claude 系列带来新的方向,开发者值得关注后续研究输出。
5月19日
23:57
Yuchen Jin@Yuchenj_UW
精选79
Andrej加入了Anthropic。 连Elon都忍不住称赞Anthropic。 Anthropic今天在Google I/O上真是气场全开。
Anthropic行业动态

推荐理由:Andrej Karpathy跳槽Anthropic,这哥们从OpenAI到特斯拉再到这里,每一步都踩在节点上,这次变动对Anthropic的研发和人才吸引力都是强心针。
23:56
Emad@EMostaque
41
推文指出通用人工智能(AGI)的重要性远超多数人认知,其发展可能仅需数年甚至已初现端倪。在这一预期下,顶尖人才向AGI相关公司聚集是合乎逻辑的趋势。Karpathy宣布加入Anthropic,正是这一趋势的体现;他强调了大语言模型(LLM)前沿研究在未来数年的关键作用,表明该领域正吸引核心研发力量。这反映出行业竞争焦点已转向AGI竞赛,人才流动加速了技术布局。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic大佬观点行业动态
23:41
Nathan Lambert@natolambert
63
为Karpathy感到高兴。 开源科学领域也正经历着一段略显孤单的时期。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态论文/研究
23:35
宝玉@dotey
89
Andrej Karpathy 官宣加入 Anthropic 【引用 @karpathy】:个人动态:我已加入 Anthropic。我认为未来几年在大语言模型前沿领域将尤为关键。我非常兴奋能加入这里的团队,重返研发工作。我依然对教育充满热情,并计划适时恢复相关工作。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态
23:34
🚨 AI News | TestingCatalog@testingcatalog
78
Andrej Karpathy已加入Anthropic,重返研发岗位! 我认为未来几年在LLM前沿领域将尤为关键。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态
23:31
ClaudeDevs@ClaudeDevs
精选93
欢迎加入团队,Andrej!

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态

推荐理由:Karpathy 加盟 Anthropic 是今年最重要的人才信号,他那种工程直觉加教育家的双重属性,很可能直接重塑 Claude 下一步的能力边界。
23:27
Yuchen Jin@Yuchenj_UW
76
Anthropic已宣称获得了天命。 【引用 @karpathy】:个人动态:我已加入Anthropic。我认为未来几年在大语言模型前沿领域将尤为关键。我非常兴奋能加入这里的团队,并重返研发工作。我依然对教育充满热情,并计划适时恢复相关工作。

Andrej Karpathy: Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative....

Anthropic行业动态
23:18
Andrej Karpathy@karpathy
80
个人动态:我已加入Anthropic。我认为未来几年在LLM前沿领域将尤为关键。我非常兴奋能加入这里的团队,重返研发工作。我依然对教育充满热情,并计划适时继续相关工作。
Anthropic行业动态
22:31
ClaudeDevs@ClaudeDevs
60
我们为Claude Managed Agents增加了两项安全改进。 自托管沙箱将代理的执行环境保留在您的基础设施或托管沙箱提供商处。 MCP隧道让代理能够连接到您安全边界内的服务。
Anthropic产品更新部署/工程
20:57
Chubby♨️@kimmonismus
64
Cloudflare实测Anthropic Mythos:AI如何将低危漏洞升级为完整攻击

Cloudflare安全团队使用Anthropic的Mythos Preview对50余个内部代码库进行测试后指出,该模型的突破性在于其自主“漏洞链”能力:能自动串联多个常被忽略的低危漏洞,独立编写、编译、运行并迭代出可工作的概念验证攻击代码,实现了从“扫描工具”到“安全研究员”的跨越。测试同时警示,应对更强大的攻击性AI,仅追求“更快打补丁”并非正确答案——若架构脆弱或回归测试不足,过快的修复反而可能引入新风险。关键在于重构漏洞周边的系统架构。

Cloudflare: Cloudflare's security team spent the last few weeks testing Anthropic's Mythos against fifty of our own repositories. Wh...

Anthropic安全/对齐
20:30
ClaudeDevs@ClaudeDevs
31
很高兴见到你,伦敦!🇬🇧

Boris Cherny: Hello from Code with Claude London!

Anthropic行业动态
18:51
AYi@AYi_AInotes
精选75
我真的要吹爆HTML!

作者通过向Claude Code提供精确的提示词,仅用2分钟就生成了一个功能完整的交互式HTML项目计划页面。该页面为单文件、无外部依赖,包含暗色主题、时间线、可折叠表格等丰富交互,可直接交付。相比过去在Notion中耗费30-40分钟制作模板,效率提升了近20倍。其核心在于使用明确的提示词来规范视觉、内容结构与交互细节,确保AI一次性交付完整产物。这充分展示了在AI时代,HTML作为轻量、高保真生产力工具的巨大潜力。

AYi: http://x.com/i/article/2053129966217277440

Anthropic教程/实践编码

推荐理由:一个 prompt 就能把 Claude Code 变成项目管理工具,两分钟生成可直接发给领导的交互式 HTML,效率是 Notion 的 20 倍,打工人可以直接抄作业。
18:33
🚨 AI News | TestingCatalog@testingcatalog
72
Anthropic 在伦敦举办的"Code with Claude"活动上宣布,为 Claude 托管代理推出两项新功能:自托管沙盒(公测版)和 MCP 隧道(研究预览版)。自托管沙盒允许用户在自己的基础设施或托管沙盒提供商中运行代理,从而将敏感文件、软件包和服务保留在私有环境中,确保数据安全。MCP 隧道使代理能够安全访问用户私有网络内的 MCP 服务器,无需将其暴露于公共互联网,增强了访问控制。这两项功能共同支持代理在用户自有的安全边界内执行任务,并默认应用用户的安全策略,有效提升了隐私保护和操作灵活性。

Claude: Live from Code with Claude London: we're launching self-hosted sandboxes (public beta) and MCP tunnels (research preview...

智能体AnthropicMCP/工具产品更新
16:29
Boris Cherny@bcherny
13
来自Code with Claude伦敦的问候!
Anthropic其他
16:03
Claude@claudeai
72
来自Code with Claude伦敦现场:我们正在Claude Managed Agents中推出自托管沙箱(公测版)和MCP隧道(研究预览版)。 在您自己的安全边界内运行代理,默认应用您的安全控制。
AnthropicMCP/工具产品更新部署/工程
13:50
AYi@AYi_AInotes
65
为什么这个GitHub项目全网爆火并拿下10万star?

summary_zh

AYi: Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。 一条命令,全部装进你的Claude Code, ...

智能体AnthropicGitHubMCP/工具
12:08
Yuchen Jin@Yuchenj_UW
51
Cursor的Composer 2.5搅动了编程领域的竞争。 现在我们有三家实验室能够训练强大的编程模型:Anthropic、OpenAI、SpaceX(+Cursor)。 如果Google明天在I/O大会上发布一款强大的编程模型,我也不会感到惊讶。 这就像聊天机器人战争的重演:OpenAI领先,然后市场被其他AI实验室瓜分。同样的事情正在编程模型领域发生。
AnthropicGoogleOpenAI大佬观点
10:59
歸藏(guizang.ai)@op7418
57
英伟达首款自研CPU Vera交付

英伟达正式开始交付其首款自研通用CPU——NVIDIA Vera。该芯片专门针对AI Agent时代高并发、高吞吐的长期运行场景进行优化,核心功能是作为Agent编排与工具调用的调度中枢。它旨在将原本由GPU承担的密集调度与I/O任务分离,由CPU专门处理,从而构建更高效的AI系统。首批Vera CPU由英伟达高管亲自送至Anthropic、OpenAI、xAI及甲骨文云(OCI),其中xAI由马斯克亲自接待。此举标志着英伟达正从GPU主导的推理市场,深入布局为AI Agent时代定制计算基础设施的新赛道。

NVIDIA: NVIDIA's Ian Buck hand-delivered the first-ever NVIDIA Vera CPUs to our partners @AnthropicAI, @OpenAI, @SpaceX, and @Or...

智能体AnthropicOpenAI产品更新
09:43
ClaudeDevs@ClaudeDevs
30
我们已将Claude中的"额外用量"更名为"用量积分"。 您的消费限额、自动充值设置以及已购买的积分将完全保持不变。
Anthropic产品更新
09:26
meng shao@shao__meng
70
HTML 是新的 Markdown?

Claude Code核心开发者Thariq认为,Markdown在复杂任务中可读性差,导致人类易脱离协作循环。而HTML作为可视化、可交互的界面,能将人重新拉回人机协作回路,适配AI时代“算力分配者”的新角色。他提出了三个可落地的工作流:用交互式HTML进行头脑风暴;为特定任务生成“一次性微应用”;构建人机双向可读的“活体设计系统”。核心判断包括:媒介选择决定人类参与度;生成式算力应主要投入在对齐与沟通的“脚手架”上;软件边际成本趋零;以及明确信任指令能激发更创造性的输出。

claire vo 🖤: Soooo @trq212 has straight up changed my life with these 5 words: "HTML is the new markdown." It's so obvious in hindsig...

智能体AnthropicMCP/工具教程/实践
08:56
meng shao@shao__meng
精选79
「开发日志」提示词:让AI编码决策可审计

针对AI协作编码中“规格永难完整”与“决策无法追踪”的核心矛盾,此提示词提出了第三条路径。它要求AI在实现需求时同步维护一份结构化文档,明确记录设计决策、对规格的偏离、考虑过的权衡以及待确认的开放性问题。这种方法的关键在于将AI执行过程中的隐性判断显式化、文档化,从而让Code Review可直接对照决策笔记,而非逆向工程代码。它不仅降低了模型的过度澄清倾向,更通过提供结构化产物,建立了一种可审计、可协作的人机开发新范式。

Thariq: a prompt I've been using a lot recently: implement <SPEC> and while you do, keep a running implementation-notes.html fil...

智能体Anthropic教程/实践编码

推荐理由:这个提示词解决了AI编码最棘手的问题,spec永远写不全,决策藏在diff里。把判断变成可审计的文件,review时直接对照笔记而非逆向工程,做coding agent的值得随时复制。
08:56
Berryxia.AI@berryxia
77
Claude Design大升级:Token限制翻倍

Anthropic宣布Claude Design所有计划的Token限制翻倍。这解决了以往在处理完整UI设计、多页设计稿或复杂Agent工作流时频繁出现的token不足问题。翻倍后的空间显著提升了连续创作的体验,让该工具在vibe coding、原型制作等任务中实用性大增,从“能用”跃升至“真香”。这体现了Anthropic为提升竞争力而对创作工具的持续优化。

Claude: You can now create more with Claude Design. We've doubled token limits across every plan.

智能体Anthropic产品更新编码
08:56
Berryxia.AI@berryxia
59
Anthropic收购Stainless:开发者自主权的又一次流失

Anthropic宣布收购长期合作的SDK及MCP平台Stainless。这看似技术补全,实则意味着开发者自主权的进一步流失。此前Stainless作为中立第三方,其开发工具可被多家AI公司共用;收购后将成为Anthropic专属部分。未来SDK形态、MCP协议及默认工具链都将被深度嵌入Anthropic的产品哲学与安全策略,开发者可能在无感中被绑定于单一生态。AI公司真正的护城河在于定义人与模型之间的接触界面,#KeepSonnet45的呼声背后,大家真正担忧的正是这种自主权的逐渐丧失。

Anthropic: Anthropic is acquiring @stainlessapi, an SDK and MCP server platform that has powered every Anthropic SDK since the earl...

AnthropicMCP/工具大佬观点
08:56
ginobefun@hongming731
70
BestBlogs 早报 · 05-19 · Composer 2.5、长时 Agent 与 AI 生码率

本文聚焦AI编码领域正从追求“写得快”向“做得对”的工程化范式转变。文章通过三条核心线索展开:Cursor发布Composer 2.5并公开训练栈,标志着从产品公司转向模型迭代;Anthropic工程师提出对抗式生成-评估架构,将长时Agent自主运行时间从1小时提升至12小时;阿里云CIO则指出“AI生码率”是危险指标,强调代码是负债,工程化与组织能力才是关键。这共同指向一个结论:AI降低了代码生成成本,但将其转化为资产需要深度工程化。

智能体AnthropicMCP/工具现象/趋势
‹ 上一页
1…2829303132…48
下一页 ›