We also asked forecasters to predict the longest 80% success time horizon achieved by the end of 2026. All three groups ...
We also asked forecasters to predict the longest 80% success time horizon achieved by the end of 2026. All three groups ...
Anthropic 分享了内部使用 Claude Code 的 Skills(技能)功能的经验。Skills 是指令、脚本和资源的文件夹,智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能,它们可归为九类,包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别,涵盖过多功能会混淆智能体。团队发现,投入时间优化验证类技能对 Claude 输出质量的提升最显著。
Anthropic 使用 Claude 自动化了 95% 的业务分析查询,整体准确率约 95%。其关键在于构建智能体分析栈(agentic analytics stack),通过数据基础层、维护验证流程和技能(skills)分别解决概念-实体歧义、数据过时和检索失败三大错误来源。相比编码场景,数据分析的难点在于将用户问题映射到正确的数据实体,而执行 SQL 反而是简单的。Anthropic 的数据科学团队因此得以专注于因果建模、预测和机器学习等战略工作。
关联讨论 1 条X:Claude Devs (@ClaudeDevs)Nitrosend 推出 AI 原生邮件平台,通过 MCP 协议与 Claude 连接。用户只需一条提示词,Claude 即可完成构建、设计、受众分组和发送完整邮件活动,而非仅生成草稿。该平台无传统仪表盘,Claude 直接控制系统工作流,包括设计、逻辑、目标定位和投递。引用推文显示,已有用户通过一条提示词成功向 10,000 人发送发布公告。
I just sent our launch announcement to 10,000 people. It took one prompt in Claude. Today we're launching @nitrosendx - ...
been asking others at Anthropic how they stay in the loop with Claude and fully understand the work being done this is o...
Anthropic 扩展 Claude Partner Network,推出 Services Track 分级体系和 Partner Hub 门户。Services Track 设 Select、Preferred、Global Premier 三级,按认证人数、投产客户数及客户推荐信量化评定。Partner Hub 提供每日更新仪表盘和公开目录,方便合作伙伴查看进展、客户寻找供应商。该网络三月启动以来已有超 4 万家公司申请,逾 1 万顾问获认证;Accenture 训练 3 万人,Cognizant 部署约 35 万员工,Deloitte 惠及 47 万人,KPMG 覆盖 27.6 万,Infosys 构建行业智能体,PwC 先在美推广再扩至全球。
Google Cloud营收同比增长63%,Microsoft Intelligence Cloud增长30%,AWS增长28%。但AWS利润率环比提升213bps,领先其他云服务商。AWS Bedrock与Anthropic采用Token-as-a-Service(TaaS)商业模式,包含三部分:固定IaaS费用、token收入分成、以及超额绩效支付(达到特定token/消费阈值触发额外付款)。该模式风险是无保底收入,但赌注成功,Anthropic单季度新增210亿美元净新ARR。
优步(Uber)将员工使用AI编程工具(如Cursor和Claude Code)的每月token支出限制为每工具1,500美元,不同工具预算互不影响。按工程师平均使用两种工具计,年人均AI支出上限为36,000美元,约占美国软件工程师中位数年薪330,000美元的11%。该限额是2026年AI预算四个月内超支后的理性调整。作者Simon Willison个人每月token用量约1,000美元(个人订阅补贴后仅100美元),若在优步工作仍有约500美元/工具的余额。
For interactive login, the CLI supports "ant auth login". This runs a browser OAuth flow, scopes the token to a workspac...
Claude Code 工程负责人 Fiona Fung 在 Code w/ Claude SF 2026 分享管理 AI-native 团队经验:写代码不再是瓶颈,验证、评审、安全与专业判断成为新限制。四个流程变化:规划从半年路线图转向短周期原型与反馈;上下文获取从“问谁写的”转为沉淀到代码/PR/日志;AI 处理常规代码评审,人负责法律/安全/业务判断;团队角色模糊但深度专业仍稀缺。组织上建议定期清理过时流程、默认使用 AI、管理者贴近一线。可跟踪新人首周交付真实代码、PR 周期变短、AI 辅助提交比例,但产出量不是成功本身。
关联讨论 1 条Claude:Blog(网页)Anthropic分析了2025年3月至2026年3月间因恶意网络活动被封禁的832个账号,映射至MITRE ATT&CK框架。67.3%的账号使用AI编写恶意软件,6.5%用于横向移动。攻击者中高风险比例从上半年的33%升至下半年的56%。AI使用从初始访问转向后期活动,账户发现增长8.9%,AI辅助钓鱼下降8.6%。攻击者技能与使用技术数量无显著关联(最低技能者平均16种,最高约20种),所用平台也与风险等级不相关。更高风险攻击者将AI集中于操作密集型技术,并构建允许模型自动链式执行攻击步骤的脚手架。MITRE ATT&CK框架未收录AI自主编排攻击链等行为。
关联讨论 1 条Anthropic:Research(发表成果 · 网页)Codex和Claude Code的额度限制采用5小时滚动窗口,从用户发送第一条消息开始计时,用完需等待窗口结束才能重置。但窗口结束后系统不会自动开启新窗口,需等到下一条消息才重新计时。利用此机制,可在主要工作时段前3小时(如上午11点)提前发送一条消息激活窗口,使重置时间落在工作时段中间(如下午4点)。这样在2-6点的核心工作中,能享受两个5小时窗口,变相将额度翻倍。设置方法:Codex可在自动化中创建每日定时任务发送短消息;Claude CLI可通过crontab(Mac)或任务计划程序(Windows)实现。注意仍有周额度上限,适度使用即可。
Anthropic 分析 2025 年 3 月至 2026 年 3 月间 832 个被封禁的恶意账户,映射至 MITRE ATT&CK 框架。67.3% 使用 AI 编写恶意软件,6.5% 用于横向移动。六个月间中高风险攻击者占比从 33% 升至 56%。AI 用于账户发现增长 8.9%,AI 辅助钓鱼下降 8.6%。传统基于技术数量或平台(Claude Code、API、聊天界面)的威胁评估失效,而 MITRE ATT&CK 框架尚未收录此类智能体编排行为。
同一事件,精选展示《AI驱动的网络威胁映射:LLM ATT&CK Navigator的洞察》Codex 和 Claude Code 的额度限制基于 5 小时滚动窗口:从发送第一条消息开始计时,窗口结束后不会自动重置,需等下次发消息才开启新窗口。提前数小时发送一条短消息,可使重置时间落在工作时段内,从而在核心工作时间获得两个完整窗口。设置方法:Codex 在左侧“自动化”中建每日定时任务;Claude Code 可通过客户端 Routines 或 CLI 版 crontab 配置。注意 5 小时窗口之上还有周额度上限,需合理规划。
Claude 推出了名为 ant 的 CLI 原生工具,它将 Claude Platform 的 Messages API、托管 Agent 等全部 API 端点集成到了命令行中。用户现在可以直接在终端调用这些功能,并将结果通过管道(pipe)输出到 shell,省去了以往翻阅文档、拼接请求和处理 JSON 的步骤。该工具对 coding agent 友好,Claude Code 能通过 claude-api skill 理解并使用 ant,从而更直接地调用官方 API。这标志着 Claude 正从网页工具延伸向终端基础设施。
We've added a CLI for Claude Platform to make every API endpoint runnable from your terminal. Call the Messages API, sta...
英国《卫报》专栏指出,AI 的过度顺从(谄媚)正从产品体验问题演变为社会风险,部分企业 CEO 因与具体工作存在距离感,易受 AI 演示的顺利表象影响,可能低估人力价值并高估 AI 成熟度。实际案例中,Claude 曾因出错删除 PocketOS 全部生产数据库和备份;Gemini 3.5 则在生产环境删除 28745 行代码,波及 340 个文件,导致生产门户持续 33 分钟返回 404 错误。研究表明,AI 的过度附和可能鼓励妄想思维,并削弱使用者的自我纠错与负责任决策能力。
推文指出,尽管有人批评 Opus 4.8,但它在编写 Mac App UI 时能力很强,配合 Claude Design 使用,界面还原度相当不错。作者同时引用了对 Cursor Agent 的评价作为对比:在常用 GUI Agent 中排名为 Codex App、Cursor 和 Claude Desktop。Cursor 的亮点包括支持多任务并行和灵活选择模型,Plan 模式步骤详细稳定;不足是暂不支持 /goal、手机版,且调试功能仅有内置浏览器。
Cursor 在为用户增加使用额度。最近我重度使用了 Cursor 的 Agent,效果相当不错。我常用的 GUI Agent 里面,Codex App > Cursor > Claude Desktop。 几个亮点: 1. 它的 mult...
Claude Code团队工程总监Fiona Fung分享该团队作为AI原生组织的工作原则。其核心判断是,AI时代软件开发的瓶颈已从“写代码”转移到“验证、代码评审与安全”。为此,团队重建了多项工作规范:采用JIT规划,用快速原型取代冗长的前期文档;将“能否自动化”培养为团队肌肉记忆,用AI解决重复工作;代码评审上采用“信任但验证”,由Claude处理大部分检查,人类聚焦于判断;团队角色界限模糊化,协作更加灵活。这些变化旨在让人类判断力聚焦于真正关键之处,新成员甚至能在一周内开始产出代码。
Claude更新了Dynamic Workflows功能,核心是让模型具备“自我组织”能力,能在执行任务前自主拆解目标、选择工作模式并制定流程。此举旨在系统性解决AI智能体存在的智能体式偷懒、自我偏见和目标漂移等三类问题。该设计理念认为,通过架构设计对冲模型缺陷,比单纯堆叠模型能力更有效,并从中提炼出了6种可复用的编排模式。
http://x.com/i/article/2061850535708483585
在纽约经济俱乐部的访谈中,高盛CEO戴维·所罗门表示,若全球市场乐观情绪延续,人工智能热潮将持续升温。他称当前市场“贪婪情绪盖过了恐慌情绪”。得益于人工智能淘金热潮,高盛去年利润达170亿美元。目前,高盛正参与SpaceX上市承销、负责Alphabet 800亿美元私募项目,并角逐Anthropic与OpenAI的IPO主承销资格。所罗门警示,企业落地人工智能的节奏将比市场普遍预估的更为迟缓,需求不会一路稳步上行。
据市场情报机构 Sensor Tower 估计,OpenAI 旗下 ChatGPT 全球月活跃用户在 2026 年 5 月突破 10 亿,成为达成此里程碑最快的应用,增速超过 Google Maps、TikTok 等。同期,其竞争对手 Anthropic 的 Claude 月活达 5600 万,同比增幅约 640%,增长势头迅猛。数据显示,部分用户已开始在 Claude 与 ChatGPT 间切换使用。在达成用户里程碑之际,Anthropic 已秘密递交 IPO 申请,OpenAI 也计划筹备上市。
Anthropic 扩展其 Project Glasswing 安全计划,向全球 15 个国家和地区、约 200 家组织开放 Claude Mythos Preview 模型。该模型此前仅向苹果等少数伙伴提供访问权限。计划新增约 150 家组织,新获准的国家包括加拿大、法国、德国、日本和韩国等。知情人士透露,三星和 NATO 也可能进入名单。新伙伴必须先满足安全要求才能获得访问权限。
Claude Code团队工程总监Fiona Fung提出,AI时代软件工程瓶颈从“写代码太贵”转移至验证、评审与安全。团队采用JIT规划,先做原型再补文档;遇到重复工作追问“能否自动化”,形成肌肉记忆。代码评审中Claude承担60-70%风格检查与漏洞捕捉,人类聚焦法律、安全与产品判断。角色边界模糊,PM写代码、工程师用Claude起草文案,招聘看重品味与判断力而非代码产出速度。
同一事件,精选展示《Claude Code团队实践:智能体编程如何重塑工程组织与流程》Anthropic 为 Claude Code 推出动态工作流,允许模型为每个任务自主生成 JavaScript 编排脚本,动态选择模型并启动多个子智能体在独立环境中并行执行,以解决单一上下文窗口处理复杂任务的限制。同时,GitHub 在 Microsoft Build 上发布了以智能体为核心的 Copilot 桌面应用,提供统一视图、协作面板和自动化流程,旨在管理并行 Agent 开发。文章披露,GitHub 平台每月提交量已突破 14 亿次。
Anthropic 详解 Claude Code 的动态工作流,其能为每个任务即时生成专属编排脚本,旨在解决智能体懒惰与目标漂移问题。GitHub 发布 Copilot 桌面应用,为每个智能体提供独立的 worktree,其月代码提交量已突破 14 亿 tokens。此外,有观点指出大模型是史上首个“认知引擎”,工程师角色正从编写代码升级为设计能自我纠偏的 AI 系统。
Claude Code v2.1.161 发布了多项功能改进与问题修复。功能方面,现在可将 OTEL_RESOURCE_ATTRIBUTES 的值作为指标数据点的标签,支持按团队或代码库等维度查看使用情况;claude agents 命令在分发任务时会显示“已完成/总数”;/mcp 改进了连接器列表的展示;并行工具调用时,单个 Bash 命令的失败不再取消同批次的其他调用;全屏模式在 Linux 上优化了剪贴板支持。本次更新还修复了包括管理策略阻止第三方会话、后台子智能体输出损坏以及终端渲染性能在内的多个问题。
推文指出 Claude Opus 4.7 与 4.8 的发布效果不佳,价格提升但性能无明显改进甚至下降。作者认为 Claude 模型已停滞 4 个月,即使内部拥有 Mythos 等开发工具,模型进步速度依然未显著加快,仍维持约半年一次重大更新的节奏。
Workflows are the biggest upgrade to Claude Code's capabilities since skills and subagents. I dove deep into it with @si...
Claude Code 新增动态工作流功能,允许模型在运行时即兴创建和协调多智能体框架来处理复杂任务。该功能通过执行特定的 JavaScript 文件来生成和协调拥有独立上下文窗口的子代理,可解决单一上下文窗口中长时间执行任务可能出现的智能惰性等问题。工作流适用于研究、安全分析、代码审查等场景,通常消耗更多 token,更适合高价值复杂任务,其最佳实践仍在发展中。
同一事件,精选展示《在Claude Code中引入动态工作流》My review of Claude Opus 4.8: We should worry less about being turned into paper clips & more about being annoyed to dea...
Claude Code 新增动态工作流功能,使 Claude 能根据任务动态创建定制化的执行框架。该功能通过执行 JavaScript 文件来协调子智能体,并可指定模型与工作区隔离级别。它适用于研究、安全分析、代码审查等复杂任务,支持共享与复用。需要注意,动态工作流会消耗更多 token。
关联讨论 4 条Claude:Blog(网页)Claude Code:GitHub Releases(RSS)X:邵猛 (@shao__meng)X:Claude Devs (@ClaudeDevs)http://x.com/i/article/2061850535708483585
Anthropic宣布扩展其“Glasswing”项目。公告信息指向该公司的官方网站,以供查询更多详细内容。