Anthropic 推出 Claude Tag,构建人机协作团队
阅读原文· claude.comAnthropic 内部总结的四个教训——公开透明、明确角色、设北极星、逐步信任,对正在探索人机协作团队的管理者来说,比产品手册更实用。
Anthropic 推出 Claude Tag,支持多用户与同一 AI 智能体在同一工作空间协作。智能体具备持久记忆、独立于人类的凭证及广泛信息访问权限。经验:工作公开化并给予智能体广泛上下文,通过工作区级安全边界让信息对人和 AI 均可用;为每位成员(含 AI)分配明确角色与相应工具。用户可通过 @Claude 私信进行敏感交互,对话保持私密。该方法已在 Slack 等团队协作工具中实践,旨在使人类与智能体高效协作完成共享目标。
构建高效的人机智能体团队
我们与 AI 协作的方式正从单人模式演变为多人体验——人类与智能体以团队形式协同工作,共同实现目标。以下我们将分享这种新工作模式的实际案例。
- 分类企业级 AI
- 产品Claude Tag
- 日期2026年6月24日
- 阅读时长5分钟
- https://claude.com/blog/building-effective-human-agent-teams
过去,与 AI 协作意味着一个人面对单一聊天窗口。随着时间的推移,AI 在处理复杂、长周期的工作(如编程、研究和金融分析)方面变得越来越强大。由此,我们看到了许多使用 AI 的新方式——从终端和 IDE 到电子表格和演示文稿——但工作本质上仍是“单人”体验:一个人与一个智能体协作完成个人任务。
随着 Claude Tag 这类工具的发布,这一局面正在改变。现在,人类和智能体可以在同一工作空间中协同工作,共同服务于团队目标。工作看起来更像一场多人游戏:由人类团队制定策略,由 Claude 执行具体工作。
这需要一些新的工作方式。在 Anthropic,过去几个月我们一直在测试实现人机智能体团队成功所需的技术。本文将介绍什么是多人智能体,以及我们在构建过程中总结的经验教训。

什么是多人智能体?
我们在这里所说的“多人智能体”,是指能够同时与多个不同人类协作的 AI 模型。与常规智能体类似,它们拥有自己的记忆和技能。但在其他方面又截然不同:它们拥有独立的凭证,并且存在于实际发生工作的地方。在 Anthropic,它们存在于 Slack 等团队协作工具中。
以下是一个人机智能体团队在 Slack 中共同分析数据集的示例:

为了让智能体有效地参与团队频道,它们需要具备特定能力:
- 持久化记忆,以便记住目标并根据目标调整执行方式
- 不与人类绑定的凭证,从而能够在安全、可预测的边界内运行
- 持续广泛地获取信息,以便它们能够了解组织的运作方式,并采取行动执行任务,以服务于团队的目标。
这些能力构成了AI智能体在由多人组成的团队中高效参与所需的技术基础。然而,要让人类与AI智能体组成的团队取得成功,还需要更多条件:团队需要特定的工作方式和共享的规范。
经验1:公开工作,并为AI智能体提供广阔的上下文
Anthropic 的团队会主动、公开地分享信息。当团队中有AI智能体时尤其如此,因为AI智能体完全依靠团队提供可搜索的文本——Slack、代码、文档和会议记录——来构建自己的理解。私信、走廊交谈和受限文档无法为AI智能体提供上下文。对于AI智能体而言,如果没有被写下来且可访问,那就等于不存在。
我们不是逐个决定哪些文档或 Slack 频道应该对AI智能体开放,而是使用明确定义的安全边界,这些边界适用于整个 Slack 工作区,以及会议记录和文档库。在安全边界内,上下文会流向每一位团队成员——无论是人类还是AI。这不仅增加了AI智能体和人类可以获取的信息量,还减少了关于什么可以分享、可以与谁分享的混乱。人类和AI智能体都难以应对按项目逐项共享的软边界:这个频道应该公开还是私密?我可以把这个文档分享给那个人吗?这个AI智能体允许看到那个线程吗?少量清晰、工作区级别的边界消除了日常工作中的决策疲劳。
高度透明是有回报的。例如,能够读取团队会议决策的AI智能体不会提出那些已被降级优先级的任务或项目。能够访问本团队之外产品规格的AI智能体可以推荐其他团队已成功实施的模式。而且,由于AI智能体读取大量文本的速度远快于人类,它们常常能呈现出人类原本会遗漏的相关工作。在这个繁忙、快速发展的行业中,我们非常依赖AI智能体来保持信息灵通和协调一致。
在Anthropic,公开工作的形式如下:
- 在公司内部选择少数几个安全边界,并创建与每个安全边界相匹配的工作空间和文档共享设置。
- 默认将组织内的新沟通渠道设为公开,并确保每次决策都能记录在渠道、文档和会议纪要中。
- 撰写文档制品和会议纪要,以便AI智能体能够找到它们,因为AI智能体现已成为团队文档的主要消费者。
- 确保AI能够访问完成其工作所需的正确工具和信息。
默认将信息对内公开可能需要文化上的转变。然而,拥有上下文的与没有上下文的人类-AI智能体团队之间的差异过于显著,不容忽视。
当然,有些交互是敏感的,需要在单个人类和AI之间保持私密。对于这些情况,你可以通过Claude Tag向@Claude发送直接消息,或者使用现有的Claude.ai和Claude Cowork应用程序。这些工具通过你的个人MCP连接器让Claude能够访问私有信息,同时知道你的对话以及与AI智能体分享的内容将保持私密。
经验二:每个人类和AI智能体都拥有明确的角色,并配备完成工作所需的正确工具。
人类与AI智能体组成的团队共享同一份成员名单、同一套文档制品和同一个工作空间。AI智能体拥有自己的凭据、技能和工具访问权限。不同的AI智能体还承担不同的角色:例如,一个可能负责项目的数据分析,另一个将维护并执行设计标准,第三个则进行研究综合。
当项目启动时,人类与AI智能体进行讨论,以确定分配哪些角色,以及人类和AI智能体将如何协作。

一旦人类和AI智能体的任务明确,一个AI智能体可能会启动其他AI智能体,以确保特定任务由具有正确记忆和适当访问权限的AI智能体处理。重要的是,它们需要访问完成工作所需的所有工具:负责数据分析的AI智能体可能需要访问BigQuery,而执行质量检查的AI智能体可能需要访问Playwright MCP。
明确划分的角色与职责,能让人类与智能体组成的人机团队走向成功。人类通常与智能体在相同的工作线程中协作,但只承担人类独有的角色。这确保了所有环节协同运作,而人类判断力被应用于最关键的决策。如果角色不清晰,人们最终会在私下运行个人专属的智能体集群,导致工作重复、团队上下文被割裂。指标追踪就是一个常见案例:一个多人协作智能体可以一次性完成工作,让所有人都看到相同的数据。
在 Anthropic,人机团队中明确划分的角色表现为:
- 一套达成共识的任务集合:团队中的人类与智能体就谁做什么达成一致。
- 人类与智能体在相同的共享线程中工作,这样任何人都能接续他人未完成的工作。
- 人类与智能体都能访问合适的工具来完成各自的任务。
- 对智能体角色及范围的描述。

Anthropic 的一个工程团队开始创建名单,以帮助将人类与智能体的角色具体化,因为这使得推动工作变得更加容易和具体。他们早期总结出的一些要点包括:
- 具体的角色也有助于人类轻松追踪任务的负责方——无论是单个任务还是整个团队的责任集合。
- 编写技能文件来定义特定智能体的角色,有助于轻松实现专业化,并让公司内其他同事能快速搭建相同类型的其他智能体。
- 当项目变得更加复杂时,团队会添加新的智能体来专注于新的领域。例如,他们增加了一个发布管理智能体来处理新的软件发布。
这些方法让人类对人机团队的认知模型能够随着智能体数量的增长而扩展。
经验之三:设定一个北极星目标,让智能体更具主动性。
虽然 Anthropic 的一些智能体只是完成分配的任务,但最重要的那些智能体会主动建议新的项目和任务流。这通常发生在某个团队已经为智能体提供了丰富的上下文和明确的角色之后,再增加一项指引:一个北极星目标。
北极星目标是宏大而广泛的目标,能帮助团队判断哪些任务和任务流是正确的。在 Anthropic,人类始终负责设定北极星目标,并将其扎根于公司的使命和业务目标。
一旦北极星目标被清晰地用书面形式表述出来,人类就会将其分享给团队中的智能体。然后,重要的是,人类要选择哪些智能体应该主动建议新的任务流,以帮助实现这一长期目标。(团队中不太可能每个智能体都具备主动建议工作所需的先决技能和信任。)
例如,一个内部工具团队设定了“让产品上手流程更有帮助”的北极星目标,结果发现一个智能体主动建议修改上手流程中错误信息的文案。这些改动在接下来的一周显著提升了上手成功率。
在 Anthropic,设定北极星目标的做法如下:
- 由人类讨论、辩论并记录一个宏大的北极星目标——这个目标根植于公司的使命和业务目标——用于他们的人机智能体团队。
- 将北极星目标分享给团队中的智能体,并明确指明哪些智能体可以主动推荐新的任务流。
- 在日历上保留高质量的人类时间,会议现在聚焦于最重要的工作。
清晰的北极星目标为智能体提供了持续努力的方向,以及主动支持团队工作的有意义的机会。
经验 4:逐步建立信任
Anthropic 的团队会根据智能体展现出的可靠性来授予相应的自主权,然后有意识地逐步扩大这种自主权。工程师们已经成功让团队中的智能体独立处理了 500 个漏洞修复,但事情刚开始时绝非如此。
当一位新同事加入团队时,需要花时间评估他们的能力,并建立高效的工作惯例。通常需要多次反馈循环,才能把完成某项任务的最佳方式所涉及的所有隐性知识显性化。智能体也是如此。用户需要尝试让智能体执行许多不同的任务,从而了解智能体能做什么、如何清晰地描述目标、需要哪些技能文件,以及哪些提示词最能有效地触发期望行为。随着模型不断更新和改进,重新测试任务也很重要。提示词可能需要重新调整措辞,而曾经有用的护栏,可能会限制更聪明的模型去探索更具创造性的解决方案。
值得注意的是,我们发现,最好的长期运行的智能体在人类审查其工作之前,会有多种不同的验证方式。代码当然有测试,但大多数其他工作也同样可以验证。例如,技术文档可以应用量规和风格指南。当人类设定标准,并确保分配智能体的所有工作都能被核查时,质量就能保持高水平,且不会偏离最初的意图。此外,与人类协作类似,让一个智能体负责执行任务,另一个智能体负责检查前者的工作,往往会有帮助。这种模式通常被称为“执行者-验证者”智能体框架。
在Anthropic,随着时间的推移,与智能体建立信任的过程如下:
- 初期手动审查智能体的工作,以检验质量、提供反馈,并设计任务验证清单
- 指示智能体在任务中使用“验证智能体”来检查自己的工作
- 将反思纳入工作循环,并要求智能体审视自身的失误,从而使工作质量随着时间推移不断提升
- 跟踪每个智能体在哪些类型的任务上已获得自主权,并在多次成功执行后按任务类型逐步扩大授权范围
Anthropic 的一位工程负责人接手了一个积压了大量工作项的新团队。为了理清头绪,他邀请了几位人类成员和几个 AI 智能体来一起梳理积压事项并确定优先级。团队中有一组智能体负责通读积压清单中的每一项,查明是否有人员正在处理这些事项,并对任何无人认领的工作项给出复杂程度评分。另一组智能体则从清单中筛选出中等和低复杂度的项,并生成代码变更。起初,人类会审核智能体所做的每一个决策,标记出任何需要人类介入的环节。随后,人类教会智能体如何将这些决策直接上报给人类,确保涉及艰难权衡的决策始终有人类参与其中。

每周,这位负责人和他的团队都会要求智能体汇总一份周报,其中包含"经验教训与失误"板块,以便智能体记录自身错误并避免在未来重犯。随着时间的推移,负责人能够将越来越复杂的代码变更任务交给智能体,并且在日常指导智能体具体任务上花费的时间也越来越少。
当智能体具备了更高的独立性后,负责人开始指导它们将人类的注意力视为稀缺资源——要将问题集中打包,一次性向人类提交;重复关键上下文以便人类快速跟上进度;并限制每个人类每次同时看到的事项数量。
帮助智能体进行良好的沟通,能确保它们始终发挥有用的、高效的作用。有些人在他们的团队中设置了专门负责决定如何批量整理、并向人类团队成员仅提升呈现最重要信息的智能体角色。还有一些人为智能体每日的工作量设置了护栏,以便人类能够有实际意义地参与其中。这样的护栏能确保人类保持对自己重要的技能,并且需要人类审核的事项数量保持在可持续的水平。
值得思考的问题
在为你的"人机混合"团队打好基础时,请思考以下几个问题:
- 智能体和人类所需要的所有信息与访问权限是否都已公开且易于检索到?
- 你能写下你团队的成员名单(人类与智能体),并说明每个成员负责什么吗?
- 团队中的每位人类和智能体是否都拥有完成其工作所需的合适工具?
- 你们是否有供人类和智能体使用、用以验证关键工作成果的评分标准或测试?
- 你的团队是否有一个清晰、人人都能参考的北极星目标?
展望未来
这些模式并不新鲜——至少对人类来说不新鲜。明确的北极星目标、清晰的职责划分、完善的文档、统一的质量标准,以及允许从错误中学习的空间——这些都是我们几十年来已知的健康团队习惯。智能体的加入只是让不跳过这些习惯变得更加重要。
那些从智能体中获益最多的团队,恰恰是最刻意落实这些基本法则的团队。
致谢
本文由 Anthropic 教育团队成员 Kristen Swanson 撰写。她感谢 Matt Bell、Erik Olesund、Hasnain Lakhani、Shale Craig、Nolan Caudill、Mike Schiraldi、Aleks Todorova 和 Molly Vorweck 对本文的贡献。
开始在 Claude Code 中使用智能体团队,或通过 Claude Tag 构建多人智能体应用。
常见问题
用 Claude 改变你的组织运作方式
订阅开发者通讯
产品更新、操作指南、社区亮点等。每月发送到你的邮箱。