Anthropic 推出了“Agent Skills”开放标准,旨在为通用智能体(如Claude)提供可组合、可扩展且可移植的领域专业知识。一个Skill是一个包含指令、脚本和资源的文件夹,其核心SKILL.md文件采用渐进式披露设计,智能体可根据任务动态加载所需信息,从而最小化上下文占用。例如,PDF技能赋予了Claude直接操作PDF表单的新能力。该框架允许用户通过封装和共享程序性知识来定制智能体,无需为每个用例构建碎片化的定制代理。
Anthropic 推出了“Agent Skills”开放标准,旨在为通用智能体(如Claude)提供可组合、可扩展且可移植的领域专业知识。一个Skill是一个包含指令、脚本和资源的文件夹,其核心SKILL.md文件采用渐进式披露设计,智能体可根据任务动态加载所需信息,从而最小化上下文占用。例如,PDF技能赋予了Claude直接操作PDF表单的新能力。该框架允许用户通过封装和共享程序性知识来定制智能体,无需为每个用例构建碎片化的定制代理。
Anthropic宣布Claude与Slack双向集成功能正式上线。用户可直接在Slack工作区添加Claude,在频道和线程中获取AI协助;也可将Slack连接至Claude,让AI搜索历史对话和文件提取上下文。该集成支持私信、AI助手面板和线程参与三种方式,可起草回复、准备会议及创建文档。功能现已向付费Slack团队开放,连接器适用于Claude Team、Enterprise及Pro/Max用户。Claude仅访问用户有权限的频道内容,严格遵循企业安全与隐私设置。
关联讨论 1 条X:Claude (@claudeai)随着AI应用从单次提示转向构建长期运行的智能体,焦点正从“提示工程”演进为“上下文工程”。后者旨在为大型语言模型优化有限的上下文窗口内的全部信息,包括指令、工具、外部数据和对话历史。其核心挑战在于模型存在“注意力预算”限制和“上下文腐化”现象——随着上下文增长,模型回忆信息的准确性会下降。因此,上下文工程要求精心编排高价值信息,以有限的资源最大化产出期望结果,这已成为构建高性能、可操控智能体的关键。
文章探讨如何为基于大语言模型的智能体设计高效工具。核心方法是通过与智能体(如Claude Code)协作,采用快速原型构建和全面评估的迭代流程来优化工具性能。关键设计原则包括:选择适当的工具实现范围,使用命名空间明确功能边界,从工具向智能体返回有意义的上下文,优化响应以提高token效率,以及对工具描述进行提示词工程。工具本质上是确定性系统与非确定性智能体之间的新契约,设计应优先考虑智能体的使用体验,而非传统开发者导向的API思路,以扩大智能体解决实际任务的能力。
Mistral AI 于 2025 年 9 月 2 日宣布为 Le Chat 推出更新。更新包括:处于测试阶段的企业级 MCP 连接器目录,提供 20 多个安全的连接器,覆盖数据、生产力、开发、自动化与商务等领域,支持搜索、总结并操作各类工具,且允许用户自定义连接器。此外,新增记忆功能(beta),可基于用户偏好和事实提供个性化回复,并支持从 ChatGPT 快速导入记忆。所有功能均向免费套餐用户开放,并支持多端部署。
新推出的服务端 Presets 功能实现了模型配置的“一次定制,处处使用”。该功能允许用户将包括模型、参数、提示词和工具在内的完整配置保存为可复用的预设方案,并能通过链接或代码片段跨应用无缝共享。这简化了从开发到生产的工作流,避免了重复配置,提升了团队协作与部署效率。
OpenRouter 宣布其灵活模型路由支持在 Cursor 中运行月之暗面的 Kimi K2。用户可直接在 Cursor 中调用 OpenRouter 路由的模型,无需额外配置。
关联讨论 1 条X:OpenRouter (@OpenRouter)用户现可通过 OpenRouter 灵活的路由服务,在 Cursor IDE 中直接调用 Moonshot AI 最新推出的 Kimi K2 模型。这一集成简化了开发流程,无需复杂配置即可在编码环境中访问高性能大语言模型。OpenRouter 作为统一接口,支持用户便捷切换包括 GPT、Claude、LLaMA 及 Kimi 在内的多种模型,显著提升了 AI 辅助编程工具的可用性和选择自由度。
一款名为“Cypher Alpha”的新型通用隐写模型现已发布。该模型具备内置的工具调用功能,可供用户免费使用。其核心特性在于“隐写”,即在执行任务时能保持隐蔽性。目前,用户已可尝试体验这一模型。
Claude Desktop推出了名为“桌面扩展”的新打包格式(.mcpb文件),旨在彻底简化MCP服务器的安装流程。该格式将服务器代码、所有依赖项和配置清单打包成一个ZIP压缩包。用户只需下载.mcpb文件并用Claude Desktop打开点击安装即可完成,无需手动配置环境、安装运行时或处理依赖冲突。此举解决了以往需要开发者工具、手动编辑配置文件和依赖管理等复杂问题,显著降低了非技术用户使用强大本地MCP服务器的门槛。
OpenRouter 新增 GIF 作为提示词(GIF Prompts)、跨提供商搜索(Omni Search)、Anthropic 工具调用缓存(Tool Caching)以及 BYOK 确认标志(BYOK confirmation),旨在通过更快的图像支持、更智能的工具和更流畅的工作流提升开发体验。
多项新功能正式上线,包括GIF提示支持、Omni全平台搜索、Anthropic工具调用缓存以及自带密钥(BYOK)确认标志。这些更新显著提升了工作流程效率,实现了更智能的工具调用机制,并优化了图像支持体验。用户现可更快捷地生成GIF动图、跨平台检索内容、缓存常用工具以加速响应,并通过BYOK标志明确数据控制权限。
Mistral AI 发布了 Agents API,这是一个用于构建能够执行操作、解决问题的 AI 智能体的专用框架。该 API 将 Mistral 的语言模型与一系列内置连接器相结合,支持代码执行、网页搜索、图像生成、文档库访问及 MCP 工具集成,并提供跨对话的持久记忆和智能体编排能力。文章展示了其在 Github 编程助手、Linear 任务管理、金融分析、旅行及营养助手等场景的应用。集成网页搜索后,模型在 SimpleQA 基准测试上的准确率显著提升,其中 Mistral Large 和 Mistral Medium 的表现分别从 23% 和 22.08% 提高至 75% 和 82.32%。
MCP Agent Server示例展示了将Agent工作流封装为MCP服务器的"Agent即服务"架构。提供asyncio(轻量级内存执行,适合开发测试)和Temporal(生产级持久化、支持暂停恢复)两种实现。通过装饰器暴露Agent能力,支持多Agent互操作,可与Claude Desktop等任意MCP客户端集成,实现复杂工作流的标准化封装与跨平台复用。
OpenRouter 推出更深入的使用洞察、更精确的性能指标和新的开发者工具,旨在加速用户工作流程。
OpenRouter 为开发者推出一系列体验改进:提供隐私说明、新增服务提供商、升级 OAuth 认证,并为 Gemini 模型启用并行工具调用功能。
OpenRouter 发布多项开发者体验改进:更新隐私政策以明确数据使用方式;新增多家模型供应商;升级 OAuth 认证流程;为 Gemini 模型增加并行工具调用能力。这些更新旨在提升 API 调用的灵活性与安全性。
本次更新为开发者带来多项体验优化。隐私条款得到进一步明确,增强了数据处理的透明度。平台新增了多个第三方模型提供商,扩展了开发者的选择范围。OAuth 认证服务完成升级,提升了安全性与集成便捷性。此外,Google 的 Gemini 模型现已支持并行工具调用功能,允许模型同时执行多项操作,有望提高复杂任务的处理效率。这些改进共同致力于提升开发者的工作效率与构建体验。
MiniMax 发布 MCP Server,集成文本转语音、语音克隆、文生图、文生视频等多模态能力。支持 Claude Desktop、Cursor、Windsurf 等主流 MCP 客户端,通过统一工作流实现文本到音视频的一站式生成,面向创作者和开发者免费开放。
Hyperbrowser 发布 MCP Server,为 AI agent 提供网页抓取、结构化数据提取和爬取能力。支持集成 OpenAI CUA、Claude Computer Use 和 Browser Use 等浏览器自动化工具,兼容 Cursor、Windsurf 和 Claude Desktop,可通过 npx 一键安装,MIT 协议开源。
Anthropic为Claude引入了“思考”工具,允许其在生成最终响应前插入一个专门的思考步骤,以处理多步骤工具调用链、分析外部信息并遵循复杂策略。该工具与更早发布的“扩展思考”功能不同,更侧重于在响应生成过程中对新信息进行针对性推理。在τ-Bench基准测试中,该工具显著提升了Claude在客户服务场景的表现。文章建议在需要复杂工具调用、长链分析或高成本序列决策的场景中使用它,并提供了标准的工具实现格式。
Anthropic基于实践经验指出,成功的LLM智能体往往采用简单、可组合的模式,而非复杂框架。文章区分了工作流(预定义路径编排)与智能体(LLM动态自主决策),建议开发者优先采用最简单方案,仅在必要时增加复杂性。许多核心模式直接调用LLM API仅需几行代码即可实现。文中介绍了增强型LLM、提示链等基础构建模块,强调应为特定用例定制检索、工具等增强功能,并推荐通过Model Context Protocol集成第三方工具生态。
OpenRouter 平台新增针对 OpenAI 4o 和 Fireworks 模型的结构化输出(Structured Outputs)功能,同时免费提供 Gemini Flash 2.0 模型供用户使用。
Mistral AI发布了两个新的边缘计算模型Ministral 3B和Ministral 8B。两者均支持高达128k的上下文长度。Ministral 8B采用了特殊的交错滑动窗口注意力模式,以实现更快、内存效率更高的推理。这些模型在知识、常识、推理、函数调用和效率方面为10B以下类别设定了新标杆,可用于设备端翻译、离线智能助手、本地分析和机器人等场景。在多项基准测试中,它们超越了同级别的Gemma 2 2B、Llama 3.2 3B等模型。Ministral 8B的API定价为$0.1 / M tokens,Ministral 3B为$0.04 / M tokens。