Claude 代理工具发布 v2.1.142 版本。本次更新新增了 --add-dir、--settings、--model 等 8 个用于配置后台会话的命令行标志,并将 Fast 模式的默认模型升级为 Opus 4.7。插件功能得到增强,拥有根目录 SKILL.md 的插件现可被识别为技能,插件详情面板会显示其提供的 LSP 服务器。此外,版本修复了超过 15 项问题,包括 MCP 工具超时设置失效、后台会话在系统休眠后异常断开、守护进程升级后无法正常退出、Windows 网络驱动器工作目录下死锁等关键错误,并改进了响应式压缩和钩子配置错误提示。
用户现可通过 ChatGPT 移动应用随时随地使用 Codex。该功能支持跨设备和远程环境实时监控、引导及批准编码任务,实现了对编程工作的无缝移动端管理。
xAI 面向 SuperGrok Heavy 订阅用户推出 Grok Build 早期测试版。这是一个直接在终端运行的新型编程智能体与命令行工具,专为专业软件工程和复杂任务设计。其核心功能包括:支持“计划模式”,允许用户在代码执行前审阅和修改详细步骤;能无缝集成现有开发工具链;可将大型任务分解,交由并行运行的专用子智能体处理。此外,该工具提供无头模式,便于脚本和自动化流程集成。用户可通过单行命令安装并立即在项目中使用。
OpenAI 为 ChatGPT 推出新的安全更新,重点提升其在敏感对话中的上下文识别能力。新机制能够通过持续分析对话历史,更有效地识别随时间推移产生的风险模式,例如涉及自我伤害等敏感话题的渐进式对话。这使得 ChatGPT 能在长期互动中更准确地检测潜在风险,并作出更安全、符合上下文的回应,而非仅依赖单次查询判断。此次更新旨在平衡对话自由度与安全边界,减少误判的同时加强对用户的保护。
Google开源框架Genkit近日推出其核心中间件系统,旨在提升智能体AI应用的可靠性与可控性。该系统允许开发者在生成调用、模型及工具层进行拦截,以注入自定义行为,如重试机制、模型回退以及人工介入的工具审批流程。通过创建并堆叠自定义中间件,开发者能够实现对模型输出的确定性控制。所有中间件的执行流程均可通过专用的开发者界面进行实时查看与调试,有效支持使用TypeScript、Go、Dart和Python构建生产就绪的智能体应用。
Claude 工具发布 v2.1.141 版本,带来多项功能新增与优化。主要更新包括:为钩子输出添加 terminalSequence 字段以支持无控制终端的桌面通知;新增 CLAUDE_CODE_PLUGIN_PREFER_HTTPS 环境变量,便于通过 HTTPS 克隆插件源码;引入 ANTHROPIC_WORKSPACE_ID 变量以在多工作区联盟中限定令牌范围。会话管理方面,claude agents 命令新增 --cwd 参数用于按目录筛选,并优化后台代理的状态归类。用户体验改进包括:在倒带菜单添加“总结至此”选项以压缩早期上下文;长思考超时后旋转指示器变色提供更明确反馈;此外,还修复了 Markdown 表格渲染异常、权限提示逻辑、历史记录管理等超过 30 项问题。
Cursor发布新工具,用于配置云端智能体开发环境。核心更新包括:支持多仓库环境,使智能体可跨代码库协同工作;提供基于Dockerfile的代码化配置,支持构建密钥并优化缓存,命中缓存后构建速度提升70%;增强由智能体主导的环境设置流程,提供验证与故障回退机制。同时新增环境治理与安全功能,如版本历史、审计日志,以及可在环境级别独立管控的网络出口和密钥权限。这些改进旨在帮助团队在受控环境中更高效地运行能端到端处理任务的并行智能体集群。
Runway正式发布Runway Agent,这是一个能够通过单次对话将创意想法转化为完整、可发布视频的智能创作伙伴。用户只需用自然语言描述需求,Agent便能根据上下文和目标,自主完成概念提案、故事节奏设计、视觉方向规划,并最终生成包含多场景、旁白、对话和音乐的成片。它旨在为品牌团队、营销人员、创意机构和电影制作人快速生产各类视频内容,如品牌宣传、社交媒体素材和短片,将传统需要数天或数周的审核制作周期压缩至几分钟。该产品现已上线,新免费计划用户可获得1500积分用于制作首个视频。
Anthropic推出“Claude for Small Business”服务包,旨在帮助小型企业弥补在AI应用资源上与大型公司的差距。该产品包含一系列连接器和15个开箱即用的自动化工作流,能将Claude深度集成到QuickBooks、PayPal、HubSpot等企业日常工具中。其核心功能是自动化处理财务、运营、销售等领域的重复性任务,如规划薪资、月末结算、追踪发票和分析营销活动等。用户通过Claude Cowork界面操作并手动批准关键步骤,所有任务均由用户发起和控制,Anthropic承诺保障数据安全。
Browser Run 产品已基于 Cloudflare Containers 完成重构,实现了使用限制提升、性能加速、可靠性增强以及交付速度提高。此次重构使产品能够更高效地处理大规模并发任务,显著缩短了任务响应时间,并提升了服务稳定性。团队通过容器化技术优化了资源调度与隔离机制,从而为用户提供更快速、更可扩展的浏览器自动化服务。
NVIDIA 团队通过结合 Codex 与 GPT-5.5,将研究构想快速转化为可实际运行的实验,并直接用于部署生产系统。这一实践显著提升了从研究到产品化的效率,实现了实验代码的即时可执行与系统级集成。
本次更新包含多项错误修复与体验优化。核心改进包括:增强了Agent工具的subagent_type匹配逻辑,现对大小写和分隔符不敏感;修复了/goal命令在特定钩子设置下无响应的问题,现会显示明确提示;解决了Windows系统上因缺失可执行文件导致的周期性事件循环停滞。此外,还修正了后台服务启动、远程设置认证重试、托管市场更新策略持久化、/loop命令调度冗余以及Read工具参数验证等多个问题。插件系统现会对因配置冲突而被静默忽略的默认组件文件夹发出警告。
Anthropic公司为法律行业发布20多个新的MCP连接器及12个专用插件,将Claude深度集成至合同管理、文档处理等法律核心软件栈。Claude现可直接在Microsoft Word、Outlook等办公应用中无缝工作,具备起草、修订、条款比对等可复用技能,并能自动化处理日常法律事务。公司同时宣布与多个司法公益组织合作,以扩大法律服务的可及性。
GitHub 宣布从6月1日起更新 Copilot 个人计划阵容,基于用户反馈进行调整。主要变化包括在现有 Pro 和 Pro+ 计划中引入弹性配额机制,允许用户更灵活地分配使用量;同时新增 Max 计划,扩展高级选项。此次更新旨在提升计划的可定制性,为开发者提供更个性化的编程辅助服务,优化整体使用体验。
在Code w/ Claude SF 2026开发者大会上,Anthropic宣布提升开发者工具能力。Claude Code的速率限制翻倍,Claude Opus的API限制提高,以支持大规模可靠开发。同时,Claude平台上的托管智能体新增四项功能:“梦想”功能通过回顾会话优化记忆;多智能体编排支持主智能体并行委派子任务;“成果”功能通过定义输出标准提升任务成功率,内部测试显示最难问题成功率最多提升10%;Webhooks提供任务完成通知。大会主题演讲和分组会议录像已上线,并计划在伦敦和东京举办后续活动。
Co-Scientist 是一款由 Gemini 构建的协作式 AI 助手,旨在帮助科研人员加速科学突破。它通过多智能体(multi-agent)的架构设计,作为研究人员的智能伙伴参与工作流程,以提升研究效率并推动创新发现。
Claude Code 近日推出“智能体视图”功能,为用户提供了一个集中管理所有会话的统一界面。该功能解决了并行运行多个智能体时需要切换终端标签、管理复杂网格的痛点,允许用户一键启动新智能体并将其发送至后台运行。在视图中,用户可以直观查看每个智能体的状态(等待输入、运行中或已完成)、最后响应内容及交互时间,并支持内联回复或进入完整会话。用户可通过 /bg 命令或将现有会话加入后台,也可直接使用 claude --bg [task] 启动后台任务。此功能已作为研究预览版向 Pro、Max、Team、Enterprise 及 Claude API 用户开放。
本次更新引入了多项新功能与优化。核心新增包括:集中管理会话的Agent视图(研究预览)、可设置目标并持续工作的/goal命令、实时调整滚轮速度的/scroll-speed命令,以及查看插件详情的claude plugin details命令。交互界面导航与控制能力得到增强。底层优化涵盖MCP服务器可获取CLAUDE_PROJECT_DIR环境变量、/context all的令牌估算会考虑模型分词器并显示舍入值。此外,修复了超过20项问题,如凭证死锁、内存无限制增长、权限规则、UI显示错误及路径处理等缺陷。
Anthropic公司正式在AWS上推出Claude平台,为AWS客户提供了通过其现有身份验证、账单及承诺消费抵扣使用完整Claude功能的新途径。该平台首次将全套Claude API功能引入AWS生态,新功能与原生API同日上线。平台包含Claude托管智能体、代码执行、文件API等多项核心功能,并支持最新模型。与Amazon Bedrock上的服务不同,此平台由Anthropic直接运营,数据在AWS边界外处理,适合需要完整平台体验的企业客户。服务将在多数AWS商业区域提供。
Runway开源了Python库confingy,旨在解决机器学习系统配置的长期痛点。该库允许开发者用纯Python代码(支持懒加载、类型检查和序列化)替代传统YAML配置文件,从而摆脱YAML作为图灵完备领域特定语言所带来的维护困境。confingy无需重构现有代码,即可满足跟踪构造函数参数、避免实例化昂贵对象(如大语言模型)等核心需求,有效改善了因复杂YAML配置导致的无法跳转定义、类型提示失效和重构困难等开发体验问题。
OpenAI正式推出校园网络计划,面向全球学生社团开放申请。该计划旨在连接世界各地的学生团体,为其提供AI工具支持、活动举办资源,并共同构建一个由AI驱动的校园社区。参与的学生社团将能直接接入OpenAI的生态系统,利用先进技术开展项目与活动,从而在校园内培育和发展人工智能的应用与实践。
Hermes桌面版发布2026.510.1更新,修复桌面打包问题,确保WebUI优先使用捆绑的hermes-agent运行时,并抑制误导性Git更新提示。此次更新捆绑hermes-agent 0.13.0与hermes-webui 0.51.34,新增macOS arm64 DMG和ZIP安装包,提升安装一致性。
Hermes桌面端2026.510.0版本正式发布。本次更新捆绑了hermes-agent 0.13.0组件(对应上游标签v2026.5.7)以及hermes-webui 0.51.34(对应上游标签v0.51.34)。同时,新版本提供了针对macOS arm64架构的DMG和ZIP安装包构建。
本次更新版本号提升至v2.1.138。核心变更是进行了一系列内部修复,旨在优化系统底层性能或解决已知问题。更新日志未提及新增功能或面向用户的具体特性改动,主要集中于后台代码的调整与完善。
本次发布的 v2.1.137 版本主要包含一项错误修复。该版本解决了 Visual Studio Code 扩展在 Windows 操作系统上无法激活的问题。此次更新专注于提升特定平台下的扩展兼容性与稳定性。
Bugbot宣布将团队与个人计划从每月每席位40美元的订阅制改为按使用量计费。现有用户的变化将于2026年6月5日后的下一个账单周期开始生效,例如2026年5月购买的年订阅将在2027年5月切换。团队按需消费计费,个人按包含使用量计费,平均每次运行成本约为1.00-1.50美元,具体取决于PR大小和复杂度。同时,用户现在可配置Bugbot审查PR的工作强度:默认强度下80%被识别的问题在合并时得到解决;高强度模式下可多发现35%的问题,解决率仍保持在80%。现有客户可在Cursor面板中提前切换至用量计费。
Claude发布了v2.1.136版本更新,主要包含一系列错误修复与功能改进。新增了CLAUDE_CODE_ENABLE_FEEDBACK_SURVEY_FOR_OTEL配置以重新启用企业质量调查,并引入了settings.autoMode.hard_deny规则用于无条件阻止操作。关键修复包括:解决了MCP服务器在VS Code等扩展中执行/clear后静默消失的问题;修复了罕见的并发写入导致OAuth令牌覆盖并引发重复登录的故障;修正了多个远程MCP服务器并发刷新时令牌丢失,导致需要每日重新认证的问题;修复了扩展思考后因工具调用产生编辑块而导致的API 400错误。此外,还针对WSL2图像粘贴、计划模式文件写入、插件管理、界面显示一致性、终端输出、文件选择器等超过40项问题进行了修复和优化,提升了整体稳定性和用户体验。
OpenRouter Agent SDK 新增一种工具类型,使智能体能够自动处理常规决策,并在高风险决策时暂停等待人工输入。该工具提供两个钩子(hooks),不需要开发者编写任何循环管理代码。
OpenRouter Agent SDK 新增一种工具类型,让智能体自动解决常规决策,并在高风险的决策点暂停等待人类输入。该工具提供两个 hook,无需编写循环管理代码。
OpenRouter Agent SDK 引入了一种新工具类型,使智能体能够自动处理常规决策,并在高风险决策时暂停以请求人工输入。该功能通过两个钩子实现,无需编写任何循环管理代码,从而在自动化流程中灵活嵌入关键的人工判断环节。
中国移动与火山引擎联合推出“机密模型服务”新模式,通过机密计算技术保护模型推理过程中的数据与模型参数安全。该服务在可信执行环境(TEE)中运行大语言模型,确保用户输入、输出及模型权重均不被服务方或第三方窥探,满足金融、政务等高合规场景的需求。双方结合运营商网络与云原生能力,为企业提供端到端的AI安全调用方案。
Claude 发布 v2.1.133 版本,新增多项配置与优化。主要新增 worktree.baseRef 设置以选择工作树分支基础,引入 sandbox.bwrapPath 等设置允许指定自定义二进制路径,并添加 parentSettingsBehavior 键供管理员控制设置合并策略。功能上,钩子现在可接收活动努力级别信息,Bash 工具命令可读取相应环境变量。此外,改进了焦点模式行为,并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题,包括并行会话死锁、权限规则误匹配、代理设置不生效、网络驱动器访问被拒、远程控制中断不彻底、努力级别跨会话更改以及子代理技能发现失败等。claude --help 现已列出远程控制选项,VSCode 扩展也修复了相关错误。
该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择,实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型(如GPT、Claude、LLaMA等)集成实时、可靠的网络信息获取能力,无需为每个模型单独适配。
2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。近日,Petri升级至3.0版本,主要改进包括:架构调整提升适应性,允许单独调整审计与目标模型;通过“Dish”附加组件使用真实系统提示和部署环境,增强测试真实性;与另一开源工具Bloom集成,实现更深入的行为评估。为确保独立性与公信力,Petri的开发已移交非营利组织Meridian Labs。
OpenAI开始在ChatGPT中测试广告功能,旨在支持其免费服务的持续运营。测试强调广告会带有明确标识,且广告内容不会影响ChatGPT的回答独立性。该举措配套严格的隐私保护措施,并确保用户对广告体验拥有控制权。
Claude for Excel、PowerPoint和Word现已全面上市,Outlook版本开放公开测试。Claude能在四大微软应用间保持连续对话上下文,实现跨文件智能协作。例如,在Outlook中分类邮件并起草回复,在Excel中调整数据后,PowerPoint图表和Word文档会自动同步更新。企业管理员可通过微软管理中心统一部署,并配置OpenTelemetry进行全流程监控。该套件支持通过Claude账户或现有LLM网关访问,Microsoft 365 Copilot用户也可在Excel和PowerPoint中直接调用Claude。