3月12日

08:00

OpenRouter：Announcements（RSS）

Auto Exacto 功能现已默认开启，尤其适用于包含工具调用的请求。该系统每 5 分钟对服务提供商进行一次全面重评估，评估维度包括吞吐量、工具调用遥测数据和基准测试分数。这一自适应路由机制旨在根据实时性能数据，自动将请求导向当前最优的模型提供商。

MCP/工具产品更新部署/工程

3月11日

19:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

从模型到智能体：为 Responses API 配备计算机环境

OpenAI 基于 Responses API、shell 工具与托管容器构建 agent runtime，支持文件处理、工具调用及状态管理，实现安全可扩展的智能体计算机环境部署。

智能体 MCP/工具 OpenAI 产品更新

推荐理由：OpenAI为Responses API增加Agent运行时与容器化执行环境

3月9日

22:25

公众号：月之暗面（Kimi）

Kimi Claw 现已支持微博和企业微信遥控

Kimi Claw 今天起内置「微博」和「企业微信」官方插件，新用户经简单设置即可通过这两个 APP 遥控 Kimi Claw 干活。同时支持连接飞书（飞书机器人）。内置 ClawHub 5000+ 社区插件，涵盖开发代码、浏览器、办公工作流、专家角色等；提供 40GB 免费云盘、实时专业财经数据搜索。该功能处于早期实验阶段，首批开放给 Allegretto 及以上会员计划的用户。

智能体 MCP/工具产品更新

3月3日

00:00

Berkeley RDI：Blog（AI 安全与评测）

MalTool：针对 LLM Agent 的恶意工具攻击

研究团队发布 MalTool 框架，揭示 LLM Agent 面临的新型恶意工具攻击威胁。该框架利用编码 LLM 自动生成多样化恶意工具，构建首个包含 1,200 个独立恶意工具和 5,287 个木马工具的大规模数据集。测试显示，现有安全对齐技术和商业检测系统均无法有效阻止或识别此类攻击，而攻击成功率达 100% 且成本极低——GPT-5.2 仅需约 20 美元即可生成约 1,200 个验证恶意工具，单个成本不足 0.02 美元。这种基于代码实现的攻击可窃取数据、删除文件或劫持计算资源，威胁远超传统的描述操纵手段。

智能体 MCP/工具安全/对齐

2月12日

08:00

Hugging Face：Blog（RSS）

精选83

实践中的OpenEnv：在真实环境中评估工具使用智能体

Meta与Hugging Face联合推出开源评估框架OpenEnv，旨在标准化智能体与真实系统的交互。Turing公司贡献了生产级“Calendar Gym”环境，用于在权限控制、时间推理等现实约束下研究工具使用智能体。该框架采用类似Gymnasium的API，通过标准接口连接真实工具，将评估重点从受控演示转向真实世界可靠性。日历系统因涉及多用户、多步骤工作流等复杂性，成为评估智能体实际能力的强大测试平台。

智能体 Hugging Face MCP/工具 Meta

推荐理由：提供生产级基准测试，帮助开发者评估和改进 AI 代理在复杂环境中的表现。

2月9日

23:54

Hacker News：AI 热帖

精选

Show HN：AI agents 通过 REST API 玩 SimCity

一款让 AI agents 担任市长的城市模拟器，支持通过 REST API 或 MCP 服务器进行程序化城市建造与管理。

智能体 MCP/工具开源/仓库

推荐理由：AI Agent 通过 MCP 协议玩模拟城市，有趣的 Agent 应用实践案例

1月23日