AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 654 条
全部一手资讯X论文
标签「Agent」清除
6月3日周三
21:30公众号:月之暗面(Kimi)67精选Kimi Work Beta版发布:面向知识工作者的本地Agent
14:35公众号:千问APP(阿里)58千问向第三方Agent、Skill全面开放,肯德基、瑞幸、东航首批接入
05:16Claude:Blog(网页)77同事件精选Claude Code 新增动态工作流功能同一事件,精选展示《在Claude Code中引入动态工作流》
01:56GitHub Blog72精选GitHub Copilot应用:智能体原生的桌面体验
00:00Anthropic:Research(发表成果 · 网页)77精选AI驱动的网络威胁映射:LLM ATT&CK Navigator的洞察
6月2日周二
23:13OpenAI:官网动态(RSS · 排除企业/客户案例)38Travelers借助OpenAI在全国部署AI理赔助手
22:40Hugging Face:Blog(RSS)73精选Holo3.1:快速本地计算机使用智能体
18:00公众号:百度智能云(文心)45华硕商用电脑与百度智能云推出企业级AI解决方案"华硕×百度搭子DuMate"
12:19OpenRouter:Announcements(RSS)77精选OpenRouter 5月发布亮点
07:14Cursor Blog64精选Cursor Teams计划定价方案更新
05:48OpenAI:官网动态(RSS · 排除企业/客户案例)66精选OpenAI前沿模型与Codex现可在AWS上使用
01:59公众号:通义实验室(千问)64同事件精选Qwen3.7-Plus 多模态智能体模型发布同一事件,精选展示《Qwen3.7-Plus:多模态智能体模型发布》
01:37Qwen:Blog Retrieval(API)81精选Qwen3.7-Plus:多模态智能体模型发布
6月1日周一
22:38Hugging Face:Blog(RSS)60精选超越LLM:为何可扩展的企业AI采用取决于智能体逻辑
18:21公众号:腾讯混元46腾讯混元为《和平精英》推出AI明星队友「小田」
09:23公众号:MiniMax(稀宇科技)65MiniMax M3 发布:1M 上下文、原生多模态、前沿编程与 Agent 能力
08:00OpenRouter:Announcements(RSS)77同事件精选OpenRouter 五月发布亮点:语音API、模型融合、企业控制及20个新模型上架同一事件,精选展示《OpenRouter 5月发布亮点》
08:00OpenRouter:Announcements(RSS)71同事件精选OpenRouter 5月发布亮点:语音与转录API、模型融合及20款新模型同一事件,精选展示《OpenRouter 5月发布亮点》
5月30日周六
10:42Claude Code:GitHub Releases(RSS)49v2.1.158
07:19OpenRouter:Announcements(RSS)69精选Guardrails:保护你的智能体、数据与成本
04:42Claude Code:GitHub Releases(RSS)67精选v2.1.157 更新
02:00OpenRouter:Announcements(RSS)77精选OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7
00:33Tomer Tunguz 博客(VC 分析)65精选技能提炼
5月29日周五
20:00OpenRouter:Announcements(RSS)73同事件精选OpenRouter 推出 Guardrails:保护你的 AI 智能体、数据与成本同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》
20:00OpenRouter:Announcements(RSS)70同事件精选OpenRouter Guardrails 发布:可配置安全与治理工具,保护 AI 智能体、数据与成本同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》
08:02公众号:阶跃星辰(Step)61同事件精选阶跃发布 Step 3.7 Flash,面向生产级 Agent 的高效率 Flash 模型同一事件,精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI——Step 3.7 Flash》
07:46OpenAI:官网动态(RSS · 排除企业/客户案例)36Endava如何借助Codex构建智能体驱动的组织
05:12Google Research:Blog(网页)79精选创新时代:Google Research 在 I/O 2026
02:39Claude Code:GitHub Releases(RSS)73同事件精选Claude Code v2.1.154 发布:新增 Opus 4.8 与动态工作流同一事件,精选展示《在Claude Code中引入动态工作流》
01:21Claude:Blog(网页)78精选在Claude Code中引入动态工作流
01:05Anthropic:Newsroom(网页)85精选Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
00:33Tomer Tunguz 博客(VC 分析)61精选AI智能体时代下的安全变革
5月28日周四
22:07公众号:腾讯混元58Hy-Memory 发布:为 Openclaw 打造的记忆插件
22:04公众号:小米 MiMo58Xiaomi MiMo Orbit 首批 Agent 生态共建合作伙伴公布
21:11Cloudflare Blog41我们如何构建Cloudflare的数据平台及其上的AI智能体
19:31公众号:百度智能云(文心)54百度搭子DuMate发布:你的上班搭子,真干活
18:47Mistral AI:News(网页)81Vibe gets to work.
18:47Mistral AI:News(网页)75AI Now Summit 2026
11:35公众号:面壁智能(MiniCPM)61精选PilotDeck 开源:以 WorkSpace 为核心的智能体操作系统
07:07Anthropic:Research(发表成果 · 网页)69精选社会科学中的编码智能体
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月3日
21:30
公众号:月之暗面(Kimi)
精选67
Kimi Work Beta版发布:面向知识工作者的本地Agent

Kimi Work Beta版随Kimi最新Mac和Windows客户端推出,是基于Kimi Code的通用型本地Agent。它内置Kimi WebBridge浏览器操作方案,支持安装和使用Skill、运行定时任务,并能根据任务复杂度自主创建最多300个子Agent的团队。开发中使用的Kimi K2.6模型支持13小时连续编码、4000余次工具调用,累计产出超5万行有效代码,其中92%由AI自主生成。用户可用自然语言描述目标,Kimi Work即可拆解任务、并行执行、调用工具、操作浏览器,交付文档、表格、PPT等工作产物。

智能体MCP/工具产品更新
关联讨论 4 条IT之家(RSS)X:Berry Xia (@berryxia)X:Kimi.ai (@Kimi_Moonshot)公众号:月之暗面(Kimi)
推荐理由:Kimi 把代码 Agent 的本地能力包装成了面向普通人的工作 Agent,300 个子 Agent 集群让繁琐的任务并行处理成为可能,对天天跟文档表格打交道的人是真提效。
14:35
公众号:千问APP(阿里)
58
千问向第三方Agent、Skill全面开放,肯德基、瑞幸、东航首批接入

千问今日向第三方Agent、Skill全面开放。瑞幸咖啡、肯德基、东方航空已首批提供Skill服务,用户可体验到店自取等。企业未来可在千问APP中接入Skill并运营自有品牌Agent,自定义人设与服务边界,以对话形式提供服务。Agent具备记忆与主动规划能力,可在特定场景主动提供服务,如行程提醒、权益到期、复购推荐。东航Agent可理解出行计划后智能推荐行程方案,瑞幸Agent能主动建议提前下单。千问希望与各行业共建Agent服务生态。

智能体MCP/工具产品更新
05:16
Claude:Blog(网页)
同事件精选77
Claude Code 新增动态工作流功能

Claude Code 新增动态工作流功能,允许模型在运行时即兴创建和协调多智能体框架来处理复杂任务。该功能通过执行特定的 JavaScript 文件来生成和协调拥有独立上下文窗口的子代理,可解决单一上下文窗口中长时间执行任务可能出现的智能惰性等问题。工作流适用于研究、安全分析、代码审查等场景,通常消耗更多 token,更适合高价值复杂任务,其最佳实践仍在发展中。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《在Claude Code中引入动态工作流》
推荐理由:Claude Code 现在能自己动态生成多代理协调器,这在调试、审查、研究等复杂任务上是个真正的生产力跃迁,但普通编码工作用它反而是杀鸡用牛刀。
01:56
GitHub Blog
精选72
GitHub Copilot应用:智能体原生的桌面体验

在微软 Build 2026 大会上,GitHub 发布了新的工具和更新,并将 Copilot 应用定位为“智能体原生的桌面体验”。其核心目标是让 AI 智能体能够以用户已经习惯的方式进行工作。

智能体GitHub产品更新编码
关联讨论 1 条The Verge:AI(RSS)
推荐理由:GitHub 把 Copilot 从插件变成了独立桌面应用,Agent 不再躲在 IDE 背后,这是 AI 编程从辅助工具走向桌面中枢的标志,开发者现在可以直接在桌面上跟 AI 协作了。
00:00
Anthropic:Research(发表成果 · 网页)
精选77
AI驱动的网络威胁映射:LLM ATT&CK Navigator的洞察

Anthropic分析了832个因违反政策被封禁的恶意账户(2025年3月至2026年3月),将其活动映射到MITRE ATT&CK框架的全部14种战术和482种子技术。风险评分显示,中等及以上风险行为者比例从上半年的33%跃升至下半年的56%,增长集中在横向移动、凭证窃取、webshell等高危技术。Agentic scaffolding使攻击链实现自主编排——2025年11月一次间谍活动风险评分达100,所用技术数量却与中等风险者相当。MITRE ATT&CK框架尚未覆盖这种自主攻击。该报告与Verizon合作,已纳入2026年数据泄露调查报告;Anthropic据此更新了Claude的检测分类器以拦截高风险行为。

智能体Anthropic安全/对齐
关联讨论 2 条Anthropic:Research(发表成果 · 网页)Anthropic:Newsroom(网页)
推荐理由:Anthropic 首次把一年内 832 个恶意账户的 AI 辅助攻击行为完整映射到 MITRE ATT&CK 框架,并给出风险评分工具,数据表明高风险攻击者半年内增长了七成,关键驱动力不是技术高低而是编排与自主执行,威胁情报团队应该马上拿来校准自己的检测规则。
6月2日
23:13
OpenAI:官网动态(RSS · 排除企业/客户案例)
38
Travelers借助OpenAI在全国部署AI理赔助手

美国保险公司Travelers与OpenAI合作,构建了一款AI驱动的Claim Assistant。该工具旨在引导客户完成理赔流程,并提供全天候支持,以在业务高峰期扩展运营规模。

智能体OpenAI行业动态语音
22:40
Hugging Face:Blog(RSS)
精选73
Holo3.1:快速本地计算机使用智能体

Holo3.1 是基于 Qwen 模型家族的计算机使用智能体系列,旨在提升在桌面、网页和移动环境中的鲁棒性。新模型提供 0.8B、4B、9B 和 35B-A3B 四种尺寸,并首次发布量化检查点,包括 FP8、Q4 GGUF 和 NVFP4,以优化本地推理。在 AndroidWorld 基准测试中,35B-A3B 模型得分从 67% 提升至 79.3%。在 DGX Spark 上,NVFP4 量化相比 BF16 实现 1.74 倍 token 吞吐量提升,并将平均步骤时间从 6.8 秒缩短至 3.3 秒。模型支持函数调用协议,可在第三方智能体框架中部署。

智能体Hugging Face开源/仓库模型发布

推荐理由:Holo3.1 把计算机使用代理从桌面扩展到了移动端,还首次放出了量化版,让本地运行真正快了起来。想做 GUI 自动化的开发者可以立刻跑起来了。
18:00
公众号:百度智能云(文心)
45
华硕商用电脑与百度智能云推出企业级AI解决方案"华硕×百度搭子DuMate"

华硕商用电脑与百度智能云在COMPUTEX 2026期间推出面向中国市场的企业级AI解决方案“华硕×百度搭子DuMate”。该方案采用端云混合推理架构:云端接入百度文心大模型及22+官方Skills,负责复杂检索与任务编排;端侧利用华硕商用AI PC本地算力,在32GB内存环境下可部署35B量级大语言模型及PaddleOCR-VL等多模态模型,支持敏感文件处理、批量OCR等离线运行,确保数据不出本机。方案具备沙箱隔离、权限授权、长期记忆等企业级能力,可实现邮件整理、PPT生成、合同审查等工作流自动化闭环,降低云端Token调用成本。

智能体产品更新端侧
12:19
OpenRouter:Announcements(RSS)
精选77
OpenRouter 5月发布亮点

OpenRouter 发布5月更新,推出语音与转录API、模型融合(Model Fusion)功能,并为平台添加了私有模型和企业工作区管控能力。此次更新共上线20个新模型,其中包括 Gemini 3.5 Flash 和 Claude Opus 4.8。

智能体MCP/工具产品更新部署/工程

推荐理由:OpenRouter 五月交付了一整套平台级能力,从安全护栏到语音 API 再到模型融合,Pareto Code Router 按质量阈值选廉价模型这个思路,对 coding agent 的成本控制很实用。如果你重度依赖 OpenRouter,这次更新值得细读。
07:14
Cursor Blog
精选64
Cursor Teams计划定价方案更新

Cursor Teams计划推出三项更新:增加Composer特定使用池,将第一方模型(Composer和Auto)与第三方API的使用额度分开计费;推出Premium席位,提供5倍于标准席位($40/月)的使用量,价格为$96/月(年付);仪表盘现可实时显示用户额度使用情况,管理员可通过Slack或邮件配置智能提醒。

智能体产品更新编码

推荐理由:Cursor这个定价更新把「用不用得起第三方模型」的问题从团队开支里切出去了,标准席位加量不加价,重度用户直接上Premium可能比现在更划算,做Agent开发的团队不妨算算账。
05:48
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选66
OpenAI前沿模型与Codex现可在AWS上使用

OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术,从而加速从评估到生产部署的过程。

智能体OpenAI产品更新编码
关联讨论 3 条X:Testing Catalog (@testingcatalog)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)
推荐理由:这不是模型发布,而是渠道开闸,企业拿着现有 AWS 安全体系就能用上 GPT-5.5,合规部门终于不用再纠结。Codex 也直接嵌入开发流程,落地阻力小了一大截。
01:59
公众号:通义实验室(千问)
同事件精选64
Qwen3.7-Plus 多模态智能体模型发布

Qwen3.7-Plus 深度融合视觉与语言,实现“看、想、写、做、验”端到端闭环,在 12 项核心基准测试中表现提升。实测中,基于该模型的智能体连续运行超 11 小时,自动完成英语学习 APP 开发,生成代码超 10000 行、触发调用超 1000 次;复刻 macOS Stocks 应用并通过 10 项功能验证。支持图像/视频转 SVG、视觉驱动网页设计及浏览器自动化。已在阿里云百炼上线,提供 OpenAI 兼容 API 与 Anthropic 协议。

智能体多模态模型发布
同一事件,精选展示《Qwen3.7-Plus:多模态智能体模型发布》
推荐理由:Qwen3.7-Plus 把视觉智能体推到了‘能看、能想、能动手’的端到端闭环,从写代码到操作浏览器一条龙,做自动化 Agent 的团队可以直接拿来用。
01:37
Qwen:Blog Retrieval(API)
精选81
Qwen3.7-Plus:多模态智能体模型发布

阿里云通义千问推出 Qwen3.7-Plus,基于 Qwen3.7 文本骨干,增强视觉语言能力,保留编码、工具使用和生产工作流的智能体能力。它支持感知现实场景、读取并操作 GUI、从视觉参考编写代码、端到端导航手机应用、基于网络知识回答视觉问题,融合 GUI 与 CLI 交互,跨 Claude Code、OpenClaw、Qwen Code 等框架泛化。在 Terminal Bench 2.0-Terminus 得分 70.3,SWE-Verified 77.7,QwenWorldBench 62.1,GPQA Diamond 90.3,MMLU-Pro 88.5。通过阿里云 Model Studio API 提供。

智能体多模态模型发布
关联讨论 4 条IT之家(RSS)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:Kim (@kimmonismus)X:通义千问 / Qwen (@Alibaba_Qwen)
推荐理由:Qwen3.7-Plus 把视觉感知、GUI 操作和编码能力整合进同一个 agent 模型,在 ScreenSpot 和浏览器操作上的提升很实在,做自动化的开发者值得上手试试。
6月1日
22:38
Hugging Face:Blog(RSS)
精选60
超越LLM:为何可扩展的企业AI采用取决于智能体逻辑

可扩展的企业AI采用需超越大语言模型,依靠智能体逻辑来引导模型执行动态、长周期且受约束的企业工作流,从而提升质量、降低成本并建立信任。文中以IBM watsonx Code Assistant for Z为例,展示了智能体逻辑如何通过程序分析等技术,在理解大型遗留代码库时,相比纯LLM基线方法,能以约30倍更低的token消耗达到更优性能。在加速测试生成任务中,该方法亦能使代码覆盖度提升20%-45%,同时token消耗降低最高达15倍。

智能体推理现象/趋势部署/工程

推荐理由:不是又一篇炒作 agent 的文章,IBM 拿真实项目数据说清楚了‘agent logic’怎么让大模型在企业落地时既降本又增效。
18:21
公众号:腾讯混元
46
腾讯混元为《和平精英》推出AI明星队友「小田」

腾讯混元多模态数字人团队基于Hy3 preview模型和GameMate1.0框架,为《和平精英》推出代言人田曦薇形象的AI队友「小田」。该角色具备战局感知、独立决策能力,并实现对话情感化回应、动态策略推理与主动协同作战。基于大模型长文记忆,玩家可生成由Image3.0制作的专属图文记忆。该AI队友累计体验用户突破1.1亿,单日活跃峰值1770万,玩家麦克风开启率75%。

智能体产品更新多模态
09:23
公众号:MiniMax(稀宇科技)
65
MiniMax M3 发布:1M 上下文、原生多模态、前沿编程与 Agent 能力

MiniMax M3 今日发布,采用自研 MSA 稀疏注意力架构,支持 1M 上下文窗口,100 万上下文下每 token 计算量仅为上代 1/20,prefilling 加速超 9 倍,decoding 加速超 15 倍。它是原生多模态模型,支持图片、视频输入及 Computer Use。Coding 与 Agent 能力在 SWE-Bench Pro(59.0%)、Terminal Bench 2.1(66.0%)等基准达到前沿水平。M3 是国内首个同时具备 1M 上下文、原生多模态、前沿编程与 Agent 能力的开源模型。API 已开放,按上下文分两档计价,上线首 7 天 512k 及以下 5 折。同步推出 MiniMax Code Agent 与 Token Plan 订阅(¥49/月起)。预计 10 天内发布技术报告并开源模型权重。

智能体多模态推理模型发布
关联讨论 12 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
08:00
OpenRouter:Announcements(RSS)
同事件精选77
OpenRouter 五月发布亮点:语音API、模型融合、企业控制及20个新模型上架

OpenRouter 推出语音与转录 API、模型融合(Model Fusion)、私有模型部署和企业级工作空间控制功能。平台同时新增 20 个模型,其中包括 Gemini 3.5 Flash 和 Claude Opus 4.8。语音 API 支持实时语音识别与合成,模型融合允许用户组合多个模型的输出结果。企业工作空间提供更细粒度的权限管理与审计日志。

智能体产品更新部署/工程
同一事件,精选展示《OpenRouter 5月发布亮点》
推荐理由:OpenRouter五月更新不只是加模型,护栏、语音、模型融合全打包成API,开发团队读完就能用。月流量破百亿token还拿了1.13亿融资,平台稳定性会更强。
08:00
OpenRouter:Announcements(RSS)
同事件精选71
OpenRouter 5月发布亮点:语音与转录API、模型融合及20款新模型

OpenRouter 发布5月更新,推出语音与转录API、模型融合功能、私有模型支持和企业工作区控制,并新增20款模型,包括Gemini 3.5 Flash和Claude Opus 4.8。

智能体产品更新部署/工程
同一事件,精选展示《OpenRouter 5月发布亮点》
推荐理由:OpenRouter 这次月度发布把安全护栏、多模型融合和语音 API 全补上了,Model Fusion 和 Pareto Code Router 对做 agent 的团队尤其实用,成本控制与质量权衡变得更直接。
5月30日
10:42
Claude Code:GitHub Releases(RSS)
49
v2.1.158

Claude Code 发布 v2.1.158 更新,将 Auto mode 的可用范围扩展至 Bedrock、Vertex 和 Foundry 平台,支持 Claude Opus 4.7 和 Opus 4.8 模型。用户可通过设置环境变量 CLAUDE_CODE_ENABLE_AUTO_MODE=1 来启用该功能。

智能体Anthropic产品更新
07:19
OpenRouter:Announcements(RSS)
精选69
Guardrails:保护你的智能体、数据与成本

Guardrails 是一套可配置的安全与治理工具,提供预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失预防等功能,旨在保护智能体(Agents)、数据与控制成本。

智能体产品更新安全/对齐部署/工程
关联讨论 1 条X:OpenRouter (@OpenRouter)
推荐理由:OpenRouter 把预算管控、注入防御和敏感信息脱敏打包成一套 guardrail 配置,让投喂给 Agent 的流量有了护栏,用 OpenRouter 做生产级应用的团队可以立刻用上,不用自己搞中间件。
04:42
Claude Code:GitHub Releases(RSS)
精选67
v2.1.157 更新

此版本主要改进了插件系统,现可自动加载 .claude/skills 目录中的插件,并通过 claude plugin init 创建;/plugin 命令增加了自动补全。claude agents 现在会应用 settings.json 中的 agent 字段,并支持 --agent 参数覆盖。更新修复了多个具体问题,包括处理不可用图片导致的崩溃、在 tmux 中的剪贴板复制失效(2.1.153 回归)、后台会话恢复后日期不正确等。此外,优化了长对话及恢复对话的性能,并改进了在 VS Code、Cursor 和 Windsurf 等 IDE 中的体验。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude Code 这个版本把插件从市场限制中解放出来,自动加载本地 skills 目录,对喜欢自己鼓捣定制工作流的开发者是个实实在在的便利。
02:00
OpenRouter:Announcements(RSS)
精选77
OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7

一组预算模型通过OpenRouter平台进行模型融合,在包含100个复杂研究任务的评估中,得分超过了GPT-5.5与Claude Opus 4.7。

智能体产品更新推理搜索
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:OpenRouter 的 Fusion 功能把模型融合做成了 API 调用,实测用便宜模型组合就能逼近 Fable 5 的性能,成本却只有一半,这对做复杂推理和深度研究的开发者来说是个很实用的新工具。
00:33
Tomer Tunguz 博客(VC 分析)
精选65
技能提炼

“技能提炼”是一种知识转移方法,由前沿大模型(如 Opus 4.7、GPT-5.1、Gemini 3 Pro)负责撰写并优化标准化的 SKILL.md 流程文件。然后,本地运行的小模型(如 Qwen 35B、Gemma 26B)直接执行这些文件。此过程不同于压缩模型权重的知识蒸馏、训练权重的指令微调或检索事实的 RAG,其核心是提取并转移操作流程,让小模型按步骤执行,从而形成前沿模型作教师、小模型作执行者的循环。

智能体MCP/工具大佬观点

推荐理由:Tomer 把个人代理的完整工作流摆了出来,用大模型写 skill 小模型执行,这条蒸馏思路比调 prompt 高级,想认真跑本地代理的人该盯一下。
5月29日
20:00
OpenRouter:Announcements(RSS)
同事件精选73
OpenRouter 推出 Guardrails:保护你的 AI 智能体、数据与成本

OpenRouter 发布 Guardrails 可配置安全与治理工具,支持预算执行、零数据保留、模型和提供商限制、提示词注入防御以及数据丢失防护,帮助用户保护 AI 智能体、数据与成本。

智能体产品更新安全/对齐
同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》
推荐理由:OpenRouter 的 Guardrails 把预算、隐私、模型白名单和 prompt 注入检测打包成傻瓜式配置,做 agent 的团队终于不用自己拼积木了,生产环境多一层放心。
20:00
OpenRouter:Announcements(RSS)
同事件精选70
OpenRouter Guardrails 发布:可配置安全与治理工具,保护 AI 智能体、数据与成本

OpenRouter 推出 Guardrails,一套可配置的安全与治理工具,支持预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失防护等策略,用于保护 AI 智能体、数据和成本。

智能体产品更新安全/对齐
同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》
推荐理由:OpenRouter 这波补上了 API 代理的安全短板,提示注入防御和 DLP 直接堵住了企业用户最担心的两个口子,配置方式也足够灵活,做 agent 的团队值得立刻上。
08:02
公众号:阶跃星辰(Step)
同事件精选61
阶跃发布 Step 3.7 Flash,面向生产级 Agent 的高效率 Flash 模型

阶跃星辰发布并开源 Step 3.7 Flash,采用稀疏 MoE 架构(总参数 196B+1.8B,激活 11B),最高生成速度 400 Tokens/s。围绕原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排、Agent 生态兼容优化四大能力优化。在 Toolathlon 达 49.5%,ClawEval-1.1 达 67.1%,GDPval 达 45.8%,τ²-bench Telecom 通过率超 98%。兼容 Claude Code、KiloCode 等主流架构及 MCP/Skills 协议,支持云端与本地部署,已在 Kilo Code 等生态中完成接入验证。

智能体MCP/工具多模态开源生态
同一事件,精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI--Step 3.7 Flash》
推荐理由:Step 3.7 Flash 用激活仅 11B 的 MoE 架构把 Agent 工作流稳定性做透了,兼容主流框架还开源,对需要低延迟、高可靠性的生产环境 Agent 是真正可用的选择。
07:46
OpenAI:官网动态(RSS · 排除企业/客户案例)
36
Endava如何借助Codex构建智能体驱动的组织

Endava通过应用AI工具Codex,成功构建了智能体驱动的组织模式,显著加速了软件交付流程。其核心成果体现在需求分析环节,耗时由数周大幅缩短至数小时。

智能体OpenAI编码行业动态
05:12
Google Research:Blog(网页)
精选79
创新时代:Google Research 在 I/O 2026

Google Research 在 I/O 2026 大会上展示了其在多个前沿领域的技术进展,包括应用AI、基础机器学习算法以及量子AI等。本次大会的核心主题是展示其在将科学发现与研究成果转化为现实世界影响方面的持续努力。

智能体Google推理论文/研究
关联讨论 1 条Google Blog:AI(RSS)
推荐理由:Google 把研究成果直接发 Nature,ERA 和 Co-Scientist 这套工具让 AI 从写诗进化到做实验,健康 AI 的临床验证数据也很扎实,搞科研的可以蹲一下访问资格。
02:39
Claude Code:GitHub Releases(RSS)
同事件精选73
Claude Code v2.1.154 发布:新增 Opus 4.8 与动态工作流

Claude Code 更新至 v2.1.154 版本,正式引入 Opus 4.8 模型。新功能包括“动态工作流”,可通过 /workflows 指令让 Claude 在后台编排数十到数百个 AI 智能体协同处理复杂任务。Opus 4.8 的快速模式现已可用,成本降低为 2 倍标准费率可实现 2.5 倍速度提升。其他更新有:精简系统提示词成为默认设置(除 Haiku、Sonnet 及 Opus 4.7 及更早版本外),优化多选题决策逻辑,简化 /simplify 命令。此次更新修复了包括后台会话管理、终端渲染在内的多个 bug,并增强了自动模式对数据外泄的检测能力。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《在Claude Code中引入动态工作流》
推荐理由:Claude Code 这版把多 agent 编排做成了产品功能,动态工作流让一个 prompt 能调度上百个 agent,再加上 Opus 4.8 快速模式只要 2 倍价格,做复杂任务的开发者可以试一下。
01:21
Claude:Blog(网页)
精选78
在Claude Code中引入动态工作流

Claude Code 推出“动态工作流”功能,使 Claude 能端到端处理复杂任务。该功能通过动态编写脚本,在单个会话中并行运行数十到数百个子智能体来完成工作,并会在结果呈现前进行验证。它适用于跨代码库的 bug 查找、大规模迁移(如将 Bun 从 Zig 移植到 Rust)等需要多角度分析的任务。该功能现已在研究预览阶段可用,支持 Claude Code CLI、桌面端、VS Code 扩展以及 API、Amazon Bedrock、Vertex AI 等平台,面向 Max、Team 及已启用的 Enterprise 计划用户。

智能体Anthropic产品更新编码
关联讨论 4 条Claude Code:GitHub Releases(RSS)X:邵猛 (@shao__meng)X:Claude Devs (@ClaudeDevs)X:Thariq (@trq212)
推荐理由:动态工作流第一次让 Claude Code 能独立搞定需要并行协调的大规模工程任务,Bun 从 Zig 到 Rust 只用了十一天,这对复杂代码库的维护和迁移是降维打击。
01:05
Anthropic:Newsroom(网页)
精选85
Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级

Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用,价格与前代相同。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增“动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。早期测试者反馈其在智能体任务中的判断力更可靠、工具调用更高效。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5。此外,其诚实度与对齐表现也得到提升,代码错误漏检率降低了约 75%。

智能体Anthropic推理模型发布
关联讨论 16 条TechCrunch:AI(RSS)X:Claude Devs (@ClaudeDevs)X:Boris Cherny (@bcherny)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)X:洪明 (@hongming731)The Decoder:AI News(RSS)X:OpenRouter (@OpenRouter)X:Thariq (@trq212)X:Kim (@kimmonismus)X:Claude (@claudeai)X:Rohan Paul (@rohanpaul_ai)MarkTechPost(RSS)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)
推荐理由:Opus 4.8看着是常规升级,但动态工作流让Claude Code能啃下跨十万行代码迁移这种硬骨头,快速模式降价三倍更是直接拉低了实时场景的入场券。
00:33
Tomer Tunguz 博客(VC 分析)
精选61
AI智能体时代下的安全变革

Lemonade的CISO Jonathan Jaffe探讨了AI智能体时代的安全新挑战。他指出,AI对攻击者和防御者同样强大,但可被利用的漏洞窗口正在缩小,因为AI能更快地生成、审查和修补代码。为此,安全团队正向工程团队转型,例如Lemonade的安全部门均由工程师组成,并构建了包含智能体的内部AI平台。同时,每个智能体(单个终端上可能运行200到10000个)都需要被赋予身份,并在操作点由策略进行更复杂的管控,这超越了当前身份与访问管理系统的能力。

智能体MCP/工具大佬观点

推荐理由:Jaffe 给出的结论很提气,AI 对防御方的加成被市场严重低估了,尤其每个 Agent 必须拥有身份和策略控制这个预判,值得所有在做 Agent 架构的人看一遍。
5月28日
22:07
公众号:腾讯混元
58
Hy-Memory 发布:为 Openclaw 打造的记忆插件

腾讯混元推出 Hy-Memory,一款为 Openclaw 长期协作型 Agent 设计的记忆插件。它采用 6 层记忆框架、System1/System2 双系统及演化链技术,解决 Agent 长期使用中的记忆漂移与碎片化问题。在 LongMemEval 上得分 85.2,在偏好、时序推理、知识更新维度领先;PersonaMem 评测超越所有竞品。相比其他方案,记忆数量降低 70%+,单条信息密度高 45%+,token 消耗降低 35%,写入速度为 Graphiti 的 8 倍,支持本地嵌入式存储,安装仅需一行命令,提供 Lite/Pro/Ultra 三档。

智能体产品更新开源/仓库
22:04
公众号:小米 MiMo
58
Xiaomi MiMo Orbit 首批 Agent 生态共建合作伙伴公布
智能体开源生态行业动态
21:11
Cloudflare Blog
41
我们如何构建Cloudflare的数据平台及其上的AI智能体

Cloudflare构建了名为Town Lake的统一分析平台,并基于此开发了内部AI智能体Skipper。

智能体教程/实践数据/训练部署/工程
19:31
公众号:百度智能云(文心)
54
百度搭子DuMate发布:你的上班搭子,真干活

百度搭子DuMate是一款PC端办公AI智能体,能看见用户屏幕、操作软件、处理文件。零门槛安装,不需配置环境;本地优先处理,数据不出设备,复杂任务自动调度上云。支持Word/Excel/PPT输出,内置百度搜索、深度研究等Skills生态。用户下载后可通过邀请码分享好友,双方各得2000积分。

智能体MCP/工具产品更新端侧
18:47
Mistral AI:News(网页)
81
Vibe gets to work.

Mistral AI 推出 Vibe,一款统一工作与编码的 AI 智能体。其工作模式可处理长期多步骤任务,连接 Google Workspace、Outlook、Slack 等应用,进行研究、分析与调度。代码模式支持从 Web 应用到终端的全流程编码。Vibe 运行为推理、智能体任务和编码优化的旗舰 Mistral 模型,并发布了新的 VS Code 扩展。

智能体产品更新编码
18:47
Mistral AI:News(网页)
75
AI Now Summit 2026

Mistral AI 在 AI Now Summit 2026 上宣布多项进展。其工业 AI 解决方案“Mistral for Industrial Engineering”整合了物理模型与工程知识,正与空客、宝马集团和 ASML 合作,加速工程设计与优化。AI 智能体产品 Vibe 进行了升级,增强了推理和智能体任务能力。此外,公司计划在 2026 年第三季度启用位于 Les Ulis、功率达 10 MW 的新数据中心,专注推理操作以增强算力安全。

智能体行业动态
11:35
公众号:面壁智能(MiniCPM)
精选61
PilotDeck 开源:以 WorkSpace 为核心的智能体操作系统

清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9stars 联合研发并开源的智能体操作系统 PilotDeck,以 WorkSpace(工作舱)替代传统对话框,每个工作舱拥有独立文件系统、记忆和技能,实现项目隔离。三大核心能力:记忆白盒化,全链路可见可控,支持一键修改和回滚;智能路由,自动识别任务难度动态分配模型,开启后成本节省近 70%,复杂任务仅用 1/6 成本即可反超顶级模型方案;Always-on 常驻任务,AI 主动发现并持续推进工作。支持端云协同,可调用端侧模型作为子 Agent,自动部署 VoxCPM 等模型完成多语言播客等任务。

智能体产品更新端侧部署/工程

推荐理由:PilotDeck把Agent从对话框解放进「工作舱」,记忆可见、成本锐减、能无人值守运行。已开源,值得所有被多任务折磨的开发者试试。
07:07
Anthropic:Research(发表成果 · 网页)
精选69
社会科学中的编码智能体

一项针对1260名定量社会科学家的调查显示,虽然81%的受访者用过AI聊天机器人,但仅有20%将Claude Code、Codex等编码智能体常规应用于工作。采用率存在显著差异:以男性名字命名的研究者使用率是女性研究者的两倍;顶尖大学研究者可能性高出40%。用户产出更多工作论文和基金申请,但这可能反映早期采用者自身差异。研究者对AI助力撰写可发表论文更乐观,但对重塑整个社会科学领域持保留态度。这是一项初步调查,更深入研究仍在进行中。

智能体Anthropic数据/训练论文/研究

推荐理由:Anthropic 这份调查把编码代理在社科领域的真实渗透率摸清了,只有 20% 的研究者真在用,而且男女、校际差距比 AI 聊天工具大得多,做学术工具的可以认真看看。
‹ 上一页
1…34567…17
下一页 ›