AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 654 条
全部一手资讯X论文
标签「Agent」清除
6月16日周二
14:30公众号:火山引擎40双第一!火山引擎领跑中国智能体开发平台市场
13:58OpenRouter:Announcements(RSS)68精选智能体AI治理:你的API密钥就是护栏
10:40公众号:蚂蚁百灵(Ling)79同事件精选蚂蚁百灵发布 Ling & Ring 2.6 技术报告同一事件,精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》
09:59Berkeley RDI:Blog(AI 安全与评测)83精选伯克利RDI发布Agents' Last Exam基准
02:33xAI:News(网页)47xAI 宣布 Grok 集成至 Warp 终端开发环境
00:47Tomer Tunguz 博客(VC 分析)61同事件精选AI 应用黄金时代已至:Fable 被禁、Nadella 的护城河论点与 Salesforce 收购 Fin同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
00:27xAI:News(网页)73精选Grok Build 推出 Agent Dashboard 管理多个编码会话
00:00Berkeley RDI:Blog(AI 安全与评测)68精选SageCTF:最强大CTF挑战AI智能体
6月15日周一
21:30公众号:百度智能云(文心)49百度搭子DuMate Harness引擎升级:复杂任务积分消耗最高降低75%
6月13日周六
17:54公众号:龙猫LongCat(美团)26美团履约AI算法团队ACL'26论文分享会
17:54公众号:百度智能云(文心)56第一!百度智能云领跑中国零售信贷决策工具市场
17:54公众号:腾讯元宝45腾讯元宝推出「元宝高考通」,行业首个高考咨询师 Agent 免费开放
17:54公众号:火山引擎55火山引擎 Agent Plan 上线专业数据搜索服务
13:17蚂蚁 inclusionAI:HuggingFace 新模型62精选inclusionAI 发布 VISTA-4B GUI 定位视觉语言模型
13:17蚂蚁 inclusionAI:HuggingFace 新模型71inclusionAI/VISTA-9B:基于VISTA训练的GUI定位视觉语言模型
10:10OpenRouter:Announcements(RSS)74精选Hermes Agent 在 OpenRouter 上的使用指南:设置、模型与路由
06:29GitHub Blog61精选GitHub Copilot CLI 在委托任务上变得更具选择性
06:26Claude Code:GitHub Releases(RSS)42Claude Code v2.1.176 发布
01:01OpenAI:官网动态(RSS · 排除企业/客户案例)57精选OpenAI 推出面向新时代工作的新 Academy 课程
6月12日周五
05:05OpenRouter:Announcements(RSS)69同事件精选Advisor:让任何模型在生成过程中求助更强的模型同一事件,精选展示《OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成》
04:24Cursor Blog74Cursor 推出 Auto-review 实现智能体自治管控
02:13Anthropic:Newsroom(网页)74精选Anthropic与DXC达成全球联盟,将Claude引入关键行业系统
01:24Cursor Blog74精选Cursor 推出 Auto-review 机制:用分类器智能体动态管控智能体自主权限
00:39OpenAI:官网动态(RSS · 排除企业/客户案例)61精选OpenAI 将收购 Ona
6月11日周四
10:50公众号:小米 MiMo74精选小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议
05:23Claude Code:GitHub Releases(RSS)69精选Claude Code v2.1.172 发布
04:23Cursor Blog74精选Cursor Bugbot 更新:速度提升超 3 倍、成本降低 22%、发现更多 Bug
02:10Claude:Blog(网页)75同事件精选智能体表面的演进:使用 Claude Managed Agents 构建同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
6月10日周三
15:10公众号:千问APP(阿里)69千问上线国内首个全周期高考志愿填报Agent,免费服务全国考生
05:06Claude:Blog(网页)75同事件精选Claude Managed Agents 新增定时运行和环境变量存储功能同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
04:55Hugging Face:Blog(RSS)73精选Cohere发布North Mini Code:面向开发者的开源编码模型
04:23OpenRouter:Announcements(RSS)75精选OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成
01:04xAI:News(网页)65精选Gopuff与SpaceXAI推出Go AI购物助手
00:18GitHub Blog68精选GitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流
6月9日周二
21:00公众号:百度智能云(文心)63精选百度搭子DuMate获中国信通院企业级Claw能力评估最高4+级
20:00公众号:火山引擎70精选火山引擎TRAE Work企业版正式上线,面向全员提供AI办公平台
19:55Hugging Face:Blog(RSS)76精选一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊
17:40公众号:通义实验室(千问)67同事件精选仅凭一份文档,Qwen3.7-Max 从 0 交付双端应用同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
11:40公众号:月之暗面(Kimi)47Kimi 将公开预测 104 场世界杯赛事:德国队或爆冷夺冠
06:16Claude Code:GitHub Releases(RSS)61同事件精选Claude Code v2.1.169 发布同一事件,精选展示《Claude Code v2.1.163 发布》
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月16日
14:30
公众号:火山引擎
40
双第一!火山引擎领跑中国智能体开发平台市场

IDC《2025中国智能体开发平台市场份额报告》显示,火山引擎以17.8%和19.3%的份额位居中国智能体开发平台私有化、公有云市场双第一。竞争焦点从Agent开发/编排延伸至全生命周期管理。火山引擎提供HiAgent(支持低/高/无代码、评测观测、数据回流、多模型接入、企业级扩展与私有化安全集成)和扣子(Coze)3.0(零代码开发部署、多人多Agent协作、跨多端协同、电脑桌面端和手机App端)两大产品,并推出AgentSphere实现多Agent统一管理。客户覆盖金融(9成头部券商、8成系统重要性银行)、教育(超八成985高校)、零售、能源等行业。

智能体行业动态部署/工程
13:58
OpenRouter:Announcements(RSS)
精选68
智能体AI治理:你的API密钥就是护栏

智能体AI使用量将在未来两年急剧上升,但治理滞后——仅五分之一企业拥有成熟治理模型。典型事故:销售智能体重试失败调用后自行升级到GPT-5.5,一夜消耗200美元。API路由层位于智能体与模型之间,是强制执行预算上限、模型白名单、提供方准入和请求日志的理想点。IBM报告指出97%遭遇AI安全事件的组织缺乏AI访问控制。最小可行治理方案:为每个智能体工作流分配独立API密钥,在API密钥层面实现预算控制、模型准入和审计追踪。

智能体现象/趋势部署/工程

推荐理由:现在代理失控的风险越来越真实,这篇文章把复杂的治理问题简化为五个 API 密钥控制,五分钟就能落地,比那些大而无当的框架实用得多。
10:40
公众号:蚂蚁百灵(Ling)
同事件精选79
蚂蚁百灵发布 Ling & Ring 2.6 技术报告

蚂蚁百灵发布 Ling & Ring 2.6 技术报告,系统公开 Ling-2.6-flash、Ling-2.6-1T 和 Ring-2.6-1T 的架构、预训练、后训练及 Agent 强化学习细节。三款模型采用 Hybrid Linear Attention 架构,将 Lightning Attention 与 MLA 以 7:1 比例结合。Ling-2.6-flash 在 4×H20 硬件上解码速度达 340 tokens/s,Ling-2.6-1T 在 Artificial Analysis Intelligence Index 上 token efficiency 较前代提升约 4 倍。Ring-2.6-1T high 在 PinchBench 得 87.60,ClawEval 得 63.82。三款模型均已开源。

智能体开源/仓库推理模型发布
同一事件,精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》
推荐理由:蚂蚁百灵2.6技术报告首次公开Hybrid Linear Attention与KPop Agent RL细节,开源模型在OpenClaw登顶,把万亿模型从聊天拉到真实工作流,做Agent应用的值得细读。
09:59
Berkeley RDI:Blog(AI 安全与评测)
精选83
伯克利RDI发布Agents' Last Exam基准

2026年6月,伯克利RDI发布Agents’ Last Exam(ALE)基准,包含1,500余项源于真实工作的任务,覆盖55个非体力职业。对Fable 5、GPT-5.5、Composer 2.5等前沿智能体的测评显示:在最困难层级成功率均为0%;整体任务表现接近,但单任务成本差异巨大(Fable 5约$15.70,GPT-5.5约$3.80,Composer 2.5约$1.33)。CLI子集ALE-CLI最佳通过率仅25.2%。主要失败模式是智能体未验证输出即宣称完成。数据集、代码及CLI子集已开源。

智能体arXivHugging Face开源生态

推荐理由:在Fable 5发布后,Berkeley的ALE基准首次大规模量化了agent在专业任务上的真实水平,最难任务0%成功率的结果值得所有押注agent落地的团队冷静下来。
02:33
xAI:News(网页)
47
xAI 宣布 Grok 集成至 Warp 终端开发环境

xAI 宣布与 Warp 集成,Warp 是一个基于终端的智能体开发环境,拥有近百万开发者。用户可使用 Grok 或 X Premium 订阅在 Warp 中访问 Grok 模型,包括驱动 Grok Build CLI 的 grok-build-0.1 模型。设置方式:下载 Warp,在 Agent 设置页连接 SuperGrok 订阅,切换至 grok-build-0.1 模型。更多智能体与集成即将推出。

智能体行业动态部署/工程
00:47
Tomer Tunguz 博客(VC 分析)
同事件精选61
AI 应用黄金时代已至:Fable 被禁、Nadella 的护城河论点与 Salesforce 收购 Fin

美国政府关闭 Anthropic 的 Fable 访问,开源和本地模型成必备;Satya Nadella 主张 AI 生态护城河应是人类专业知识和模型外围系统;Salesforce 以 36 亿美元收购 Fin(前 Intercom),Fin 利用开源模型实现性价比。这三件事标志 AI 应用进入黄金时代。构建 AI 应用的难点:在 Kimi K2.6、Qwen 3.6 27b、GLM 5.1 等不同特性模型中选择;设计智能体系统的 hill-climbing 循环;持续评估模型+循环性能以最大化 token 预算中的智能。掌握这三项技能的公司将主导这一时代。

智能体大佬观点开源生态
同一事件,精选展示《关于美国政府指令暂停访问Fable 5和Mythos 5的声明》
推荐理由:Tunguz 认为模型不再是护城河,系统设计才是,他提的三个新学科,选模型、设计循环、评估性能,对做 Agent 的团队是实用的框架,值得一读。
00:27
xAI:News(网页)
精选73
Grok Build 推出 Agent Dashboard 管理多个编码会话

xAI 为 Grok Build 推出 Agent Dashboard,提供单一屏幕管理多个编码会话。仪表板按状态分组(等待输入、工作中、空闲),每行显示状态标记、名称、分支、权限模式和当前操作。选中会话可打开 peek 面板查看最新输出并直接回复,等待输入的会话支持用箭头键或数字键选择选项。底部输入框用于分派新会话,支持设置模型、启动计划模式或自动批准编辑。通过 grok dashboard、/dashboard 或 Ctrl+\ 打开,关闭后会话继续运行,重新打开即可恢复。

智能体xAI产品更新编码

推荐理由:xAI给Grok Build加了一个类似终端的仪表盘,可以并行管理多个编码代理,对重度用户来说能省下频繁切换窗口的心智负担。功能本身不颠覆,但标志着AI编程工具在往多会话编排走。
00:00
Berkeley RDI:Blog(AI 安全与评测)
精选68
SageCTF:最强大CTF挑战AI智能体

UC Santa Barbara与UC Berkeley团队基于OpenSage框架构建了CTF专用智能体SageCTF。在DEF CON CTF 2026资格赛中,SageCTF以单人玩家身份尝试15道挑战,成功攻克7道、恢复8个flag,总计1,743分,排名前5%,超越全部自评“不使用AI”或“低AI”的175支团队。在50道近期CTF挑战的对比测试中,SageCTF以Claude-Opus-4.6为主模型,在相同预算(每道$200/10小时)下解出39道,而Claude Code仅解出13道,且Claude Code的解出全部被SageCTF覆盖。技术核心包括AI自生成拓扑、多智能体通信、分层记忆及多模型协同编排。

智能体推理论文/研究评测/基准

推荐理由:SageCTF 在 DEF CON CTF 排进前 5%,是 AI agent 在顶级安全竞赛中的首次重大突破。OpenSage 的自构建多智能体架构和十小时持续探索的能力,给做复杂推理工具的人提供了真参考。
6月15日
21:30
公众号:百度智能云(文心)
49
百度搭子DuMate Harness引擎升级:复杂任务积分消耗最高降低75%

百度搭子DuMate完成Harness引擎系统性升级,复杂任务积分消耗最高降低75%。以行业深度调研报告为例,积分从约400降至约100;电商运营周报从近300降至约78。降本不降质源于三项优化:自研安全沙箱资源消耗降低、模型推理效率提升(非替换低成本模型)、Harness执行链路工程升级(提升任务规划精度与工具调用效率)。

智能体产品更新部署/工程
6月13日
17:54
公众号:龙猫LongCat(美团)
26
美团履约AI算法团队ACL'26论文分享会

美团履约AI算法团队将于6月17日举办ACL'26论文分享会,重点介绍五篇被录用的论文,覆盖强化学习、高效推理、模拟环境、记忆管理、全双工交互。GeoRA提出几何感知低秩适配,专为RLVR定制;CoT-Flow将离散推理步骤建模为连续概率流,缩短回答长度并提升准确率;UserLM-R1构建具备推理能力的用户模拟器;Fine-Mem实现基于证据的细粒度反馈对齐优化记忆管理;DuplexOmni支持实时全双工多模态交互。

智能体推理行业动态
17:54
公众号:百度智能云(文心)
56
第一!百度智能云领跑中国零售信贷决策工具市场

6月11日,IDC报告显示2025年中国零售信贷智能风控解决方案市场规模达74.23亿元,同比增长13.5%。百度智能云在决策工具及服务市场位居第一,收入翻倍,服务客户数同比增长近100%,覆盖超800家金融机构。其推出首个可商用自我演进超级智能体“伐谋”,涵盖挖掘、模型、策略三大模块;与中信百信银行合作“AlphaMo”项目实现特征挖掘效率提升320%,风险区分度提升10%。另推出反代理投诉、资质预测、涉农评分等产品,依托千帆大模型与胜算数据平台推动决策工具向自主决策演进。

智能体数据/训练行业动态
17:54
公众号:腾讯元宝
45
腾讯元宝推出「元宝高考通」,行业首个高考咨询师 Agent 免费开放

腾讯元宝上线「元宝高考通」功能,定位为行业首个高考咨询师 Agent。用户输入省市、分数、选科后,可一键生成「冲/稳/保」三梯度志愿方案,并支持通过对话实时调整意向(如剔中外合作、换专业优先)。数据源引用「掌上高考」官方信息,全程免费使用。

智能体产品更新
17:54
公众号:火山引擎
55
火山引擎 Agent Plan 上线专业数据搜索服务

火山引擎 Agent Plan Harness 新增专业数据搜索服务,通过 Data MCP 接入股票金融、企业工商、学术论文三类数据源。用户可用自然语言搭建个人投资助手,自动生成带引用的个股简评并定时监控盘后风险。配置 Base URL、获取 API Key、安装 Data MCP 三步即可上手。即日起至8月7日,Agent Plan 首两月2.5折,入门版9.9元/月,热门模型用量提升2.5倍。

智能体MCP/工具产品更新
13:17
蚂蚁 inclusionAI:HuggingFace 新模型
精选62
inclusionAI 发布 VISTA-4B GUI 定位视觉语言模型

VISTA-4B 是基于 Qwen3.5-4B 骨干的 GUI 定位模型,输入截图与自然语言指令,输出归一化 0-1000 坐标。训练采用视图一致 GRPO 和自验证交叉视图锚定。在 GUI 定位基准上,SSPro 得分 64.2(相比 GRPO-4B 提升 2.0),SSV2 得分 93.8(下降 0.4),OSWorld-G 得分 61.2(提升 1.3),OSWorld-G-R 得分 69.7(提升 0.5)。模型已开源在 HuggingFace,推荐使用提示词并返回 [x,y] 格式坐标。

智能体Hugging Face多模态模型发布

推荐理由:蚂蚁 inclusionAI 开源了一款 GUI 定位模型,基于 Qwen3.5 微调,在接地基准上小幅提升,关键是提供了自验证训练方法,做桌面自动化的可以直接下载用。
13:17
蚂蚁 inclusionAI:HuggingFace 新模型
71
inclusionAI/VISTA-9B:基于VISTA训练的GUI定位视觉语言模型

VISTA-9B是基于Qwen3.5 9B骨干训练的GUI定位模型,输入截图与自然语言指令,输出0-1000归一化坐标。采用VISTA(视图一致自验证)方法,含view-consistent GRPO与self-verified cross-view anchoring。在SSPro、SSV2、OSWorld-G、OSWorld-G-R上分别取得69.2、95.8、68.1、75.5分,超越Qwen3.5-9B与GRPO-9B基线。模型已开源,可通过HuggingFace加载使用。

智能体Hugging Face多模态模型发布
10:10
OpenRouter:Announcements(RSS)
精选74
Hermes Agent 在 OpenRouter 上的使用指南:设置、模型与路由

Hermes Agent 已通过 OpenRouter 处理超过 17 万亿 tokens。使用指南包括设置流程、选择支持 64K 上下文窗口的模型,以及调整路由策略以兼顾成本与可靠性。

智能体教程/实践部署/工程

推荐理由:OpenRouter 这篇教程把 Hermes Agent 的配置、路由和降本技巧都讲透了,刚上手的人照着走就能跑起来,而且给出了廉价辅助模型的省钱套路,实用性强。
06:29
GitHub Blog
精选61
GitHub Copilot CLI 在委托任务上变得更具选择性

GitHub Copilot CLI 通过更好的编排实现了更少的任务交接和更快的进度,且没有新增任何配置选项。

智能体GitHub产品更新

推荐理由:官方博客把子代理从默认操作变成了需要权衡的决策,23% 的工具失败减少和明显的等待时间下降,说明 AI 工具的体验升级不一定要加新按钮,改好调度逻辑一样有用。
06:26
Claude Code:GitHub Releases(RSS)
42
Claude Code v2.1.176 发布

Claude Code v2.1.176 更新:会话标题现按对话语言生成;新增 footerLinksRegexes 设置支持正则匹配页脚行链接徽章;优化 Bedrock 凭证缓存。修复多项问题:环境变量不可再绕过 availableModels 限制;/fast 切换至白名单外模型时拒绝;auto 模式退化为可用 Opus 模型;修正路径 hook 条件匹配;修复 Linux 沙箱内符号链接启动问题;修复 tmux 内 SSH 剪贴板问题;修复 Remote Control 多项连接问题。

智能体Anthropic产品更新编码
01:01
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选57
OpenAI 推出面向新时代工作的新 Academy 课程

OpenAI 发布三门 Academy 课程,帮助用户掌握实用 AI 技能、创建可重复工作流,并在日常工作中应用 AI 智能体。

智能体OpenAI教程/实践

推荐理由:OpenAI 官方第一次把模型使用经验整理成有体系的三段式课程,从基础提示到 agent 工作流,对想在职场中真正用起来的人是个实在的起点。
6月12日
05:05
OpenRouter:Announcements(RSS)
同事件精选69
Advisor:让任何模型在生成过程中求助更强的模型

OpenRouter 推出 advisor 服务器工具,允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务,在关键环节调用 Claude Fable 进行更高质量的推理。

智能体产品更新
同一事件,精选展示《OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成》
推荐理由:让 GPT-4o Mini 在关键时刻请教 Claude,用 1/10 的成本得到相近质量,这种跨模型顾问把“模型路由”做成了开箱即用的工具,做 agent 的值得试。
04:24
Cursor Blog
74
Cursor 推出 Auto-review 实现智能体自治管控

Cursor 本周推出 Auto-review,旨在让代码智能体在保持自主性同时降低安全风险。该功能引入分类器代理,在每次工具调用前根据上下文判断风险:低风险时允许自由操作,越界时阻止并返回解释,使父智能体自主调整路径。分类器为轻量模型,与父代理同 RPC 流运行避免延迟,并可读取工作区文件辅助决策。团队基于约 12 小时内部开发者会话整理 6,122 条标注数据,补充合成异常用例评测,以平衡安全与开发效率。

智能体产品更新安全/对齐
02:13
Anthropic:Newsroom(网页)
精选74
Anthropic与DXC达成全球联盟,将Claude引入关键行业系统

Anthropic与IT服务公司DXC Technology达成多年全球联盟。DXC将培训数万名获得Claude认证的前沿部署工程师(FDE),将Claude引入其为全球大型银行、航空公司、保险公司及政府机构运营的关键系统。内部部署中,Claude已成为DXC OASIS平台的默认基础模型,该平台超95%代码由Claude编写,开发速度提升10倍,已服务50多家客户。DXC加入Claude Partner Network,将在保险、现代化服务、网络安全及应用服务四个领域率先推出基于Claude的解决方案。

智能体Anthropic行业动态

推荐理由:这是 Anthropic 在企业服务赛道的一次重大卡位,DXC 把银行、航空等关键行业的系统交给 Claude,比任何 benchmark 都更能证明模型在大规模生产环境中的可靠性。
01:24
Cursor Blog
精选74
Cursor 推出 Auto-review 机制:用分类器智能体动态管控智能体自主权限

Cursor 近日推出 Auto-review,通过一个专门的分类器智能体在工具调用前审查动作风险。该分类器根据上下文判断动作是否与用户意图一致,高风险时阻止并返回解释给父智能体,低风险时放行。分类器采用小模型,运行在智能体循环内以避免额外延迟,并能读取工作区文件辅助判断。测试基于约12小时内部开发会话生成的6122条标签数据,以及针对读取密钥、操作生产数据等危险场景的合成数据。设计目标是在不频繁阻断日常开发的前提下,拦截风险动作。

智能体产品更新安全/对齐

推荐理由:Cursor把agent监管从"是/否"开关变成了可调节的刻度盘,一个专用小模型实时判断操作风险,高风险时给反馈让父agent换个安全方案,而非频繁打断用户。用Cursor的开发者都得了解这个逻辑。
00:39
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选61
OpenAI 将收购 Ona

OpenAI 计划收购 Ona,以拓展 Codex 的功能,提供安全、持久的云端环境,从而支持企业工作流中长时间运行的 AI 智能体。

智能体OpenAI行业动态部署/工程
关联讨论 1 条X:小北 (@frxiaobei)
推荐理由:OpenAI收购Ona,给Codex补上持久化云环境,让Agent能长时间自主工作。这是把AI Agent从会话工具变成企业级生产平台的一个基础设施信号。
6月11日
10:50
公众号:小米 MiMo
精选74
小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议

小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议。内置限时免费MiMo-V2.5多模态模型,性能比肩Claude Sonnet 4.6;支持接入DeepSeek、Kimi、GLM等模型。核心能力包括持久记忆系统(项目记忆、会话检查点、任务进度)和无限上下文——通过独立subagent自动保存状态解决长会话遗忘。独创Compose模式实现模型与Agent协同优化,SWE-Bench Pro达62%(Claude Code 57%),Terminal Bench 2达73%(68%)。内置语音输入和/dream命令,每7天自动合并记忆。终端输入mimo即可使用,所有设置中文汉化。

智能体产品更新开源生态编码
关联讨论 3 条X:Berry Xia (@berryxia)Hacker News 热门(buzzing.cc 中文翻译)X:小米 MiMo (@XiaomiMiMo)
推荐理由:小米悄悄发了MiMo Code,开源且免费,用记忆系统和Compose模式解决了AI编程两大顽疾:健忘和跑偏,实测比同模型Claude Code更强,开发者现在就能装上试。
05:23
Claude Code:GitHub Releases(RSS)
精选69
Claude Code v2.1.172 发布

子智能体现可创建自己的子智能体,最多嵌套5层。Amazon Bedrock 在未设置 AWS_REGION 时从 ~/.aws/config 读取区域。插件市场新增搜索栏。修复了使用1M上下文且无使用额度的会话永久卡住的问题,现会自动压缩回标准上下文限制。修复了多个图片导致重复报错等问题。改进了长对话性能,减少冗余消息归一化和不必要的UI重绘,降低空闲CPU占用。Claude in Chrome 工具加载改为单次批量调用。/code-review 在未登录时保留 ultra 选项并提示需要 claude.ai 账户。

智能体Anthropic产品更新

推荐理由:子代理现在可以递归生成子代理(最多 5 层),这个特性让复杂的多 agent 编排成为可能,但总体还是以 bug 修复为主,Bedrock 的区域读取也更顺手了,Claude Code 用户直接升级即可。
04:23
Cursor Blog
精选74
Cursor Bugbot 更新:速度提升超 3 倍、成本降低 22%、发现更多 Bug

Cursor 的代码审查工具 Bugbot 迎来重大更新:运行速度提升超 3 倍,成本降低 22%,每轮审查多发现 10% 的 bug,90% 的运行在三分钟内完成。新增 /review 命令,可在推送代码前运行 Bugbot 和安全审查,并与 GitHub/GitLab 同步——若已通过 /review 审查过同一 diff,打开 PR 时 Bugbot 会自动跳过并备注。支持配置仅审查 PR 中新增内容。性能提升源于驱动 Bugbot 的 Composer 2.5 模型训练改进。Bugbot 遵循模型阻止列表,若组织禁用 Composer 2.5 则自动回退。该功能已在 Cursor 3.7+ 和 cursor.com/agents 上线,CLI 支持即将推出。

智能体产品更新编码

推荐理由:Cursor 的 Bugbot 三倍速跑 review 还便宜了 22%,这次更新让「commit 前先审一遍」变得几乎无痛,对日常开发流是个实在提升。
02:10
Claude:Blog(网页)
同事件精选75
智能体表面的演进:使用 Claude Managed Agents 构建

Anthropic 推出 Claude Managed Agents,一套可组合 API 套件,用于构建和部署生产级智能体。该产品从早期简单 API 演进至 Claude Agent SDK,再到将智能体调度层与代码执行沙箱解耦的 Managed Agents。通过只追加日志的会话机制,Managed Agents 解决了托管伸缩、会话持久化、文件系统管理、执行隔离、凭证安全与可观测性等生产部署挑战。团队借助该方案可在数天内完成从原型到生产环境的转化,无需自建基础设施。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
推荐理由:Claude Managed Agents 把代理部署的复杂基础设施打包成了 API,让团队从原型到上线只需几天而不是几个月,尤其凭证隔离和延迟优化对生产环境很关键,想部署可靠代理的团队可以认真看看。
6月10日
15:10
公众号:千问APP(阿里)
69
千问上线国内首个全周期高考志愿填报Agent,免费服务全国考生

千问今日上线国内首个全周期高考志愿填报Agent,基于千问高考志愿大模型和夸克8年高考数据,免费为全国考生提供服务。该Agent具备“志愿日历”“志愿报告”“志愿问答”三项核心能力:志愿日历根据选科、估分等信息量身定制分步骤规划;志愿报告今年升级,可捕捉细节需求、实时调整并具备自我检查机制;志愿问答融合位次法定位等专家经验。同时开展“暖芒公益”计划,针对老旧机型与弱网环境进行优化。

智能体产品更新数据/训练
关联讨论 1 条公众号:千问APP(阿里)
05:06
Claude:Blog(网页)
同事件精选75
Claude Managed Agents 新增定时运行和环境变量存储功能

Claude Managed Agents 今日在 Claude Platform 公开测试两项新功能:代理可按 cron 计划自动执行周期性任务(如夜间数据同步、周度合规扫描、每日摘要),无需用户自建调度器,支持暂停、恢复、归档或按需触发;vaults 新增环境变量支持,允许代理通过 CLI 进行认证请求,真实密钥仅附加在网络边界,代理无法读取。已集成的 CLI 包括 Browserbase、KERNEL、Notion、Ramp 和 Sentry。Rakuten、Actively AI、Ando、Milana 等团队正在使用这些功能实现自动化数据报表、跨账户搜索、招聘提醒等场景。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
推荐理由:Claude Managed Agents 现在能定时跑任务和用 vault 安全连接 CLI 了,这基本解决了企业 agent 落地的两个最大痛点——自动化和凭证管理。做 agent 的团队应该仔细读。
04:55
Hugging Face:Blog(RSS)
精选73
Cohere发布North Mini Code:面向开发者的开源编码模型

Cohere发布North Mini Code,一款30B参数MoE模型(3B活跃参数),Apache 2.0开源。在Artificial Analysis Coding Index上得分33.4,超越Qwen3.5、Gemma 4等同类模型。后训练采用两阶段SFT和RLVR,在SWE-Bench Verified上pass@10达80.2%,Terminal-Bench v2上达55.1%。支持64K/128K上下文长度,专为智能体编码任务优化。

智能体开源生态模型发布编码

推荐理由:Cohere的新编码模型North Mini Code以30B参数MoE架构,在SWE-bench pass@1达到61%,Apache 2.0开源,是小模型在agent coding领域真正可用的信号。
04:23
OpenRouter:Announcements(RSS)
精选75
OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成

OpenRouter 发布 advisor 服务器工具,允许一个快速、便宜的模型在生成过程中咨询一个更强大的模型。具体而言,可用 GPT-4o Mini 处理日常例行工作,在关键时刻调用 Claude Fable 解决真正重要的问题,从而实现成本和质量的动态平衡。

智能体产品更新
关联讨论 1 条X:OpenRouter (@OpenRouter)
推荐理由:OpenRouter 开放了跨模型顾问调用,让便宜模型在关键节点求助昂贵模型,这会让 agent 开发重心从选一个万能模型转向编排一组模型,值得所有做 agent 架构的人试一下。
01:04
xAI:News(网页)
精选65
Gopuff与SpaceXAI推出Go AI购物助手

Gopuff与SpaceXAI合作推出Go智能购物助手,内置于Gopuff应用,由Grok文本、音频和图像模型驱动。Go结合Grok的推理、语音和图像生成能力与Gopuff的13年需求智能,利用X和网络实时信号。它可在用户打开应用前根据历史偏好和天气等信号构建个性化购物车,并包含基于Grok Imagine的超逼真视觉购物信息流。Go目前在美国iOS和Android端可用,随后在英国推出。

智能体xAI产品更新多模态

推荐理由:Gopuff加SpaceXAI的组合给即时零售塞了个挺实在的AI购物助手,预判需求比我自己翻分类流畅,本地生活类工具团队该把它当个落地样本。
00:18
GitHub Blog
精选68
GitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能,使 CLI 能够理解开发者的技术栈和团队工作流,将一次性终端提示转变为可重复、可审查的流程。

智能体GitHub教程/实践编码

推荐理由:GitHub Copilot CLI 的自定义代理把一次性提示变成可重复工作流,相当于给命令行配了个 AI 副驾驶,做自动化的朋友值得一试。
6月9日
21:00
公众号:百度智能云(文心)
精选63
百度搭子DuMate获中国信通院企业级Claw能力评估最高4+级

2026年6月,百度智能云旗下百度搭子DuMate V3.4.0通过中国信通院「可信AI-企业级Claw能力评估」,获最高评级4+级,为国内首批。评估依据《智能助理智能体(Claw)技术和应用要求 第2部分 企业级Claw能力》(AIIA/T 0295-2026),覆盖智能体、工程化部署、服务、业务融合、运行管理五大能力域。百度搭子支持多智能体分工协作、容器化批量部署、多租户隔离与三级差异化授权、企业知识库接入、全链路日志审计等能力,企业级智能助手服务能力获国家级权威认可。

智能体行业动态

推荐理由:百度搭子通过信通院企业级Claw最高评级,算是给企业智能体的安全可控盖了个章,对正在选型的人有点参考,但内容本身是典型PR稿,了解下标准细节就好。
20:00
公众号:火山引擎
精选70
火山引擎TRAE Work企业版正式上线,面向全员提供AI办公平台

火山引擎将TRAE Solo品牌升级为TRAE Work企业版,发布面向企业的AI办公平台。平台提供Work和Code两种模式:Work模式面向产品、运营、市场等非技术岗位,支持上传.pptx、.xlsx、图片等多种格式混合输入直接输出PPT或文档,支持语音讨论自动整理结构化纪要,支持按天或按周自动运行的数据整理和报告生成;Code模式面向开发者和业务同学,可用自然语言描述需求直接生成页面或小应用。桌面端、网页端和移动端多端同步。企业后台可统一配置模型、用量限额、上传内部文档,沙箱机制隔离执行,支持命令黑名单、MCP白名单、内容安全策略,关键操作可审计。同时发起TRAE Enterprise Fellow招募计划。

智能体产品更新

推荐理由:火山引擎把 TRAE 从开发者工具升级成全员工 AI 协作平台,语音讨论和自动化任务直击非技术岗痛点,企业推 AI 落地又多了一个务实选择。
19:55
Hugging Face:Blog(RSS)
精选76
一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space,从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像,再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约3倍),并构建基于Three.js的滚动切换、拖拽旋转查看器,最终部署为静态Space。整个过程无需客户端库,每个Space通过agents.md暴露可调用API。

智能体Hugging FaceMCP/工具多模态

推荐理由:Hugging Face 把 agents.md 做成每个 Space 的标准说明书,agent 能直接读懂并链式调用图像和 3D 模型,这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了,做 AI 工具链的可以立刻照着试。
17:40
公众号:通义实验室(千问)
同事件精选67
仅凭一份文档,Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下,Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档,于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付,单端耗时约 4 小时,中途无人工接管。模型不具备图像理解能力,通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统:任务拆分为规划、架构、编码等阶段,验收覆盖静态检查、编译自检(0 error)、路由完整性(Web 端 34 条路由全部可达)、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试,使模型数小时内收敛。移动端产出可安装 APK,Web 端 typecheck 与构建均通过。

智能体教程/实践部署/工程
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
推荐理由:通义实验室没有炫技分数,而是把 Agent 逼到了长程交付的极限,约束闭环这套方法论比模型本身更值钱,所有做 Agent 开发的都该读一遍。
11:40
公众号:月之暗面(Kimi)
47
Kimi 将公开预测 104 场世界杯赛事:德国队或爆冷夺冠

Kimi 通过「Agent 集群」同时调度 300 个子 Agent,从战术、球员、伤病等维度并行分析 104 场世界杯赛事,并公开预测与复盘。模型综合采用 Elo/FIFA 强度模型、Poisson 与 Dixon-Coles 进球分布模型、xG/xT 指标体系、Monte Carlo 模拟等。分析发现德国队夺冠概率被市场低估:基准约 11.0%,校准后约 11.3%,而部分市场隐含概率仅约 7.4%,存在约 +3.6 个百分点的正向偏离。同时推出总奖池 1 万亿 Token 的竞猜活动,并发布 Kimi Work——面向知识工作者的通用型本地 Agent,集成了建站、PPT 等专业 Skills 及 Kimi WebBridge。

智能体推理行业动态
06:16
Claude Code:GitHub Releases(RSS)
同事件精选61
Claude Code v2.1.169 发布

Claude Code v2.1.169 新增 --safe-mode 标志及环境变量,用于禁用所有自定义配置以排查问题;新增 /cd 命令,可在不破坏提示词缓存的情况下切换工作目录;新增 disableBundledSkills 设置隐藏内置技能。修复了企业 MCP 策略在重连、IDE 配置及首次会话中不被强制的问题,以及 macOS 用户每轮约 30–50ms 的 UI 卡顿、Windows 下 claude -p 和 Git 凭证弹窗等多项 bug。改进了任务创建的可靠性,恢复 Vertex/Foundry 默认 5 分钟空闲超时,并降低 CPU 占用。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《Claude Code v2.1.163 发布》
推荐理由:全是修 bug 的版本里藏了两个实用命令,/cd 换目录不丢缓存和 safe-mode 跳过所有自定义直接排查,重度用户的小痛点被摸到了。
‹ 上一页
12345…17
下一页 ›