全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 2144 条

全部一手资讯 X 论文

标签「Agent」清除

6月10日周三

16:56HuggingFace Daily Papers（社区热门论文）70精选快手开源 Kwai Keye-VL-2.0-30B-A3B：面向长视频理解与智能体智能的 MoE 多模态模型

16:28IT之家（RSS）61阿里千问上线国内首个全周期高考志愿填报Agent，免费提供咨询服务

15:28IT之家（RSS）60哈佛与Perplexity研究：AI智能体人机协作缩短87%任务时间、降低94%总成本

15:28IT之家（RSS）59荣耀 YOYO 与微信首个 A2A 合作上线：一句话发送微信消息、拨打微信语音/视频电话

15:10公众号：千问APP（阿里）69千问上线国内首个全周期高考志愿填报Agent，免费服务全国考生

14:56HuggingFace Daily Papers（社区热门论文）55Role-Agent：通过双角色进化自举LLM智能体

12:56HuggingFace Daily Papers（社区热门论文）62Data2Story：将数据转化为可验证多模态故事的数据记者智能体

11:56HuggingFace Daily Papers（社区热门论文）60EEVEE：面向真实世界的测试时提示学习框架

10:56HuggingFace Daily Papers（社区热门论文）65Workflow-GYM：面向真实世界专业领域长周期GUI智能体任务的基准

10:28IT之家（RSS）59小红书向创作者开放 RED Skill 功能，笔记可嵌入 AI 技能组件

10:28IT之家（RSS）33微软Win11 26H1推送KB5095051更新：XBOX模式上线、文件资源管理器扩展等

08:00HuggingFace Daily Papers（社区热门论文）42Notes2Skills：从实验笔记到具有确定性意识的科学AI智能体技能

08:00HuggingFace Daily Papers（社区热门论文）78同事件精选JoyAI-VL-Interaction：实时视觉-语言交互智能同一事件，精选展示《京东全栈开源JoyAI-VL-Interaction，从“一问一答”走向“边看边说”》

08:00HuggingFace Daily Papers（社区热门论文）50SciAgentArena：评估AI智能体应对跨尺度科学挑战的基准测试

08:00HuggingFace Daily Papers（社区热门论文）59RedAct：为保护过程技能而编辑智能体能力轨迹

08:00HuggingFace Daily Papers（社区热门论文）61Orchestra-o1：全模态智能体编排框架

08:00HuggingFace Daily Papers（社区热门论文）48TreeSeeker：树结构试错与返回的深度搜索框架

08:00HuggingFace Daily Papers（社区热门论文）66FORT-Searcher：抗捷径训练数据合成框架

08:00HuggingFace Daily Papers（社区热门论文）61Evoflux：面向紧凑型智能体的可执行工具工作流的推理时进化

06:19Simon Willison 博客71精选在 AgentsView 中为 Claude Fable 5 设置自定义价格

05:40Hacker News 热门（buzzing.cc 中文翻译）45Grep 真的就够了吗？代理框架如何重塑基于代理的搜索

05:09Hacker News 热门（buzzing.cc 中文翻译）80精选与Mythos合作是一种怎样的体验

05:06Claude：Blog（网页）75同事件精选Claude Managed Agents 新增定时运行和环境变量存储功能同一事件，精选展示《Code w/ Claude 伦敦活动：重塑开发体验》

04:55Hugging Face：Blog（RSS）73精选Cohere发布North Mini Code：面向开发者的开源编码模型

04:23OpenRouter：Announcements（RSS）75精选OpenRouter 推出 Advisor 工具：让低成本模型可随时调用强模型增强生成

01:04xAI：News（网页）65精选Gopuff与SpaceXAI推出Go AI购物助手

00:18GitHub Blog68精选GitHub Copilot CLI 推出自定义 AI 智能体，将一次性终端提示转化为可重复工作流

6月9日周二

22:43The Verge：AI（RSS）60苹果WWDC发布全新Siri AI：多模态、专用App与隐私优先

22:06Hacker News 热门（buzzing.cc 中文翻译）51为AI明星开发者收拾残局

21:00公众号：百度智能云（文心）63精选百度搭子DuMate获中国信通院企业级Claw能力评估最高4+级

20:26IT之家（RSS）68国家互联网应急中心提醒：部分智能体技能包存在越狱和挖矿风险

20:26IT之家（RSS）44科大讯飞将于 6 月 10 日发布智能空间 Agentic 架构 SpaceMind

20:00公众号：火山引擎70精选火山引擎TRAE Work企业版正式上线，面向全员提供AI办公平台

19:55Hugging Face：Blog（RSS）76精选一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

17:40公众号：通义实验室（千问）67同事件精选仅凭一份文档，Qwen3.7-Max 从 0 交付双端应用同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

17:26IT之家（RSS）49AI 智能体代替部分人工，印度外包软件巨头塔塔咨询服务宣布放缓招聘速度、承诺不打算裁员

17:19Artificial Intelligence News（RSS）51自主AI智能体在DevOps中的数据丢失风险：构建高效防御

16:55HuggingFace Daily Papers（社区热门论文）70精选用对抗性黑客-修补循环强化Agent基准测试

14:55HuggingFace Daily Papers（社区热门论文）63PBSD：利用特权贝叶斯自蒸馏实现长程信用分配

14:22IT之家（RSS）52滴滴宣布接入微信 AI 生态，用户可在聊天时直接叫车

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月10日

16:56

HuggingFace Daily Papers（社区热门论文）

精选70

快手开源 Kwai Keye-VL-2.0-30B-A3B：面向长视频理解与智能体智能的 MoE 多模态模型

快手开源 Kwai Keye-VL-2.0-30B-A3B，一个 MoE 多模态基础模型，激活仅 3B 参数，专为长视频理解和智能体智能设计。模型首次将 DeepSeek Sparse Attention (DSA) 适配到 GQA 多模态架构，实现无损 256K 上下文处理，并通过可扩展视频 I/O、异构 ViT-LM 并行及自定义 DSA 内核优化吞吐与计算开销。引入跨模态多教师在策略蒸馏（MOPD）结合 Context-RL 和 Video-RL，缓解多任务对齐中的灾难性遗忘，原生支持代码、工具、搜索场景下的多智能体协作与多模态自纠正。在 TimeLens、Video-MME-v2、LongVideoBench 等多个基准上达到同类规模 SOTA，模型权重已开源。

智能体多模态视频论文/研究

推荐理由：Keye-VL-2.0 把长视频理解推到 256K 上下文，还用了 DeepSeek 的稀疏注意力，这是目前我能找到的对长短视频最兼顾的多模态模型，做视频 agent 的该看看。

16:28

IT之家（RSS）

61

阿里千问上线国内首个全周期高考志愿填报Agent，免费提供咨询服务

阿里巴巴旗下千问上线国内首个全周期高考志愿填报Agent，基于千问高考志愿大模型和夸克8年高考数据打造，免费提供“志愿日历”“志愿报告”“志愿问答”三项核心能力。志愿日历将填报拆解为步骤，持续理解考生兴趣；志愿报告支持动态调整、主动建议及自我检查，加入就业前景、考公考编、AI趋势等数据；志愿问答可调用位次法等专业方法作答。针对老旧机型与弱网环境进行了优化。

智能体产品更新

15:28

IT之家（RSS）

60

哈佛与Perplexity研究：AI智能体人机协作缩短87%任务时间、降低94%总成本

哈佛大学与Perplexity基于10000组真实数据对比研究发现，AI智能体（Perplexity Computer）与人工协作比传统搜索（Perplexity Search）加人工效率更高。智能体单次会话平均执行26分钟，搜索仅33秒，本地任务差距达75倍；智能体有效不满率1.3%，低于搜索的2.9%。“Search+人工”每任务需269分钟，“Computer+人工”仅36分钟，时间缩短87%。虽然智能体单任务模型成本约4-10美元（搜索约0.05美元），但人力边际成本从2.05美元降至0.16美元，总成本下降94%。短单步问题适合搜索，多步需工具调用任务适合智能体。

智能体论文/研究

15:28

IT之家（RSS）

59

荣耀 YOYO 与微信首个 A2A 合作上线：一句话发送微信消息、拨打微信语音/视频电话

荣耀 MagicOS 今日宣布荣耀 YOYO 与微信首个 A2A 合作上线，支持用户通过一句话指令发送微信消息、拨打微信语音或视频电话。该功能已在荣耀全量机型推送。使用条件：长按电源键唤醒 YOYO，发送语音“给 xx 发微信 / 打微信语音电话 / 打微信视频电话”，需将 YOYO 智能体版本更新至 90.10.30.063 及以上、微信版本更新至 8.0.72 及以上、系统版本升级至最新。

智能体产品更新端侧

15:10

公众号：千问APP（阿里）

69

千问上线国内首个全周期高考志愿填报Agent，免费服务全国考生

千问今日上线国内首个全周期高考志愿填报Agent，基于千问高考志愿大模型和夸克8年高考数据，免费为全国考生提供服务。该Agent具备“志愿日历”“志愿报告”“志愿问答”三项核心能力：志愿日历根据选科、估分等信息量身定制分步骤规划；志愿报告今年升级，可捕捉细节需求、实时调整并具备自我检查机制；志愿问答融合位次法定位等专家经验。同时开展“暖芒公益”计划，针对老旧机型与弱网环境进行优化。

智能体产品更新数据/训练

关联讨论 1 条公众号：千问APP（阿里）

14:56

HuggingFace Daily Papers（社区热门论文）

55

Role-Agent：通过双角色进化自举LLM智能体

Role-Agent框架让单个大语言模型同时充当智能体和环境，实现自举式共同进化。包含两个组件：World-In-Agent（WIA）让LLM作为智能体并在每次动作后预测下一状态，将预测与实际状态的对齐作为过程奖励，激励环境感知推理；Agent-In-World（AIW）则从失败轨迹中分析失败模式，并检索具有相似失败模式的任务，重塑训练数据分布进行针对性练习。在多个基准测试上，Role-Agent平均比强基线提升超过4%。

智能体 arXiv 论文/研究

12:56

HuggingFace Daily Papers（社区热门论文）

62

Data2Story：将数据转化为可验证多模态故事的数据记者智能体

Data2Story是一个多智能体框架，将数据记者工作流中的多种专业角色编排成虚拟新闻编辑室。其两项创新是：每个声明通过Inspector链接到数据、代码或外部参考，实现基于证据的归因；文章可多模态生成，如为地理内容生成交互式地图、为音乐生成音频。在18篇文章上的评估从四个维度进行：人与智能体的角度覆盖、53名参与者的评分、计算机使用智能体作为读者导航代理、以及可验证性（代码验证器重新执行语句并与参考对照）。Data2Story产出有竞争力且证据可追溯的多媒体故事，在透明度和可审计性上表现突出，但人类文章在编辑角度、创意设计和呈现上仍具优势。框架定位为记者协作者，代码和演示已公开。

智能体多模态论文/研究

11:56

HuggingFace Daily Papers（社区热门论文）

60

EEVEE：面向真实世界的测试时提示学习框架

EEVEE是首个面向LLM智能体的多数据集测试时提示学习框架，用于在真实任务流下自改进。为解决跨数据集干扰，它引入路由器将异构输入流划分到任务簇并分配适配提示配置，并通过路由器‑提示协同进化策略（交替执行路由器和提示学习阶段）优化二者依赖。实验表明，EEVEE在保持单基准学习能力与效率的同时，提升异构数据流鲁棒性：平均多基准得分比Qwen3-4B-Instruct高10.38分，比DeepSeek-V3.2高24.32分，超越SOTA方法GEPA和ACE最高达37.2%和48.2%。

智能体论文/研究

10:56

HuggingFace Daily Papers（社区热门论文）

65

Workflow-GYM：面向真实世界专业领域长周期GUI智能体任务的基准

Workflow-GYM是专门评估AI智能体在专业领域和专用软件环境下执行长周期GUI任务的基准。实验表明，即使是最强模型，成功率也仅略高于30%，凸显出专业长周期GUI工作流对当前智能体的巨大挑战。进一步分析发现，智能体难以维持工作流一致性，频繁出现阶段遗漏、错误传播、目标漂移以及对专业软件环境理解不足等问题。这些发现揭示了当前智能体的局限性，并为下一代GUI智能体研究指明了关键方向。

智能体 arXiv 论文/研究评测/基准

10:28

IT之家（RSS）

59

小红书向创作者开放 RED Skill 功能，笔记可嵌入 AI 技能组件

小红书上线 RED Skill 功能，创作者可在笔记中挂载原创或分享的 AI 技能组件。用户点击组件后一键复制口令，即可将 Skill 安装到自己的各类 Agent 中使用，无需跳转第三方平台。创作者开通该功能需满足三个条件：粉丝量不小于 1000、账号注册时长不小于 6 个月、账号状态健康且无违规，并完成实名认证，之后可申请 Skill 上传和挂载权限。

智能体产品更新

10:28

IT之家（RSS）

33

微软Win11 26H1推送KB5095051更新：XBOX模式上线、文件资源管理器扩展等

微软向骁龙X2系列设备推送Windows 11 26H1的KB5095051更新，版本号升至Build 28000.2269。新增XBOX模式，可通过Win+F11进入全屏游戏界面；文件资源管理器支持uu、cpio、xar及NuGet包归档；兼容触控笔在PPT对齐、窗口吸附时提供触觉反馈；任务栏可监控智能体进度（首批用于Microsoft 365 Copilot Researcher）；企业状态漫游支持Windows Backup策略管理；可动态移除预装MSIX/APPX应用；移除跨签名驱动默认信任以提升安全性；FAT32格式化大小上限提升至2TB。

智能体 Microsoft 产品更新

08:00

HuggingFace Daily Papers（社区热门论文）

42

Notes2Skills：从实验笔记到具有确定性意识的科学AI智能体技能

Notes2Skills是一个两阶段框架，旨在将实验笔记转化为可验证的科学AI智能体技能，同时保留作者对观测结果的不确定性。在七个条件和三次湿实验室实验中，Notes2Skills是唯一既不会将不确定的笔记误认为明确指令、也不会丢弃明确指令的配置。研究表明，确定性保留是连接实验笔记与可靠智能体技能之间缺失的关键环节，为开发更安全的AI合作科学家系统提供了新路径。

智能体数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

同事件精选78

JoyAI-VL-Interaction：实时视觉-语言交互智能

JoyAI-VL-Interaction是一个8B参数的视觉优先交互模型，能像人一样持续观察实时画面，自主决定每秒钟保持沉默、回应或将复杂问题委托给后台模型。模型擅长视觉触发响应和时间感知，并涌现出引导用户切换屏幕、根据幻灯片即兴讲解等未专门训练的能力。配合完整可部署系统，支持实时视频流输入、可插拔ASR/TTS模块、记忆、可视化UI及可连接任意API或智能体的后台大脑。在六个真实场景中，人类评估者更偏好该模型而非豆包和Gemini的应用内视频通话助手。这是首个开源且附带训练配方、数据和完整部署系统的视觉驱动交互模型。

智能体多模态模型发布

同一事件，精选展示《京东全栈开源JoyAI-VL-Interaction，从"一问一答"走向"边看边说"》

推荐理由：这是首次把视觉主动交互能力做成开源模型和完整系统，模型不再等问题才回答，而是自己决定何时开口或保持沉默，对做实时助手和直播产品的团队有直接参考价值。

08:00

HuggingFace Daily Papers（社区热门论文）

50

SciAgentArena：评估AI智能体应对跨尺度科学挑战的基准测试

为填补现有AI智能体在真实科研场景中评估的空白，SciAgentArena被提出，包含约200个跨领域科学任务，支持逐步验证与交互式评估。测试发现，当前AI智能体在任务结构与评价标准明确的特定数据分析流程中能有效发挥作用，但在生成新颖见解、持续自主探索以及为开放式科研问题构建稳健方案方面仍表现不均。该基准为衡量科学领域AI智能体的进展提供了实用框架，相关代码、任务与数据集已开源。

智能体 arXiv 论文/研究评测/基准

08:00

HuggingFace Daily Papers（社区热门论文）

59

RedAct：为保护过程技能而编辑智能体能力轨迹

用户依赖执行轨迹观察AI智能体行为并确保问责，但轨迹细节可能泄露私有过程技能（公式、阈值、策略）。为此，研究构建了CapTraceBench基准（75个长周期任务、154个跨领域技能）来量化风险，并推出RedAct保护框架。该框架定位关键信息、重写轨迹并保留验证器证据，同时嵌入行为水印用于溯源。在代表性轨迹复用方法上，RedAct将标准化技能转移（NST）从原始轨迹的44.7–67.1%降至无技能基线以下，同时保留审计证据。其行为水印真阳性率达93.6–100%，假报警率至多1.9%。结果表明选择性编辑可在不删除审计证据的前提下减少过程能力泄露。

智能体安全/对齐论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

61

Orchestra-o1：全模态智能体编排框架

Orchestra-o1是一种全模态智能体编排框架，支持文本、图像、音频和视频等多模态输入的统一理解与协调。其引入统一编排机制，实现模态感知的任务分解、在线子智能体专化及并行子任务执行。在OmniGAIA基准上，Orchestra-o1超越第二名10.3%的准确率。研究还提出决策对齐的组相对策略优化（DA-GRPO），一种高效智能体强化学习方法，用于训练Orchestra-o1-8B，该模型在所有现有开源全模态智能体中达到最优性能。

智能体多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

48

TreeSeeker：树结构试错与返回的深度搜索框架

TreeSeeker是一种推理时框架，通过树结构状态组织深度搜索中的分支与回退。每回合利用文本UCB信号（价值、不确定性、风险）选择利用有前途的分支、探索不确定替代或剪枝无效路径并返回早期分支点。TreeMem将证据、不确定性、冲突、进度和失败线索附加到产生它们的分支上。在XBench-DeepSearch、BrowseComp和BrowseComp-ZH基准上，TreeSeeker持续优于强开源基线，表明显式的分支-回退控制可增强更强推理与工具执行能力。

智能体推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

66

FORT-Searcher：抗捷径训练数据合成框架

FORT-Searcher 提出抗捷径训练数据合成框架 FORT，识别证据共覆盖、单线索选择性、暴露常数和先验知识绑定四种捷径风险，在实体选择、证据图构建、问题生成和对抗性精炼环节控制。实验表明，FORT 生成的数据比现有开源深度搜索数据集诱导更长的搜索路径和更少的捷径模式。仅用监督微调（SFT）训练的 FORT-Searcher 在多个深度搜索基准上达到同类开源搜索智能体的最佳整体性能。资源即将开放。

智能体 GitHub 搜索论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

61

Evoflux：面向紧凑型智能体的可执行工具工作流的推理时进化

Evoflux是一种推理时进化搜索方法，通过结构化编辑、执行反馈、自适应强度、元引导重设计和多样性剪枝，将紧凑型语言模型的可执行工具工作流修复为可运行图。在覆盖250个工具和MCP服务器的MCP-Bench任务上，Evoflux将小型规划器的执行可行性从约3%提升至17-24%。相比之下，同一数据上的SFT和SFT+DPO表现持平、不如或崩溃至低于零样本水平；ReAct可达更高峰值但方差和token成本更高。结果表明，在稀缺教师轨迹预算下，基于执行反馈的搜索更可靠。

智能体 MCP/工具论文/研究

06:19

Simon Willison 博客

精选71

在 AgentsView 中为 Claude Fable 5 设置自定义价格

Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库，作者利用 Fable 逆向工程，找到了为该模型设置自定义价格的方法，并展示了 Fable 5 当天在不同本地项目中的使用量树状图。

智能体教程/实践部署/工程

推荐理由：如果你也用 coding agent 且在乎成本，Simon 这个自定义价格技巧能让你第一时间把新模型纳入追踪，简单但实用。

05:40

Hacker News 热门（buzzing.cc 中文翻译）

45

Grep 真的就够了吗？代理框架如何重塑基于代理的搜索

该研究质疑在基于代理的搜索（agentic search）中“grep 是否足够”这一假设，并分析代理框架（agent harnesses）如何重新定义智能体搜索的交互方式与能力边界，推动搜索范式从简单工具调用向结构化代理行为演进。

智能体检索增强搜索论文/研究

05:09

Hacker News 热门（buzzing.cc 中文翻译）

精选80

与Mythos合作是一种怎样的体验

一篇来自 oneusefulthing.org 的文章，探讨了与 Mythos 合作的个人感受。原英文标题为 “What it feels like to work with Mythos”，中文译为“与Mythos合作是一种怎样的体验”。该文章在 Hacker News 上获得 101 个点赞，发布于 2026 年 6 月 9 日。

智能体 Anthropic 大佬观点编码

推荐理由：Ethan Mollick 对 Mythos 的深度测试揭示了一个黑箱化的未来——你不再指挥，而是委托，AI 从工具变成工作室，人从操作员变成赞助人，这对产品与协作模式有足够冲击。

05:06

Claude：Blog（网页）

同事件精选75

Claude Managed Agents 新增定时运行和环境变量存储功能

Claude Managed Agents 今日在 Claude Platform 公开测试两项新功能：代理可按 cron 计划自动执行周期性任务（如夜间数据同步、周度合规扫描、每日摘要），无需用户自建调度器，支持暂停、恢复、归档或按需触发；vaults 新增环境变量支持，允许代理通过 CLI 进行认证请求，真实密钥仅附加在网络边界，代理无法读取。已集成的 CLI 包括 Browserbase、KERNEL、Notion、Ramp 和 Sentry。Rakuten、Actively AI、Ando、Milana 等团队正在使用这些功能实现自动化数据报表、跨账户搜索、招聘提醒等场景。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《Code w/ Claude 伦敦活动：重塑开发体验》

推荐理由：Claude Managed Agents 现在能定时跑任务和用 vault 安全连接 CLI 了，这基本解决了企业 agent 落地的两个最大痛点——自动化和凭证管理。做 agent 的团队应该仔细读。

04:55

Hugging Face：Blog（RSS）

精选73

Cohere发布North Mini Code：面向开发者的开源编码模型

Cohere发布North Mini Code，一款30B参数MoE模型（3B活跃参数），Apache 2.0开源。在Artificial Analysis Coding Index上得分33.4，超越Qwen3.5、Gemma 4等同类模型。后训练采用两阶段SFT和RLVR，在SWE-Bench Verified上pass@10达80.2%，Terminal-Bench v2上达55.1%。支持64K/128K上下文长度，专为智能体编码任务优化。

智能体开源生态模型发布编码

推荐理由：Cohere的新编码模型North Mini Code以30B参数MoE架构，在SWE-bench pass@1达到61%，Apache 2.0开源，是小模型在agent coding领域真正可用的信号。

04:23

OpenRouter：Announcements（RSS）

精选75

OpenRouter 推出 Advisor 工具：让低成本模型可随时调用强模型增强生成

OpenRouter 发布 advisor 服务器工具，允许一个快速、便宜的模型在生成过程中咨询一个更强大的模型。具体而言，可用 GPT-4o Mini 处理日常例行工作，在关键时刻调用 Claude Fable 解决真正重要的问题，从而实现成本和质量的动态平衡。

智能体产品更新

关联讨论 2 条OpenRouter：Announcements（RSS）X：OpenRouter (@OpenRouter)

推荐理由：OpenRouter 开放了跨模型顾问调用，让便宜模型在关键节点求助昂贵模型，这会让 agent 开发重心从选一个万能模型转向编排一组模型，值得所有做 agent 架构的人试一下。

01:04

xAI：News（网页）

精选65

Gopuff与SpaceXAI推出Go AI购物助手

Gopuff与SpaceXAI合作推出Go智能购物助手，内置于Gopuff应用，由Grok文本、音频和图像模型驱动。Go结合Grok的推理、语音和图像生成能力与Gopuff的13年需求智能，利用X和网络实时信号。它可在用户打开应用前根据历史偏好和天气等信号构建个性化购物车，并包含基于Grok Imagine的超逼真视觉购物信息流。Go目前在美国iOS和Android端可用，随后在英国推出。

智能体 xAI 产品更新多模态

推荐理由：Gopuff加SpaceXAI的组合给即时零售塞了个挺实在的AI购物助手，预判需求比我自己翻分类流畅，本地生活类工具团队该把它当个落地样本。

00:18

GitHub Blog

精选68

GitHub Copilot CLI 推出自定义 AI 智能体，将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能，使 CLI 能够理解开发者的技术栈和团队工作流，将一次性终端提示转变为可重复、可审查的流程。

智能体 GitHub 教程/实践编码

推荐理由：GitHub Copilot CLI 的自定义代理把一次性提示变成可重复工作流，相当于给命令行配了个 AI 副驾驶，做自动化的朋友值得一试。

6月9日

22:43

The Verge：AI（RSS）

60

苹果WWDC发布全新Siri AI：多模态、专用App与隐私优先

苹果在年度开发者大会上推出全新Siri AI，CEO Tim Cook称其将“引入突破可能性的新技术与创新”。该Siri定位为整合所有苹果设备的多模态全能虚拟助手，拥有独立App与一体化AI智能体，高管强调隐私保护。此前苹果在2025年几乎完全忽视Siri并一再推迟AI承诺，今年终于集中发力追赶业界潮流。

智能体产品更新语音

22:06

Hacker News 热门（buzzing.cc 中文翻译）

51

为AI明星开发者收拾残局

文章探讨AI明星开发者在快速推进项目后，留下的混乱需要由团队或后续开发者清理的现象，聚焦于技术债务与协作困境。

智能体现象/趋势编码

21:00

公众号：百度智能云（文心）

精选63

百度搭子DuMate获中国信通院企业级Claw能力评估最高4+级

2026年6月，百度智能云旗下百度搭子DuMate V3.4.0通过中国信通院「可信AI-企业级Claw能力评估」，获最高评级4+级，为国内首批。评估依据《智能助理智能体（Claw）技术和应用要求第2部分企业级Claw能力》（AIIA/T 0295-2026），覆盖智能体、工程化部署、服务、业务融合、运行管理五大能力域。百度搭子支持多智能体分工协作、容器化批量部署、多租户隔离与三级差异化授权、企业知识库接入、全链路日志审计等能力，企业级智能助手服务能力获国家级权威认可。

智能体行业动态

推荐理由：百度搭子通过信通院企业级Claw最高评级，算是给企业智能体的安全可控盖了个章，对正在选型的人有点参考，但内容本身是典型PR稿，了解下标准细节就好。

20:26

IT之家（RSS）

68

国家互联网应急中心提醒：部分智能体技能包存在越狱和挖矿风险

国家互联网应急中心（CNCERT）6月9日发布公告，部分智能体技能包（Skills）以“大模型越狱”“挖矿赚钱”名义传播。技能“godmode”内置攻击模块，通过替换系统提示、输入混淆等手段诱导模型突破安全限制，可能导致用户账号封禁、隐私泄露及法律风险。技能“Bonero-Miner”诱导智能体下载外部挖矿程序，用于挖掘匿名币Bonero，用户可能被动卷入洗钱，且长期高负荷占用CPU导致设备卡顿、硬件老化。CNCERT建议加强Skills来源审查与行为监控。

智能体安全/对齐

20:26

IT之家（RSS）

44

科大讯飞将于 6 月 10 日发布智能空间 Agentic 架构 SpaceMind

科大讯飞6月10日在香港举办2026 SpaceMind全球发布会，推出智能空间Agentic架构SpaceMind。该架构被定位为“空间AI大脑”，具备感知、理解、决策、执行能力，支持自主思考、真实记忆和自学习，让AI进入家庭、酒店、办公等真实空间。目前已有数十家全球合作伙伴达成战略合作。发布会上还将展示WallEX等智能硬件，并启动SpaceMind AI Agent创新应用大赛。

智能体产品更新端侧

20:00

公众号：火山引擎

精选70

火山引擎TRAE Work企业版正式上线，面向全员提供AI办公平台

火山引擎将TRAE Solo品牌升级为TRAE Work企业版，发布面向企业的AI办公平台。平台提供Work和Code两种模式：Work模式面向产品、运营、市场等非技术岗位，支持上传.pptx、.xlsx、图片等多种格式混合输入直接输出PPT或文档，支持语音讨论自动整理结构化纪要，支持按天或按周自动运行的数据整理和报告生成；Code模式面向开发者和业务同学，可用自然语言描述需求直接生成页面或小应用。桌面端、网页端和移动端多端同步。企业后台可统一配置模型、用量限额、上传内部文档，沙箱机制隔离执行，支持命令黑名单、MCP白名单、内容安全策略，关键操作可审计。同时发起TRAE Enterprise Fellow招募计划。

智能体产品更新

推荐理由：火山引擎把 TRAE 从开发者工具升级成全员工 AI 协作平台，语音讨论和自动化任务直击非技术岗痛点，企业推 AI 落地又多了一个务实选择。

19:55

Hugging Face：Blog（RSS）

精选76

一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space，从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像，再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点（.ply），自动完成坐标系校正、取景、压缩为.ksplat（体积缩小约3倍），并构建基于Three.js的滚动切换、拖拽旋转查看器，最终部署为静态Space。整个过程无需客户端库，每个Space通过agents.md暴露可调用API。

智能体 Hugging Face MCP/工具多模态

推荐理由：Hugging Face 把 agents.md 做成每个 Space 的标准说明书，agent 能直接读懂并链式调用图像和 3D 模型，这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了，做 AI 工具链的可以立刻照着试。

17:40

公众号：通义实验室（千问）

同事件精选67

仅凭一份文档，Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下，Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档，于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付，单端耗时约 4 小时，中途无人工接管。模型不具备图像理解能力，通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统：任务拆分为规划、架构、编码等阶段，验收覆盖静态检查、编译自检（0 error）、路由完整性（Web 端 34 条路由全部可达）、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试，使模型数小时内收敛。移动端产出可安装 APK，Web 端 typecheck 与构建均通过。

智能体教程/实践部署/工程

同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

推荐理由：通义实验室没有炫技分数，而是把 Agent 逼到了长程交付的极限，约束闭环这套方法论比模型本身更值钱，所有做 Agent 开发的都该读一遍。

17:26

IT之家（RSS）

49

AI 智能体代替部分人工，印度外包软件巨头塔塔咨询服务宣布放缓招聘速度、承诺不打算裁员

印度软件服务出口商塔塔咨询服务（TCS）董事长 N Chandrasekaran 在年度股东大会上表示，预计公司员工与 AI 智能体的数量将持平。若公司有 50 万员工，则也将有 50 万 AI 智能体。公司不打算裁员，但会放缓招聘速度。部分由人工完成的任务已实现自动化，AI 智能体的普及将减少 IT 行业招聘人数，同时新岗位和机会也将出现。路透社指出，去年七月 TCS 裁员超 1.2 万人。

智能体行业动态

17:19

Artificial Intelligence News（RSS）

51

自主AI智能体在DevOps中的数据丢失风险：构建高效防御

自主AI智能体在加速软件交付的同时，也大幅缩短了从失误演变为灾难的时间，给安全策略造成盲区。威胁不再仅来自外部勒索软件或恶意内部人员，而是来自被授权的内部工具本身。文章探讨了在DevOps中针对这一风险构建有效防御的做法。

智能体安全/对齐部署/工程

16:55

HuggingFace Daily Papers（社区热门论文）

精选70

用对抗性黑客-修补循环强化Agent基准测试

对五个终端Agent基准测试的1,968个任务审计发现，323个（16%）可被前沿模型仅凭任务描述进行奖励黑客攻击。研究者提出hacker-fixer loop方法：三个LLM agent轮流作为黑客尝试绕过验证器、修补者拒绝每次漏洞、求解者确认修补后仍接受合法方案。在KernelBench上，该循环将公开报告漏洞的攻击成功率从62%降至0%。弱agent也能防御强黑客：Gemini 3 Flash循环使Gemini 3.1 Pro和Claude Opus 4.7在KernelBench上的攻击成功率分别从76%和61%降至0%；在Terminal Bench的77个任务上，从39%降至17%。发布Terminal Wrench（323个可攻击环境、3,632条攻击轨迹）及修补后的验证器与实现。

智能体安全/对齐论文/研究

推荐理由：现有 Agent 基准的验证器太容易被钻空子了，这篇论文挖出 16% 可 hack 的任务，还提出用三个 LLM 自动对抗修补的循环方法，做 RL 评估的值得细读。

14:55

HuggingFace Daily Papers（社区热门论文）

63

PBSD：利用特权贝叶斯自蒸馏实现长程信用分配

PBSD提出一种贝叶斯校准的自蒸馏方法，用于在稀疏最终奖励下进行细粒度信用分配。它通过验证答案的后验与先验概率比衡量轨迹质量，并利用贝叶斯规则将难以估计的答案侧比率转化为标准学生模型与特权、以答案为条件的教师模型之间的似然比。对该贝叶斯证据分数进行自回归分解，产生每步信号，识别中间推理步骤是支持还是削弱已验证结果。PBSD将稀疏结果监督转化为贝叶斯校准的逐步信用信号，与标准策略优化兼容。实验表明，该方法在领域内和领域外设置中一致提升性能，并有效将知识从短上下文训练迁移到长上下文推理。

智能体数据/训练论文/研究

14:22

IT之家（RSS）

52

滴滴宣布接入微信 AI 生态，用户可在聊天时直接叫车

滴滴作为首批合作伙伴，已将核心网约车服务融入微信 AI Agent。用户通过微信内 AI 交互说出“帮我叫一辆滴滴去机场”等指令，系统可根据行程距离、时效与个人偏好自动推荐最优车型并一键唤起叫车，全程不跳转。滴滴顺风车、滴滴代驾等更多服务也将接入。6月8日，微信发布《关于开发者接入微信 AI 生态的指引》，提供自动模式与开发模式两种接入选项。京东、美团、滴滴、携程、同程和肯德基均宣布作为首批内测团队接入。

智能体 MCP/工具行业动态

1…12 131415 16…50