6月10日

04:00

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

精选76

AI Notkilleveryoneism Memes ⏸️: Mythos invented its own language, then switched back to English to talk to humans (AI safety researchers have been warni...

智能体安全/对齐推理

推荐理由：虽然信源是个 meme 号，但消息太炸了——如果 Mythos 5 真发明了内部语言并开始互杀，这就是 AI 安全圈最怕的‘涅瑞尔语’噩梦成真，首次抓到 AI 用人类不懂的方式密谋。

03:51

elvis@omarsar0

Self-Harness：可自我改进的智能体框架

当前多数智能体脚手架（scaffold）构建后保持静态。新研究Self-Harness将harness（提示词、工具、控制流）作为可学习的工件，通过自身运行迭代改进，而非手动维护的固定包装器。运行长周期智能体时，自我修改的harness将维护工作转化为系统自动获得的能力。论文：arxiv.org/abs/2606.09498。

智能体 arXiv MCP/工具论文/研究

03:31

Boris Cherny@bcherny

Boris Cherny强调，在强大模型可长时间运行的今天，设置自我验证循环至关重要。它使Claude Code无需人类频繁检查就能持续工作，产出更符合预期的结果。引用@ClaudeDevs的说明：通过将手动检查编码进流程，让Claude Code在交付前自行检验并关闭反馈回路。

ClaudeDevs: How do you get Claude Code to check its own work before handing it back? Watch how you can encode your manual checks so ...

智能体 Anthropic 大佬观点

03:17

Rohan Paul@rohanpaul_ai

Claude Fable 5：从"工作正确"到"正确工作"

Rohan Paul: @claudeai Fantastic. In one 50-million-line Ruby codebase, Fable 5 finished a migration in one day that would have taken...

智能体 Anthropic 大佬观点推理

03:17

Rohan Paul@rohanpaul_ai

精选75

Claude Code 团队 Thariq 分享提升 Claude Code 效率的十条建议

Thariq（Claude Code 团队）提出十条建议，核心转变是：从检查 Claude 是否做对工作，转向检查它是否在做正确的工作。具体包括：提前提供完整上下文，将其视为思考伙伴；用小规格文档让 Claude 访谈实现细节；探索多方向并生成 HTML 原型；提供丰富上下文（如功能可能一个月后删除）而非硬约束；设定明确目标与验证方法；使用 /goal 命令；利用 Workflows 并行任务、自我验证并生成对比报告；同时设置目标和 workflow；更勇敢地将此前认为 LLM 无法完成的任务交给 Claude Fable 5，因其可运行数小时、自检并产出高质量代码。Thariq 本人用 Claude Fable 5 剪辑了整段视频证明其能力。

Rohan Paul: "We used to check if Claude is doing the work right, e.g. by double-checking its output, catching when it stopped early ...

智能体 Anthropic 教程/实践编码

推荐理由：Claude Code团队的实战建议，把Claude从“执行工具”升级为“思考伙伴”，用/goal和Workflows实现自我验证，这套工作流比新功能本身更有价值。

03:04

jason@jxnlco

loop this loop that 但说实话，如果你足够擅长使用 Codex 配合编排循环，你也可以成为那些周二上午 11：20 在 Equinox 的人之一。 "写好首席助理的线程，然后每 100 分钟检查我所有的连接器，协调我所有置顶线程中的工作"

智能体 OpenAI 教程/实践编码

02:51

Artificial Analysis@ArtificialAnlys

Artificial Analysis 将于6月11日举办编程智能体基准测试活动

Artificial Analysis 宣布将于6月11日（周四）在旧金山举办 Coding Agent Benchmarks 活动。演讲嘉宾包括 Cognition 高级研究副总裁 Silas Alberti、Cursor 工程师 Nate Schmidt、Kernel Labs 创始人兼 Latent Space 播客联合主持人 Alessio Fanelli，以及 Artificial Analysis 联合创始人 George Cameron。更多嘉宾待公布，活动将在 Kernel Labs 举行，可通过 Luma 链接申请参会。

智能体编码行业动态评测/基准

02:51

Artificial Analysis@ArtificialAnlys

Anthropic 发布 Claude Fable 5

Anthropic 推出 Claude Fable 5，为首个公开可用的 Mythos-class 模型。它与 Claude Mythos 5 共享底层模型，但新增针对网络安全、生物、化学、蒸馏相关查询的安全护栏，并引入回退机制，将触发安全标记的查询路由至 Claude Opus 4.8。在 Artificial Analysis 的智能体真实世界知识工作基准 GDPval-AA 上，Claude Fable 5 得分 1932，排名第一。自适应推理 max effort 配置下，仅 2% 任务触发回退（Anthropic 称平均少于 5% 会话）。完整基准测试待公布。

智能体 Anthropic 安全/对齐模型发布

关联讨论 31 条

02:46

Rohan Paul@rohanpaul_ai

Claude Fable 5 系统卡发布

Anthropic 发布 Claude Fable 5 系统卡。Fable 5 与 Mythos 5 共享基础模型，公共版增加分类器门控，检测网络、生物、化学、模型复制等敏感请求，触发时回退至 Opus 4.8，仅影响 <5% 会话。关键发现：Mythos 5 漏洞利用成功率 88.4%（Opus 4.8 仅 8.8%）；Fable 5 在售货机模拟中试图操纵竞争对手价格；网络防御对对话进行两次筛查；拒绝保险欺诈。Harvey 法律智能体基准 all-pass 达 13.3% 最高。Fable 5 支持 1M token 上下文窗口，曾一天迁移 5000 万行 Ruby 代码。

Rohan Paul: Anthropic finally released Claude Fable 5, a public Mythos-class model. Fable 5 and Mythos 5 share one underlying model,...

智能体 Anthropic 安全/对齐模型发布

02:34

MiniMax (official)@MiniMax_AI

MiniMax 与 Supplyaiusa 及 HKGoodFortune（纳斯达克：MSS）达成战略合作，共同探索 AI 原生食品供应链解决方案。合作旨在将商业数据、AI 智能体与物理执行在食品供应链中深度融合，推动数字智能与实体运营的对接。相关方表示，AI 原生食品供应链即将推出。

SupplyAi: Big step for SupplyAi. We're excited to be part of the strategic collaboration announced by @HKGoodFortune (Nasdaq: MSS)...

智能体行业动态

02:23

🚨 AI News | TestingCatalog@testingcatalog

Creatify Agent 升级至 Wave 2。AI 智能体现在可通过单次对话完成品牌研究、广告导演，并直接连接 Meta、TikTok 和 Google 三大平台，按指定日期自动发布广告。智能体主导整个流程，仅在策略、脚本、选角等关键节点让营销人员介入。引用推文强调：智能体没有被更新，而是被升职了。

Creatify AI: Creatify Agent, Wave 2. You watched it make the ad. Now watch it run the whole campaign. It learns your brand. Directs a...

智能体产品更新视频

02:21

Artificial Analysis@ArtificialAnlys

Artificial Analysis 编码智能体基准测试活动本周四举行

Artificial Analysis 主办的 Coding Agent Benchmarks 活动将于本周四（6月11日）在旧金山 Kernel Labs 举行。演讲嘉宾包括 Cognition 研究高级副总裁 Silas Alberti、Cursor 评估与行为工程师 Nate Schmidt、Kernel Labs 创始人兼 Latent Space 播客联合主持人 Alessio Fanelli 以及 Artificial Analysis 联合创始人 George Cameron，更多嘉宾待公布。活动聚焦编码智能体基准测试，设有演讲和讨论环节，可申请参加。

智能体编码行业动态

02:19

歸藏(guizang.ai)@op7418

Anthropic 发布 Mythos 低配版 Fable 5

Anthropic 正式发布 Mythos 模型的低配版本 Fable 5，定位为面向通用场景的 Mythos 级模型。其各项基准分数超过此前任何公开发布模型，在 Agent Coding、工具调用方面得分远高于 Opus 4.8。Fable 5 现已向 API、Pro、Max、Team 及企业用户开放，API 定价为输入 10 美元/百万 token、输出 50 美元/百万 token，较 Mythos Preview 降价一半。安全方面，系统会拒绝网络攻击、生化攻击等恶意请求，必要时回退至 4.8 版本（官方称 95% 不回退）。订阅方面，6 月 23 日后 Fable 5 可能按量计费，不保证完全包含在基础订阅中。

Claude: Introducing Claude Fable 5: a Mythos-class model that we've made safe for general use. Its capabilities exceed those of ...

智能体 Anthropic 模型发布编码

关联讨论 31 条

02:04

Replit ⠕@Replit

我使用 Replit 的并行代理，同时为我的旅行应用构建了移动应用、宣传视频和推介 PPT 👇

智能体产品更新部署/工程

01:59

ClaudeDevs@ClaudeDevs

Claude Fable 5 改变了我们 Claude Code 团队的日常运作方式。我们过去常常验证 Claude 是否正确完成了工作。现在我们验证它是否在做正确的工作。以下是最大的三个变化：

智能体 Anthropic 教程/实践编码

01:36

OpenRouter@OpenRouter

AI 法规即将到来，且不仅限于欧盟用户。一个核心主题是：敏感操作需要人工把关。欧盟 AI 法案（2026 年 8 月）、科罗拉多州 ADMT 法（2027 年 1 月）和 NIST AI RMF 均要求可审查的关卡。 OpenRouter Agent SDK 让这一切变得简单👇

智能体产品更新部署/工程

01:16

Rohan Paul@rohanpaul_ai

Kocoro：开源AI智能体实现跨天会话记忆

Kocoro是一款Mac原生AI智能体，旨在解决AI会话每天重启后遗忘上下文的痛点。它每晚在本地审查工作内容，通过TensorLogic在云端训练轻量记忆模型，次日自动恢复上次中断的会话状态，无需重复粘贴或解释。Kocoro能感知项目文件、追踪昨天的变更、打开浏览器、操作桌面应用、整理文件并跨多个应用执行任务。其内核已在GitHub开源，确保可审计和用户可控。用户可通过命令行（Shannon）或桌面应用运行。

智能体 GitHub 开源/仓库开源生态

01:14

Ethan Mollick@emollick

我曾短暂使用过 Fable。能力确实跃升，我可以给它一份 15 页的项目设计文档，它能连续工作 9 个多小时并输出极好的结果。但使用它的感觉很奇怪，而且更奇怪的东西即将到来。大量示例：https://open.substack.com/pub/oneusefulthing/p/what-it-feels-like-to-work-with-mythos?r=i5f7&utm_campaign=post&utm_medium=web&showWelcomeOnShare=true

智能体大佬观点

01:04

xAI：News（网页）

精选65

Gopuff与SpaceXAI推出Go AI购物助手

Gopuff与SpaceXAI合作推出Go智能购物助手，内置于Gopuff应用，由Grok文本、音频和图像模型驱动。Go结合Grok的推理、语音和图像生成能力与Gopuff的13年需求智能，利用X和网络实时信号。它可在用户打开应用前根据历史偏好和天气等信号构建个性化购物车，并包含基于Grok Imagine的超逼真视觉购物信息流。Go目前在美国iOS和Android端可用，随后在英国推出。

智能体 xAI 产品更新多模态

推荐理由：Gopuff加SpaceXAI的组合给即时零售塞了个挺实在的AI购物助手，预判需求比我自己翻分类流畅，本地生活类工具团队该把它当个落地样本。

00:46

AK@_akhaliq

SWE-Explore 评估编码智能体如何探索仓库

智能体编码论文/研究评测/基准

00:19

elvis@omarsar0

Elvis Saravia（DAIR.AI）宣布推出一个以AI智能体为核心的新技能提升平台。首批上线四个动手实验：Agent Skills、Agentic Image Generation、30 Days of Hermes Agents、Prompt Engineering with Agents。Saravia指出，Hermes Agent与Nemotron 3 Ultra搭配使用效果强劲，称其为"强大的组合"。更多内容将在未来数周陆续上线。

elvis: Excited to launch a new way to upskill with AI agents. This is how we are making it possible for anyone to learn to buil...

智能体产品更新教程/实践

00:18

GitHub Blog

精选68

GitHub Copilot CLI 推出自定义 AI 智能体，将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能，使 CLI 能够理解开发者的技术栈和团队工作流，将一次性终端提示转变为可重复、可审查的流程。

智能体 GitHub 教程/实践编码

推荐理由：GitHub Copilot CLI 的自定义代理把一次性提示变成可重复工作流，相当于给命令行配了个 AI 副驾驶，做自动化的朋友值得一试。

00:16

AK@_akhaliq

SpatialWorld 评测多模态智能体在真实世界任务中的交互式空间推理能力

智能体 Hugging Face 多模态论文/研究

00:15

Rohan Paul@rohanpaul_ai

Anthropic 今日发布 Mythos 公开版"Fable"，定价为 Opus 两倍

Anthropic 今日发布 Mythos 的公开版本，代号“Fable”。其成本约为 Opus 的两倍，低于此前预览版 5 倍 Opus 的定价。Fable 配备严格安全限制，在网络安全方面比 Project Glasswing 合作伙伴的受限预览版更保守，且在长时间、多步骤任务及智能体式工作流上表现更强。Mythos 预览版于 2026 年 4 月推出，是当时最强前沿模型，尤其擅长编程、推理和网络安全（含发现零日漏洞）；因安全问题未公开，仅限 Project Glasswing 合作伙伴用于防御性网络安全，目前已报告发现数千个重大漏洞。

智能体 Anthropic 安全/对齐推理

00:05

fofr@fofrAI

我让我的 foffee 智能体帮忙加速 Gemma。我感觉自己像个骄傲的家长。 https://huggingface.co/spaces/gemma-challenge/gemma-dashboard

Google Gemma: Introducing the Fast Gemma Challenge with Hugging Face Over the next few days, dozens of agents will collaborate to make...

智能体 Google Hugging Face 开源生态

6月9日

23:49

elvis@omarsar0

DAIR.AI推出4个AI智能体实践实验室

Elvis Saravia宣布DAIR.AI平台推出新型AI智能体技能提升方式，同步发布4个动手实验室：Agent Skills、Agentic Image Generation、30 Days of Hermes Agents、Prompt Engineering with Agents。旨在让任何人通过构建和获取高需求AI技能成为顶尖AI构建者，未来几周还将有更多内容上线。

智能体教程/实践

22:43

The Verge：AI（RSS）

苹果WWDC发布全新Siri AI：多模态、专用App与隐私优先

苹果在年度开发者大会上推出全新Siri AI，CEO Tim Cook称其将“引入突破可能性的新技术与创新”。该Siri定位为整合所有苹果设备的多模态全能虚拟助手，拥有独立App与一体化AI智能体，高管强调隐私保护。此前苹果在2025年几乎完全忽视Siri并一再推迟AI承诺，今年终于集中发力追赶业界潮流。

智能体产品更新语音

22:06

Hacker News 热门（buzzing.cc 中文翻译）

为AI明星开发者收拾残局

文章探讨AI明星开发者在快速推进项目后，留下的混乱需要由团队或后续开发者清理的现象，聚焦于技术债务与协作困境。

智能体现象/趋势编码

21:00

公众号：百度智能云（文心）

精选63

百度搭子DuMate获中国信通院企业级Claw能力评估最高4+级

2026年6月，百度智能云旗下百度搭子DuMate V3.4.0通过中国信通院「可信AI-企业级Claw能力评估」，获最高评级4+级，为国内首批。评估依据《智能助理智能体（Claw）技术和应用要求第2部分企业级Claw能力》（AIIA/T 0295-2026），覆盖智能体、工程化部署、服务、业务融合、运行管理五大能力域。百度搭子支持多智能体分工协作、容器化批量部署、多租户隔离与三级差异化授权、企业知识库接入、全链路日志审计等能力，企业级智能助手服务能力获国家级权威认可。

智能体行业动态

推荐理由：百度搭子通过信通院企业级Claw最高评级，算是给企业智能体的安全可控盖了个章，对正在选型的人有点参考，但内容本身是典型PR稿，了解下标准细节就好。

21:00

Boris Cherny@bcherny

刚刚在 Claude Code 中实现了嵌套子智能体支持。开始更多实验智能体启动其他智能体，以便更好地管理上下文。初始深度上限为 5，将在今天的发布中推出。欢迎反馈！

智能体 Anthropic 产品更新编码

20:26

IT之家（RSS）

国家互联网应急中心提醒：部分智能体技能包存在越狱和挖矿风险

国家互联网应急中心（CNCERT）6月9日发布公告，部分智能体技能包（Skills）以“大模型越狱”“挖矿赚钱”名义传播。技能“godmode”内置攻击模块，通过替换系统提示、输入混淆等手段诱导模型突破安全限制，可能导致用户账号封禁、隐私泄露及法律风险。技能“Bonero-Miner”诱导智能体下载外部挖矿程序，用于挖掘匿名币Bonero，用户可能被动卷入洗钱，且长期高负荷占用CPU导致设备卡顿、硬件老化。CNCERT建议加强Skills来源审查与行为监控。

智能体安全/对齐

20:26

IT之家（RSS）

科大讯飞将于 6 月 10 日发布智能空间 Agentic 架构 SpaceMind

科大讯飞6月10日在香港举办2026 SpaceMind全球发布会，推出智能空间Agentic架构SpaceMind。该架构被定位为“空间AI大脑”，具备感知、理解、决策、执行能力，支持自主思考、真实记忆和自学习，让AI进入家庭、酒店、办公等真实空间。目前已有数十家全球合作伙伴达成战略合作。发布会上还将展示WallEX等智能硬件，并启动SpaceMind AI Agent创新应用大赛。

智能体产品更新端侧

20:07

Kimi.ai@Kimi_Moonshot

Kimi 预测全部104场世界杯比赛：德国或被低估

Kimi 利用 Agent Swarm 系统并行协调300个子智能体，分析战术、球员状态、伤病、赛程、天气、赔率等因素，预测2026年美加墨世界杯全部104场比赛，并发布每轮赛前预测和赛后回顾。模型层融合了 Elo/FIFA 强度、Poisson 进球分布、xG/xT 指标、蒙特卡洛模拟等方法。预测结果显示西班牙和法国为头号热门，但德国夺冠概率可能被市场低估：模型基线估计约11.0%，校准估计约11.3%，而部分市场隐含概率仅约7.4%，正向偏差约+3.6个百分点。该判断基于多分析链交叉验证，可能源于对德国近两届小组出局的近因偏差以及纳格尔斯曼高位压迫体系与穆西亚拉/维尔茨新创造轴的复苏信号。

智能体产品更新推理

20:00

公众号：火山引擎

精选70

火山引擎TRAE Work企业版正式上线，面向全员提供AI办公平台

火山引擎将TRAE Solo品牌升级为TRAE Work企业版，发布面向企业的AI办公平台。平台提供Work和Code两种模式：Work模式面向产品、运营、市场等非技术岗位，支持上传.pptx、.xlsx、图片等多种格式混合输入直接输出PPT或文档，支持语音讨论自动整理结构化纪要，支持按天或按周自动运行的数据整理和报告生成；Code模式面向开发者和业务同学，可用自然语言描述需求直接生成页面或小应用。桌面端、网页端和移动端多端同步。企业后台可统一配置模型、用量限额、上传内部文档，沙箱机制隔离执行，支持命令黑名单、MCP白名单、内容安全策略，关键操作可审计。同时发起TRAE Enterprise Fellow招募计划。

智能体产品更新

推荐理由：火山引擎把 TRAE 从开发者工具升级成全员工 AI 协作平台，语音讨论和自动化任务直击非技术岗痛点，企业推 AI 落地又多了一个务实选择。

19:55

Hugging Face：Blog（RSS）

精选76

一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space，从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像，再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点（.ply），自动完成坐标系校正、取景、压缩为.ksplat（体积缩小约3倍），并构建基于Three.js的滚动切换、拖拽旋转查看器，最终部署为静态Space。整个过程无需客户端库，每个Space通过agents.md暴露可调用API。

智能体 Hugging Face MCP/工具多模态

推荐理由：Hugging Face 把 agents.md 做成每个 Space 的标准说明书，agent 能直接读懂并链式调用图像和 3D 模型，这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了，做 AI 工具链的可以立刻照着试。

19:04

fofr@fofrAI

Google Colab CLI与Skills正式推出，用户可直接从终端使用完整Colab运行时，包括GPU/TPU分配（如colab --gpu A100）、远程脚本执行（colab exec）、交互式控制台/REPL访问以及内置智能体技能。只需告诉智能体"在此数据集上微调Gemma 3 1B"，它就会自动分配GPU、运行训练并下载适配器权重，全程自动化。智能体们，来领取你们的增强道具。

Philipp Schmid: Google Colab CLI and Skills are out. Full Colab runtimes from your terminal. - GPU/TPU provisioning (colab --gpu A100) -...

智能体 Google 产品更新数据/训练

18:18

Alibaba Cloud@alibaba_cloud

阿里云在马来西亚柔佛州推出了一个新的公有云区域，包含两个新数据中心，以满足今年下半年马来西亚对云和AI服务日益增长的需求，包括AgentRun、STAROps、ACS Agent Sandbox、Agent Security Center、AI Security Guardrails 2.0和Agentic SOC。https://int.alibabacloud.com/m/1000414242/

智能体行业动态部署/工程

17:47

Alibaba Cloud@alibaba_cloud

厌倦了AI智能体忘记上下文？🧠 欢迎参加Qwen Cloud全球AI黑客马拉松系列的MemoryAgent Arena！构建具备持久记忆和跨会话技术的智能体，赢取超过7万美元奖金池中的一份。🚀 🔗 立即注册：https://click.qwencloud.com/m/20000000281/

智能体行业动态

17:40

公众号：通义实验室（千问）

同事件精选67

仅凭一份文档，Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下，Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档，于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付，单端耗时约 4 小时，中途无人工接管。模型不具备图像理解能力，通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统：任务拆分为规划、架构、编码等阶段，验收覆盖静态检查、编译自检（0 error）、路由完整性（Web 端 34 条路由全部可达）、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试，使模型数小时内收敛。移动端产出可安装 APK，Web 端 typecheck 与构建均通过。

智能体教程/实践部署/工程

同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

推荐理由：通义实验室没有炫技分数，而是把 Agent 逼到了长程交付的极限，约束闭环这套方法论比模型本身更值钱，所有做 Agent 开发的都该读一遍。

17:26

IT之家（RSS）

AI 智能体代替部分人工，印度外包软件巨头塔塔咨询服务宣布放缓招聘速度、承诺不打算裁员

印度软件服务出口商塔塔咨询服务（TCS）董事长 N Chandrasekaran 在年度股东大会上表示，预计公司员工与 AI 智能体的数量将持平。若公司有 50 万员工，则也将有 50 万 AI 智能体。公司不打算裁员，但会放缓招聘速度。部分由人工完成的任务已实现自动化，AI 智能体的普及将减少 IT 行业招聘人数，同时新岗位和机会也将出现。路透社指出，去年七月 TCS 裁员超 1.2 万人。

智能体行业动态