6月14日

20:43

meng shao@shao__meng

Bloomberg纪录片揭秘Anthropic：坚持“安全优先”，拒绝国防部无护栏要求被拉黑；Claude Code团队6个月100%代码由AI编写，Cowork发布致单日2850亿美元软件股市值蒸发。Dario维持预判：AI 1–5年内消除约50%初级白领岗位，并给出10–25%文明崩溃概率。被限制模型Mythos发现数千高危漏洞。Anthropic支持对华芯片出口管制，呼吁发布前强制第三方测试。

Anthropic 安全/对齐现象/趋势编码

17:11

The Decoder：AI News（RSS）

AI编码智能体虽能定位正确文件，但常错过关键代码行，研究显示

AI编码智能体Claude Code和Codex能可靠找到正确文件，但漏掉其中大部分关键代码行。新的SWE-Explore基准首次将代码搜索与实际修复分开测试，证明缺乏足够上下文时，即使最佳修复方案也会失败。

智能体编码评测/基准

16:41

Rohan Paul@rohanpaul_ai

"学习编程在不久前显然还是正确的事情。但现在不是了。" ~ Sam Altman 谈在AI时代生存的技能

OpenAI 大佬观点编码

11:46

Peter Steinberger 🦞@steipete

收到一条PayPal验证短信，以为被黑客攻击了，结果只是codex在注册它需要的网络服务。

Anthropic MCP/工具现象/趋势编码

11:26

jason@jxnlco

在我的 agents.md 中新增了一些内容： "当你给我发送一张没有上下文的应用截图时，尽你所能弄清楚你想让我对它做什么，并更新你的应用截图分诊技能。"

智能体教程/实践编码

10:57

宝玉@dotey

Claude Design将合并至Desktop，Codex未来集成Plugin

模型能力是根本，Harness层相对容易补齐且无需过多垂直领域。Claude Design将很快合并至Claude Desktop。未来模型能力足够时，Codex会在Codex App以Plugin集成Codex Design。针对开源Open Design方案，若使用Claude Code的模型能否达到类似工程能力？这是该讨论中提出的问题。

赖叔 | LaiShu.ai: @dotey 模型能力与Harness是相辅相成的。宝玉这篇对这两个的解释太通透了。另外,宝玉怎么看开源的Open Design之类的?如果他用上了Claude Code的模型,是否也能达到类似的工程能力呢?

智能体 Anthropic OpenAI 大佬观点

07:57

宝玉@dotey

Claude Design 与 Claude Code 联动示例：设计变更自动改代码

宝玉分享了 Claude Design 与 Claude Code 联动的实际案例：在 Claude Design 上修改字幕编辑器 UI 设计稿后，导出 zip 并用 git diff 查看变更，然后通过一句提示让 Claude Code 参考设计目录变更自动修改 Swift 代码，全程只需手动同步设计文件。他解释为何 Codex 没有类似产品：Claude Design 依赖 Claude Opus 4.8 模型同时具备 UI/UX 设计和系统架构设计能力，能一次性交付可交互原型（含数据结构、状态管理、交互逻辑）；而 GPT-5.5 还做不到。Harness 层可复制，模型层才是关键门槛。

宝玉: 为啥 Codex 还不推出类似 Codex Design 的产品? Anthropic 最近推出了 Claude Design,是我除了编程之外用得最多的 Agent,也推荐过很多次。效果真的好:你用一句话描述想要的 App,它直接给你生成...

Anthropic 教程/实践编码

07:48

🚨 AI News | TestingCatalog@testingcatalog

同事件精选78

智谱发布最强开源模型GLM-5.2，面向所有GLM Coding Plan用户（Lite/Pro/Max）开放。该模型支持真正可用的100万上下文窗口，在长程任务独立完成方面保持领先，适合构建复杂AI智能体应用，也是国产最强编码模型的核心引擎。面对外部封锁限制，智谱强调科学全球性、AGI不应被高墙垄断，采取激进开源态度。GLM-5.2的开源与API预计下周同步上线。

jietang: GLM-5.2 is Fully Open, Frontier Intelligence Belongs to Everyone Today, the sudden restriction of certain frontier model...

开源生态模型发布编码

同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

推荐理由：智谱发布 GLM-5.2，把 1M 上下文和强编码能力装进开源模型，在当前地缘限制下这种激进开放是难得的立场，做 agent 的值得上手一试。

03:43

elvis@omarsar0

Elvis Saravia详解Claude Code /goal模式：从提示转向目标控制系统

长期运行编码智能体核心从提示转向控制系统。Elvis Saravia在DAIR.AI Academy session中详解Claude Code的/goal模式：人类指定最终状态、成功证据、约束与预算，目标作为“合同”而非长提示。评估器成为第一类组件——明确任务用确定性检查（测试、lint、基准），模糊任务用智能体评估器（判断报告、UI设计），两者结合降低幻觉。验证器定义信任边界：外部检查（测试套件、类型检查、浏览器运行、截图对比）提供不可绕过的证据。

智能体 Anthropic 大佬观点编码

03:43

elvis@omarsar0

关于我们最近一次关于自主长期运行编码智能体的会议的笔记。（收藏它）主题：/goal、循环工程、验证器、动态工作流等等。内容太多，所以我尝试用我的写作智能体快速总结最相关的部分。

elvis: http://x.com/i/article/2065876120965111808

智能体教程/实践编码

03:24

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选72

GLM 5.2 发布

GLM 5.2 版本已正式发布。该消息来自 Hacker News 的一则热门讨论，帖子获得 111 个 HN 积分。页面包含一张发布图片，但未提供具体功能或更新内容。

开源生态模型发布编码

同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

推荐理由：GLM-5.2 把 1M 上下文和长链推理压进了开源模型，智谱高调喊出“前沿智能应属于所有人”，这对被断供的开发者是一剂强心针，可以立刻上手试试。

03:24

Hacker News 热门（buzzing.cc 中文翻译）

在家学习AI编程，不花大钱

一篇关于在家低成本学习AI编程的实践分享，讨论了借助免费或低价AI编码工具进行自学的方法，避免高昂课程费用。

智能体教程/实践编码

02:13

elvis@omarsar0

Elvis Saravia 指出，拥有 harness 即拥有智能体编排器，开源正推动这一趋势，多智能体组合可避免模型锁定，但路由仍待解决。@matei_zaharia 开源了 Omnigent，一个位于 Claude Code、Codex、Pi 及各类 agent SDK 之上的元平台，支持构建多智能体编码和自定义智能体，并实现实时协作与丰富的控制策略。

Matei Zaharia: Really excited to open source a new project: Omnigent, a meta-harness for AI agents. It lets you build multi-agent codin...

智能体开源/仓库开源生态编码

00:53

宝玉@dotey

tinyfool 问：现在你选 Claude Code 还是 Codex？宝玉回应：小孩子才做选择，成年人全都要。

Tinyfool: 现在你选 Claude Code 还是 Codex?

Anthropic OpenAI 大佬观点编码

00:52

Hacker News 热门（buzzing.cc 中文翻译）

/architect：减少80%的Fable token，Fable负责协调/审核，Codex负责构建

/architect项目将Fable token减少80%，由Fable进行协调和审核，Codex负责构建任务。

智能体 Anthropic OpenAI 开源/仓库

6月13日

23:37

向阳乔木@vista8

Codex Goal指令24分钟开发世界杯赛程订阅站

作者用 Codex 的 Goal 指令，耗时 24 分钟开发了一个娱乐网站，提供 2026 年世界杯赛程订阅服务。网站支持个性化日历订阅，可按赛程、48 支球队、12 个小组、小组赛分别订阅；生成 ICS 日历文件包含开赛前 30 分钟提醒。立即订阅链接见推文。

产品更新教程/实践编码

23:37

IT之家（RSS）

智谱发布ZCode 3.0：搭载自研Agent内核，深度适配GLM-5.2

智谱今日推出AI编程工具ZCode 3.0，全面切换自研ZCode Agent内核，深度适配GLM-5.2，优化长程推理、工具调用及大型工程执行链路，后续版本不再维护第三方Agent。GLM-5.2作为智谱迄今最强开源模型，支持1M上下文，已向GLM Coding Plan用户开放；订阅用户专享150%应用内配额。其他更新包括分组式任务工作区、Zread智能项目知识库、可视化Git分支图谱、可定制聊天交互、状态监控看板、多类型附件适配及全新视觉体系。

智能体产品更新编码

22:27

Chubby♨️@kimmonismus

Kim指出，封禁Fable 5成为开源模型和公司最大的公关助推。智谱（Zhipu）随即宣布完全开源其最强模型GLM-5.2，支持实际可用的1M上下文窗口，在长程任务独立完成上保持领先，可为复杂智能体应用提供基础支持，并继续作为最强国产编程模型的主引擎。今晚5：21起，GLM-5.2将向所有GLM编程计划用户（Lite/Pro/Max）开放，API下周上线。

jietang: GLM-5.2 is Fully Open, Frontier Intelligence Belongs to Everyone Today, the sudden restriction of certain frontier model...

开源生态模型发布编码

22:07

向阳乔木@vista8

Codex 小说创作 Skill 生成《炉灰命》

Codex 生成的小说创作 Skill 测试，随机生成了小说《炉灰命》。作者读后感觉还行，计划在迭代优化后开源。

开源/仓库教程/实践编码

21:58

The Verge：AI（RSS）

我用 Gemini 一个提示词就建好了浇花应用--连 Bug 都是它自己修的

用户向 Gemini 提交一个长提示词，五分钟后返回一个功能完整的预览窗口和一条“信道不可恢复损坏”的 Bug 消息。Gemini 提供“修复 Bug”按钮，用户点击后，233 秒内模型自行诊断并解决了“阻塞”和“竞态条件”问题，用户完全无需理解技术细节。整个过程只靠单次提示词驱动。

Google 现象/趋势编码

21:47

数字生命卡兹克@Khazix0918

实测GLM-5.2：国产Coding模型新高峰

美国商务部以国家安全为由要求Anthropic限制外国公民访问Fable 5和Mythos 5，Anthropic直接关停两模型。同日智谱发布GLM 5.2并开源，推出需抢购的Coding Plan，下周上线API。实测：上下文窗口扩至1M，400-500k长度准确性和指令遵循与Claude差距不大；代码工程能力极稳、幻觉低；小型任务21分钟结果与Opus 4.8相同但速度慢约两倍。缺憾：纯文本、无多模态、推理慢。作者认为这是国产Coding模型新高峰，推荐GLM 5.2 + Claude Code框架。

开源生态编码评测/基准

21:36

IT之家（RSS）

华为发布 DevEco Code 鸿蒙开发 AI Agent 工具

华为在 HDC 2026 期间发布 DevEco Code，这是一款面向 HarmonyOS 开发场景的 AI Agent 工具，支持代码编写、编译构建、设备运行、文档查阅、运行时调试及 ArkTS 问题修复。DevEco Code 基于开源项目 OpenCode 扩展，保留了其终端交互、配置体系、Provider / MCP / Skill / Plugin 等能力，并针对 HarmonyOS 工程新增了 DevEco Studio、Hvigor、HDC、Skill、HarmonyOS 知识库、ArkTS 检查和设备调试集成。集成的工具包括 build_project、start_app、hdc_log、verify_ui、check_ets_files、arkts_knowledge_search、switch_cwd 等。

智能体产品更新开源生态编码

21:30

公众号：数字生命卡兹克

实测GLM-5.2，国产Coding模型的又一座新高峰。

在Anthropic的Fable 5因美国商务部要求全面关停当日，智谱发布GLM 5.2并宣布继续开源。该模型上下文长度增至1M，在编码和智能体任务上表现突出：10万行代码的监控BUG排查耗时21分钟，结果与Claude Opus 4.8一致（后者fast模式仅需6分钟）；400-500k长上下文下准确性和指令遵循接近Claude。GLM 5.2为纯文本模型，无多模态能力，已通过Coding Plan订阅开放（限额需抢），下周将提供API并开源。

智能体 Anthropic DeepSeek 编码

19:38

meng shao@shao__meng

虽然 Claude Fable 5 被禁，但也挡不住古法编程真的很快要退出历史舞台了，想想这十几年，还是用过一些非主流编程语言的：Cobol、Fortran、Flex、Silverlight…

大佬观点编码

18:16

Berryxia.AI@berryxia

GLM-5.2作为智谱新旗舰模型，主打编码能力，支持可用的1M上下文，并在长任务上表现强劲。目前已面向所有GLM Coding Plan用户（包括Lite、Pro、Max、Team）开放，API和Chatbot服务将于下周上线。同时，该模型将于下周在MIT许可证下正式开源。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码

17:54

公众号：智谱（GLM）

同事件精选70

智谱 GLM-5.2 全量开放，支持 1M 上下文且下周开源

GLM-5.2 是智谱迄今能力最强的开源模型，支持真正可用的 1M 上下文，在长程任务中继续保持领先，并被智谱称为最强的国产 Coding 模型。今晚 5:21 起面向 GLM Coding Plan 全量用户开放（覆盖 Lite、Pro、Max、团队版）。API 将于下周上线，模型下周正式开源，遵循 MIT 协议。

开源生态模型发布编码

同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

推荐理由：智谱把最强大模型全量开放且开源，这事本身就在打脸那些收回权限的闭源模型，做中文编码的开发者可以认真看看。

17:07

meng shao@shao__meng

智谱（Zhipu AI）推出新旗舰模型GLM-5.2，已对GLM Coding Plan所有用户（Lite/Pro/Max/Team）开放。该模型具备强大编码能力，支持1M上下文窗口，在长周期任务中表现持续优秀。API和Chatbot服务将于下周上线，模型也将于下周以MIT许可证正式开源。智谱在声明中强调"前沿智能不应只属于少数人"，并暗讽大洋彼岸某厂商和政府，称未来AI属于开放和大众。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码

17:02

The Decoder：AI News（RSS）

月之暗面开源模型Kimi K2.7 Code每个token价格比GPT-5.5和Claude低12倍

Moonshot AI发布Kimi K2.7 Code，一款拥有1万亿参数的开源权重编程模型。在编程基准测试上仍落后于GPT-5.5和Claude Opus 4.8，但每个token的价格比竞争对手低最多12倍。核心问题在于：同等预算下额外获得的运行次数能否弥补质量差距。

开源/仓库模型发布编码

16:46

数字生命卡兹克@Khazix0918

GLM-5.2作为智谱新旗舰模型，今晚已向所有Coding Plan用户（Lite/Pro/Max/Team）开放，支持1M可用的上下文窗口，具备强大的编码能力。API和Chatbot服务将于下周推出，模型也将在下周以MIT许可证正式开源。

Z.ai: Intelligence should be open, accessible, and ready to build with, empowering every developer, everywhere. GLM-5.2 is now...

开源生态模型发布编码

16:14

Z.ai@Zai_org

智谱 GLM-5.2 旗舰模型发布：1M 上下文、下周开源

智谱（Z.ai）发布新旗舰模型 GLM-5.2，现已对 GLM Coding Plan 用户（Lite/Pro/Max/Team 计划）开放。该模型具备强大编程能力、可用的 1M 上下文支持，并延续长程任务优势。API 和聊天机器人服务将于下周上线，模型也将于下周以 MIT 许可证正式开源。

开源生态模型发布编码

关联讨论 8 条

14:36

IT之家（RSS）

精选73

SemiAnalysis 洞察 Token 经济：200 美元 AI 订阅榨出 70 倍用量

SemiAnalysis 购买了 Anthropic 和 OpenAI 的全部订阅方案，模拟高强度编码任务直至触及每周上限。月费 200 美元的 Claude Max 20x 方案，按 API 价格换算最高可消耗约值 8000 美元的 token；ChatGPT Pro 20x 方案对应最高约值 14000 美元的 token。用户通过订阅可获取 40 至 70 倍的 API 价值，该机构指出这种价格体系在重度用户持续榨满上限后可能难以长期维持。

Anthropic OpenAI 推理现象/趋势

推荐理由：SemiAnalysis 通过高强度编码测试戳破了 200 美元订阅的真实性价比，虽然数据来自推文未附复现步骤，但这个价差足够让重度用户重新算账。

13:41

AYi@AYi_AInotes

VPS选购攻略：用三款免费工具30秒验IP质量

推文指出90%的人买VPS只对比配置，忽略IP类型和纯净度。用于运行Claude Code、Codex等长期任务，或登录Claude、Google等对环境挑剔的账号时，脏IP轻则限流断连，重则触发风控封号。作者分享了一套免费筛选流程：使用三个网页工具，三十秒即可检测VPS的IP底细，从看懂结果到下单选购全程无需写命令。文章最后还提到许多场景无需自建VPS，避免为折腾而折腾。

AYi: http://x.com/i/article/2065392505554677760

其他编码

12:59

MarkTechPost（RSS）

Moonshot AI 开源 Kimi K2.7-Code：编程模型在 Kimi Code Bench v2 上较 K2.6 提升 21.8%

Moonshot AI 以 Modified MIT 许可证开源了 Kimi K2.7-Code，一款专注编程的智能体模型，基于 Kimi K2.6，拥有 256K 上下文窗口，推理 token 使用量降低约 30%。在六项基准测试中均优于 K2.6，其中在 Kimi Code Bench v2 上提升 21.8%。该模型可通过 Kimi API 和 Kimi Code 获取。

开源生态模型发布编码

12:49

jason@jxnlco

codex 用户！我想就两件事征集反馈：插件是否真的让 codex 更好用了？哪些插件，以及哪些地方仍有问题？你们团队是如何使用 codex 的？请提供示例，我会整理给团队！

OpenAI 其他编码

12:41

Peter Steinberger 🦞@steipete

Codex 在 crabbox 内部实现自我构建

Peter Steinberger 分享了 Codex 在其项目 crabbox 中的应用体验。Codex 在 crabbox 内部运行，同时构建 crabbox 自身。它已连续4天在多处代码树中非停止循环运行。所有构建均为端到端可验证，使得项目几乎能够自我构建。Codex 还能通过浏览器/电脑使用自动注册所需服务。作者的主要工作仅剩添加信用卡信息和关闭不合适的内容。

智能体大佬观点编码

12:25

Kimi.ai@Kimi_Moonshot

Kimi K2.7 Code builders 额外 API 配额 🎉 如果你正在使用 Kimi API 进行开发，在 7 月 2 日前充值 $100+ 可获 20%-30% 额外配额！ 🔷 $100-$299 → +20% 配额 🔷 $300-$999 → +25% 配额 🔷 $1，000+ → +30% 配额（每账户一次奖励。） - 详情：https://platform.kimi.ai/docs/pricing/promotion - Kimi API：https://platform.kimi.ai/

编码行业动态

09:14

Berryxia.AI@berryxia

Kimi 开源编码模型 Kimi-K2.7-Code，解决过度思考问题

Kimi 发布并开源最新编码模型 Kimi-K2.7-Code。相比 K2.6，该模型在 Kimi Code Bench v2 提升 21.8%，Program Bench 提升 11%，MLS Bench Lite 提升 31.5%。核心改进是解决编码模型“过度思考”问题，推理 token 使用量降低 30%，long-horizon 编码任务的指令跟随和端到端成功率显著提升。权重与代码已上传 Hugging Face，支持通过 Kimi API 和 Kimi Code 使用，同时开放 Beta 计划。团队预告即将推出 6x High-Speed Mode，进一步提升编码效率。

Kimi.ai: 🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...

智能体模型发布编码

09:04

meng shao@shao__meng

为大规模训练 Composer 模型，Cursor 团队构建了始终运行的 Agent 舰队系统

Cursor 团队为训练 Composer 模型构建了一个始终运行的 Agent 舰队系统。主 Agent（Fleet Manager）在远程机器上运行，通过 SSH 连接数百台子 Agent 机器，利用本地工具和磁盘文件“inbox”实现状态共享与协调。每轮循环检查舰队健康，将故障推送至 Slack/PagerDuty，并主动终止或重启进程。子 Agent 并行执行研究实验。系统基于此前长运行 Agent 研究，主 Agent 拥有编码 ML 实验隐性知识的 Skills。核心是使用 Cursor 自身产品，通过 inbox 文件与 Skills 实现大规模 Agent 协同与自我管理。

Lee Robinson: http://x.com/i/article/2065439304785039360

智能体教程/实践编码部署/工程

08:27

ginobefun@hongming731

Anthropic AI民调、黄仁勋谈AI工厂、Kimi K2.7 Code开源

Anthropic首份全美AI民调覆盖51993人：48%期待AI攻克癌症，64%担心失业，仅15%信任AI公司自行开发。黄仁勋以发电机类比AI工厂，提出五层产业蛋糕（能源/芯片/设施/模型/应用），每个计算单元含72颗芯片、造价约400万美元。月之暗面开源Kimi K2.7 Code编程模型，相比K2.6平均token消耗减少30%，Kimi Code Bench v2提升21.8%，Program-Bench提升11%，MLS Bench Lite提升31.5%。

Anthropic 开源生态编码行业动态

07:14

karminski-牙医@karminski3

KIMI K2.7 Code发布，编程/Agent专项模型

KIMI K2.7 Code正式发布，为编程/Agent专项模型，架构与K2.6一致，属后训练优化版本。在kimi自测的kimi-code-bench-v2上较K2.6提升11%，其他Agent测试项目同样有提升。适用场景包括编程任务以及需要Agent参与的验证任务（如简历筛选、PR审查等）。

智能体模型发布编码