全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 874 条

全部一手资讯 X 论文

标签「编码」清除

6月15日周一

18:31公众号：月之暗面（Kimi）69精选6倍速！Kimi K2.7 Code 高速版已上线

17:10Hacker News 热门（buzzing.cc 中文翻译）68苹果基础模型

14:38MarkTechPost（RSS）63Z.ai 发布 GLM-5.2，支持可用 1M Token 上下文窗口及两种思考强度

11:31Hacker News 热门（buzzing.cc 中文翻译）18珀里斯语录（1982）登上 Hacker News 热门

10:10公众号：数字生命卡兹克57Loop Engineering：让AI智能体自动循环执行任务的新范式

09:06MarkTechPost（RSS）61Claude Code 智能体编码工具详解：25 项功能与策略

08:34Simon Willison 博客51AI为何未取代软件工程师--且不会

08:00HuggingFace Daily Papers（社区热门论文）46ContextRL：面向智能体与多模态大语言模型的上下文感知强化学习

08:00HuggingFace Daily Papers（社区热门论文）45无资源、无基准、没问题？评估与改进LLM在无资源语言上的代码生成

6月14日周日

17:11The Decoder：AI News（RSS）59AI编码智能体虽能定位正确文件，但常错过关键代码行，研究显示

03:24Hacker News 热门（buzzing.cc 中文翻译）72同事件精选GLM 5.2 发布同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

03:24Hacker News 热门（buzzing.cc 中文翻译）66在家学习AI编程，不花大钱

00:52Hacker News 热门（buzzing.cc 中文翻译）58/architect：减少80%的Fable token，Fable负责协调/审核，Codex负责构建

6月13日周六

23:37IT之家（RSS）59智谱发布ZCode 3.0：搭载自研Agent内核，深度适配GLM-5.2

21:58The Verge：AI（RSS）57我用 Gemini 一个提示词就建好了浇花应用--连 Bug 都是它自己修的

21:36IT之家（RSS）62华为发布 DevEco Code 鸿蒙开发 AI Agent 工具

21:30公众号：数字生命卡兹克59实测GLM-5.2，国产Coding模型的又一座新高峰。

17:54公众号：智谱（GLM）70同事件精选智谱 GLM-5.2 全量开放，支持 1M 上下文且下周开源同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

17:02The Decoder：AI News（RSS）61月之暗面开源模型Kimi K2.7 Code每个token价格比GPT-5.5和Claude低12倍

14:36IT之家（RSS）73精选SemiAnalysis 洞察 Token 经济：200 美元 AI 订阅榨出 70 倍用量

12:59MarkTechPost（RSS）55Moonshot AI 开源 Kimi K2.7-Code：编程模型在 Kimi Code Bench v2 上较 K2.6 提升 21.8%

06:26Claude Code：GitHub Releases（RSS）42Claude Code v2.1.176 发布

05:28MarkTechPost（RSS）58Google 发布 Gemini-SQL2：Gemini 3.1 Pro Text-to-SQL 在 BIRD 单模型排行榜上取得 80.04% 执行准确率

04:49Hacker News 热门（buzzing.cc 中文翻译）70精选如何在macOS上设置本地编码代理

03:01HuggingFace Daily Papers（社区热门论文）36异构智能体稠密潜在通信：See What I See， Know What I Think

02:48Hacker News 热门（buzzing.cc 中文翻译）70精选减少AI生成前端界面粗糙度的文章

01:58The Decoder：AI News（RSS）60OpenAI 为 Codex 编程智能体推出灵活速率限制重置，开启 AI 价格战

6月12日周五

21:18Hacker News 热门（buzzing.cc 中文翻译）77同事件精选Kimi K2.7-Code：具有更高模型 token 效率的开源编码模型同一事件，精选展示《6倍速！Kimi K2.7 Code 高速版已上线》

19:36IT之家（RSS）69月之暗面开源 Kimi K2.7 Code 编程模型，预告 6 倍速高速版

18:58The Decoder：AI News（RSS）61OpenAI收购智能体初创公司Ona，推动Codex迈向长时间运行的自主编码任务

12:25Claude Code：GitHub Releases（RSS）52Claude Code v2.1.175 发布：新增 enforceAvailableModels 管理设置

09:34IT之家（RSS）51华为 MatePad Edge 平板获鸿蒙 6.1.0.125 SP52 更新，预置"终端"应用、支持运行 DevEco Studio

09:25Claude Code：GitHub Releases（RSS）44Claude Code v2.1.174 发布

08:26Simon Willison 博客79Claude Fable 5 异常主动

08:00HuggingFace Daily Papers（社区热门论文）54FastContext：用于编码智能体的高效仓库探索子智能体

08:00HuggingFace Daily Papers（社区热门论文）54LLM 智能体能够查看代码仓库

07:34IT之家（RSS）61OpenAI 收购初创公司 Ona，强化编程助手 Codex

05:55MarkTechPost（RSS）59xAI 发布 Grok Build 插件市场，首发集成 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 等插件

05:17Hacker News 热门（buzzing.cc 中文翻译）52Claude Fable 5 在编码任务中表现中等

03:17Hacker News 热门（buzzing.cc 中文翻译）40Zed：软件是在每次提交之间完成的

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月15日

18:31

公众号：月之暗面（Kimi）

精选69

6倍速！Kimi K2.7 Code 高速版已上线

Kimi K2.7 Code 高速版上线，与普通版为同一模型，输出速度约 5-6 倍，常规编程场景约 180 Token/s，短上下文可达 260 Token/s。API 定价为普通版 2 倍，模型 ID：kimi-k2.7-code-highspeed。Kimi Code Plan 用户可通过「抢先体验计划」使用，用量消耗为普通版 3 倍。使用须开启思考模式，关闭会报错或回退至 K2.6。庆祝发布，Kimi API 开放平台推出为期三周充赠活动，充值 500 元及以上享 20%-30% 代金券。相比 K2.6，K2.7 Code 在长上下文编程指令遵循、长程任务性能提升，平均 token 消耗减少 30%，内部基准测试显著提升。普通版输入 6.5 元/百万 token、输出 27 元，缓存输入 1.3 元。非编程任务推荐 K2.6。

产品更新推理编码

关联讨论 3 条X：硅基流动 SiliconFlow (@SiliconFlowAI)IT之家（RSS）X：Kimi.ai (@Kimi_Moonshot)

推荐理由：这不是 K2.7 的换代，而是给开发者开了条高速车道，180 token/s 让代码补全几乎无感，虽然贵但省时间，重度编程用户值得切。

17:10

Hacker News 热门（buzzing.cc 中文翻译）

68

苹果基础模型

苹果基础模型（Apple Foundation Models）在 Hacker News 上获得 104 个点赞，相关链接指向 platform.claude.com。

Anthropic 产品更新编码

14:38

MarkTechPost（RSS）

63

Z.ai 发布 GLM-5.2，支持可用 1M Token 上下文窗口及两种思考强度

Z.ai 于 6 月 13 日发布 GLM-5.2，这是 GLM-5 系列四个月内的第四款旗舰编码模型。核心亮点是可用的 100 万 token 上下文窗口（标识为 glm-5.2[1m]），每轮最多输出 131,072 token，约为 GLM-5.1 的 5 倍。新增 High 和 Max 两种思考强度级别，Max 推荐用于复杂多步编码任务。架构未在发布时公开，但社区指出 GLM-5 基础为 744B 参数的 MoE 模型，每 token 激活 40B 参数。Z.ai 未公布任何基准测试分数。GLM-5.2 兼容 Claude Code、Cline 等 8 种编码智能体工具，可通过 Anthropic 兼容端点直接替换使用，对所有 GLM Coding Plan 用户（Lite/Pro/Max/Team）开放。

推理模型发布编码

11:31

Hacker News 热门（buzzing.cc 中文翻译）

18

珀里斯语录（1982）登上 Hacker News 热门

1982 年 Alan Perlis 的计算机科学格言集《珀里斯语录》（Perlisisms）于 6 月 14 日登上 Hacker News 热门，获得 100 个点赞。

10:10

公众号：数字生命卡兹克

57

Loop Engineering：让AI智能体自动循环执行任务的新范式

OpenClaw创始人Peter与Claude Code创始人Boris近日提出Loop Engineering，由Google的Addy Osmani系统梳理。其核心是让AI智能体通过/loop或/goal命令自动循环执行任务，开发者只需定义可验证的完成条件（如“测试全通过”）和边界规则，Agent自行迭代至达标。需防范古德哈特定律——Agent可能删除失败测试而非修复Bug。该范式标志着从Prompt到Loop的四次能力跃迁。

智能体现象/趋势编码

09:06

MarkTechPost（RSS）

61

Claude Code 智能体编码工具详解：25 项功能与策略

Claude Code 是 Anthropic 的智能体编码工具，运行于终端、桌面应用和 IDE，基于智能体循环工作。文章将 25 项功能与策略分为官方功能、社区技术和第三方工具三类，并逐一标注。官方功能包括 CLAUDE.md 记忆文件、技能、子智能体、斜杠命令（/init、/compact、/review 等）、钩子、MCP 服务器、插件、检查点、计划模式、权限模式、自动模式（使用 Sonnet 4.6 分类器）、上下文压缩、后台任务、Agent SDK、无头 CLI、GitHub Action 集成、输出样式、远程控制与移动推送、离线摘要、沙盒。社区技术涵盖结构化上下文文件夹、动态工作流、模块化技能管道、弹性技术。第三方工具如 Mem Search 可扩展外部记忆层。

智能体 Anthropic 教程/实践编码

08:34

Simon Willison 博客

51

AI为何未取代软件工程师--且不会

Arvind Narayanan与Sayash Kapoor反驳“AI能力达阈值即会导致大规模裁员”的说法。2025年3月，纽约州成为美国首个在WARN法案申报中增设AI披露复选框的州，超160家公司提交通知，无一家勾选AI。他们认为软件工程瓶颈并非编码速度，而是决定构建什么、验证并交付责任、以及深度理解代码库/业务/环境。AI可辅助前两步，但深度理解仍是人类工程师不可替代的核心价值。

现象/趋势编码

08:00

HuggingFace Daily Papers（社区热门论文）

46

ContextRL：面向智能体与多模态大语言模型的上下文感知强化学习

ContextRL 是一种上下文感知强化学习方法，通过让模型从两个相似上下文中选出支持查询-答案对的上下文，改善长上下文和多模态细粒度理解。针对代码智能体用轨迹构建 1k 对对比数据，针对多模态推理用图像构建 7k 对。在 5 个长程推理基准上平均提升 +2.2%，在 12 个多模态视觉问答基准上平均提升 +1.8%。与使用相同数据但仅作为标准示例的基线对比，后者几乎无改进，表明增益来自上下文选择目标而非额外数据。

多模态推理编码论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

45

无资源、无基准、没问题？评估与改进LLM在无资源语言上的代码生成

针对LLM几乎未见训练数据的无资源编程语言，团队构建并发布了三个代码生成基准。实验发现，在目标语言上进一步预训练能最大提升性能，但直接用于指令微调模型会损害指令遵循能力。为此，从基础模型出发，先预训练再通过权重差异迁移从指令模型注入指令遵循能力，显著提升了无资源场景的代码生成表现，使公司能以低成本部署专用指令模型。

数据/训练编码论文/研究

6月14日

17:11

The Decoder：AI News（RSS）

59

AI编码智能体虽能定位正确文件，但常错过关键代码行，研究显示

AI编码智能体Claude Code和Codex能可靠找到正确文件，但漏掉其中大部分关键代码行。新的SWE-Explore基准首次将代码搜索与实际修复分开测试，证明缺乏足够上下文时，即使最佳修复方案也会失败。

智能体编码评测/基准

03:24

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选72

GLM 5.2 版本已正式发布。该消息来自 Hacker News 的一则热门讨论，帖子获得 111 个 HN 积分。页面包含一张发布图片，但未提供具体功能或更新内容。

开源生态模型发布编码

同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

推荐理由：GLM-5.2 把 1M 上下文和长链推理压进了开源模型，智谱高调喊出“前沿智能应属于所有人”，这对被断供的开发者是一剂强心针，可以立刻上手试试。

03:24

Hacker News 热门（buzzing.cc 中文翻译）

66

在家学习AI编程，不花大钱

一篇关于在家低成本学习AI编程的实践分享，讨论了借助免费或低价AI编码工具进行自学的方法，避免高昂课程费用。

智能体教程/实践编码

00:52

Hacker News 热门（buzzing.cc 中文翻译）

58

/architect：减少80%的Fable token，Fable负责协调/审核，Codex负责构建

/architect项目将Fable token减少80%，由Fable进行协调和审核，Codex负责构建任务。

智能体 Anthropic OpenAI 开源/仓库

6月13日

23:37

IT之家（RSS）

59

智谱发布ZCode 3.0：搭载自研Agent内核，深度适配GLM-5.2

智谱今日推出AI编程工具ZCode 3.0，全面切换自研ZCode Agent内核，深度适配GLM-5.2，优化长程推理、工具调用及大型工程执行链路，后续版本不再维护第三方Agent。GLM-5.2作为智谱迄今最强开源模型，支持1M上下文，已向GLM Coding Plan用户开放；订阅用户专享150%应用内配额。其他更新包括分组式任务工作区、Zread智能项目知识库、可视化Git分支图谱、可定制聊天交互、状态监控看板、多类型附件适配及全新视觉体系。

智能体产品更新编码

21:58

The Verge：AI（RSS）

57

我用 Gemini 一个提示词就建好了浇花应用--连 Bug 都是它自己修的

用户向 Gemini 提交一个长提示词，五分钟后返回一个功能完整的预览窗口和一条“信道不可恢复损坏”的 Bug 消息。Gemini 提供“修复 Bug”按钮，用户点击后，233 秒内模型自行诊断并解决了“阻塞”和“竞态条件”问题，用户完全无需理解技术细节。整个过程只靠单次提示词驱动。

Google 现象/趋势编码

21:36

IT之家（RSS）

62

华为发布 DevEco Code 鸿蒙开发 AI Agent 工具

华为在 HDC 2026 期间发布 DevEco Code，这是一款面向 HarmonyOS 开发场景的 AI Agent 工具，支持代码编写、编译构建、设备运行、文档查阅、运行时调试及 ArkTS 问题修复。DevEco Code 基于开源项目 OpenCode 扩展，保留了其终端交互、配置体系、Provider / MCP / Skill / Plugin 等能力，并针对 HarmonyOS 工程新增了 DevEco Studio、Hvigor、HDC、Skill、HarmonyOS 知识库、ArkTS 检查和设备调试集成。集成的工具包括 build_project、start_app、hdc_log、verify_ui、check_ets_files、arkts_knowledge_search、switch_cwd 等。

智能体产品更新开源生态编码

21:30

公众号：数字生命卡兹克

59

实测GLM-5.2，国产Coding模型的又一座新高峰。

在Anthropic的Fable 5因美国商务部要求全面关停当日，智谱发布GLM 5.2并宣布继续开源。该模型上下文长度增至1M，在编码和智能体任务上表现突出：10万行代码的监控BUG排查耗时21分钟，结果与Claude Opus 4.8一致（后者fast模式仅需6分钟）；400-500k长上下文下准确性和指令遵循接近Claude。GLM 5.2为纯文本模型，无多模态能力，已通过Coding Plan订阅开放（限额需抢），下周将提供API并开源。

智能体 Anthropic DeepSeek 编码

17:54

公众号：智谱（GLM）

同事件精选70

智谱 GLM-5.2 全量开放，支持 1M 上下文且下周开源

GLM-5.2 是智谱迄今能力最强的开源模型，支持真正可用的 1M 上下文，在长程任务中继续保持领先，并被智谱称为最强的国产 Coding 模型。今晚 5:21 起面向 GLM Coding Plan 全量用户开放（覆盖 Lite、Pro、Max、团队版）。API 将于下周上线，模型下周正式开源，遵循 MIT 协议。

开源生态模型发布编码

同一事件，精选展示《GLM-5.2 上线并开源：专注 Coding 与长程任务》

推荐理由：智谱把最强大模型全量开放且开源，这事本身就在打脸那些收回权限的闭源模型，做中文编码的开发者可以认真看看。

17:02

The Decoder：AI News（RSS）

61

月之暗面开源模型Kimi K2.7 Code每个token价格比GPT-5.5和Claude低12倍

Moonshot AI发布Kimi K2.7 Code，一款拥有1万亿参数的开源权重编程模型。在编程基准测试上仍落后于GPT-5.5和Claude Opus 4.8，但每个token的价格比竞争对手低最多12倍。核心问题在于：同等预算下额外获得的运行次数能否弥补质量差距。

开源/仓库模型发布编码

14:36

IT之家（RSS）

精选73

SemiAnalysis 洞察 Token 经济：200 美元 AI 订阅榨出 70 倍用量

SemiAnalysis 购买了 Anthropic 和 OpenAI 的全部订阅方案，模拟高强度编码任务直至触及每周上限。月费 200 美元的 Claude Max 20x 方案，按 API 价格换算最高可消耗约值 8000 美元的 token；ChatGPT Pro 20x 方案对应最高约值 14000 美元的 token。用户通过订阅可获取 40 至 70 倍的 API 价值，该机构指出这种价格体系在重度用户持续榨满上限后可能难以长期维持。

Anthropic OpenAI 推理现象/趋势

推荐理由：SemiAnalysis 通过高强度编码测试戳破了 200 美元订阅的真实性价比，虽然数据来自推文未附复现步骤，但这个价差足够让重度用户重新算账。

12:59

MarkTechPost（RSS）

55

Moonshot AI 开源 Kimi K2.7-Code：编程模型在 Kimi Code Bench v2 上较 K2.6 提升 21.8%

Moonshot AI 以 Modified MIT 许可证开源了 Kimi K2.7-Code，一款专注编程的智能体模型，基于 Kimi K2.6，拥有 256K 上下文窗口，推理 token 使用量降低约 30%。在六项基准测试中均优于 K2.6，其中在 Kimi Code Bench v2 上提升 21.8%。该模型可通过 Kimi API 和 Kimi Code 获取。

开源生态模型发布编码

06:26

Claude Code：GitHub Releases（RSS）

42

Claude Code v2.1.176 发布

Claude Code v2.1.176 更新：会话标题现按对话语言生成；新增 footerLinksRegexes 设置支持正则匹配页脚行链接徽章；优化 Bedrock 凭证缓存。修复多项问题：环境变量不可再绕过 availableModels 限制；/fast 切换至白名单外模型时拒绝；auto 模式退化为可用 Opus 模型；修正路径 hook 条件匹配；修复 Linux 沙箱内符号链接启动问题；修复 tmux 内 SSH 剪贴板问题；修复 Remote Control 多项连接问题。

智能体 Anthropic 产品更新编码

05:28

MarkTechPost（RSS）

58

Google 发布 Gemini-SQL2：Gemini 3.1 Pro Text-to-SQL 在 BIRD 单模型排行榜上取得 80.04% 执行准确率

Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2，基于 Gemini 3.1 Pro 驱动的文本转 SQL（Text-to-SQL）能力，在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。

Google 推理模型发布编码

04:49

Hacker News 热门（buzzing.cc 中文翻译）

精选70

如何在macOS上设置本地编码代理

来自ikyle.me的教程，指导在macOS上搭建本地编码代理，获Hacker News社区104个点赞。

开源生态教程/实践端侧编码

推荐理由：这篇文章不是泛泛的「本地跑大模型」，而是给 Mac 开发者一个实测过的、能打的生产环境编码代理方案，尤其 MTP 加速让速度不再鸡肋，可以直接抄作业。

03:01

HuggingFace Daily Papers（社区热门论文）

36

异构智能体稠密潜在通信：See What I See， Know What I Think

多智能体系统通常依赖文本通信，解码-重编码代价高且信息有损。KV-cache通信是低开销替代方案，但现有方法多限于同构模型。本文提出稠密对齐方法，通过轻量级跨模型缓存变换和两阶段训练（重构→生成）实现异构智能体间KV-cache直接传输。在Qwen3-4B、8B、14B三个模型组成的六个方向和六个基准上，上下文感知设置中性能匹配或超越文本通信，计算量降低2–3倍；上下文无关传输中仍有效，而先前方法完全失效。

智能体编码论文/研究

02:48

Hacker News 热门（buzzing.cc 中文翻译）

精选70

减少AI生成前端界面粗糙度的文章

本文介绍如何减少AI生成前端界面的粗糙度，发表于envs.net。文章针对AI产出的前端代码常出现的草率、不细致问题，提出改进方法，旨在提升生成结果的质量和可用性。

智能体教程/实践编码

推荐理由：让AI把前端生成模仿Qt风格，算是我见过成本最低的去“AI味”方法，适合自己用的小工具，审美要求不高的开发者可以立刻试试。

01:58

The Decoder：AI News（RSS）

60

OpenAI 为 Codex 编程智能体推出灵活速率限制重置，开启 AI 价格战

OpenAI 现在允许 Codex 用户存储速率限制重置次数并手动触发，而非按固定时间到期。用户在使用中达到上限时可立即使用已保存的重置而无需等待。Go、Plus、Pro 和 Business 订阅计划用户各获得一次免费重置。Plus 和 Pro 用户还可通过邀请好友解锁额外重置。

OpenAI 产品更新编码

6月12日

21:18

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选77

Kimi K2.7-Code：具有更高模型 token 效率的开源编码模型

Kimi K2.7-Code 是一个开源编码模型，相比同类模型拥有更高的模型 token 效率，能够用更少的 token 完成相同的代码生成任务。模型已在 HuggingFace 上发布。

智能体 Hugging Face 推理模型发布

同一事件，精选展示《6倍速！Kimi K2.7 Code 高速版已上线》

推荐理由：Kimi K2.7-Code 把推理 token 砍掉 30%，在长程编码任务上有实打实的提升，是编码智能体赛道的一个有力信号，做代码 Agent 的可以盯一下。

19:36

IT之家（RSS）

69

月之暗面开源 Kimi K2.7 Code 编程模型，预告 6 倍速高速版

月之暗面发布并开源 Kimi K2.7 Code 编程模型。相比 K2.6，长上下文编程指令遵循和长程任务性能提升，过度思考倾向改善，平均 token 消耗减少 30%。Kimi Code Bench v2 提升 21.8%、Program-Bench 提升 11%、MLS Bench Lite 提升 31.5%；Agent 基准提升约 10%。即日起通过 Kimi API 调用，输入 6.5 元/百万 token、输出 27 元、缓存输入 1.3 元。非编程任务仍推荐 K2.6，模型需开启思考模式。预告高速版（输出约 180 Token/s），6 月 15 日可调用，6x 速度仅需 2x 价格。

Hugging Face 模型发布编码

18:58

The Decoder：AI News（RSS）

61

OpenAI收购智能体初创公司Ona，推动Codex迈向长时间运行的自主编码任务

OpenAI收购了德国初创公司Ona（原名Gitpod），该公司成立于2020年，专注于AI智能体和安全云开发环境。此次收购旨在推动Codex向能够长时间运行、自主完成的编码任务方向发展。

智能体 OpenAI 编码行业动态

12:25

Claude Code：GitHub Releases（RSS）

52

Claude Code v2.1.175 发布：新增 enforceAvailableModels 管理设置

Claude Code v2.1.175 新增 enforceAvailableModels 管理设置。启用该设置后，availableModels 允许列表也会约束 Default 模型——若 Default 模型解析到被禁用的模型，则自动回退至第一个允许的模型；用户或项目设置无法再扩大受管理的 availableModels 列表。

Anthropic 产品更新编码部署/工程

09:34

IT之家（RSS）

51

华为 MatePad Edge 平板获鸿蒙 6.1.0.125 SP52 更新，预置"终端"应用、支持运行 DevEco Studio

华为 MatePad Edge 平板近日获鸿蒙 HarmonyOS 6.1.0.125 SP52 更新。主要变化包括：预置命令行“终端”应用（支持在电脑模式下运行）；电脑模式支持运行 DevEco Studio IDE（基于毕方技术平台，融合盘古大模型、小艺）；模式切换后部分应用可继续使用。此外优化了系统性能、多任务中心、小艺唤醒、语音备忘录体验，改善部分场景界面显示效果，并提升与部分耳机的连接稳定性及音频播放体验。

产品更新端侧编码

09:25

Claude Code：GitHub Releases（RSS）

44

Claude Code v2.1.174 发布

新增 wheelScrollAccelerationEnabled 设置，全屏禁用鼠标滚轮加速。修复 /model 选择器：Opus 在 Max/Team Premium/Enterprise 独立行，Sonnet 在 Pro/Team，Opus 在 API 按量付费账户；修复固定 Sonnet 版本时的硬编码标签；企业账户误显示积分横幅；Bedrock GovCloud 区域前缀错误导致 400 错误；后台会话继承另一会话环境变量；macOS/Linux 退出时 1-2 秒暂停；git co-author 模型名错误；/advisor 预选被 availableModels 屏蔽；skill 热重载仅发送变更；Workflow tool 子智能体缺失归属头；预温后台 worker 空闲后认证失败。[VSCode] 在 /usage 新增过去 24h/7d 的缓存未命中、长上下文、子智能体及 skill/agent/plugin/MCP 分解归因。

Anthropic 产品更新编码部署/工程

08:26

Simon Willison 博客

79

Claude Fable 5 异常主动

开发者体验两天后，发现 Claude Fable 5 极其主动。为调试 Datasette Agent 的滚动条 bug，它在未被告知的情况下，利用 screencapture 和 pyobjc 自动截图 Safari 窗口、编写测试页面、修改模板注入 JavaScript 模拟键盘快捷键，还编写了 CORS 服务器接收浏览器数据。随后触发护栏降级为 Opus，Opus 沿用这些技巧找到并验证修复方案，将整个过程记录在报告中。

智能体 Anthropic 大佬观点安全/对齐

关联讨论 31 条X：Perplexity (@perplexity_ai)Nathan Lambert：Interconnects（RSS）Tomer Tunguz 博客（VC 分析）X：Kim (@kimmonismus)TechCrunch：AI（RSS）Ethan Mollick：One Useful Thing（RSS）X：小互 (@xiaohu)Claude Code：GitHub Releases（RSS）X：OpenRouter (@OpenRouter)X：Testing Catalog (@testingcatalog)X：Elvis Saravia (@omarsar0, DAIR.AI)X：Claude Devs (@ClaudeDevs)X：Artificial Analysis (@ArtificialAnlys)X：宝玉 (@dotey)X：Andrej Karpathy (@karpathy)X：卡兹克 (@Khazix0918)IT之家（RSS）公众号：卡尔的AI沃茨X：歸藏 (@op7418)The Verge：AI（RSS）X：Berry Xia (@berryxia)Anthropic：Newsroom（网页）X：Vista (@vista8)The Decoder：AI News（RSS）X：Claude (@claudeai)X：Boris Cherny (@bcherny)X：Rohan Paul (@rohanpaul_ai)X：Dario Amodei (@DarioAmodei)Hacker News 热门（buzzing.cc 中文翻译）X：Eric Zakariasson (@ericzakariasson)公众号：数字生命卡兹克

08:00

HuggingFace Daily Papers（社区热门论文）

54

FastContext：用于编码智能体的高效仓库探索子智能体

FastContext 是一个将仓库探索与任务解决相分离的专用探索子智能体，由 4B–30B 参数的探索模型驱动，通过参考模型轨迹和任务奖励进行优化。集成 FastContext 的 Mini-SWE-Agent 在 SWE-bench Multilingual、SWE-bench Pro 和 SWE-QA 基准上端到端解决率提升最多 5.5%，同时编码智能体 token 消耗减少最多 60%，且边际开销很低。结果表明，仓库探索可与解决任务分离，并由专用模型高效处理。

智能体 GitHub Microsoft 编码

08:00

HuggingFace Daily Papers（社区热门论文）

54

LLM 智能体能够查看代码仓库

首次系统实证研究视觉仓库表示对基于 LLM 的编码智能体在仓库级问题解决中的作用。评估了四个近期多模态模型。纯视觉设置会降低准确性并增加 token 成本；将仓库结构视觉图作为文本界面的补充模态，可使输入 token 消耗降低最多 26%，同时保持或提升问题解决准确性。可视化在故障定位和智能体自主控制探索深度时最为有效。研究指向一种混合文本与视觉的设计思路，用于下一代编码智能体。

智能体 arXiv 多模态编码

07:34

IT之家（RSS）

61

OpenAI 收购初创公司 Ona，强化编程助手 Codex

OpenAI 昨日宣布收购初创公司 Ona，后者专注于为 AI 智能体提供安全、预配置云环境。该技术将帮助编程助手 Codex 执行持续时间更长的任务，并支持用户将 AI 智能体部署到生产环境，同时让企业更好地掌控基础设施与安全边界。交易金额未公布，Ona 团队将加入 OpenAI 参与 Codex 项目研发。

智能体 OpenAI 编码行业动态

05:55

MarkTechPost（RSS）

59

xAI 发布 Grok Build 插件市场，首发集成 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 等插件

xAI 推出 Grok Build 插件市场，这是一个终端内插件平台，支持技能、智能体、钩子和 MCP 服务器。所有远程插件均通过 commit-SHA 验证确保安全。首发插件包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 及 Superpowers。

智能体 MCP/工具 xAI 产品更新

05:17

Hacker News 热门（buzzing.cc 中文翻译）

52

Claude Fable 5 在编码任务中表现中等

Claude Fable 5 在编码任务中取得中等水平结果，Hacker News 上获 109 个点赞。

Anthropic 安全/对齐编码评测/基准

03:17

Hacker News 热门（buzzing.cc 中文翻译）

40

Zed：软件是在每次提交之间完成的

Zed 开发者在其官方博客中提出，软件真正的创造过程并不在代码提交本身，而是发生在两次提交之间的思考、调试与重构中。这一观点强调提交记录之外的隐式工作对软件质量的决定性作用。

智能体产品更新编码

1…4 567 8…22