全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 874 条

全部一手资讯 X 论文

标签「编码」清除

5月15日周五

11:42IT之家（RSS）47微软押注 WinUI 3 重塑 Win11 原生体验，文件管理器内存分配减少 41%

11:40OpenAI：官网动态（RSS · 排除企业/客户案例）32Sea 对基于 Codex 的智能体软件开发未来的展望

10:48HuggingFace Daily Papers（社区热门论文）72精选Orchard：一个开源智能体建模框架

10:28公众号：数字生命卡兹克52Codex更新远程控制，你也终于可以在手机上随时随地Vibe Coding了。

08:41IT之家（RSS）53xAI 发布 Grok Build 早期测试版编程智能体，仅限 SuperGrok 订阅用户使用

08:00Hacker News 热门（buzzing.cc 中文翻译）69Codex 现已登陆 ChatGPT 移动应用

07:56Simon Willison 博客56技术栈的"锁定效应"正在减弱

06:56Simon Willison 博客34引用 Mitchell Hashimoto

06:56Claude Code：GitHub Releases（RSS）63精选Claude 代理工具 v2.1.142 版本更新

04:09OpenAI：官网动态（RSS · 排除企业/客户案例）78精选随时随地使用 Codex

03:30Hacker News 热门（buzzing.cc 中文翻译）52该死的人工智能把我给变笨了

03:01xAI：News（网页）73精选xAI 推出 Grok Build 早期测试版

02:00Claude：Blog（网页）74精选创始人手册：构建AI原生初创公司

00:56Simon Willison 博客58Datasette IP速率限制插件发布，应对恶意爬虫访问

5月14日周四

21:29Hacker News 热门（buzzing.cc 中文翻译）78精选克劳德代码与《代码书》技能：有针对性的技能培养

15:40IT之家（RSS）61Anthropic CFO：AI 已能编写九成代码，人类白领从执行者转变为监督者

10:45HuggingFace Daily Papers（社区热门论文）64重访DAgger算法在长视野大语言模型智能体训练中的应用

08:00HuggingFace Daily Papers（社区热门论文）57Solvita：通过智能体演化增强大语言模型的竞技编程能力

07:55Claude Code：GitHub Releases（RSS）67精选Claude 工具 v2.1.141 版本更新

07:39IT之家（RSS）54消息称苹果评估 AI 编程类应用入驻方案，担心恶意软件与收入流失

5月13日周三

22:39IT之家（RSS）62澳洲放羊大叔引爆 AI 编程革命！Claude Code 急推 goal 模式，不干完不许停

10:39IT之家（RSS）66苹果发布 Xcode 26.5：让智能体先问清再动手、支持 AI 消息队列

07:27Hacker News：AI 热帖76精选展示 HN：Statewright--通过可视化状态机提升AI智能体可靠性

07:09OpenAI：官网动态（RSS · 排除企业/客户案例）63精选财务团队如何使用 Codex

06:08OpenAI：官网动态（RSS · 排除企业/客户案例）25AutoScout24 通过 AI 驱动的工作流扩展工程能力

06:08OpenAI：官网动态（RSS · 排除企业/客户案例）47NVIDIA 工程师与研究人员如何运用 Codex 进行开发

06:08OpenAI：官网动态（RSS · 排除企业/客户案例）51财务团队如何使用 Codex

01:53GitHub Blog61精选GitHub Copilot 个人计划：在 Pro 和 Pro+ 中引入弹性配额，以及新的 Max 计划

5月12日周二

23:53GitHub Blog58精选Dungeons & Desktops：使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏

19:49公众号：智谱（GLM）63同事件精选GLM-5.1获AA全新Coding Agent基准开源第一同一事件，精选展示《GLM-5.1开源：一个独立工作8小时的模型》

17:36IT之家（RSS）49AI 时代新怪象：越来越多人抱着"半开笔记本电脑"到处跑

12:25Hacker News 热门（buzzing.cc 中文翻译）54我让人工智能开发了一个工具，帮助我找出是什么在半夜吵醒我

09:25Hacker News 热门（buzzing.cc 中文翻译）53如果人工智能能编写代码，为何还要使用Python？

08:53Simon Willison 博客65对GitLab裁员及战略调整的思考

08:36IT之家（RSS）55OpenAI 发布 Daybreak 项目：剑指 Anthropic，把安全检查放进日常代码流程

05:53Claude：Blog（网页）74Claude Code 推出智能体视图功能

03:52Simon Willison 博客49引用 James Shore

02:52Claude Code：GitHub Releases（RSS）72精选Claude Code v2.1.139 版本更新

01:23Hacker News 热门（buzzing.cc 中文翻译）47使用 Swift 训练大型语言模型（LLM），第一部分：将矩阵乘法性能从 Gflop/s 提升至 Tflop/s

5月11日周一

23:52Simon Willison 博客54在"教学车间"中学习：公开协作与渗透式学习

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月15日

11:42

IT之家（RSS）

47

微软押注 WinUI 3 重塑 Win11 原生体验，文件管理器内存分配减少 41%

微软正通过WinUI 3框架优化Windows 11原生体验，旨在解决系统卡顿、臃肿及过度依赖网页技术等问题。优化已见成效：文件资源管理器启动过程中，WinUI框架内存分配次数减少41%，临时内存分配减少63%，代码执行时间降低25%。同时，开始菜单等核心组件正转向纯原生开发。微软还发布了新的命令行项目模板以简化开发，并引入AI智能体插件辅助编程。不过，部分优化因涉及破坏性改动，目前仍需开发者手动启用。

智能体 Microsoft 产品更新端侧

11:40

OpenAI：官网动态（RSS · 排除企业/客户案例）

32

Sea 对基于 Codex 的智能体软件开发未来的展望

Sea Limited 首席产品官阐述了公司为何在工程团队中全面部署 Codex，以加速亚洲地区的 AI 原生软件开发。公司正推动开发模式向“智能体化”转变，让 AI 智能体承担从需求分析到代码生成、测试的更多开发任务。这一举措旨在显著提升工程效率，缩短产品迭代周期，并应对亚洲市场对敏捷、智能化软件开发日益增长的需求。

智能体 OpenAI 现象/趋势编码

10:48

HuggingFace Daily Papers（社区热门论文）

精选72

Orchard：一个开源智能体建模框架

针对智能体建模领域因依赖闭源资源而受限的问题，研究团队推出了开源框架Orchard。其核心是轻量级环境服务Orchard Env，提供跨任务和流程的可复用沙箱管理基元。基于此构建了三个高效智能体方案：编码智能体Orchard-SWE在SWE-bench Verified上达到67.5%的准确率；视觉语言计算机使用智能体Orchard-GUI仅用少量数据便在多项基准测试中取得64.0%-74.1%的成功率；个人助理智能体Orchard-Claw仅用0.2K合成任务便在Claw-Eval上实现59.6%的pass@3成功率。该框架证明了其跨领域实现可复用数据、训练与评估的能力。

智能体编码论文/研究

推荐理由：开源终于能打低数据量、高性能的 agent recipe 了，Orchard-SWE 在 SWE-bench 拿下 67.5%，只用了 107K 条蒸馏轨迹，小团队也能复现，做 coding agent 的必读。

10:28

公众号：数字生命卡兹克

52

Codex更新远程控制，你也终于可以在手机上随时随地Vibe Coding了。

产品更新编码

08:41

IT之家（RSS）

53

xAI 发布 Grok Build 早期测试版编程智能体，仅限 SuperGrok 订阅用户使用

xAI 发布专为软件工程设计的编程智能体 Grok Build 早期测试版，目前仅限 SuperGrok 订阅用户在终端使用。该智能体提供“规划模式”，允许用户在任务执行前审核、修改或重写计划，批准后所有改动会以 Diff 形式呈现。此外，它支持直接调用 AGENTS.md 文件、插件、hooks、skills 及 MCP 服务，并兼容无头模式，便于集成到脚本与自动化流程中。CLI 还提供完整的 ACP 支持，以帮助用户构建机器人和智能体编排应用。

智能体 xAI 产品更新编码

08:00

Hacker News 热门（buzzing.cc 中文翻译）

69

Codex 现已登陆 ChatGPT 移动应用

OpenAI 宣布其代码生成模型 Codex 现已正式集成到 ChatGPT 移动应用中，用户可通过智能手机直接访问该功能，实现在移动环境中实时生成、编辑和调试代码。这一更新将 Codex 从桌面端扩展至移动平台，提升了编程的便携性和灵活性，方便开发者在户外或旅途中高效工作。该消息在 Hacker News 上获得 109 点关注度，显示出技术社区对此举的高度兴趣与积极反响。

OpenAI 产品更新编码

07:56

Simon Willison 博客

56

技术栈的"锁定效应"正在减弱

Mitchell Hashimoto 关于 Bun 从 Zig 迁移到 Rust 的评论，引发了对技术选择锁定的思考。一家中型科技公司近期利用编码智能体，将原有的 iPhone 和 Android 原生应用重写为 React Native。团队选择 React Native 并非因为 AI 降低了维护两套代码的成本，而是因为 React Native 近年来的发展已能满足其所有需求。关键在于，即便未来证明此选择错误，他们也能轻松迁移回原生平台。这印证了当前编程语言与技术框架的“锁定效应”已显著减弱，技术回退或切换的成本和风险大大降低。

大佬观点现象/趋势编码

06:56

Simon Willison 博客

34

引用 Mitchell Hashimoto

Mitchell Hashimoto 针对 Bun 从 Zig 移植到 Rust 一事发表评论，指出编程语言正变得越来越可替代。他认为，过去编程语言常形成技术锁定，但现在情况已大不相同。Bun 团队展示出他们可以在大约一两周内用任何他们想要的语言重写项目，Rust 也不例外。语言变得可消耗，有用时则用，不再适用时便可弃用，这一现象值得关注。

大佬观点开源生态编码

06:56

Claude Code：GitHub Releases（RSS）

精选63

Claude 代理工具 v2.1.142 版本更新

Claude 代理工具发布 v2.1.142 版本。本次更新新增了 --add-dir、--settings、--model 等 8 个用于配置后台会话的命令行标志，并将 Fast 模式的默认模型升级为 Opus 4.7。插件功能得到增强，拥有根目录 SKILL.md 的插件现可被识别为技能，插件详情面板会显示其提供的 LSP 服务器。此外，版本修复了超过 15 项问题，包括 MCP 工具超时设置失效、后台会话在系统休眠后异常断开、守护进程升级后无法正常退出、Windows 网络驱动器工作目录下死锁等关键错误，并改进了响应式压缩和钩子配置错误提示。

智能体 Anthropic 产品更新编码

推荐理由：Claude Code 把 Agent 配置折腾得更顺手了，后台任务死锁、睡眠唤醒崩掉这类老毛病也修了一串，如果你的 Dispatch Agent 经常掉链子，这次升级很实在。

04:09

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选78

随时随地使用 Codex

用户现可通过 ChatGPT 移动应用随时随地使用 Codex。该功能支持跨设备和远程环境实时监控、引导及批准编码任务，实现了对编程工作的无缝移动端管理。

智能体 OpenAI 产品更新编码

推荐理由：Codex mobile让你在手机上监控和指挥AI写代码，对需要远程协作的开发者是个实用升级，不过更像功能补全而非颠覆性创新，适合日常需要随时掌控进度的团队。

03:30

Hacker News 热门（buzzing.cc 中文翻译）

52

该死的人工智能把我给变笨了

作者反思过度依赖AI工具导致自身认知能力下降。具体表现为：使用AI辅助编程后，自行编写代码的能力减弱；依赖AI总结文章，导致阅读理解深度不足；习惯AI快速生成初稿，削弱了独立构思与写作能力。文章指出，AI在提升效率的同时，也可能使人疏于深度思考和实践，从而造成“变笨”的负面效应。这引发了对人机协作中如何保持并锻炼人类核心思维能力的讨论。

现象/趋势编码

03:01

xAI：News（网页）

精选73

xAI 推出 Grok Build 早期测试版

xAI 面向 SuperGrok Heavy 订阅用户推出 Grok Build 早期测试版。这是一个直接在终端运行的新型编程智能体与命令行工具，专为专业软件工程和复杂任务设计。其核心功能包括：支持“计划模式”，允许用户在代码执行前审阅和修改详细步骤；能无缝集成现有开发工具链；可将大型任务分解，交由并行运行的专用子智能体处理。此外，该工具提供无头模式，便于脚本和自动化流程集成。用户可通过单行命令安装并立即在项目中使用。

智能体 xAI 产品更新编码

推荐理由：xAI终于下场做终端里的编码代理了，功能规划看着挺全，但早期beta只开放给SuperGrok Heavy用户，普通开发者还得再等等。

02:00

Claude：Blog（网页）

精选74

创始人手册：构建AI原生初创公司

Anthropic公司发布了一份面向AI原生初创企业的实用指南，旨在重塑2026年创业生命周期的构思、最小可行产品、发布和规模化四个核心阶段。该手册为每个阶段提供了具体目标、退出标准、常见失败模式及AI驱动练习，涵盖如何利用Claude进行问题验证与客户发现、避免AI生成代码的技术债务、区分真实产品市场契合度与早期炒作，并引入智能工作流替代创始人手动操作。指南还整合了多家初创企业的实践案例，为从零开始围绕AI构建公司的创始人提供架构、范围与安全方面的最佳实践。

智能体 Anthropic 教程/实践编码

推荐理由：这份创业手册把从Idea到Scale四阶段拆成了可复制的流程和prompt，不再是玄学方法论，而是创始人可以直接上手操作的“AI创业作弊本”。

00:56

Simon Willison 博客

58

Datasette IP速率限制插件发布，应对恶意爬虫访问

为解决datasette.io网站遭受恶意爬虫频繁访问的问题，作者借助Codex开发了一款可配置的IP速率限制插件。该插件能够监控并阻止在设定时间窗口内对特定路径发起过多请求的IP地址。文中给出了当前生产环境的配置示例：通过Fly-Client-IP请求头识别IP，设置最大跟踪键值数为10000，并豁免静态文件等路径；针对“/global-power-plants/*”和“/legislators/*”两类路径，规则限定60秒内最多允许60次请求，违规IP将被封锁20秒。

开源/仓库编码部署/工程

5月14日

21:29

Hacker News 热门（buzzing.cc 中文翻译）

精选78

克劳德代码与《代码书》技能：有针对性的技能培养

开发者发布了一款名为“克劳德代码与《代码书》技能”的GitHub工具，旨在通过刻意练习提升编程技能。该工具利用AI模型生成特定主题的代码示例与解释，帮助用户进行针对性学习。项目在Hacker News上获得104点热度，关注度较高。其核心变化在于将传统的广泛学习转化为聚焦、可重复的技能训练模式，通过结构化练习提升学习效率。

教程/实践编码

推荐理由：这个skill把Claude Code变成一对一的代码教练，专门抓你代码里的坏习惯，对想用AI真正提升编码水平的人是个好东西。

15:40

IT之家（RSS）

61

Anthropic CFO：AI 已能编写九成代码，人类白领从执行者转变为监督者

Anthropic首席财务官透露，公司内部AI已承担约90%的代码编写工作，财务报告等任务也能在人工介入前完成90%-95%。员工角色正从执行者转变为AI系统的监督者与战略决策者，部分报告处理时间从数小时缩短至30分钟。AI提升了团队效率，公司因此继续招聘，更注重“高密度人才”与AI的结合。行业趋势呈现分化：一些企业要求员工学习使用AI工具，另一些则以效率提升为由裁员。尽管自动化可能取代部分岗位，但若需求持续，企业招聘未必停止。

智能体 Anthropic 大佬观点编码

10:45

HuggingFace Daily Papers（社区热门论文）

64

重访DAgger算法在长视野大语言模型智能体训练中的应用

研究将数据集聚合（DAgger）算法应用于长视野大语言模型智能体训练，以解决监督微调中的协变量偏移与强化学习反馈稀疏的困境。该方法通过学生与教师策略的逐轮插值收集交互轨迹，并利用教师提供的密集监督信号进行训练，使模型接触真实环境状态。在软件工程智能体训练中，经DAgger式训练的4B和8B学生模型在SWE-bench Verified基准上显著提升，最终4B智能体成功率超越已发布的代表性8B系统，8B智能体性能接近更强32B规模模型，验证了该方法的有效性。

智能体推理编码论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

57

Solvita：通过智能体演化增强大语言模型的竞技编程能力

Solvita 是一个无需更新底层大语言模型权重的智能体演化框架，旨在提升模型在竞技编程中的推理能力。它将解题过程重组为由 Planner、Solver、Oracle、Hacker 四个专用智能体执行的闭环系统。每个智能体配备一个可训练的图结构知识网络，系统运行时产生的通过/失败结果、测试质量与对抗漏洞等信号，会转化为对这些网络的强化学习更新，使智能体能基于历史经验动态路由后续查询，持续积累可迁移的推理经验。在多个基准测试及实时编程比赛中，Solvita 在代码生成智能体中取得了新的最优性能，显著超越了现有方法。

智能体推理编码论文/研究

07:55

Claude Code：GitHub Releases（RSS）

精选67

Claude 工具 v2.1.141 版本更新

Claude 工具发布 v2.1.141 版本，带来多项功能新增与优化。主要更新包括：为钩子输出添加 terminalSequence 字段以支持无控制终端的桌面通知；新增 CLAUDE_CODE_PLUGIN_PREFER_HTTPS 环境变量，便于通过 HTTPS 克隆插件源码；引入 ANTHROPIC_WORKSPACE_ID 变量以在多工作区联盟中限定令牌范围。会话管理方面，claude agents 命令新增 --cwd 参数用于按目录筛选，并优化后台代理的状态归类。用户体验改进包括：在倒带菜单添加“总结至此”选项以压缩早期上下文；长思考超时后旋转指示器变色提供更明确反馈；此外，还修复了 Markdown 表格渲染异常、权限提示逻辑、历史记录管理等超过 30 项问题。

智能体 Anthropic MCP/工具产品更新

推荐理由：Claude Code 的小版本但修得扎实，MCP 连接、/bg 权限继承、VSCode 语音等一堆边角都补了，Agent 模式稳定性明显提升，强烈建议升级。

07:39

IT之家（RSS）

54

消息称苹果评估 AI 编程类应用入驻方案，担心恶意软件与收入流失

据报道，苹果公司正内部讨论如何允许AI编程应用（如智能体编程、氛围编程）进入App Store。这类应用能用AI直接生成代码和软件，但违反了商店禁止在设备上直接编程的现有规则。苹果面临两难：一方面担心开闸后，AI生成的新代码可能绕过安全审核，增加恶意软件风险，并可能减少应用分发和抽成收入；另一方面又不想错过这波新应用带来的机会。为此，苹果正在探索折中方案，试图设计一套系统来确保隐私与安全标准，但深度调用系统资源的AI应用可能仍无法直接登陆iPhone。

智能体编码行业动态

5月13日

22:39

IT之家（RSS）

62

澳洲放羊大叔引爆 AI 编程革命！Claude Code 急推 goal 模式，不干完不许停

澳大利亚牧羊大叔Geoffrey Huntley为解决AI编程工具Agent中途停止的痛点，编写了一个名为“Ralph Loop”的三行bash脚本。该脚本通过无限循环将任务持续喂给AI，确保其工作至完成。此简单粗暴的思路在11天内被OpenAI、Anthropic和Hermes三家顶级AI实验室集体采纳，并分别集成至Codex、Claude Code和Hermes Agent产品中，推出了/goal等类似功能。这一变化标志着AI编程的核心正从“生成代码”转向“闭环交付”，显著提升了AI的自主性和任务完成能力，被视为通用人工智能发展的关键一步。

智能体 Anthropic OpenAI 现象/趋势

10:39

IT之家（RSS）

66

苹果发布 Xcode 26.5：让智能体先问清再动手、支持 AI 消息队列

苹果发布了Xcode 26.5版本，主要增强了AI智能体编程能力。新版本支持编程智能体消息队列功能，允许开发者在AI生成响应期间连续发送多条消息，同时AI也可主动提出澄清问题，使协作更流畅，减少了大型项目中的操作停顿。此外，本次更新还包含了Swift 6.3.2版本，为iOS等多平台提供SDK，并在StoreKit Testing中新增了对12个月承诺制月订阅计费方案的支持，同时修复了错误，提升了稳定性。

智能体产品更新编码

07:27

Hacker News：AI 热帖

精选76

展示 HN：Statewright--通过可视化状态机提升AI智能体可靠性

Statewright 是一个通过状态机为AI智能体提供约束的系统，能控制其在各阶段可使用的工具，从而聚焦推理并提升可靠性。它将工作流定义为规划、实施、测试等多个阶段，自动执行工具限制与状态转换。在本地模型测试中，两个模型在5项SWE-bench子任务上应用约束后，正确率从2/10显著提升至10/10。该系统已集成到Claude Code等平台，一个修复测试失败的典型工作流可在46秒内完成。

智能体 MCP/工具产品更新编码

推荐理由：Statewright用状态机给AI代理上“紧箍咒”，让13B小模型也能搞定SWE-bench任务，做coding agent的应该立刻装上试试。

07:09

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选63

财务团队如何使用 Codex

财务团队能够利用 Codex，基于实际工作输入构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具将自然语言指令转化为代码，自动化处理财务数据整合、差异分析和模型验证等复杂任务，从而提升报告生成效率与准确性，并支持快速创建多版本规划场景。

OpenAI 教程/实践编码

推荐理由：金融团队终于有了一个正经的 AI 用例，用 Codex 自动生成 MBR、差异桥接和规划场景，比手工拉 Excel 高效太多了，做财务分析的建议点开看看。

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

25

AutoScout24 通过 AI 驱动的工作流扩展工程能力

AutoScout24 Group 采用 Codex 和 ChatGPT 来加速开发周期并提升代码质量。公司通过 AI 工具自动化代码审查、生成测试用例和编写文档，将部分开发任务效率提升高达 40%。工程师得以更专注于复杂问题，同时 AI 应用范围从代码辅助扩展至需求分析和数据查询。这一转变推动了团队 AI 采用率的显著增长，并系统化地融入了日常开发工作流。

OpenAI 教程/实践编码

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

47

NVIDIA 工程师与研究人员如何运用 Codex 进行开发

NVIDIA 团队通过结合 Codex 与 GPT-5.5，将研究构想快速转化为可实际运行的实验，并直接用于部署生产系统。这一实践显著提升了从研究到产品化的效率，实现了实验代码的即时可执行与系统级集成。

OpenAI 产品更新编码

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

51

财务团队如何使用 Codex

财务团队可利用 Codex 从实际工作输入中构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具能将非结构化数据（如电子邮件、会议记录和电子表格）自动转换为结构化的财务分析框架，从而提升报告效率与准确性。Codex 的应用减少了手动数据整理时间，使团队能更专注于高价值的分析与决策支持工作。

OpenAI 教程/实践编码

01:53

GitHub Blog

精选61

GitHub Copilot 个人计划：在 Pro 和 Pro+ 中引入弹性配额，以及新的 Max 计划

GitHub 宣布从6月1日起更新 Copilot 个人计划阵容，基于用户反馈进行调整。主要变化包括在现有 Pro 和 Pro+ 计划中引入弹性配额机制，允许用户更灵活地分配使用量；同时新增 Max 计划，扩展高级选项。此次更新旨在提升计划的可定制性，为开发者提供更个性化的编程辅助服务，优化整体使用体验。

GitHub 产品更新编码

推荐理由：GitHub Copilot 个人版引入弹性配额和更贵的 Max 计划，对你这样每天靠它写代码的人，要么多花钱要么被限流，算清楚自己的用量比看功能列表更重要。

5月12日

23:53

GitHub Blog

精选58

Dungeons & Desktops：使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏

一位 GitHub 员工利用 GitHub Copilot CLI 开发了一款扩展程序，能够将任何代码库转换成一个独特的 Roguelike 风格地下城。该工具通过 AI 辅助的代码生成，实现了程序化关卡创建，展示了 Copilot CLI 在创意编码和游戏原型开发中的实际应用潜力。项目核心是自动解析代码结构并生成对应的可探索地下城布局。

GitHub 教程/实践编码

推荐理由：用 GitHub Copilot CLI 把代码库变成 roguelike 地牢，玩法挺有脑洞，做 Copilot 扩展的开发者可以看一眼思路。

19:49

公众号：智谱（GLM）

同事件精选63

GLM-5.1获AA全新Coding Agent基准开源第一

全球权威评测机构Artificial Analysis发布全新Coding Agent Index，包含SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA三项基准，用于衡量模型与Agent harness组合的真实编程能力。闭源模型Opus 4.7（在Cursor CLI中运行）全球第一，智谱GLM-5.1（在Claude Code中运行）获开源第一，代表国产大模型在实际编程Agent场景达到SOTA水平。

开源生态编码评测/基准

同一事件，精选展示《GLM-5.1开源：一个独立工作8小时的模型》

推荐理由：GLM-5.1 在 AA 的新 Coding Agent 基准上拿了开源第一，时隔一个月回头看，这个成绩对国产开源模型在编程 Agent 赛道的位置是个重要注脚，做工具链选型的还是值得扫一眼。

17:36

IT之家（RSS）

49

AI 时代新怪象：越来越多人抱着"半开笔记本电脑"到处跑

随着AI智能体热潮兴起，技术从业者为保持AI编码任务持续运行，不得不抱着半开笔记本电脑在公共场所走动。报道采访了多位有此习惯的人，他们出现在溜冰场、机场、高中走廊等地，因任务一旦合盖中断就会丢失进度。有人将电脑开合角度调至最小以避人耳目。这种行为已形成网络梗文化，当事人常感尴尬，但在旧金山湾区等技术密集区已较常见。

智能体 Anthropic OpenAI 现象/趋势

12:25

Hacker News 热门（buzzing.cc 中文翻译）

54

我让人工智能开发了一个工具，帮助我找出是什么在半夜吵醒我

作者利用人工智能开发了一款工具，用于监测和分析夜间可能吵醒他的声音。该工具通过记录和分析环境音频，识别并分类噪音来源，帮助作者找出睡眠中断的具体原因。这一实践展示了AI在解决个人生活问题上的实际应用潜力。

多模态教程/实践编码

09:25

Hacker News 热门（buzzing.cc 中文翻译）

53

如果人工智能能编写代码，为何还要使用Python？

尽管AI代码生成工具日益强大，但学习Python等传统编程语言依然重要。文章指出，AI无法替代开发者对问题分解、逻辑理解和代码审查的核心能力。Python凭借其简洁语法、庞大生态和广泛的应用场景，正转变为人类与AI协作的关键桥梁。它的价值将更侧重于快速原型设计、概念验证以及让开发者更高效地指导AI完成复杂任务，而非仅仅是一门手动编写的语言。因此，在AI辅助编程的时代，Python的角色是演进而非被取代。

现象/趋势编码

08:53

Simon Willison 博客

65

对GitLab裁员及战略调整的思考

GitLab宣布为适应“智能体时代”进行组织与战略调整，包括计划将设有小团队的国家数量减少高达30%，并扁平化管理结构，在某些职能中移除最多三层管理层。公司重组研发部门，建立约60个拥有端到端所有权的小型赋能团队，使独立团队数量近乎翻倍。同时，公司价值观框架从CREDIT更改为“速度与质量、主人翁心态、客户成果”。GitLab认为智能体时代将成倍增加软件需求，但其股价在过去一年从约52美元跌至26美元，增长前景面临市场不确定性。

智能体大佬观点现象/趋势编码

08:36

IT之家（RSS）

55

OpenAI 发布 Daybreak 项目：剑指 Anthropic，把安全检查放进日常代码流程

OpenAI于5月12日推出企业级安全项目Daybreak，旨在将网络安全防御前置至软件开发流程中。该项目对标Anthropic的Glasswing，提供基于GPT-5.5的三个模型，用于标准防护、授权环境及专门工作流。Daybreak并非一次性扫描工具，而是嵌入开发环节的持续安全工具链，支持代码审查、威胁建模等场景。企业目前可申请评估，具体价格尚未公布。

OpenAI 产品更新安全/对齐编码

05:53

Claude：Blog（网页）

74

Claude Code 推出智能体视图功能

Claude Code 近日推出“智能体视图”功能，为用户提供了一个集中管理所有会话的统一界面。该功能解决了并行运行多个智能体时需要切换终端标签、管理复杂网格的痛点，允许用户一键启动新智能体并将其发送至后台运行。在视图中，用户可以直观查看每个智能体的状态（等待输入、运行中或已完成）、最后响应内容及交互时间，并支持内联回复或进入完整会话。用户可通过 /bg 命令或将现有会话加入后台，也可直接使用 claude --bg [task] 启动后台任务。此功能已作为研究预览版向 Pro、Max、Team、Enterprise 及 Claude API 用户开放。

智能体 Anthropic 产品更新编码

03:52

Simon Willison 博客

49

引用 James Shore

James Shore 强调，AI 编码代理必须降低代码维护成本，否则编码速度的提升反而会导致长期维护负担剧增。如果编码输出速率加倍，维护成本需减半；输出速率提升三倍，维护成本需降至三分之一。数学关系显示：输出加倍且维护成本加倍时，总维护成本将翻四倍；输出加倍但维护成本稳定时，总成本仍翻倍。这警示开发者，AI 工具应在提升效率的同时，以成反比的方式减少维护开销，避免用短期速度换取永久性债务。

智能体大佬观点编码

02:52

Claude Code：GitHub Releases（RSS）

精选72

Claude Code v2.1.139 版本更新

本次更新引入了多项新功能与优化。核心新增包括：集中管理会话的Agent视图（研究预览）、可设置目标并持续工作的/goal命令、实时调整滚轮速度的/scroll-speed命令，以及查看插件详情的claude plugin details命令。交互界面导航与控制能力得到增强。底层优化涵盖MCP服务器可获取CLAUDE_PROJECT_DIR环境变量、/context all的令牌估算会考虑模型分词器并显示舍入值。此外，修复了超过20项问题，如凭证死锁、内存无限制增长、权限规则、UI显示错误及路径处理等缺陷。

智能体 Anthropic MCP/工具产品更新

推荐理由：Claude Code 这波更新给了两个真正改变工作流的杀手功能，agent view 让你一眼看清所有会话，/goal 命令能让 Claude 自己跑完一个任务直到满足条件，做开发的同学可以立刻试试。

01:23

Hacker News 热门（buzzing.cc 中文翻译）

47

使用 Swift 训练大型语言模型（LLM），第一部分：将矩阵乘法性能从 Gflop/s 提升至 Tflop/s

文章探讨了在Swift语言中训练大型语言模型时，如何将矩阵乘法的性能从每秒千兆次浮点运算（Gflop/s）提升至每秒万亿次浮点运算（Tflop/s）。这是系列文章的第一部分，聚焦于通过优化技术实现计算性能的数量级飞跃，旨在展示Swift在高效执行核心机器学习运算方面的潜力。

教程/实践数据/训练编码

5月11日

23:52

Simon Willison 博客

54

在"教学车间"中学习：公开协作与渗透式学习

Shopify创始人Tobias Lütke介绍了公司内部的编码智能体工具River，其独特之处在于完全在Slack公共频道中运行，拒绝私聊，确保所有对话可被搜索且任何员工都能参与。Lütke的个人频道已有超100人参与互动、补充背景或协助审查，形成了一个“教学车间”。这种模式通过公开工作实现渗透式学习，无需正式课程或管理计划，让员工在观察与协作中自然成长。文章同时类比了Midjourney早期在Discord公共频道的成功，认为公开分享提示词有效促进了集体学习与早期发展。

智能体现象/趋势编码

1…12 131415 16…22