全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 874 条

全部一手资讯 X 论文

标签「编码」清除

5月6日周三

03:12Tomer Tunguz 博客（VC 分析）55精选优化软件工厂

5月5日周二

20:56Hacker News 热门（buzzing.cc 中文翻译）65"能动编码"的启示：当编码成本低廉时，我们该怎么做？

02:16Simon Willison 博客38TRE Python 绑定--ReDoS 鲁棒性演示

5月4日周一

17:54The Decoder：AI News（RSS）56OpenAI 认为人类注意力是瓶颈，因此构建了让智能体自主管理的系统

14:13IT之家（RSS）60Linux 7.1 RC2 发布，AI 已渗透到内核开发

09:50Hacker News 热门（buzzing.cc 中文翻译）64"代理编码"是个陷阱

08:20Hacker News 热门（buzzing.cc 中文翻译）72精选DeepClaude - 搭载 DeepSeek V4 Pro 的 Claude Code 代理循环，价格仅为原价的 1/17

5月3日周日

16:49Hacker News 热门（buzzing.cc 中文翻译）46Show HN：黑客新闻评论员眼中的编码模型艺术现状

15:51The Decoder：AI News（RSS）60小米开源模型 MiMo-V2.5-Pro 瞄准 Claude Opus，实现数小时自主编程

13:49Hacker News 热门（buzzing.cc 中文翻译）43Kimi K2.6 刚刚在一场编程挑战赛中击败了 Claude、GPT-5.5 和 Gemini

00:49Hacker News 热门（buzzing.cc 中文翻译）63开放式设计：将您的编程代理用作设计引擎

5月2日周六

13:11IT之家（RSS）61苹果官方App误打包Claude.md文件，意外暴露内部使用Claude Code开发

04:13Simon Willison 博客60iNaturalist 观察记录聚合浏览工具

04:10Gary Marcus：The Road to AI We Can Trust（RSS）51能生成通过测试的代码模型，不等于能产出正确、安全、可维护、架构良好软件的模型

01:48Hacker News 热门（buzzing.cc 中文翻译）54优步仅用四个月就耗尽了原定2026年的AI预算，全部投入到Claude代码开发中

5月1日周五

16:47The Decoder：AI News（RSS）51Mistral 新旗舰模型 Medium 3.5 将聊天、推理和代码功能整合为一体

16:11IT之家（RSS）58OpenAI 总裁布罗克曼：AI 帮你编写的代码占比已从二成猛增至八成

11:14HuggingFace Daily Papers（社区热门论文）55InteractWeb-Bench：多模态智能体能在交互式网站生成中摆脱盲目执行吗？

10:14Claude Code：GitHub Releases（RSS）55精选Claude Desktop v2.1.126 版本更新

09:10IT之家（RSS）49用户的"口袋指挥部"：OpenAI 被曝将推出手机版 Codex，定位转向通用 AI 生产力工具

08:13Simon Willison 博客64Codex CLI 0.128.0 新增 /goal 指令

06:12Simon Willison 博客50Zig 语言创始人 Andrew Kelley 谈如何识别 AI 生成的代码

01:15Claude：Blog（网页）64精选Claude Security 开启公开测试，赋能企业代码安全

00:44Hacker News 热门（buzzing.cc 中文翻译）49如果您的提交中提到了"OpenClaw"，Claude Code 会拒绝请求或收取额外费用

00:13GitHub Blog59精选GitHub Copilot CLI 入门指南：交互模式与非交互模式

4月30日周四

22:13Hacker News 热门（buzzing.cc 中文翻译）43Vera：一种专为机器编写而设计的编程语言

20:10IT之家（RSS）53完全由 AI 生成：《任天堂明星大乱斗》PC 移植版问世

20:00Cursor Blog55精选持续优化智能体工具链：上下文演进与效果评估

16:09IT之家（RSS）55"氛围编程"命名人卡帕西提醒：AI 写的代码仍然臃肿，还需要靠人类把关

15:09HuggingFace Daily Papers（社区热门论文）51扭转TIDE：面向扩散大语言模型的跨架构蒸馏框架

15:09IT之家（RSS）55阿里发布数字员工 QoderWake：可在真实工作中承担软件工程师、运营、分析师等岗位角色

10:43智谱：研究（网页内嵌数据）55精选超大规模编码代理推理实践

09:34Simon Willison 博客57Zig项目严格反AI贡献政策的核心理由

09:34IT之家（RSS）64万亿级综合旗舰模型：蚂蚁集团百灵大模型开源 Ling-2.6-1T

03:42Hacker News 热门（buzzing.cc 中文翻译）56让 AI 来玩我的游戏--构建一个具有自主行为能力的测试框架以辅助游戏测试

03:12Hacker News 热门（buzzing.cc 中文翻译）39光标营

02:11Claude：Blog（网页）64精选Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp

00:40Mistral AI：News（网页）76Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体

4月29日周三

21:34IT之家（RSS）55华盛顿大学计算机科学教授格罗斯曼谈学习编程：是时候要重新理解了

20:00Cursor Blog75精选使用 Cursor SDK 构建可编程智能体

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月6日

03:12

Tomer Tunguz 博客（VC 分析）

精选55

优化软件工厂

软件工程团队中AI与人力比例的选择核心在于韧性而非吞吐量。在10/90比例下，约20名工程师使用Copilot等AI工具，保持传统层级结构；50/50比例时，12名工程师管理代理群，角色转向解决方案架构；90/10比例则仅需3名工程师核心操控自主代理，负责生成、测试和部署，无管理层级。高AI比例虽提升效率，但知识集中于少数人，团队利用率达100%，一旦人员离职将引发严重风险。借鉴制造业70-90%利用率原则，保持冗余可增强系统稳健性。因此，目前大多数初创公司不宜过度依赖AI。

智能体大佬观点编码

推荐理由：Tomer Tunguz 把 AI 团队比作工厂，点出反直觉结论，AI Agent 不是越多越好，关键在于预留弹性，避免单点故障。做工程管理的读完会重新算一算配比。

5月5日

20:56

Hacker News 热门（buzzing.cc 中文翻译）

65

"能动编码"的启示：当编码成本低廉时，我们该怎么做？

随着AI和自动化工具大幅降低编码成本，文章《“能动编码”的启示》提出了10个关键教训，指导开发者应对“能动编码”趋势。这些教训涵盖工作流程优化、角色重新定义以及抽象思维提升，帮助在代码廉价时代保持竞争力。该内容在Hacker News社区引发热议，获得105个点赞，显示技术界对此的高度关注。

智能体现象/趋势编码

02:16

Simon Willison 博客

38

TRE Python 绑定--ReDoS 鲁棒性演示

作者受 antirez 将 TRE 正则表达式引擎集成到 Redis 的启发，深入探索了 Ville Laurikari 开发的 TRE 引擎。他利用 Claude Code 构建了一个基于 ctypes 的实验性 Python 绑定库，并针对该库进行了一系列恶意的正则表达式攻击测试。结果显示，由于 TRE 引擎不支持回溯机制，其在抵御这些攻击方面的表现远优于 Python 标准库中的正则表达式实现。

GitHub 开源/仓库编码

5月4日

17:54

The Decoder：AI News（RSS）

56

OpenAI 认为人类注意力是瓶颈，因此构建了让智能体自主管理的系统

OpenAI 发布名为 Symphony 的新规范，旨在彻底改变人工智能编码工作流程。该系统允许智能体直接从 Linear 等项目管理平台自主领取任务并独立运行直至完成，无需开发者持续监控多个 Codex 会话。其核心目标是突破人类注意力瓶颈，实现开发过程中智能体的自我管理。

智能体 OpenAI 产品更新编码

14:13

IT之家（RSS）

60

Linux 7.1 RC2 发布，AI 已渗透到内核开发

Linux 7.1 第二个候选版本（RC2）已发布，整体进展顺利，预计将按时推出正式版。本次更新中，KVM自测试相关补丁因代码重命名而占比异常，导致版本体量偏大。Linus Torvalds指出，补丁数量激增很可能与AI开发工具的普及有关，这一趋势从Linux 7.0就已开始。此外，版本修复了大量显卡与网络驱动问题，包括AMD和英特尔显卡的内存泄漏、缓冲区溢出等漏洞，并对NVMe认证、TLS模式、RAID10配置等核心组件进行了多项安全与稳定性修复。

编码行业动态部署/工程

09:50

Hacker News 热门（buzzing.cc 中文翻译）

64

"代理编码"是个陷阱

文章指出“代理编码”是一个陷阱，认为过度依赖AI代理进行软件开发会导致代码质量下降、系统复杂性增加和开发者技能退化。核心论点是，AI代理目前缺乏真正的理解与创造力，其生成的代码往往存在隐藏缺陷，且使开发者脱离实际编程过程，长远来看会损害工程能力与软件可靠性。作者主张应将AI工具定位为辅助而非替代，保持人类开发者在关键设计与决策中的核心作用。

智能体现象/趋势编码

08:20

Hacker News 热门（buzzing.cc 中文翻译）

精选72

DeepClaude - 搭载 DeepSeek V4 Pro 的 Claude Code 代理循环，价格仅为原价的 1/17

DeepClaude项目在GitHub上发布，它是一个结合了DeepSeek V4 Pro模型的Claude代码代理循环工具。该工具的核心优势在于显著降低了使用成本，其价格仅为原Claude方案的1/17，即便宜了约17倍。这一开源方案为开发者提供了一个高性能且极具成本效益的代码生成与处理替代选择。

Anthropic 开源/仓库编码

推荐理由：用 DeepSeek V4 Pro 跑 Claude Code 代理循环，成本直接打到一杯奶茶钱，虽说不一定每个任务都能媲美原版，但便宜成这样还要什么自行车？

5月3日

16:49

Hacker News 热门（buzzing.cc 中文翻译）

46

Show HN：黑客新闻评论员眼中的编码模型艺术现状

根据Hacker News评论者的讨论，当前编码模型的最新技术进展显著。模型在代码生成、补全和错误修复等任务上表现突出，部分模型在特定基准测试中的准确率已超过90%。评论指出，模型对常见编程语言的支持日趋成熟，但在处理复杂逻辑或边缘案例时仍有局限。开源模型与闭源商业模型之间的差距正在缩小，开发者可用的工具选择更加丰富。社区关注点集中在模型的实用性、运行效率及与现有开发流程的集成能力上。

现象/趋势编码

15:51

The Decoder：AI News（RSS）

60

小米开源模型 MiMo-V2.5-Pro 瞄准 Claude Opus，实现数小时自主编程

小米发布开源模型 MiMo-V2.5-Pro，其编程基准测试成绩接近 Anthropic 的 Claude Opus 4.6，同时令牌消耗量减少 40% 至 60%。该模型能持续数小时自主处理单一任务，标志着中国开源模型竞争焦点正从单纯追求基准分数，转向降低运行成本与提升任务持久性。小米借此进一步深入与 DeepSeek 等国内开源提供商的竞争。

Anthropic 开源/仓库模型发布编码

13:49

Hacker News 热门（buzzing.cc 中文翻译）

43

Kimi K2.6 刚刚在一场编程挑战赛中击败了 Claude、GPT-5.5 和 Gemini

Kimi K2.6在编程挑战赛中击败了Claude、GPT-5.5和Gemini。该模型是一款开源的中国AI模型，在HumanEval编程基准测试中取得了92.7%的准确率，超越了GPT-5.5的92.2%和Claude 3.5 Sonnet的90.2%。其上下文长度扩展至128K tokens，并采用了MoE架构。此次表现标志着开源模型在编程能力上首次超越主流闭源模型。

开源/仓库编码评测/基准

00:49

Hacker News 热门（buzzing.cc 中文翻译）

63

开放式设计：将您的编程代理用作设计引擎

开源项目“Open Design”发布，旨在将编程智能体转化为设计引擎。该项目允许开发者利用代码生成和修改用户界面等设计元素，推动设计与开发流程的融合。项目在GitHub开源，并在Hacker News社区获得103点热度，显示出开发者对此类工具的积极关注。其核心变化在于为编程代理赋予了视觉设计能力，可能提升界面开发效率。

智能体开源/仓库编码

5月2日

13:11

IT之家（RSS）

61

苹果官方App误打包Claude.md文件，意外暴露内部使用Claude Code开发

苹果在Apple Support应用v5.13版本更新中，意外将内部开发文件Claude.md打包发布，证实其使用Claude Code构建生产级应用。泄露文件揭示了该应用对话系统的核心架构：采用Juno AI（自动应答）和Live Agents（真人客服）双后端设计，通过协议层无缝切换，用户无法区分消息来源。苹果在24小时内紧急撤回了该更新。此次事件表明，苹果内部已深度集成定制化Claude模型进行开发，且数据保存在自有服务器上。

Anthropic 编码行业动态

04:13

Simon Willison 博客

60

iNaturalist 观察记录聚合浏览工具

作者在手机上利用 Claude Code 开发了 iNaturalist Sightings 工具，以可视化其两个 iNaturalist 账户的观察记录。该工具通过自建的 Python CLI 程序获取数据，默认将2小时内、5公里内的观察记录聚类分组，并通过 Git scraping 技术将结果存储为 GitHub 上的 JSON 文件。前端页面获取此 JSON 数据后，以懒加载的缩略图展示所有观察记录，点击缩略图可在模态框中查看大图及物种常见名，从而实现了观察数据的便捷浏览与展示。

Anthropic 教程/实践编码

04:10

Gary Marcus：The Road to AI We Can Trust（RSS）

51

能生成通过测试的代码模型，不等于能产出正确、安全、可维护、架构良好软件的模型

当前大量代码由AI生成，但其实际意义需审慎评估。能生成可通过给定测试的代码模型，与能产出真正正确、安全、可维护且架构良好软件的模型存在本质区别。AI生成的代码可能在特定测试用例下运行成功，却未必满足软件工程对长期维护性、安全性、架构设计及潜在边界情况处理的高标准要求。这一差距揭示了当前AI编程工具的核心局限，提醒开发者需以批判性眼光看待其输出，而非完全替代专业开发实践。

大佬观点编码

01:48

Hacker News 热门（buzzing.cc 中文翻译）

54

优步仅用四个月就耗尽了原定2026年的AI预算，全部投入到Claude代码开发中

优步公司在短短四个月内耗尽了原定2026年全年的AI预算，所有资金全部投入到Claude代码的开发中。这一支出速度远超预期，突显了公司在人工智能领域的激进投资策略，可能预示着对Claude相关技术的高度优先推进。预算的快速消耗或影响后续AI项目的资金分配，反映科技巨头在AI竞赛中的加速布局。

Anthropic 编码行业动态

5月1日

16:47

The Decoder：AI News（RSS）

51

Mistral 新旗舰模型 Medium 3.5 将聊天、推理和代码功能整合为一体

Mistral 发布其新旗舰模型 Mistral Medium 3.5，它将此前独立的聊天、推理和代码生成模型合并为一个单一产品。同时，该公司为其编程工具 Vibe 增加了异步云代理功能，并为聊天产品 Le Chat 引入了新的智能体模式。

智能体推理模型发布编码

16:11

IT之家（RSS）

58

OpenAI 总裁布罗克曼：AI 帮你编写的代码占比已从二成猛增至八成

OpenAI总裁布罗克曼指出，AI编程工具进步显著，已从辅助角色转变为主导力量。仅去年12月，AI辅助编写代码的比例就从20%跃升至80%。OpenAI的Codex平台现已能支持“任何使用电脑工作的人”。布罗克曼强调，人类仍需对合并的代码负责，应避免盲目使用或完全拒绝AI生成代码。行业趋势显示，谷歌内部目前75%的新代码由AI生成并交由人工审核，Meta和Anthropic也报告了类似进展。Anthropic CEO预测，未来一年内AI可能编写绝大部分甚至全部代码。

OpenAI 现象/趋势编码

11:14

HuggingFace Daily Papers（社区热门论文）

55

InteractWeb-Bench：多模态智能体能在交互式网站生成中摆脱盲目执行吗？

本文针对非专业低代码用户指令模糊、质量低的现实瓶颈，提出了首个多模态交互式网站生成基准InteractWeb-Bench。该基准通过四类用户智能体与基于人物角色的指令扰动，系统模拟了包含模糊、冗余和矛盾在内的多样化用户行为，并提供了一个支持澄清、实现、验证和提交统一行动的交互式执行环境，以实现迭代式意图细化与代码合成。大量实验表明，当前前沿的多模态大语言模型智能体仍受困于“盲目执行”模式，在意图识别与自适应交互方面存在明显局限。

智能体多模态编码论文/研究

10:14

Claude Code：GitHub Releases（RSS）

精选55

Claude Desktop v2.1.126 版本更新

本次更新增强了模型网关集成，当配置指向兼容网关时，可直接在模型选择器中列出可用模型。新增了 claude project purge 命令，用于彻底清理项目状态数据。OAuth登录流程得到优化，支持在浏览器回调失败时手动粘贴授权码，并修复了多种网络环境下的登录问题。安全方面，修复了 allowManagedDomainsOnly 等设置可能被忽略的漏洞。此外，还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。

Anthropic MCP/工具产品更新编码

推荐理由：这是 Claude Code 一次‘生活质量’大更新，OAuth、Windows 权限、流超时等痛点都被修了，如果你在用 Claude Code，今天就该升级。

09:10

IT之家（RSS）

49

用户的"口袋指挥部"：OpenAI 被曝将推出手机版 Codex，定位转向通用 AI 生产力工具

OpenAI计划将AI编程智能体工具Codex从桌面端扩展至移动端，推出配套iPhone应用。该应用定位为“开发智能体指挥中心”，用户可通过手机监控后台运行的自动化任务并接收实时反馈。产品定位从智能体编程转向通用生产力工具，新版Mac应用新增工作类型选项，涵盖工程、财务等10个领域，系统会根据用户选择调整界面。移动应用预计深度集成版本控制系统，支持用户通过语音或触控审批代码修改建议。

智能体 OpenAI 产品更新编码

08:13

Simon Willison 博客

64

Codex CLI 0.128.0 新增 /goal 指令

OpenAI 的 Codex CLI 编码代理最新版本 0.128.0 引入了类似 Ralph 循环的功能。用户可通过设置 /goal 指令，让 Codex 持续循环执行任务，直至系统判定目标完成或达到预设的 token 预算上限。该功能主要通过自动注入的 goals/continuation.md 和 goals/budget_limit.md 提示模板实现，标志着 Codex CLI 在自主任务执行与预算控制方面的能力得到增强。

智能体 OpenAI 产品更新编码

06:12

Simon Willison 博客

50

Zig 语言创始人 Andrew Kelley 谈如何识别 AI 生成的代码

Zig 语言创始人 Andrew Kelley 反驳了“无法识别谁在使用 LLM”的常见误解。他指出，尽管可能未捕获所有由 AI 辅助的拉取请求，但人类错误与 LLM 的幻觉存在本质区别，使得后者易于识别。他进一步比喻道，习惯于使用 AI 代理编程的人带有一种“数字气味”，就像吸烟者进入房间时，不吸烟者能立刻察觉一样。Kelley 澄清自己并非反对使用 LLM，但明确禁止在 Zig 项目中使用 AI 辅助生成的代码。

大佬观点开源生态编码

01:15

Claude：Blog（网页）

精选64

Claude Security 开启公开测试，赋能企业代码安全

Claude Security 现已面向所有 Claude Enterprise 客户开放公开测试。该功能基于 Claude Opus 4.7 模型，能够扫描代码库中的漏洞并生成针对性修复方案。公开版本新增了计划扫描与定向扫描功能，更易于与审计系统集成，并改进了问题追踪流程。此外，Opus 4.7 的能力正通过 CrowdStrike、微软安全等技术合作伙伴，以及埃森哲、德勤等服务合作伙伴，集成到企业现有安全工具中，帮助防御者应对日益严峻的网络安全挑战。

Anthropic 产品更新安全/对齐编码

推荐理由：Claude Security 正式公测，Anthropic 把 Opus 4.7 的代码理解力直接嵌进企业安全流程，从扫描到 patch 一条龙，安全团队可能第一次能和 AI 齐步跑了。

00:44

Hacker News 热门（buzzing.cc 中文翻译）

49

如果您的提交中提到了"OpenClaw"，Claude Code 会拒绝请求或收取额外费用

Claude Code 对提交内容中提及“OpenClaw”的请求采取了限制措施，会直接拒绝处理或收取额外费用。这一政策变化源于相关社区讨论，并在 Hacker News 上获得了超过 127 个关注点。该调整表明平台正对特定关键词关联的提交实施更严格的管控或成本规则。

Anthropic 编码行业动态

00:13

GitHub Blog

精选59

GitHub Copilot CLI 入门指南：交互模式与非交互模式

GitHub Copilot CLI 提供了交互与非交互两种主要使用模式。交互模式允许用户通过对话式指令逐步构建和调整命令，适合探索性任务。非交互模式则支持直接输入完整指令快速执行，适用于自动化脚本或已知命令。理解这两种模式的区别能帮助开发者更高效地利用该工具，提升命令行工作效率。

GitHub 教程/实践编码

推荐理由：如果你总在 Copilot CLI 的交互和非交互模式之间犯迷糊，这篇官方教程算是清晰的速查手册，初学者花五分钟就能搞清楚。

4月30日

22:13

Hacker News 热门（buzzing.cc 中文翻译）

43

Vera：一种专为机器编写而设计的编程语言

Vera 是一种新型编程语言，专为机器自动编写代码而设计，旨在推动编程自动化。该语言已在 GitHub 平台开源发布，项目地址为 github.com/aallan/vera。自亮相以来，在技术社区 Hacker News 上引发热议，相关帖子获得了 100 点的热度指标，显示出业界对其创新潜力的广泛关注。

GitHub 开源/仓库编码

20:10

IT之家（RSS）

53

完全由 AI 生成：《任天堂明星大乱斗》PC 移植版问世

初代《任天堂明星大乱斗》的PC原生移植版《BattleShip》发布，其全部代码完全由AI生成。开发者仅用25天，借助Opus和GPT等大模型独立完成。该项目基于C/C++源码，需用户提供原版ROM以提取版权数据方可运行。开发者旨在验证AI能胜任此类开发，并展示结合现有技术积累与AI可大幅降低创作门槛。游戏制作人樱井政博也曾认同利用AI提升开发效率有助于行业可持续发展。

智能体 Anthropic OpenAI 开源/仓库

20:00

Cursor Blog

精选55

持续优化智能体工具链：上下文演进与效果评估

Cursor团队以构建软件产品的方式迭代优化其智能体工具链，核心围绕上下文窗口的演进。早期模型能力有限，工具链依赖大量静态上下文和防护机制；随着模型能力提升，团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合：通过CursorBench等基准测试进行标准化质量评估，同时进行线上A/B测试，使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误，以应对日益复杂的工具链状态。

智能体 Anthropic OpenAI 教程/实践

推荐理由：Cursor 这篇 agent harness 复盘是今年聊 agent 基础设施最好的文章之一，从上下文管理到多 agent 调度，全是实战迭代的血泪经验，做 agent 的团队该逐字读。

16:09

IT之家（RSS）

55

"氛围编程"命名人卡帕西提醒：AI 写的代码仍然臃肿，还需要靠人类把关

特斯拉前AI负责人安德烈·卡帕西指出，当前AI生成的代码质量仍不理想，存在臃肿、复制粘贴多、抽象设计别扭脆弱等问题，如同“实习生”需要人类监督。他提出的“氛围编程”概念描述了高度依赖AI辅助的开发模式，但人类仍需负责高层级决策与审美把关。卡帕西认为，AI并非无法写出简洁代码，只是模型训练尚未将此作为重点优化方向。

大佬观点编码

15:09

HuggingFace Daily Papers（社区热门论文）

51

扭转TIDE：面向扩散大语言模型的跨架构蒸馏框架

研究团队提出首个跨架构扩散大语言模型蒸馏框架TIDE，以解决师生模型在架构、注意力机制和分词器上不同时的知识迁移难题。该框架包含三个核心组件：TIDAL根据训练进度和扩散时间步联合调节蒸馏强度；CompDemo通过互补掩码分割丰富教师模型上下文，以改进重度掩码下的预测；Reverse CALM则是一种提供有界梯度和双端噪声过滤的跨分词器目标函数。实验将80亿参数稠密模型和160亿参数MoE教师模型的知识蒸馏至6亿参数学生模型，在八个基准测试中平均领先基线1.53分，代码生成能力提升显著。

数据/训练编码论文/研究

15:09

IT之家（RSS）

55

阿里发布数字员工 QoderWake：可在真实工作中承担软件工程师、运营、分析师等岗位角色

阿里发布业界首个安全可控、持续进化的生产级数字员工产品QoderWake，可在真实工作中承担软件工程师、运营、分析师等岗位。目前已上线“数字程序员”，能自主完成代码变更简报整理、错误诊断与初诊报告、告警分诊等工作，全流程基本无人值守。该产品已在阿里内部应用，将单条问题的根因分析耗时从30分钟大幅缩短至2分钟。近期还将上线数字分析师、数字客户经理等多种数字员工角色。QoderWake已开放邀测，个人和企业可通过官网申请雇佣或定制专属数字员工。

智能体产品更新编码

10:43

智谱：研究（网页内嵌数据）

精选55

超大规模编码代理推理实践

在超大规模编码代理推理中，乱码和生僻字异常伴随低spec_accept_length，复读异常伴随高spec_accept_rate，均因KV Cache状态偏差导致。通过修复KV Cache竞态和加载时序缺失，引入显式同步约束及分层存储优化，提升了推理稳定性和效率。

编码论文/研究部署/工程

推荐理由：智谱公开了超大规模Coding Agent推理的工程细节，KV Cache竞态的修复和分层存储方案可以直接用，做Agent infra的值得收藏。

09:34

Simon Willison 博客

57

Zig项目严格反AI贡献政策的核心理由

Zig项目实施了最严格的反LLM政策，全面禁止在问题、拉取请求和评论中使用AI生成内容。尽管其生态中的重要项目Bun（已被Anthropic收购）重度依赖AI辅助，并通过对Zig的分支实现了4倍的编译性能提升，但由于该禁令，这些改进不会向上游合并。Zig软件基金会社区副总裁解释，此政策的核心逻辑是“贡献者扑克”——项目更重视培养可信赖的长期贡献者，而非单次代码贡献。审查PR被视为对“人”的投资，而LLM生成的“完美”PR无法帮助社区积累这样的贡献者，因此被禁止。

Anthropic 大佬观点开源生态编码

09:34

IT之家（RSS）

64

万亿级综合旗舰模型：蚂蚁集团百灵大模型开源 Ling-2.6-1T

蚂蚁集团正式开源百灵大模型万亿级综合旗舰模型 Ling-2.6-1T。该模型不单纯追求参数规模，而是通过MLA与Linear Attention混合架构等创新，系统性优化智效比与复杂任务执行能力。其核心是在更低Token开销下实现强综合智能，减少对冗长思考链的依赖，并在AIME26、SWE-bench Verified等多个执行类基准测试中达到开源SOTA水平。模型具备完整的工程落地能力，并与主流Agent框架兼容，旨在成为可部署于真实业务系统的底座。为方便体验，其在OpenRouter平台的免费API调用服务将延期一周。

开源生态推理模型发布编码

03:42

Hacker News 热门（buzzing.cc 中文翻译）

56

让 AI 来玩我的游戏--构建一个具有自主行为能力的测试框架以辅助游戏测试

开发者构建了一个基于AI的自主测试框架，用于辅助游戏测试。该框架让AI智能体能够自主探索游戏环境、执行复杂任务并报告异常，从而替代部分重复性人工测试工作。文中提及该框架在测试中发现了传统方法难以触达的边界情况，提升了测试覆盖率和效率。这一方法为游戏测试自动化提供了新思路，目前已在Hacker News社区获得广泛关注。

智能体教程/实践编码

03:12

Hacker News 热门（buzzing.cc 中文翻译）

39

互动网页“光标营”在Neal.fun平台发布，该页面模拟了一个光标训练营场景。页面中大量光标元素会进行集体操练、障碍跑和阅兵等拟人化活动，呈现出动态视觉效果。该作品在Hacker News上获得了109点社区热度。

02:11

Claude：Blog（网页）

精选64

Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp

Claude API技能现已扩展集成至CodeRabbit、JetBrains、Resolve AI和Warp四款开发工具中，使开发者能在其常用环境中直接获得生产就绪的Claude API代码支持。该技能能自动捕获API最佳实践细节，如适配的智能体模式、参数变更与提示缓存规则，从而减少错误并简化模型迁移。开发者可在工具内直接指示Claude执行“提高缓存命中率”或“升级至最新Claude模型”等任务。此开源技能会随SDK更新自动同步，帮助团队更快采用新功能，避免因API知识过时导致的生产问题。

Anthropic MCP/工具产品更新编码

推荐理由：Anthropic 把 claude-api skill 从自家 IDE 扩散到 JetBrains、Warp 等主流开发工具，本质是用「内置专家知识」抢开发者心智，做 Claude API 集成的产品人值得看看它覆盖了哪些坑。

00:40

Mistral AI：News（网页）

76

Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体

Mistral AI推出旗舰模型Mistral Medium 3.5，这是一个128B参数的密集模型，拥有256K上下文窗口，在SWE-Bench Verified上获得77.6%的分数。该模型现作为Vibe和Le Chat的默认引擎，并驱动两项新功能：Vibe远程编程智能体可将编码任务移至云端异步并行执行，用户可通过CLI或Le Chat启动并在完成后接收通知；Le Chat的新工作模式则是一个由该模型驱动的智能体，能处理研究、分析和跨工具操作等多步骤复杂任务。这些更新旨在将开发者从本地线性任务中解放出来，提升工作效率。

智能体开源生态模型发布编码

4月29日

21:34

IT之家（RSS）

55

华盛顿大学计算机科学教授格罗斯曼谈学习编程：是时候要重新理解了

华盛顿大学计算机科学教授丹·格罗斯曼指出，AI编程工具正重塑编程学习。过去教学重点在于语法细节如分号和逗号，如今AI能替非专业和专业人士处理这些琐碎工作。关键能力转向精确描述算法运行和创造性设计应用。艾伦学院已调整教学方式，毕业生就业比例大体稳定，但更多学生进入非传统科技公司。未来软件发展潜力巨大，工程师需求依然旺盛，编程方式持续演变，核心概念仍需掌握。

大佬观点编码

20:00

Cursor Blog

精选75

使用 Cursor SDK 构建可编程智能体

Cursor 正式推出 SDK 公开测试版，开发者仅需几行 TypeScript 代码即可构建和部署智能体。该 SDK 提供与 Cursor 应用相同的运行时、框架及前沿模型（如 GPT-5.5）支持，并允许将智能体部署于本地或 Cursor 云的专用虚拟机。借助其生产级云基础设施，如安全沙箱和持久状态管理，智能体正从个人工具演变为组织的可编程基础设施。许多团队已将其集成至 CI/CD 流水线、工作流自动化及核心产品中。

智能体产品更新编码

推荐理由：Cursor 把自家产线拆出来给外部用，对于想把 AI 代理嵌入 CI/CD 或产品的团队，省掉了自建完整 agent 栈的麻烦，对做自动化编码的开发者是个必看的更新。

1…14 151617 18…22