6月2日

12:34

Hacker News 热门（buzzing.cc 中文翻译）

Chipotlai Max 项目在 Hacker News 获得关注

“Chipotlai Max”项目在 Hacker News 上获得了 102 点热度，并提供了其 GitHub 仓库地址。

GitHub 开源/仓库编码

12:07

IT之家（RSS）

微软 Copilot 超级应用曝光：整合多款工具，常驻 AI 智能体 Scout

根据曝光的截图，微软正在开发“Copilot 超级应用”，内部口号是“Delivering one Copilot”，旨在统一所有 Copilot 工具入口。该应用计划整合 GitHub Copilot、Copilot 聊天、Copilot Cowork 及内部代号为 Autopilot 的新智能体能力。应用内包含一个代码页，形态类似 Claude Code 面板，带有一个名为 Scout 的常驻 AI 智能体。用户可通过该页面管理代码仓库、切换模型并安排定时任务。另一个 Cowork 标签页用于汇总数据并提供提示词。

智能体产品更新编码

12:07

Ethan Mollick@emollick

关于使用Github及其他数据的AI编程智能体的重要论文自动补全工具（如Copilot）使代码量增加2.2倍，本地智能体（如初版Claude Code）增加7.4倍，而当前远程编程智能体增加17.3倍（！）但编程中的人类瓶颈意味着实际发布量"仅"增加了30%

智能体编码论文/研究

12:03

Tibo@thsottiaux

你只需用 Codex 就能……生成一个农场 https://chatgptpro.substack.com/p/hiroki-tomiyasu

OpenAI 教程/实践编码

11:53

MiniMax (official)@MiniMax_AI

MiniMax宣布推出首个开源权重模型M3。该模型结合了三大前沿能力：在编程与智能体方面，它在SWE-Bench Pro等评测上取得了具体分数；通过MiniMax Sparse Attention技术，其上下文窗口可扩展至1M tokens；并且模型从零开始原生支持多模态。模型的权重与技术报告将在约10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

开源生态模型发布编码

关联讨论 11 条

10:56

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.160 发布

Claude Code v2.1.160版本主要增强安全性和稳定性。新版本在向shell启动文件和.git/config等文件写入内容前增加提示，防止意外命令执行；acceptEdits模式在写入.npmrc等构建配置文件前也会提示。此次更新修复了多个问题，包括Windows/WSL剪贴板、会话恢复、后台会话连接等，并优化了自动模式延迟和后台清理流程。此外移除了JetBrains插件建议，将动态工作流触发词从workflow重命名为ultracode。

Anthropic 产品更新编码

10:35

小互@xiaohu

今晚 codex 将有大更新…

编码行业动态

10:13

Chubby♨️@kimmonismus

OpenAI 将于明天发布一次重要的 Codex 更新。经过数月开发，这将是一个相当特别的功能。它听起来与 GPT-5.6 确实不同。

Rohan Varma: Tomorrow, we're launching something special into Codex. It's been months in the making and it's the feature I've persona...

OpenAI 产品更新编码

09:35

meng shao@shao__meng

用户邵猛的 $10K Cursor 额度使用体验回顾

用户邵猛在获得 Cursor 团队赠送的 $10K 额度及两个月 Ultra 订阅后，实际使用了约 $2 千美元。其使用体验显示，100% 的时间都在使用 Agent Windows 模式，很少进行多模型切换。模型选择上，有外网访问时偏好 GPT-5.5，否则常用 Composer 2.5，因其 Fast 模式速度快且喜欢输出 Diagram 流程图。优点在于 Context 使用明细清晰，但 Agent 输出界面默认非 Markdown 且不支持拷贝为 Markdown。此外，Agent 界面右侧的扩展窗口（Terminal、Browser、File、Canvas）被认为比较实用。

meng shao: 收到 @cursor_ai 团队成员私信,随后 $10K 到手,非常感谢! 5月份是 Cursor Token 自由的一个月 😃 把 Cursor 新功能用起来,多多给团队提反馈,自己也试试在 Token 自由的情况下,看看能做出什么有趣...

智能体教程/实践编码

09:05

meng shao@shao__meng

Lee Robinson 分享四条「Agent 友好型代码库」原则

Lee Robinson 分享了四条构建适合AI智能体的代码库的原则：1. 源码应为真相或提供可读路径（如将内容从CMS迁移回代码）；2. 智能体需能通过类型系统、测试和Linter验证工作；3. 维护精简有效的AGENTS.md文件，提供项目特有上下文；4. 设置自动化流程（如安全扫描）持续改进。他以Cursor官网迁移为例，该过程耗时3天，消耗344次Agent请求，花费$260，证明降低抽象层成本能带来可量化的投资回报。

Lee Robinson: Some tips to help agents understand your codebase: 1. The source code either needs to be the source of truth, or have so...

智能体教程/实践编码

09:05

meng shao@shao__meng

精选78

Anthropic 开发者分享 Claude Code「理解验证」工作流

Anthropic 核心开发者分享了一套用于 Claude Code 的「理解验证」工作流。该工作流将 AI 定位为“高效且睿智的教师”，成功标准不仅是完成任务，更是确保人类对问题、方案及影响有可复述、可辩护的掌握。它通过增量教学、用户复述、清单+测验等方式，围绕问题域、方案域和语境域三条轴线展开，具体包含8个可执行步骤，强调在进入下一阶段前需确认用户已真正理解。此工作流旨在对抗长会话中人类易沦为“审批按钮”的“智能体黑箱”问题，强制沉淀决策上下文，实现可审计的深度理解。

Thariq: been asking others at Anthropic how they stay in the loop with Claude and fully understand the work being done this is o...

智能体 Anthropic 教程/实践编码

推荐理由：Anthropic内部的「理解验证」工作流，把结对编程的认知摊到全程，用清单和测验逼你真正懂。做AI辅助开发又不想当审批按钮的，可以直接套用。

09:04

Baidu Inc.@Baidu_Inc

我们将于本周五北京时间上午9点直播演示 MeDo 3.0！ @Medo_CodeFree 将介绍其变化、工作原理以及你可以用它构建的一些东西。 🧵 点击此处观看 ↓

产品更新编码

08:48

OpenCode@opencode

我们的团队对 little frank 上瘾了猜猜这是什么模型

其他编码

08:48

OpenAI Developers@OpenAIDevs

今天与客户通话。明天开始新的产品工作流程。 Proaction是一个5人团队，他们使用Codex构建车队管理软件，涵盖销售演示、客户支持跟进、营销资产和工程工作。

OpenAI 教程/实践编码

08:12

Rohan Paul@rohanpaul_ai

精选75

🎯 Andrej Karpathy 谈如何学习。

教程/实践编码

推荐理由：Karpathy的学习方法贴，虽然只是一张图，但可能是你今年最该抄的作业，直接改掉低效学习模式。

08:00

HuggingFace Daily Papers（社区热门论文）

EvoTrainer：为自主智能体 RL 共同进化 LLM 策略与训练端工具

EvoTrainer 是一个自主训练框架，通过经验反馈共同进化 LLM 策略与训练端工具。它诊断 rollout 级证据、修正诊断、回测干预并积累可复用技能。在数学推理、竞赛编程代码生成和仓库级软件工程评估中，EvoTrainer 在相同数据、代码库和协议下匹配或超越人工设计的 RL 参考，最大收益在长 horizon SWE 任务上。轨迹分析显示，保留的策略跨领域发散，进化的诊断阻止无效高分分支被提升，可复用技能塑造后续搜索。

智能体推理编码论文/研究

07:54

ginobefun@hongming731

BestBlogs 早报：MiniMax M3 开源模型发布，集成前沿能力

本期早报聚焦三个主题。核心是 MiniMax 发布其开源模型 M3，这是国内首个同时具备前沿 Coding 能力、1M 超长上下文和原生多模态的模型。M3 在 SWE-Bench Pro 上得分 59.0%，其自研 MSA 稀疏注意力架构显著降低了长上下文计算开销。实测中，M3 可在 24 小时内自主完成 CUDA 算子优化。此外，早报还简述了 Chromium 项目对 AI Coding 的规范化实践，以及 xAI 工程师关于视频 Agent 发展前景的观点。

智能体 xAI 模型发布现象/趋势

07:54

ginobefun@hongming731

MiniMax发布开源模型M3：集成编码、长上下文与多模态

MiniMax开源发布了国内首个集成前沿Coding能力、1M超长上下文和原生多模态的模型M3。该模型能在24小时内自主完成145次CUDA算子迭代。与此同时，xAI前负责人指出，视频模型的上限将由LLM决定，下一个类似Sora的产品应是视频Agent，而非单纯的视频生成模型。

多模态开源/仓库模型发布编码

07:35

Alibaba Cloud@alibaba_cloud

通义千问 Qwen3.7-Plus 多模态代理模型发布

阿里云发布了 Qwen3.7-Plus，这是一款统一了视觉与语言能力的多模态代理模型。该模型旨在成为通用的代理基础，支持图形界面与命令行操作，能够处理视觉和文本任务，充当编程代理和效率助手。其能力涵盖视觉感知、推理、目标定位以及搜索增强问答，并可跨多种代理框架进行泛化。该模型现已在阿里云百炼平台提供 API 服务。

智能体多模态模型发布编码

关联讨论 6 条

07:19

MiniMax (official)@MiniMax_AI

同事件精选81

M3 on Cloudflare AI Gateway， day one ⚡ 前沿编码能力，1M 上下文，原生多模态，现在一次 fetch 即可调用。是时候构建些东西了。 🦞

Cloudflare Developers: M3 from @MiniMax_AI is now available on Cloudflare AI Gateway: - First open model to push SOTA coding frontier - 1M cont...

多模态开源/仓库模型发布编码

同一事件，精选展示《MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型》

推荐理由：MiniMax的M3把开源编码模型拉到新高度，1M上下文加原生多模态是惊喜，上线首周5折，值得跑一下看是不是真能干翻闭源。

07:14

Cursor Blog

精选64

Cursor Teams计划定价方案更新

Cursor Teams计划推出三项更新：增加Composer特定使用池，将第一方模型（Composer和Auto）与第三方API的使用额度分开计费；推出Premium席位，提供5倍于标准席位（$40/月）的使用量，价格为$96/月（年付）；仪表盘现可实时显示用户额度使用情况，管理员可通过Slack或邮件配置智能提醒。

智能体产品更新编码

推荐理由：Cursor这个定价更新把「用不用得起第三方模型」的问题从团队开支里切出去了，标准席位加量不加价，重度用户直接上Premium可能比现在更划算，做Agent开发的团队不妨算算账。

06:44

Peter Steinberger 🦞@steipete

我告诉 Codex，当我分心且它需要我的帮助来解除阻塞时，使用 http://sag.sh。偶尔我会听到它在跟我说话，这是有史以来最酷的事情。（例如，对于需要 npm 且受 1Password 门控的发布任务）

MCP/工具教程/实践编码

06:43

Ars Technica：AI（RSS）

GitHub Copilot 用户对全新按量计费系统反应强烈

GitHub Copilot 正从固定订阅制转向基于使用量的计费系统。部分用户反映，其单日用量就消耗掉了整月的“AI credit”配额，引发用户对成本控制的担忧。

GitHub 编码行业动态

06:30

宝玉@dotey

Cursor 为团队用户提升使用额度

Cursor 宣布提升所有团队用户使用额度，并推出 Premium 团队席位。用户反馈其 Agent 模式效果好，支持多任务并行、灵活选择各类模型，且 Plan 模式步骤详细。对比中，用户认为其表现优于 Claude Desktop，略低于 Codex App。当前不足包括不支持 /goal 与手机版，且调试功能仅限内置浏览器。

Cursor: We're increasing usage limits for every Teams user. Inspired by the success of our Ultra plan, we're also introducing a ...

智能体编码评测/基准

06:27

eric zakariasson@ericzakariasson

我玩这个玩得太久了。感谢构建它，@DanHollick https://cursor.com/insights

其他编码

06:01

jason@jxnlco

现已在Bedrock上可用！【引用 @OpenAI】：OpenAI前沿模型和Codex现已在AWS上全面可用，为企业提供了一种新方式，通过其现有的安全、合规和治理工作流，在Amazon Bedrock上使用OpenAI进行构建。这同时也是OpenAI在AWS上更广泛能力扩展的开端，包括未来将提供Daybreak等网络安全能力。 https://openai.com/index/openai-frontier-models-and-codex-are-now-available-on-aws/

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI 产品更新编码部署/工程

06:00

宝玉@dotey

Cursor 在为用户增加使用额度。

Cursor 宣布为所有 Teams 用户提升使用额度，并受其 Ultra 计划启发，将推出一个提供 5 倍用量、价格 3 倍的 Premium 团队席位。有用户分享了重度使用其 Agent 的体验，认为效果不错，亮点包括：可开启多任务并行的 multitask 模式、能灵活选择各种模型（如 composer 2.5），以及步骤详细的 Plan 模式配合使用效果稳定。目前不足之处是不支持 /goal、手机版，以及缺乏类似 Codex 的 Chrome use 和 Computer use 调试功能，仅有内置浏览器调试。

Cursor: We're increasing usage limits for every Teams user. Inspired by the success of our Ultra plan, we're also introducing a ...

智能体编码评测/基准

05:48

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选66

OpenAI前沿模型与Codex现可在AWS上使用

OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术，从而加速从评估到生产部署的过程。

智能体 OpenAI 产品更新编码

关联讨论 3 条

推荐理由：这不是模型发布，而是渠道开闸，企业拿着现有 AWS 安全体系就能用上 GPT-5.5，合规部门终于不用再纠结。Codex 也直接嵌入开发流程，落地阻力小了一大截。

05:37

jason@jxnlco

我们希望有人能帮助我们发布 Python Codex SDK，并希望能与 PyPI 的相关人员沟通。有人能帮我们吗？

OpenAI 编码行业动态

05:17

Lee Robinson@leerob

帮助AI智能体理解代码库的四点建议

文章分享了四条让AI智能体有效理解代码库的实用建议。1. 确保源代码是唯一真实来源，或通过MCP、CLI等方式让外部内容对智能体可读。2. 智能体需具备自我验证能力，这依赖于使用类型语言、高质量测试和配置良好的linter。3. 编写简洁有效的AGENTS.md文件，并融入符合模型预期的直观命名，可借助Cursor等工具自定义智能体。4. 配置自动化流程，用于代码重构建议、安全问题检查和持续文档生成，以实现一个能自我改进的“自动驾驶”代码库。

智能体 MCP/工具教程/实践编码

04:16

🚨 AI News | TestingCatalog@testingcatalog

XAI 🔥：SuperGrok 和 X Premium+ 用户现在可以通过 Grok Build 使用 Cursor 的 Composer 2.5 模型！ Grokposer 🤖

xAI 产品更新编码

03:53

Replit ⠕@Replit

精选73

你能用单个提示词免费构建一个真实的业务吗？从今天起，在 Replit 上，答案是肯定的。从一个提示词开始，获得一个网站、移动应用、幻灯片和发布视频。此外，还能解锁使用 @stripe @atlas， @QuickBooks， @mercury & @doolaHQ 运营业务的福利。

产品更新编码部署/工程

关联讨论 1 条

推荐理由：Replit 从写代码进化到了‘一个提示生成网站+App+PPT+视频’，还串起了 Stripe 和 QuickBooks，‘建个生意玩玩’的成本降到史低，产品人和独立开发者值得试。