5月14日

22:45

Hugging Face：Blog（RSS）

精选59

在连续批处理中，同步方式导致CPU与GPU交替工作，造成闲置浪费。测试显示，使用8B模型生成8K令牌时，GPU有24%的时间处于空闲状态。异步批处理通过分离工作负载，让CPU准备下一批次（N+1）的同时，GPU计算当前批次（N），从而消除闲置间隙。这可通过CUDA流实现操作并发，无需更改内核或模型，仅需协调硬件执行顺序。理论上，该方法可将总生成时间从300.6秒减少至228秒，实现24%的免费加速。相关技术已集成到transformers库的连续批处理中，显著提升推理性能。

Hugging Face 推理教程/实践部署/工程

推荐理由：文章手把手拆解了异步批处理如何用CUDA流和事件消除CPU与GPU的互相等待，把推理吞吐提升22%，搞推理优化的工程师值得细读。

21:29

Hacker News 热门（buzzing.cc 中文翻译）

精选78

克劳德代码与《代码书》技能：有针对性的技能培养

开发者发布了一款名为“克劳德代码与《代码书》技能”的GitHub工具，旨在通过刻意练习提升编程技能。该工具利用AI模型生成特定主题的代码示例与解释，帮助用户进行针对性学习。项目在Hacker News上获得104点热度，关注度较高。其核心变化在于将传统的广泛学习转化为聚焦、可重复的技能训练模式，通过结构化练习提升学习效率。

教程/实践编码

推荐理由：这个skill把Claude Code变成一对一的代码教练，专门抓你代码里的坏习惯，对想用AI真正提升编码水平的人是个好东西。

12:11

公众号：数字生命卡兹克

现在，你可以在手机上用AI生成一个APP了。

产品更新教程/实践

08:55

Simon Willison 博客

欢迎来到 Datasette 博客

Datasette 项目正式推出官方博客，用于发布一系列即将到来的公告。博客的创建使用了 OpenAI Codex desktop，该工具具备 Markdown 会话转录导出功能，简化了开发流程。构建过程的完整会话记录已公开在 GitHub Gist 中，相关项目 issue 也提供了更多背景信息。此举标志着 Datasette 项目通过 AI 辅助编程工具扩展其沟通渠道。

OpenAI 教程/实践

03:29

Claude：Blog（网页）

精选73

Claude 电脑与浏览器使用的最佳实践

Claude 最新模型在电脑与浏览器使用能力上显著提升，支持构建复杂智能体系统。本文针对Claude 4.6系列和Opus 4.7提供实践指南，重点优化截图分辨率：Claude 4.6系列API限制最大长边1568像素、总像素115万；Opus 4.7提升至最大长边2576像素、总像素375万。发送前将截图缩放到限制内是提升点击准确性的最有效方法。推荐起始分辨率为1280x720，Opus 4.7用户可优先使用1080p，并避免发送未经缩放的原始截图或过低分辨率图像。

智能体 Anthropic 教程/实践部署/工程

推荐理由：如果你正在让 Claude 操作桌面或浏览器，这篇官方指南把分辨率、token 压缩和缓存策略一次讲透了，附带代码和踩坑表，是那种"读完就能少写一堆 bug"的硬核文档。

02:31

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选62

在 Windows 上构建安全有效的沙箱以启用 Codex

OpenAI 为 Windows 平台上的 Codex 构建了一个安全沙箱环境。该沙箱通过严格控制文件访问权限和实施网络限制，确保了代码生成与执行过程的安全性。这一举措使得基于 Codex 的编码助手能够以高效且受控的方式运行，在提供强大编程辅助功能的同时，有效隔离了潜在风险，保障了用户系统的安全。

OpenAI 安全/对齐教程/实践

推荐理由：OpenAI 首度公开 Codex 在 Windows 上的沙箱细节，控制文件访问和网络限制的架构设计讲得很实在，做自主编程代理安全的值得一读。

5月13日

17:39

IT之家（RSS）

Anthropic Claude Code 缔造者：数千个 AI 智能体夜间自动为我写代码

Anthropic工程师鲍里斯・切尔尼透露，他利用Claude Code的循环指令和例行任务功能，在夜间自动运行数千个AI智能体进行编程开发。他通常同时开启5至10个会话，每个会话包含多个智能体，并通过手机应用管理这些任务。这种模式标志着工程师将AI从聊天机器人转变为全天候自主助手。切尔尼此前在社交平台分享的智能体配置方案已获得超10.4万次收藏和810万次浏览。

智能体 Anthropic MCP/工具教程/实践

13:55

Simon Willison 博客

CSP允许列表实验

该工具展示了一项实验：将应用加载于受内容安全策略（CSP）保护的沙盒iframe中，并通过自定义的fetch()函数拦截CSP错误，将其传递至父窗口。父窗口随后可提示用户将受阻域名（如https://api.inaturalist.org）添加至允许列表，刷新页面后即可生效。工具界面包含源代码、预览面板及允许列表管理区，用户可手动添加如https://api.github.com等受信来源。此项目由作者在Codex桌面应用中借助GPT-5.5 xhigh协助构建完成。

教程/实践部署/工程

07:09

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选63

财务团队如何使用 Codex

财务团队能够利用 Codex，基于实际工作输入构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具将自然语言指令转化为代码，自动化处理财务数据整合、差异分析和模型验证等复杂任务，从而提升报告生成效率与准确性，并支持快速创建多版本规划场景。

OpenAI 教程/实践编码

推荐理由：金融团队终于有了一个正经的 AI 用例，用 Codex 自动生成 MBR、差异桥接和规划场景，比手工拉 Excel 高效太多了，做财务分析的建议点开看看。

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

AutoScout24 通过 AI 驱动的工作流扩展工程能力

AutoScout24 Group 采用 Codex 和 ChatGPT 来加速开发周期并提升代码质量。公司通过 AI 工具自动化代码审查、生成测试用例和编写文档，将部分开发任务效率提升高达 40%。工程师得以更专注于复杂问题，同时 AI 应用范围从代码辅助扩展至需求分析和数据查询。这一转变推动了团队 AI 采用率的显著增长，并系统化地融入了日常开发工作流。

OpenAI 教程/实践编码

06:08

OpenAI：官网动态（RSS · 排除企业/客户案例）

财务团队如何使用 Codex

财务团队可利用 Codex 从实际工作输入中构建管理层报告、报告包、差异桥接、模型检查和规划场景。该工具能将非结构化数据（如电子邮件、会议记录和电子表格）自动转换为结构化的财务分析框架，从而提升报告效率与准确性。Codex 的应用减少了手动数据整理时间，使团队能更专注于高价值的分析与决策支持工作。

OpenAI 教程/实践编码

02:54

Claude：Blog（网页）

精选58

Anthropic 网络安全团队如何利用 Claude Code 构建威胁检测平台

Anthropic 检测平台工程团队技术负责人 Jackie Bow 运用 Claude Code 开发了 CLUE 威胁检测与响应平台。该平台通过自然语言界面连接内部系统，包含 CLUE Triage 自动初筛警报，整合上下文信息分配处置建议；以及 CLUE Investigate 支持分析师用自然语言查询日志，由 Claude 自动生成并执行查询，将数小时的人工分析缩短至几分钟。团队在一天内完成概念验证，一周内交付实现，显著提升了安全运营效率。

智能体 Anthropic 安全/对齐教程/实践

推荐理由：我一直好奇大模型公司自己怎么用 AI 做安全，这篇挖出了 Anthropic 内部 CLUE 平台的构建细节——从一天出原型到每周省下 234 人天，数据比很多 PR 稿扎实。

01:05

Google Developers Blog（RSS）

精选73

使用ADK构建可暂停、恢复且永不丢失上下文的长时运行AI智能体

本文探讨了如何从无状态聊天机器人升级为生产级AI智能体，以管理长达数天或数周的企业工作流程（如HR入职）。通过引入Agent Development Kit（ADK），其架构核心采用持久状态机和持久化会话存储，确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制，实现在暂停期间“休眠”，并在唤醒后以高推理准确性恢复复杂任务，从而构建出具备韧性和可靠性的长时运行智能体系统。

智能体 Google 教程/实践部署/工程

推荐理由：Google 官方手把手教你把无状态 chatbot 升级成能跨天跨周的持久化 agent，状态机和持久会话是两个关键切入点，做过生产环境 agent 的都懂这东西有多刚需。

5月12日

23:53

GitHub Blog

精选58

Dungeons & Desktops：使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏

一位 GitHub 员工利用 GitHub Copilot CLI 开发了一款扩展程序，能够将任何代码库转换成一个独特的 Roguelike 风格地下城。该工具通过 AI 辅助的代码生成，实现了程序化关卡创建，展示了 Copilot CLI 在创意编码和游戏原型开发中的实际应用潜力。项目核心是自动解析代码结构并生成对应的可探索地下城布局。

GitHub 教程/实践编码

推荐理由：用 GitHub Copilot CLI 把代码库变成 roguelike 地牢，玩法挺有脑洞，做 Copilot 扩展的开发者可以看一眼思路。

18:00

公众号：小红书技术（dots.llm）

QCon 北京 2026 | 把自动化测试当 AI Coding 来做：小红书 GUI Agent 实战回顾

小红书在 QCon 北京 2026 分享了 GUI Agent 实战经验，核心思路是将自动化测试当作 AI Coding 来做，通过工程化方式让 GUI Agent 在真实业务场景中“跑起来、跑得稳、跑得省钱”。

智能体教程/实践部署/工程

12:25

Hacker News 热门（buzzing.cc 中文翻译）

我让人工智能开发了一个工具，帮助我找出是什么在半夜吵醒我

作者利用人工智能开发了一款工具，用于监测和分析夜间可能吵醒他的声音。该工具通过记录和分析环境音频，识别并分类噪音来源，帮助作者找出睡眠中断的具体原因。这一实践展示了AI在解决个人生活问题上的实际应用潜力。

多模态教程/实践编码

10:08

公众号：数字生命卡兹克

分享5个Claude Code + 飞书的超实用Agent办公玩法。

智能体教程/实践

07:43

Hugging Face：Blog（RSS）

精选58

在AWS上进行基础模型训练与推理的核心构建模块

本文面向使用开源框架的机器学习工程师，阐述了AWS如何为大规模基础模型的全生命周期提供核心基础设施。其核心是三大紧密集成的组件：配备多代NVIDIA GPU（如H100、H200及新一代Blackwell B200/B300）的大显存加速计算实例；用于集体通信的高带宽、低延迟网络（节点内NVLink与节点间EFA）；以及可扩展的分布式存储。这些基础设施与Slurm/Kubernetes等资源编排系统、PyTorch/JAX等ML框架协同，共同支撑预训练、后训练和推理工作负载，并可通过Prometheus/Grafana实现全栈可观测性。

开源生态教程/实践数据/训练部署/工程

推荐理由：这篇把AWS上训大模型的全套基础设施串了一遍，从GPU选型到网络存储再到Slurm/K8s编排，是做云端大规模训练的工程师的必读参考。

03:52

Simon Willison 博客

精选80

在脚本的shebang行中使用LLM

本文介绍了一种创新方法，将LLM工具直接嵌入脚本的shebang行中执行指令。通过LLM的fragments模式，shebang行可执行简单任务，如生成SVG图像；使用-T选项能调用外部工具（如llm_time）创作包含当前时间的俳句；更复杂的是运行YAML模板，其中定义了Python函数作为工具进行数学计算，示例中演示了计算2344乘以5252加134的过程，并通过调试输出展示了分步结果，最终得到12,310,822。这展现了LLM作为脚本解释器的强大扩展性，能够支持从内容生成到数据查询的多样化任务。

MCP/工具教程/实践

推荐理由：Simon 这个 shebang 技巧让 LLM 直接变成脚本解释器，虽然是极客玩法，但对常写自动化脚本的开发者来说可以直接抄走，创意很妙。