7月1日

17:21

向阳乔木@vista8

Vista 分享一个前端开发 Skill，可当作专业动效字典使用：通过 animation-vocabulary 查询“列表一个个冒出来”等动效的标准术语；用 emil-design-eng 打磨弹窗、按钮、页面动效；用 review-animations 审查动画问题。地址详见评论。

教程/实践编码

12:21

向阳乔木@vista8

美团发布并开源LongCat-2.0万亿参数MoE大模型

美团发布并开源LongCat-2.0，1.6万亿总参数、480亿激活参数（3%）的MoE大模型。使用35万亿token训练，在5万片国产芯片上“全程无回滚”完成。引入LongCat稀疏注意力（LSA），包含流感知索引、跨层索引和层级化索引，解决长文本注意力瓶颈。采用5-gram N-gram Embedding增加135B参数，在不增加MoE专家竞争的情况下增强局部上下文理解。训练使用6D并行技术适配国产算力。计划2026年6月30日发布并开源。

开源生态推理教程/实践数据/训练

12:06

François Chollet@fchollet

tufalabs 刚刚开源了他们获得第一名的 notebook。主推文表示，这有望解锁新一波更好的参赛作品。

Greg Kamradt: .@tufalabs just open sourced their 1st place notebook 👀

开源/仓库开源生态教程/实践

09:33

meng shao@shao__meng

精选75

mattpocockuk 的 /writing-great-skills：编写可预测 AI Skill 的指南

mattpocockuk 的 /writing-great-skills 成为其最常调用的 Skill，指导如何编写稳定可预测的 AI Skill。核心：以过程可预测为目标；区分 model-invoked（自动触发）与 user-invoked（用户调用），description 应作触发器；采用三层信息结构（主步骤、参考、外部文件）实现渐进式披露；每步骤需明确完成标准；拆分 Skill 是为了控制模型注意力；利用 leading word 压缩行为要求。同时诊断五种失败模式：Premature completion、Duplication、Sediment、Sprawl、No-op，并提供 No-op 测试作为判断句子是否有效的标准。

Matt Pocock: /writing-great-skills is quickly becoming my most often-invoked skill It's just really good at writing skills, guys. npx...

智能体 GitHub 教程/实践

推荐理由：Matt Pocock 把写 Skill 从玄学变成了可拆解的工程，其中领先词和完成标准这两个概念，能立刻让你的自定义工具行为更稳定，搞 Agent 的都应该试一下。

05:37

Hacker News 热门（buzzing.cc 中文翻译）

我研制了一台毫米波物料分类雷达

针对欧洲石棉污染严重、传统取样送检成本高昂的问题，作者用 TI IWRL6432 BOOST 开发板和 ESP32 搭建了 FMCW 毫米波雷达原型。DSP 链通过混频、距离 FFT 和 MIMO 阵列角度估计，配合 Capon 波束成形获得材料密度谱，再输入 CNN 进行物料表面分类。天线部分用开源电磁仿真工具 openEMS 建模并模拟全链路，仿真结果与实测接近。项目因资金不足未完成，但展示了低成本非接触式石棉检测的可行路径。

教程/实践数据/训练部署/工程

01:28

Claude：Blog（网页）

精选72

Claude Code 入门：智能体循环

Claude Code 团队将智能体循环定义为 agent 重复工作直到满足停止条件的过程，并划分出四种主要类型：turn-based 循环（用户提示触发，Claude 自行判断完成或需更多上下文）、goal-based 循环（通过 /goal 命令设定可验证完成标准与最大轮次）、time-based 循环（通过 /loop 按时间间隔重复执行，可用 /schedule 移至云端）、以及 proactive 循环（基于事件或计划自动运行，无人实时参与）。文章还介绍了如何编写 SKILL.md 文件将人工验证步骤编码，让 Claude 进行端到端自检，减少 turn-based 循环中的手动操作。

智能体 Anthropic MCP/工具教程/实践

推荐理由：Anthropic把agentic loops从模糊概念变成四种可复制的模式，附带SKILL.md和命令示例，Claude Code用户读完就能设计更自主的编码流程。

01:03

OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 发布 Genebench-Pro 基准测试：10个案例研究详解

OpenAI 推出 GeneBench-Pro 生物医学基准测试，包含 10 个案例研究。每个案例提供原始提示词、数据集和支持材料，覆盖体细胞肿瘤学（结构变异指导的肿瘤治疗获益-风险决策）、功能基因组学（CRISPR 靶点验证：lncRNA 转录本或基因组位点）和统计遗传学（连锁遗传位点中蛋白质药物靶点优先排序）等方向，要求模型输出 JSON 格式分析结果。

OpenAI 教程/实践评测/基准

01:00

OpenAI Developers@OpenAIDevs

⚙️ 我们在数据基础设施中调试了一整年的崩溃，发现了一个硬件问题，以及另一个在开源代码中隐藏了18年未被注意的问题。以下是我们的追踪过程： http://openai.com/index/core-dump-epidemiology-data-infrastructure-bug/

OpenAI 教程/实践部署/工程

00:50

fofr@fofrAI

Google 通过 Gemini Omni API 发布 gemini-skills 技能包，支持视频编辑、文生视频、图片参考视频生成、首帧生成视频，并提供预处理输入视频为 10 秒 720p、音频剥离、视频检查等辅助工具。同作者展示 Omni Flash 模型编辑能力：输入"将桌子改成浅水池"，模型输出湿手、水波、折射、阴影及音效。该 API 已开放，可用于构建视频编辑流水线。

fofr: Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...

智能体 Google 教程/实践视频

6月30日

22:35

elvis@omarsar0

elvis: http://x.com/i/article/2071684582336782336

开源生态教程/实践

22:30

宝玉@dotey

微服务架构下AI Agent的系统设计与编码实践

建议将所有微服务放在一个workspace（monorepo或虚拟monorepo），让Agent同时看到schema、API和实现代码。文档采用分层结构：根目录AGENTS.md索引各服务职责，每个服务内写清bounded context。优先用OpenAPI spec等机器可读规格自动生成文档。协议测试（contract test）是精准活文档，能验证服务间交互。验证环节各服务提供mock server或基于OpenAPI的模拟服务，Agent在本地跑contract test形成“写代码→跑测试→自我修正”闭环。可进一步引入consumer-driven contract testing（如Pact）。

智能体教程/实践

22:21

凡人小北@frxiaobei

做Agent自动化系统时，一个很容易踩的坑：把"放行信号"写在调用者也能写的地方

将放行信号放在PR评论等可被调用者写入的通道存在风险。AI review贴评论，monitor回读“High: None”即自动合并，但任何有评论权限的人或Agent都能伪造结果。安全门禁的信任结果应走进程内闭环（如returncode、内存状态），评论仅供查看，不可作为门禁依据。

智能体安全/对齐教程/实践

16:37

Hacker News 热门（buzzing.cc 中文翻译）

Moondream Photon 通过流水线解码消除 GPU 气泡，提升 35% 吞吐量

Moondream 推理引擎 Photon 在 NVIDIA B200 上实现约 33ms 近实时 VLM 推理。其利用流水线解码技术，将 GPU 计算与 CPU 任务重叠，消除传统循环中 GPU 空闲等待的“GPU 气泡”，使解码吞吐量提升高达 35%。文章详述三种关键机制：乒乓缓存槽位避免缓冲冲突、前向计算与采样解耦实现受约束解码、以及已结束请求的清理流程（zombies）。

推理教程/实践部署/工程

11:36

小互@xiaohu

精选81

一个人管理5款产品，80%时间不写代码？Every的复利工程

媒体软件公司Every公开「复利工程」方法论，以单人工程团队维护5款产品。核心是四步循环：Plan→Work→Review→Compound，其中Compound将每次解决问题的解法写入CLAUDE.md和docs/solutions/，使AI下次自动避坑。工程师80%时间花在Plan和Review，仅20%用于写代码。配套开源插件支持Claude Code等，含26个专项agent、23条工作流命令、13项技能，可零配置使用。/workflows:review一次并发14个agent审查代码，/workflows:plan在ultrathink模式下可并发40多个研究agent。

智能体教程/实践编码部署/工程

推荐理由：Every把内部单人维护5款产品的方法论和插件开源了，14个AI同时审代码、40多个研究agent做计划，是目前公开的多agent并行工程里数字最具体的参考之一，做AI辅助开发的可以直接上手抄。

11:29

MarkTechPost（RSS）

Top 6 无代码 AI 工具速览（涵盖多智能体、可视化工作流、RAG 引擎、本地 LLM 工作站、微调框架）

Atoms 是无代码平台，支持零基础设施、多智能体架构并即时连接 GPT 与 Gemini。Sim AI 是开源可视化 AI 智能体工作流工具，提供拖拽画布、80+ 集成及 MCP 支持，可云托管或 Docker 自部署。RAGFlow 是检索增强生成引擎，支持多格式文件建立知识库，连接 LLM（API 或 Ollama），具备检索质量验证。Transformer Lab 是免费开源本地 LLM 与扩散模型工作站，支持下载、对话、图像生成、微调（含 RLHF）、RAG 及嵌入计算。LLaMA-Factory 支持 100+ 模型及 SFT、PPO、DPO、LoRA、QLoRA 等训练方法。

智能体教程/实践部署/工程

11:06

Hacker News 热门（buzzing.cc 中文翻译）

形式化验证：你能对软件做出哪些保证？

形式化验证的成本和工具已进入可广泛使用阶段，AI消除了编写证明的最大障碍。与仅覆盖有限输入的测试不同，形式化验证通过验证语言（如Dafny、Lean、Rocq）编写属性和代码，由SMT求解器自动检查所有可达状态是否满足规范——例如权限系统的子集不变性，确保派生权限始终是父权限的子集。验证保证是绝对的：只要规范正确，代码在所有状态下都不会违反属性。过去编写证明需要博士级技能且工具缓慢，如今这一门槛正在降低。

教程/实践部署/工程

10:59

宝玉@dotey

《Claude Code From Scratch》开源电子书

开源电子书用约4300行代码（TypeScript和Python）复现Claude Code核心架构，涵盖Agent Loop、13个工具、4层上下文压缩、语义记忆召回、技能系统、多Agent、MCP集成。全书13章分步教程，讲解如何简化实现。提供中英文版。

开源生态教程/实践编码

07:36

karminski-牙医@karminski3

DSpark：草稿模型高接受率token不降智原理

主推文解释DSpark（类似MTP的预测技术）为何不降智：草稿模型生成的高接受率token（标点、助词、代码语法等）信息熵低，计算成本不变，被接受后提升性能而不影响质量；真正决定prompt质量的token接受率低。后置置信度调度器进一步保证效果。回应了引用中关于“小模型逆合不如大模型自解码为何不降智”的疑问。

Wanderer: @karminski3 牙医老师,我有一个问题:既然 DSpark 是类似于 MTP 的预测技术(依旧是类似于草稿模型的思路),那么小模型逆合的输出应该是不如大模型自身 decode 的,为什么说不会降智呢?(或者说....实际上是这样对性...

推理教程/实践

06:05

karminski-牙医@karminski3

DeepSeek DSpark：推测性解码技术详解

DeepSeek推出的DSpark是一种推测性解码技术，通过在Final RMSNorm后接入3层MTP微型Transformer堆叠，让大模型在输出前并行猜5个token，经置信度头剪裁后，送回大模型用prefill验证，正确则一次性吐出多个token。相比外挂小模型更高效，不降智，速度提升60%-85%。目前SGLang已有相关PR（#29538），DeepSeek已在HuggingFace发布多款DSpark魔改版小模型。

DeepSeek 推理教程/实践部署/工程

01:05

Hacker News 热门（buzzing.cc 中文翻译）

运行 CUDA 内核时会发生什么？

一个简单的CUDA向量加法程序在RTX 4090上运行，背后需执行上千万条CPU指令、操作数个设备文件、发出约900次ioctl并访问一个内存映射doorbell寄存器。程序经nvcc编译，设备代码先由cicc转为PTX虚拟ISA，再由ptxas转为SASS机器码，最终正确完成1+1=2的一百万次计算。

教程/实践编码

6月29日

23:55

Google Blog：AI（RSS）

问AI专家：全栈AI到底是什么？

一位Google专家解释了全栈AI方法的含义，并指出这一方法长期以来一直是Google AI工作的基础。

Google 教程/实践部署/工程

23:29

swyx @aiDotEngineer WF Day 1@swyx

AIE 工作坊日 https://x.com/i/broadcasts/1dGYllOggQoKX

其他教程/实践

23:24

Berryxia.AI@berryxia

Anthropic工程师在Code with Claude分享提示词工程实战手册

Anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战手册。核心观点：维护已有提示词比从零写更常见，最佳起点是评估（Eval）而非直接改提示词。两个场景：客服机器人需用XML标签结构化，移除旧模型冗余指令，为精确计算提供工具；零售排班Agent应拆分成生成-评估-修复循环，使用更强推理模型（Opus）+自适应思考。强调评估是判断改动有效性的唯一严谨方式。

智能体 Anthropic 推理教程/实践

23:24

Berryxia.AI@berryxia

精选77

Anthropic工程师Margot Van Laar：提示词工程实战--调试生产提示词为主，评估是唯一严谨方式

An anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战，核心观点：大部分时间在调试和维护已有生产提示词而非从零编写。两个场景：客服机器人维护中，用XML标签结构化清理，移除旧模型遗留的“禁止列表”指令（新模型会过度拟合），精确计算应调用工具，转人工决策需明确代价与收益；零售排班Agent从零构建时，拆成生成-评估-修复三个简单提示词更稳定，选用更强推理模型（Opus）。她反复强调：评估（Eval）是唯一严谨方式，没有评估就是碰运气。

Berryxia.AI: 睡前来一发,这个视频还是挺完美的。 Anthropic的应用AI工程师Margot Van Laar在Code with Claude分享了提示词工程的实战手册。核心观点是:我们很少从零写提示词,大部分时间都在调试和维护已有的生产提示词。...

智能体 Anthropic 推理教程/实践

推荐理由：Margot Van Laar把提示词维护讲到了工程级别，评估驱动迭代、清理旧指令、拆分任务循环，这些方法比死记prompt模板重要得多，做AI应用的人都该看一遍。