6月18日

09:20

OpenRouter：Announcements（RSS）

精选65

OpenRouter 提供统一 API 键（sk-or- 开头），兼容 OpenAI Chat API，可接入 300+ 模型和 60+ 供应商。用户只需将 base URL 改为 https://openrouter.ai/api/v1，设置 API 键，并指定模型 slug（如 openai/gpt-4o 或 anthropic/claude-sonnet-4）即可。同一键可直接用于 Claude Code、Codex CLI、Cursor、Cline 等编码代理与工具。其路由机制在供应商故障时自动切换，代理无需感知失败即可继续多步骤任务。OpenRouter 也提供 Python 和 TypeScript 原生 SDK。

教程/实践编码

推荐理由：如果你在 Cursor、Claude Code 和自定义代理之间来回切 API 密钥，这篇 OpenRouter 官方教程把设置统一成一个模式，读完就能把三四个工具连到同一个路由后端。

09:20

OpenRouter：Announcements（RSS）

使用OpenRouter连接Claude Code

设置三个环境变量即可将Claude Code连至OpenRouter，无需本地代理或Docker。OpenRouter提供供应商故障转移、预算控制与用量监控，支持Anthropic Skin原生协议，保留Thinking、工具调用、流式输出。可为Opus（架构推理）、Sonnet（日常编码）、Haiku（快速转换）分别指定模型。Fast Mode最高2.5倍速度，仅限Claude Opus 4.6/4.7/4.8，需Claude Code v2.1.96+。团队场景：一个OpenRouter密钥统一计费、设置每密钥限额，活动仪表板查看会话成本。

教程/实践编码部署/工程

09:20

OpenRouter：Announcements（RSS）

如何在 OpenRouter 上使用 OpenAI Codex CLI

Codex CLI 支持自定义 OpenAI 兼容提供商，只需在 config.toml 中配置即可将请求路由到 OpenRouter。用户无需修改 Codex 本身，就能获得提供商故障转移、使用跟踪以及跨所有模型的统一密钥。

智能体 OpenAI 教程/实践编码

09:20

OpenRouter：Announcements（RSS）

Kilo Code + OpenRouter：设置、模型路由与免费模型

Kilo Code 是一款自带提供商（bring-your-own-provider）的编码 AI 智能体，集成 OpenRouter 后可用一个 API 密钥访问 300 多个模型，并支持提供商路由（provider routing）与故障转移（failover）。设置分三步完成，通过 kilo.json 中的字段控制路由行为。

教程/实践编码

05:13

Google Developers Blog（RSS）

精选64

Google 分享 A2UI 与 MCP Apps 三种集成架构模式

Google 分享了三种集成 A2UI 与 MCP Apps 的架构模式，旨在结合两者优势。A2UI 采用声明式框架，通过 JSON payload 定义 UI，由宿主原生渲染，确保一致性与安全性，但受限于预定义组件库。MCP Apps 在 iframe 中使用标准 Web 技术提供自定义界面，但存在设计碎片化、性能与安全挑战。三种模式包括：通过 MCP 服务器提供 A2UI，利用 MCP Resources 或 Tool 调用传递 JSON，实现“一次编写，原生渲染”的跨平台能力；以及静态与动态交付方案。Google 正考虑扩展 MCP 以原生支持 A2UI。

智能体 Google MCP/工具教程/实践

推荐理由：Google 这篇指南给出了三种具体的架构模式，帮开发者同时用上 A2UI 的原生安全性和 MCP 的定制能力，对正在做 Agent UI 的团队是直接的工程参考。

04:42

Hacker News 热门（buzzing.cc 中文翻译）

Browser Use Cloud 基于 Firecracker 重构：嵌套虚拟化下 1 秒启动浏览器

Browser Use Cloud 重建基础设施，让每个浏览器会话在独立的 Firecracker VM 中运行，新会话启动时间不到 1 秒，成本从每浏览器小时 0.06 美元降至 0.02 美元。他们放弃了 Unikraft unikernel 方案，因其自动扩缩容能力不足，曾导致压测使生产环境宕机 45 分钟。新方案选择在普通 EC2 上运行嵌套虚拟化，以换取更快扩缩速度和更低成本，并构建了控制平面实时监控自动扩缩容。启动过程包含恢复 VM 快照、启动 Chromium 并通过 CDP 返回连接 URL，首个瓶颈是嵌套虚拟化下的内存页面错误。

教程/实践部署/工程

6月17日

19:27

Hacker News 热门（buzzing.cc 中文翻译）

创始人的行动指南：打造一家原生AI初创公司

Anthropic 近日发布创业行动指南，将生命周期分为 Idea、MVP、Launch、Scale 四阶段，每阶段附目标、退出标准、常见失败模式及基于 Claude 的 AI 实践。指南覆盖：用 Claude 验证问题假设、绘制竞争图谱、开展客户发现；通过架构设计避免 AI 生成 MVP 代码的技术债务；区分真正产品市场契合与早期热度的衡量框架；用智能体工作流替代创始人注意力的 Launch 阶段操作系统；以及 Chat、Claude Cowork、Claude Code 各阶段使用矩阵。还收录了 Ambral、Anything、Carta Healthcare 等创始人的实际案例。

智能体 Anthropic 教程/实践编码

18:41

公众号：卡尔的AI沃茨

视频Agent Seko更新无限画布，自动连接节点生成工作流

视频Agent Seko在最新更新中推出无限画布，并能自动将创意、剧本、角色、场景和分镜等素材节点连接成完整工作流。用户可通过Seedance 2.0全能模式输入一句话或完整剧本，Seko自动生成多集短剧大纲、人物、场景、美术风格及分镜描述，并支持逐段修改提示词和生成视频。画布提供全自动与精细手动编辑的双重控制，解决了AI视频从70分改到85分时反复重做的痛点。实测用该流程三小时完成两集悬疑短剧，角色一致性、故事节奏和画面氛围表现力均超出预期。

智能体教程/实践视频

12:26

Hacker News 热门（buzzing.cc 中文翻译）

让 ast.walk 的运行速度提升 220 倍

作者为优化 AI 生成 Python 代码的 lint 效率，发现 ast.walk 遍历 AST 是性能瓶颈。通过逐步去除生成器 yield、内联 iter_child_nodes 和 iter_fields、用 getattr(node, field, None) 替代异常处理，实现了约 2 倍提速。随后用 Rust 通过 PyO3 重写遍历逻辑，并直接读取 __dict__ 及预缓存 AST 子类类型信息，最终将 ast.walk 速度提升约 220 倍。

GitHub 教程/实践编码部署/工程

09:03

IT之家（RSS）

苹果 iPadOS 27 提升生产力：强化搜索、AI 降低快捷指令门槛、升级上网体验

iPadOS 27 为妙控键盘添加自动化触发条件，连接或移开键盘可自动执行分屏、关闭应用等操作。快捷指令支持自然语言描述，系统自动生成流程并展示底层步骤。Safari 可根据网页主题自动整理标签页。系统整体提升窗口切换、文件传输等桌面化体验。Siri AI 搜索在索引完成后，用户可用自然语言跨应用查找文件、信息、邮件等内容，并给出带来源的上下文结果。

搜索教程/实践

08:27

MarkTechPost（RSS）

用xFormers构建内存高效Transformer：Packed Sequences、GQA、ALiBi、SwiGLU与因果注意力教程

教程演示如何使用xFormers工具包在GPU上实现内存高效的Transformer。先验证memory-efficient attention与标准注意力结果一致性，对比不同序列长度下的速度和内存消耗；然后实现因果掩码、packed variable-length sequences、grouped-query attention（GQA）和自定义ALiBi位置偏置。最后组合成可训练的GPT风格模型，集成xFormers注意力、SwiGLU前馈层和自动混合精度训练。

教程/实践部署/工程

02:03

OpenRouter：Announcements（RSS）

精选62

OpenRouter Presets：当模型下线时保持 AI 智能体运行

Anthropic 在 Claude Fable 5 发布仅数天后便对其进行了限制。如果代码硬编码模型 slug，该限制也会导致服务中断。OpenRouter 的 Presets 功能将模型选择移至服务器端，使用户无需重新部署即可切换模型、设置回退策略并强制执行数据策略。

智能体教程/实践部署/工程

推荐理由：给 Agent 开发者的实用提醒，硬编码模型名会在供应商限制时塌方，用 Presets 换模型、设降级方案比现改代码省心。

6月16日

23:49

Hacker News 热门（buzzing.cc 中文翻译）

现在运行本地模型效果不错

2026年6月16日，vickiboykis.com 上发布了一篇题为“Running local models is good now”的文章，作者认为当前阶段在本地硬件上运行大语言模型已经能够取得不错的效果。该文章在 Hacker News 社区引发讨论，相关帖子获得 114 点热度，表明本地模型运行体验得到了社区的认可。

智能体 Google 教程/实践端侧

16:23

Artificial Intelligence News（RSS）

AI红队测试解析：是什么及为何需要

AI红队测试通过模拟提示注入、数据操纵、越狱等真实攻击场景，系统性探测模型、智能体及应用的安全缺陷。研究显示AI安全事件从2024年233起增至2026年362起，凸显测试必要性。红队测试可提升模型安全性、对齐NIST AI RMF与EU AI Act等框架、加快事件响应并增强系统韧性。主要服务商包括：CBIZ Pivot Point Security（覆盖API、RAG、智能体工作流与MCP，结合手动测试与治理）；Reply（融合威胁建模、对抗攻击模拟与持续监控）；Mindgard（自主红队复制攻击者技术并提供运行时防御）。

安全/对齐教程/实践

15:38

MarkTechPost（RSS）

使用 Docling Parse 构建布局感知文档智能解析管道教程

本教程演示了利用 Docling Parse 对 PDF 文档进行结构化解析的流程。先搭建稳定 Python 环境并生成含文本、列、表格、矢量图形和嵌入图像的多页 PDF。再通过 Docling Parse 提取词、字符和行级文本及页面坐标，渲染可视化叠加图层，最后输出为 JSON 与 CSV 文件。该流程展示了底层 PDF 解析如何支持布局分析、阅读顺序还原、表格感知处理及检索就绪的文档预处理等文档 AI 任务。

检索增强教程/实践部署/工程

15:00

公众号：卡尔的AI沃茨

Claude终于松口，第三方Agent能共享额度了

Anthropic调整了Claude的订阅政策，允许第三方AI智能体共享Max订阅额度。此前在第三方Agent中使用Claude只能单独计费，每月100美元的订阅额度用完后按API标准价收费。调整后，用户可在第三方工具中直接走订阅额度，无需额外计费。该变化解除了此前用户因高额API费用而不得不绕开单独计费的限制。

智能体 Anthropic MCP/工具教程/实践

09:00

IT之家（RSS）

iOS 27 Beta 1 内容索引重建进度可通过 Mac 控制台查看

苹果在 iOS 27 Beta 1 中为配合 Apple Intelligence 与 Apple Foundation Models 重建了用户内容索引。部分机型仅显示“索引处理中”，无剩余进度。用户可将 iPhone 连接 Mac，打开控制台并启用调试信息，搜索“spotlight indexing progress”，再在 iPhone 上打开设置，即可在控制台看到 PipelineCompleteness 百分比形式的索引进度。

其他教程/实践

08:59

Simon Willison 博客

Cloudflare CAPTCHA 至少含一个 & 符号才触发

使用 Cloudflare CAPTCHA（WAF 自定义规则 Managed Challenge）防止爬虫过度抓取分面搜索引擎时，连简单 ?q=term 搜索也会触发验证。通过 Claude Code 发现可注册规则：仅当搜索 URL 包含至少一个 & 符号才触发 CAPTCHA，例如 /search/?q=lemur 不再触发验证。另尝试了 Cloudflare MCP 与 Claude Code 集成但无法编辑规则，改用 Cloudflare API 实现。

其他教程/实践

04:59

GitHub Blog

精选59

GitHub Copilot CLI 初学者指南：常用斜杠命令概览

GitHub Copilot CLI 为初学者提供了常用斜杠命令的概述，帮助用户通过命令控制终端中的 AI 智能体。

GitHub 教程/实践编码

推荐理由：如果你是刚用上 Copilot CLI 的开发者，这篇官方指南把最常用的 slash 命令都讲清楚了，上手很快；老用户可以直接跳过。

03:02

Hacker News 热门（buzzing.cc 中文翻译）

我的家庭实验室 AI 开发平台

一名开发者于6月15日在Hacker News上分享了其家庭实验室AI开发平台，该帖子获得106个HN Points。

教程/实践部署/工程

6月15日

10:10

公众号：卡尔的AI沃茨

实测OiiOii 2.0：智能画布、一键拉片复刻与skill库上线

OiiOii 2.0新增智能画布、一键拉片复刻和skill库三个功能。一键拉片复刻可将输入片段拆解为含关键帧、叙事要素、镜头语言等维度的拉片表格，用户替换角色、场景、元素后，半小时内可复刻出镜头设计一致度达90%的动画片段。智能画布支持直接点击素材唤醒Agent对话修改，不同素材可并行调用多个Agent同步推进任务。skill库内置自媒体、广告营销、周边设计等类型，电商广告skill可指定卖点并上传商品图生成专业短片，3C数码广告skill也能通过自然语言对话逐步调优，另有世界杯搞笑玩梗skill可直接生成搞怪视频。

智能体教程/实践视频

09:06

MarkTechPost（RSS）

Claude Code 智能体编码工具详解：25 项功能与策略

Claude Code 是 Anthropic 的智能体编码工具，运行于终端、桌面应用和 IDE，基于智能体循环工作。文章将 25 项功能与策略分为官方功能、社区技术和第三方工具三类，并逐一标注。官方功能包括 CLAUDE.md 记忆文件、技能、子智能体、斜杠命令（/init、/compact、/review 等）、钩子、MCP 服务器、插件、检查点、计划模式、权限模式、自动模式（使用 Sonnet 4.6 分类器）、上下文压缩、后台任务、Agent SDK、无头 CLI、GitHub Action 集成、输出样式、远程控制与移动推送、离线摘要、沙盒。社区技术涵盖结构化上下文文件夹、动态工作流、模块化技能管道、弹性技术。第三方工具如 Mem Search 可扩展外部记忆层。

智能体 Anthropic 教程/实践编码

05:06

MarkTechPost（RSS）

FineWeb 流式加载、过滤、去重、分词与大规模网络语料库分析实践教程

该教程演示如何在不下载完整多 TB 语料库的前提下，通过 HuggingFace 的 load_dataset 流式接口加载 FineWeb sample-10BT 子集的 3000 条文档，检查其 schema 及 url、language、language_score、token_count 等元数据字段，并复现 FineWeb 的质量过滤流程（Gopher / C4 / FineWeb 自定义规则）、采用 MinHash 进行近似重复检测、用 GPT-2 tokenizer 验证 token 计数，最后生成域名、语言分数、文档长度和 tokenizer 效率等统计图表。

Hugging Face 教程/实践数据/训练

02:29

Hacker News 热门（buzzing.cc 中文翻译）

我使用搭载 M1 Max 芯片的电脑和本地机器学习模型，对 669 GB 的 GoPro 视频进行了索引

Hacker News 上一则 Ask HN 帖子显示，用户利用搭载 M1 Max 芯片的电脑和本地机器学习模型，成功索引了 669 GB 的 GoPro 视频。该帖子获得 105 个 HN 点数。

OpenAI 教程/实践端侧视频

6月14日

18:59

Hacker News 热门（buzzing.cc 中文翻译）

不要相信大型上下文窗口

Hacker News 热门文章以标题直指大型上下文窗口的可靠性问题，提醒用户不应盲目信任大语言模型宣称的上下文长度能力。文章未给出具体模型或数据，但这一警示在 AI 社区引发讨论。

智能体教程/实践

08:32

Simon Willison 博客

将 SQLite 结果列映射回源表.列

Simon Willison 为 Datasette 探索了三种方案，使其能对任意 SQL 查询结果补充源表列信息。他使用 Claude Code（Opus 4.8）发现：利用 apsw 库、通过 ctypes 调用 SQLite 内部未暴露的 sqlite3_column_table_name() C 函数，以及分析 EXPLAIN 输出。这些方法可程序化识别 select users.name, orders.total from users join orders on orders.user_id = users.id 等查询中每个结果对应的源表.列，并支持 JOIN 和 CTE 等复杂语法。

开源生态教程/实践部署/工程

03:24

Hacker News 热门（buzzing.cc 中文翻译）

在家学习AI编程，不花大钱

一篇关于在家低成本学习AI编程的实践分享，讨论了借助免费或低价AI编码工具进行自学的方法，避免高昂课程费用。

智能体教程/实践编码

02:24

Hacker News 热门（buzzing.cc 中文翻译）

RTX 5080 和 RTX 3090 配置：在 Qwen 3.6 27B Q8 上达到 80 Tok/s

使用 RTX 5080 和 RTX 3090 组合硬件，在 Qwen 3.6 27B Q8 模型推理中获得 80 Tok/s 的速度。

教程/实践端侧部署/工程

01:32

MarkTechPost（RSS）

如何构建QwenPaw智能体工作区：自定义技能、模型提供商、控制台访问与流式API测试

该教程演示如何构建并测试QwenPaw智能体工作区。步骤包括：安装与初始化QwenPaw、配置工作目录、设置身份认证、通过Colab secrets连接可选模型提供商、创建包含自定义技能与本地知识文件的结构化工作区，以及启动控制台访问与流式API测试。

智能体教程/实践部署/工程

6月13日

20:33

The Decoder：AI News（RSS）

微软 SkillOpt 仅凭一个训练好的 Markdown 文件即可提升 GPT-5.5 性能

微软与三所中国大学联合开发了 SkillOpt 方法，利用传统模型训练原理优化 AI 智能体的指令文档。仅需一个简单的 Markdown 文件，即可让 GPT-5.5 在程序化任务上提升约 23 分，且该文件能够跨模型和跨 Agent 环境（如 Codex 和 Claude Code）迁移。

智能体 Microsoft OpenAI 教程/实践

17:54

公众号：通义实验室（千问）

精选79

MNN 适配 SME2 使 Qwen3-VL-4B 在端侧实时推理

MNN 推理引擎深度适配 Arm SME2 指令集，使 Qwen3-VL-4B-Instruct 在支持 SME2 的 vivo X300 上实现实时多模态推理。Prefill 阶段性能提升 81%，Decode 阶段提升 13%。MNN 采用编译时内建 + 运行时自动检测设计，默认开启 SME2 加速。该模型为 4B 参数视觉语言模型，支持图文理解和对话，通过 MNN 官方已转换量化的模型可直接下载部署，开发者可通过编译开关一键开启硬件加速。

多模态教程/实践端侧

推荐理由：这是一份硬核的端侧部署指南，实测数据让 Qwen3-VL 在 SME2 手机上 Prefill 提速超过 80%，做移动端 AI 的团队可以直接抄作业。

10:58

MarkTechPost（RSS）

基于city2graph、OSMnx和PyTorch Geometric的空间图神经网络城市功能推断编码实现

构建了一个端到端空间图学习流程，使用city2graph从OpenStreetMap收集城市POI和街道网络数据，并以合成回退保障可靠性。工程化空间特征后，构造多个邻近图族并比较各自对同一城市环境的表征能力。随后将异质图和同质图转换为PyTorch Geometric格式，训练GraphSAGE模型从空间结构预测POI类别。

开源生态教程/实践数据/训练

10:10

OpenRouter：Announcements（RSS）

OpenRouter 可靠性与自动故障转移：请求如何持续成功

OpenRouter 默认启用提供商故障转移（provider failover），模型回退（model fallbacks）则为选择加入。这两层机制分别应对不同类型的故障：提供商故障转移在 API 调用失败时自动切换至其他提供商，模型回退则在指定模型不可用时切换到备选模型。公告详细说明了各层的工作原理以及故障转移的停止条件。

教程/实践部署/工程

10:10

OpenRouter：Announcements（RSS）

精选66

OpenRouter 模型路由工作原理

OpenRouter 将每个请求路由到 60 多家提供商，用户可自定义提供商顺序、价格上限和回退链，从而灵活控制路由策略。

教程/实践部署/工程

推荐理由：如果你在用 OpenRouter，这篇把默认的逆向平方权重、:nitro/:floor 快捷方式和 model fallback 逻辑讲得很清楚，读完就能调整请求策略。

10:10

OpenRouter：Announcements（RSS）

精选74

Hermes Agent 在 OpenRouter 上的使用指南：设置、模型与路由

Hermes Agent 已通过 OpenRouter 处理超过 17 万亿 tokens。使用指南包括设置流程、选择支持 64K 上下文窗口的模型，以及调整路由策略以兼顾成本与可靠性。

智能体教程/实践部署/工程

推荐理由：OpenRouter 这篇教程把 Hermes Agent 的配置、路由和降本技巧都讲透了，刚上手的人照着走就能跑起来，而且给出了廉价辅助模型的省钱套路，实用性强。

08:29

Simon Willison 博客

OpenAI WebRTC Audio Session：现在支持文档上下文

Simon Willison 于 2024 年 12 月构建了基于 OpenAI WebRTC API 的音频会话工具，用于与实时音频模型交互。上月 OpenAI 为该 API 推出新模型 GPT‑Realtime‑2，号称“首个具有 GPT‑5 级推理能力的语音模型”，知识截止日期为 2024 年 9 月 30 日。该工具现已更新，支持选择此模型，并可粘贴大段文档上下文，使用户能在浏览器中围绕任意信息进行音频对话。

OpenAI 教程/实践语音

05:40

OpenRouter：Announcements（RSS）

精选64

如何在OpenRouter上获得最低成本的LLM推理

在OpenRouter上追加:floor可获取最便宜提供商，通过max_price设定花费上限，并可免费使用20多个零成本模型。同时需注意避免计费陷阱。

教程/实践部署/工程

推荐理由：如果你是 OpenRouter 的开发者，这篇教程把成本控制的开关全摆出来了，从 :floor 到免费模型再到 BYOK 的成本账，看完就能立刻调配置省钱。

04:49

Hacker News 热门（buzzing.cc 中文翻译）

精选70

如何在macOS上设置本地编码代理