6月28日

15:03

Hacker News 热门（buzzing.cc 中文翻译）

本文介绍如何配置两节点 AMD Strix Halo 集群，通过 Intel E810 (RoCE v2) 网卡实现 RDMA 互联，用于分布式 vLLM 推理（Tensor Parallelism）。硬件采用两块 Framework Desktop 主板（AMD Ryzen AI MAX+ "Strix Halo"，128GB 统一内存）及 E810-CQDA1 100GbE 网卡，直连无需交换机。软件栈基于 Fedora 43，使用 Ray 编排集群、RCCL 通信。RDMA 延迟约 5µs（TCP/IP 为 70‑100µs）。涵盖 BIOS 设置、网络配置、工具箱安装及启动集群的详细步骤。

推理教程/实践部署/工程

12:23

Berryxia.AI@berryxia

Google TimesFM 2.5：轻量化时序预测模型支持零样本与LoRA微调

Google Research 于2024年开源时序预测基础模型TimesFM（ICML 2024），采用预训练+零样本预测范式。2025年9月发布的2.5版本参数从500M降至200M，上下文窗口扩展至16K，新增30M分位数预测头，可同时输出点预测及10%-90%置信区间。200M参数单GPU可运行，16K上下文支持五年日数据。模型已内置在BigQuery ML、Google Sheets、Vertex AI中，开源版本通过pip install即可使用。2026年4月通过HuggingFace Transformers和PEFT支持LoRA微调，便于领域适配。

Google 开源生态教程/实践

11:51

Tibo@thsottiaux

OpenAI 发布 planttalk 构建指南，让植物拥有声音。主推文评论：和植物对话不再奇怪，只需 codex 即可。

ChatGPT: Our plants are chatty. Yours can be too. Give your plants a voice with our build guide: https://github.com/openai/plantt...

OpenAI 教程/实践

06:26

Rohan Paul@rohanpaul_ai

一位日本开发者发现了这个技巧：让Claude Code自动查找Skills。可以跨Claude、Codex、Cursor和Gemini，使用Vercel的skills CLI将你的目标匹配到正确的工具。所以像安装开发工具一样安装skill，而不是手动重写。

MCP/工具教程/实践编码

03:25

Hugging Face：Blog（RSS）

精选62

一条命令在HF Jobs上启动vLLM服务器

HuggingFace Jobs 支持一条命令启动 vLLM 服务器，用于测试、评估或批量生成。使用 hf jobs run 命令，指定官方 vllm/vllm-openai 镜像、GPU flavor（如 a10g-large）、暴露端口 8000 并设置超时。服务器启动后可通过 OpenAI 兼容 API 访问，每次请求需携带 HF token 作为 bearer token（仅限有读权限的用户）。示例部署了 Qwen/Qwen3-4B（多 GPU 需 --tensor-parallel-size）。a10g-large 价格为 $1.50/小时，按分钟计费，可通过 hf jobs cancel 停止。

Hugging Face 教程/实践部署/工程

推荐理由：这是一条命令在HF上启动vLLM的完整教程，适合快速测试模型的开发者，但方案完全绑定Hugging Face平台，通用性有限。

01:22

Berryxia.AI@berryxia

Anthropic 分享 Claude Code 记忆管理方法论：四层架构与"做梦"机制

Anthropic 应用 AI 负责人 Lamis 在 2026 年 AI DevCon 上介绍 Claude Code 记忆管理。起点是 CLAUDE.md 纯文本文件，但会上下文膨胀。第二层让 Agent 自主读写记忆；第三层 Skills 实现渐进式披露；第四层将记忆系统建模为普通文件系统，用 bash/grep 操作。生产环境设版本控制、哈希并发控制、权限分层和干净 API 四道防线。核心“做梦”机制是带外异步处理：专用 Agent 分析会话记录、识别模式并建议更改，已投入生产，能降低延迟和成本。

智能体 Anthropic 教程/实践

01:22

Berryxia.AI@berryxia

Anthropic Lamis谈上下文工程实践：从Claude MD到"做梦"机制

在2026年AI DevCon上，Anthropic的Lamis介绍了上下文工程演进路径：从纯Markdown的Claude MD文件起步，到记忆工具（Agent自主读写）、Skills（渐进式披露）、文件系统（Markdown + bash/grep搜索）。生产环境中遇到并发写入、权限、注入等问题，通过版本控制、哈希校验、组织级只读/个人可写权限、可移植API解决。最后提出"做梦"——带外异步处理，由专门Agent分析跨会话模式并调整记忆。该机制已投产，可提升任务效率、降低延迟，额外token消耗被效率提升抵消。

智能体 Anthropic MCP/工具教程/实践

01:16

AYi@AYi_AInotes

在Cloudflare Workers AI上配置GLM 5.2免费使用：登录后创建API Token，在Chatbox中设置OpenAI API兼容的自定义API，填入API Key和拼接了Account ID的Host地址，模型名选@cf/zai-org/glm-5.2即可。但实测每日有使用限制，并非真正无限。冲！

珠音こころ: ClaudeflareでGLM5.2無料で使えるヤツ、秒で設定できた。クレカもなんもいらんから楽。 Claudeflareログイン Workers AIクリック REST APIクリック Create a Workers AI APITok...

教程/实践部署/工程

01:16

AYi@AYi_AInotes

LangChain 从零构建深度 Agent 教程：三大上下文工程技巧解决长任务忘事崩链

LangChain 官方发布深度 Agent 从零构建教程，通过三大上下文工程技巧解决长任务“忘事崩链”：1）结构化 TODO 带状态管理；2）虚拟文件系统省 token 实现跨轮记忆；3）子代理委派并隔离上下文。教程含 5 个渐进式 Notebook，从 ReAct 循环起步，逐步叠加规划、文件系统、子代理，最终搭建可联网深度研究 Agent。配套 deepagents 生产库可复用。强调高级 Agent 差距在上下文工程架构设计，而非模型本身。

AYi: http://x.com/i/article/2070416868943306753

智能体开源/仓库教程/实践

00:25

宝玉@dotey

宝玉：Codex/Claude Code上下文压缩成熟，配合fork和/btw功能体验提升

@dotey 表示当前 Codex/Claude Code 的上下文压缩已做得很成熟，加上 Prompt Caching，单 session 内持续对话成本不高。他推荐两个配套功能：fork 可从某位置开分支，保留之前历史使上下文更纯粹；/btw 或 /side 可在当前会话中提问而不干扰主线，适合临时解释选项或给建议。引用 @reach_vb 称自 GPT 5.3 Codex 后不再担心上下文，Codex 能压缩并记住关键信息，还支持分支出新线程，这也是 /goal 命令有效的原因。

Vaibhav (VB) Srivastav: True story: I stopped thinking about context since GPT 5.3 Codex Single project focused threads with the recent capabili...

智能体 Anthropic OpenAI 教程/实践

6月27日

22:40

向阳乔木@vista8

第二次GEO公开课：GEO内容工程直播资料汇总

本周六晚8点，姚老师在WaytoAGI进行第二次GEO公开课，主题为“GEO内容工程”。直播资料包括三份核心文档（操作手册、研究报告、实操教程）、两本推荐图书（《系统之美》《人人都该懂的工程学》）及三篇GEO相关论文。相关资源有GEO改写提示词、改写Skill及单篇内容GEO特征标注演示。开源项目包括GEO Skills、GEOFlow、Meta skill的GitHub仓库及课程PPT。

向阳乔木: 本周六(明天)晚上8点, 姚老师 @yaojingang 和我会在WaytoAGI给大家分享第二次GEO公开课。主题是:GEO内容工程链接:https://vc.feishu.cn/j/108720872 明天直播前5分钟进入就行。

开源/仓库搜索教程/实践

21:22

Berryxia.AI@berryxia

@gengdaJ 近日发布Codex玩法全集，涵盖变现、入门、记忆系统、Agent开发、工具集成、Computer Use实战及产品对比七大板块。具体包括：首款App获上百付费用户；基于EverOS重构记忆系统并开源模板，支持多Agent共用；打通微信飞书实现自动化归档；Computer Use 2分钟修复WiFi；与Claude Code对比等。该合集被评论可直接包装为9998元线下课程。

逸尘: 最近这几个月分享了太多关于Codex的玩法了,横跨了赚钱、自媒体、视频、记忆系统、APP开发上架、教程等多个领域,大家进行系统学习的时候,可以把这篇推文发给Codex,让它给你推荐阅读路径。一、边玩边赚钱与实战变现 1. Codex进阶实...

智能体 OpenAI 教程/实践编码

17:16

AYi@AYi_AInotes

免费替代剪映SVIP，6个2026年顶级AI视频Skills

推文指出，现在用AI做视频已变得极为简单，无需支付700多元的剪映SVIP。只需安装6个2026年最顶级的插件和Skills，提供安装链接，可直接交给AI Agent（如Claude Code、Cursor、Hermes、OpenClaw等）自动安装。具体链接和使用建议可在评论区自取。

AYi: http://x.com/i/article/2069352641423896576

智能体教程/实践视频

15:19

歸藏(guizang.ai)@op7418

用 Seedance 2.0 重新做了一下 Codepilot 的宣传片

教程/实践视频

12:16

AYi@AYi_AInotes

Karpathy LLM-WIKI：反转知识管理逻辑

Karpathy LLM-WIKI反转逻辑：人只筛选高质量资料并做最终判断，AI负责整理、链接、更新等脏活。三层架构（原始层、知识层、规则层）将资料编译成有机知识网络，让存量内容生长复利。核心是升级人与AI的分工。

AYi: http://x.com/i/article/2069352641423896576

大佬观点教程/实践