5月15日

11:54

歸藏(guizang.ai)@op7418

bailey: @op7418 @jimail0218 支持,修改~/.codex/config.toml,添加[features]remote-control = true,然后终端运行codex remote-control,然后手机端就能看到了,好用...

智能体 OpenAI 教程/实践

11:28

PixVerse@PixVerse_

当PixVerse拿到媒体通行证时会发生什么这些病毒式传播的球场镜头最有趣之处在于，它们有种随机的标志性感觉。所以我用@PixVerse_重现了巴西对英格兰的SuperSport风格直播时刻，真实感简直离谱🔥 同一个世界，同一个目标。由PixVerse创作。⚽✨ #WEARE26 #PixVerseChallenge #FIFAWorldCup 📌查看下方提示👇🏾

Gilbert Odera | Your AI Plug🇰🇪: POV: The SuperSport cameraman finds the main character 😭⚽ The funniest part about these viral stadium cams is how RANDO...

图像生成教程/实践视频

10:54

歸藏(guizang.ai)@op7418

ChatGPT手机端现可远程控制Codex

Codex现已支持通过手机上的ChatGPT应用进行远程控制，实现了跨设备对话同步与指令操作。用户需在桌面端Codex客户端内启动设置，并完成多重因素验证（推荐使用Google Authenticator）。绑定后，手机ChatGPT App将出现Codex侧边栏，可查看并控制已绑定桌面设备的所有对话，直接发送命令。目前该功能仅支持Mac版Codex，Windows版本仍在开发中。

智能体 OpenAI 教程/实践部署/工程

10:54

Berryxia.AI@berryxia

关于Claude账号被封后通过联系苹果客服获得App Store礼品卡退款的说明

用户因Claude账号被封，其通过App Store礼品卡支付的125美元Max档位订阅费未自动退款。通过拨打苹果400电话，提供Apple ID并转接至外区客服后，可选择网页自助或由客服手动提交退款申请，款项通常在48小时内原路退回。该用户已成功收到125美元退款，并已用同一Apple ID新购买了20美元的Claude Pro会员进行测试，但因Max档位封号情况较多而暂未再次订阅。

Berryxia.AI: 关于Claude 封号,如何申请美区退款! 这件事,我给大家简单交代一下后续。因为我当时订阅是用 Apple Gift Card 礼品卡充值的,所以它没有自动退费。我订阅的是 Max 125 美金那一档。我刚刚给苹果中国打了电话,具体...

Anthropic 安全/对齐教程/实践

09:57

向阳乔木@vista8

ChatGPT客户端Codex配置教程

在ChatGPT客户端中使用Codex需先更新本地客户端，左侧会出现“设置 Codex 移动版”入口，但必须使用官方订阅账号，API模式无法显示。点击入口后，需用苹果或安卓原生相机扫码，ChatGPT应用内无扫码功能且微信不适用。接着登录ChatGPT账号，即使App已登录也需重新验证。授权后即可完成配置，后续可调整电脑保持唤醒状态的设置。客户端下载地址见评论。

OpenAI 教程/实践编码

09:51

Berryxia.AI@berryxia

牛津大学博士后Kevin Lin开源了视频翻译工具Violin，可将视频自动进行语音识别、LLM翻译和语音合成，打破语言壁垒。工具支持个性化翻译风格，并能基于视频内容进行问答交互。它提供Web应用、CLI命令行及Agent Skill（如Claude Code skill）多种使用方式，默认利用Together AI的免费额度，也支持OpenAI等API。该项目旨在推动高质量视频内容的全球化传播。

Berryxia.AI: 兄弟们,这个可以啊!赶紧装起来! Kevin Lin,牛津大学博士后,前Meta和Microsoft研究员,刚刚把Violin这个开源视频翻译Skill放了出来。视频已经是互联网绝对主流的内容形式。可绝大多数高质量讲座、演讲、播客却被单...

多模态开源生态教程/实践视频

09:27

向阳乔木@vista8

飞书CLI工具：连接AI与工作流的高效利器

飞书CLI工具在GitHub上已获超1万Star，成为连接AI工作流的关键工具。它允许用户将AI助手（如Codex和Claude Code）的产出直接整合到飞书生态中，实现自动化操作。典型应用包括：让AI搜索整理资料并自动写入飞书文档、通过对话安排出差日程、以及读取飞书妙记自动生成会议纪要和待办事项。该工具通过指令npx @larksuite/cli@latest install即可安装，官方文档提供了更多进阶使用案例。

MCP/工具教程/实践

08:51

ginobefun@hongming731

早报聚焦AI前沿：Claude代码实践、GPT-Realtime-2与效率思考

本期早报重点推荐了三项内容。Anthropic发布了Claude Code在大型代码库中的官方实践指南。OpenAI则公开了GPT-Realtime-2的实现细节并提供了开发演示视频。此外，少楠探讨了在大模型时代，当效率大幅提升（效率溢出）之后所带来的深层思考。

Anthropic MCP/工具 OpenAI 教程/实践

08:04

ClaudeDevs@ClaudeDevs

精选70

减少API长提示首令牌生成时间的实用技巧：预热提示缓存。在用户提示前发送系统提示。Claude会将其写入缓存，但跳过生成任何输出。当真实用户请求到达时，将直接命中预热缓存。

Anthropic 教程/实践

推荐理由：官方给出的 prompt cache 预热技巧，一行代码优化延迟，做长上下文 API 产品的开发者可以直接抄进流程里。

01:40

AYi@AYi_AInotes

吴恩达新课拆解Transformer，聚焦LLM生产落地与优化

吴恩达与AMD合作推出新课《Transformers in Practice》，旨在将Transformer从学术概念转化为可调试的工程工具。课程提供交互式可视化，让开发者深入模型内部，观察自回归生成、注意力头分工及幻觉产生过程。核心聚焦生产中的推理优化难题，指出大部分延迟源于内存带宽与注意力计算，而非参数量。课程将系统讲解量化、KV Cache、Flash Attention、投机解码等关键技术，以实现数倍速度提升且精度损失极小。其最大价值在于培养能诊断问题、优化成本的稀缺人才，弥补了仅关注CUDA而缺乏硬件感知优化的市场空白。

Andrew Ng: New course: Transformers in Practice. You'll get a practical view of how transformer-based LLMs work, so you can reason ...

推理教程/实践部署/工程

5月14日

18:32

Alibaba Cloud@alibaba_cloud

如何让基于智能体的语音交互变得更稳定、更快速？🚀 当并发量上升时，消息链路可能成为隐藏瓶颈。了解 RocketMQ LiteTopic 如何实现大规模稳定低延迟交互： https://int.alibabacloud.com/m/1000412958/

智能体教程/实践语音

17:05

Peter Steinberger 🦞@steipete

编写了一个技能，可以循环运行codex /review直到没有错误为止。注意事项：它不会为你修复系统架构，所以你仍然需要将BRAIN作为主模型。https://github.com/steipete/agent-scripts/blob/main/skills/codex-review/SKILL.md

智能体教程/实践编码

16:51

Berryxia.AI@berryxia

宝玉基于卡比开发的wx-cli命令行工具，编写了一个微信群聊总结Skill。该工具通过解密本地微信数据库工作，安装简便，仅需几步命令即可自动总结指定群聊（如"AI产品蝗虫"）的当日消息。其优势在于无需关闭系统完整性保护（SIP），若运行报错，可将错误信息发送给AI代码助手寻求解决方案。相关项目源码已在GitHub开源。

向阳乔木: 宝玉老师基于卡比的wx-cli写了一个微信群聊总结Skill。安装成功,正在总结下AI产品蝗虫今天的消息。 wx-cli不错啊,解密本地的微信数据库,甚至连SIP都不用关,如果报错,可以发给Codex或Claude Code解就行。卡比...

GitHub MCP/工具教程/实践

13:35

Rohan Paul@rohanpaul_ai

Qwen 3.6 27B 在 MacBook Pro M5 Max 64GB 上实现每秒34个token的本地推理

近期，Qwen 3.6 27B大型语言模型通过TurboQuant技术被量化为GGUF格式，并整合Multi-Token Prediction技术。在配备M5 Max芯片和64GB内存的MacBook Pro上，该模型实现了每秒34个token的本地推理速度。高达90%的接受率表明，性能提升并非以牺牲输出质量为代价，而是通过避免重复的全成本解码工作来达成。同时，利用llama.cpp进行高效调用，进一步优化了运行效率。这一技术组合显著扩展了“笔记本电脑AI”的应用边界，使得在本地设备上流畅运行大型模型成为可能，提升了用户体验。

atomic.chat: Multi-Token Prediction (MTP) for Qwen on LLaMA.cpp! +40% performance! 90% acceptance rate. Running locally on a MacBook ...

GitHub 推理教程/实践端侧

13:13

meng shao@shao__meng

OpenAI 给 Codex 在 Windows 造了一个沙箱，过程比想象中曲折

OpenAI 为在 Windows 上实现 Codex 的“默认安全”体验，从免提权沙箱演进到提权沙箱。Windows 缺乏原生进程级约束，初期方案通过合成 SID 和 Write-Restricted Token 限制文件写入，但网络封锁只能依赖环境变量软拦截，无法强制生效。团队最终放弃免提权约束，转向创建独立本地用户（在线与离线沙箱用户），需一次性管理员权限安装并配置防火墙规则。通过引入 codex-command-runner.exe 作为中介，解决跨用户创建受限令牌进程的权限难题，形成四层架构，在保障安全的同时最小化对主流程的侵入。

Tibo: We are continuing to invest in making agents work better on Windows. Highly recommend reading David's engineering post o...

智能体 OpenAI 安全/对齐教程/实践

12:26

向阳乔木@vista8

宝玉老师开发微信群聊总结Skill

宝玉老师基于卡比开发的wx-cli工具，编写了一个自动总结微信群聊消息的Skill。该工具通过解密本地微信数据库获取聊天记录，无需关闭系统完整性保护。用户可对指定群聊当天的消息进行内容总结，若遇报错可借助AI编程助手解决。相关工具源代码已在GitHub开源。

GitHub MCP/工具教程/实践

12:07

宝玉@dotey

精选80

baoyu-skills 新加了一个 Skill：微信群聊总结 Skill：https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 wx-cli：https://github.com/jackwener/wx-cli 如何配置使用 wx-cli 请看项目文档，无法提供帮助。另外目前只是借助其读取数据，其他没任何关系。 Claude Code + Claude Opus 4.6 效果最佳

Anthropic 开源/仓库教程/实践

推荐理由：微信群聊的AI总结一直缺现成方案，宝玉这个skill直接调wx-cli读取聊天记录再丢给Claude总结，社群运营同学可以马上试试。

12:07

宝玉@dotey

问：上下文（Context）和上下文窗口（Context Window）什么差别？

上下文是AI Agent执行任务时动态拥有的全部信息总和，包括系统提示、对话历史、检索文档等，其管理属于“Context Engineering”。上下文窗口则是模型单次推理能处理的最大token数量的硬性技术限制。两者关系如同厨房操作台面积与台上实际摆放的食材工具。开发中的核心挑战在于所需上下文常远超窗口容量，因此需通过摘要、选择性检索等策略，在有限窗口内高效管理最有价值的内容。

智能体教程/实践

10:51

Berryxia.AI@berryxia

精选79

UnslothAI发布Qwen3.6 MTP GGUF模型，实现推理速度大幅提升

UnslothAI创始人Daniel Han发布了实验性的Qwen3.6 MTP GGUF模型，显著提升了推理速度。其中，27B模型在单GPU上达到每秒140个token，35B-A3B版本更是高达每秒220个token，相比原版GGUF速度提升超过1.4倍且精度无损。关键优化在于将draft tokens设置为2，这是性能与接受率的最佳平衡点。这项MTP投机解码技术极大提升了消费级显卡运行大模型的效率，推动了本地AI的性能边界。

Daniel Han: We released experimental MTP Qwen3.6 Unsloth GGUFs! Qwen3.6 27B MTP now runs at 140 tokens/s. Qwen3.6 35B-A3B MTP gets 2...

推理教程/实践部署/工程

推荐理由：这波MTP投机解码把消费级显卡的推理速度榨出新高度，27B模型单GPU跑140 tokens/s，精度毫无损失。玩llama.cpp或本地Agent的人现在就该试一下。

08:51

ginobefun@hongming731

使用Claude进行计算机和浏览器操作的最佳实践

Anthropic发布了Claude计算机操作官方指南，核心解决了截图发送至API时因静默压缩导致的点击坐标偏移问题。关键在于客户端预先将截图缩放至1280x720等标准分辨率，并将指令置于截图前发送以提高精度。模型方面，Sonnet 4.6机械点击精度更高，Opus 4.7则支持更高分辨率。安全上必须在隔离环境中运行并设置高风险操作人工确认。Browser Use适合结构化Web任务，Computer Use则适用于桌面应用等非结构化场景。

智能体 Anthropic 多模态教程/实践

07:51

ginobefun@hongming731

精选77

BestBlogs早报：AI智能体工程化实战与安全架构

BestBlogs早报聚焦AI智能体的工程化落地。Anthropic官方指南详解Claude Computer Use最佳实践，包括解决点击偏移的根本原因、推荐分辨率策略及必须采用虚拟机隔离与人工确认门控的安全原则。OpenAI工程师分享了为Codex构建Windows安全沙箱的历程，其最终方案通过专属安全标识符和写受限令牌，实现了操作系统层面的强制文件系统隔离。早报同时指出，基准测试优异的RAG Agent在生产环境中可能出现高达30%的幻觉率。

智能体 Anthropic OpenAI 安全/对齐

推荐理由：三篇来自 Anthropic 和 OpenAI 的生产级 Agent 实践精华，从坐标偏移坑到沙箱自研方案到评估框架，都是工程团队踩坑后的一手经验，做 Agent 落地的可以直接抄作业。

07:39

AYi@AYi_AInotes

孙宇晨：争议烟雾下的投资先知与物理世界转向

孙宇晨以争议行为闻名，但其2016年公开推荐比特币、英伟达、特斯拉等资产，十年后涨幅惊人，展现超前投资眼光。他断言数字世界已到顶，未来转向物理世界，布局具身智能、无人机、空间计算、太空等领域。争议成为其高alpha投资的烟雾弹。类似地，在Claude中转站市场中，ccode.dev通过自研技术解决模型冒充问题，提供真实Claude Opus服务，确保稳定透明，体现了在噪音中识别真实价值的能力。

AYi: 说个暴论,90%的Claude中转站,都在偷偷给你跑Sonnet冒充Opus! 兄弟们,Claude 中转站里,终于出了一个自己人做的了! 老板是我朋友,他自己就是重度 Claude Code 用户, 饱受封号之苦,外面的站也用烂了,干脆自...

其他教程/实践