6月3日

22:09

向阳乔木@vista8

若多台电脑均安装 Codex 并登录同一 ChatGPT 账号，可在设置 -> 连接 -> 控制其他设备中添加其他电脑。之后本机创建项目时即可选择添加远程项目，例如远程控制家中电脑上的 Codex 进行代码编写。该功能无需额外配置，利用账号同步实现跨设备协作。

OpenAI 教程/实践编码

22:07

Hacker News 热门（buzzing.cc 中文翻译）

每个字节都至关重要

文章标题为《Every Byte Matters》，来自 fzakaria.com，讨论字节级优化的重要性。

教程/实践编码

21:41

Hugging Face：Blog（RSS）

精选55

DharmaOCR 利用 DPO 将文本退化率降低 59.4%

4月发布的DharmaOCR（结构化OCR模型）在巴西葡萄牙语文档提取任务中，使用直接偏好优化（DPO）作为监督微调（SFT）后的第二训练阶段。SFT无法直接惩罚文本退化（重复循环），而DPO以模型自身失败输出（退化循环）作为负样本进行偏好训练，使所有测试模型族的文本退化率平均降低59.4%，最高达87.6%（如Nanonets-OCR2-3B从1.61%降至0.20%）。传统DPO多用于聊天对齐，该工作将其扩展至客观的OCR任务，证明DPO可针对性修复特定失败模式。

Hugging Face 教程/实践数据/训练

推荐理由：DPO 不只能对齐，这篇直接用模型自身的垃圾输出当反例，把 OCR 的重复错误平均降了 59%。思路不复杂，但告诉做结构化生成的工程师：训练数据里最该保留的就是模型犯的错。

21:34

Google Blog：AI（RSS）

Google Search 提升二手和复古购物体验的5种方式

Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。

Google 多模态搜索教程/实践

21:31

fofr@fofrAI

更改屏幕，使其显示她在FaceTime通话中。

图像生成教程/实践视频

21:25

🚨 AI News | TestingCatalog@testingcatalog

Capafy 推出 5 个预制电商技能，每个均由一线运营者将实践手册打包成 AI 智能体。包括：Commerce Video Ad Maker（上传 1-3 张产品图生成适配 TikTok Shop、Amazon、Meta 等平台的广告视频）；Amazon Listing Image Generator（按买家疑虑顺序生成主图到画廊，用 GPT Image 2 检查合规性）；Paid Ads Diagnose（分析 ROAS 下降或 CPA 飙升原因，给出扩量或暂停建议）；Amazon Listing Fix Kit（逐行检查详情，提供重写文案、7 图计划、A+ 内容和索赔安全标识）；Amazon/TikTok Shop SOP Generator（生成逐条执行的 SOP 并标注违规风险）。Capafy 定位为技能智能体市场，支持上传技能并按次收费。

Capafy: Introducing 5 Capafy e-commerce Skills. Behind each of these 5 Skills is an operator who has spent years on the e-commer...

智能体教程/实践

20:54

Artificial Intelligence News（RSS）

E.ON 借助 SAP S/4HANA 以 AI 现代化电网

德国能源巨头 E.ON 通过 SAP S/4HANA 标准化电网数据，进而现代化基础设施并部署 AI 应用。E.ON 管理能源电网、客户解决方案和能源基础设施解决方案三个领域，维持运营需要持续的 IT 硬件与软件资本支出。公司领导层最初对大规模业务案例存在疑虑。

教程/实践部署/工程

17:54

数字生命卡兹克@Khazix0918

Codex与Claude Code额度翻倍技巧

Codex和Claude Code的额度限制采用5小时滚动窗口，从用户发送第一条消息开始计时，用完需等待窗口结束才能重置。但窗口结束后系统不会自动开启新窗口，需等到下一条消息才重新计时。利用此机制，可在主要工作时段前3小时（如上午11点）提前发送一条消息激活窗口，使重置时间落在工作时段中间（如下午4点）。这样在2-6点的核心工作中，能享受两个5小时窗口，变相将额度翻倍。设置方法：Codex可在自动化中创建每日定时任务发送短消息；Claude CLI可通过crontab（Mac）或任务计划程序（Windows）实现。注意仍有周额度上限，适度使用即可。

智能体 Anthropic OpenAI 教程/实践

17:28

公众号：数字生命卡兹克

精选63

提前触发窗口让 Codex/Claude Code 额度翻倍的小技巧

Codex 和 Claude Code 的额度限制基于 5 小时滚动窗口：从发送第一条消息开始计时，窗口结束后不会自动重置，需等下次发消息才开启新窗口。提前数小时发送一条短消息，可使重置时间落在工作时段内，从而在核心工作时间获得两个完整窗口。设置方法：Codex 在左侧“自动化”中建每日定时任务；Claude Code 可通过客户端 Routines 或 CLI 版 crontab 配置。注意 5 小时窗口之上还有周额度上限，需合理规划。

Anthropic OpenAI 教程/实践

推荐理由：一个很小的窗口重置技巧，但能让你在核心工作时段多拿一倍额度，做 Agent 开发的直接抄自动化设置就好。

14:37

Hacker News 热门（buzzing.cc 中文翻译）

在 AMD MI300X 上运行 DeepSeek-V4-Flash

一篇来自 fergusfinn.com 的博客文章，介绍了在 AMD MI300X GPU 上运行 DeepSeek-V4-Flash 模型的过程。

DeepSeek 教程/实践部署/工程

14:36

SiliconFlow@SiliconFlowAI

精选67

@karpathy 的 llm-wiki 在几周内获得了 5，000+ 颗星。其理念是：停止在每个会话中重新发现知识。让一个大语言模型构建并维护一个维基，每次使用时它都会变得更智能。以下是如何使用 @opencode + @justsisyphus OMO + SiliconFlow 构建你自己的版本 🧵

开源生态教程/实践

推荐理由：把 karpathy 的 llm-wiki 创意拆成了可复制的 recipe，跟着教程用 SiliconFlow + opencode + OMO 就能搭一个自进化的知识库，相当实用。

14:05

宝玉@dotey

推文展示 GPT Image Gen V2 根据详细提示词生成的图像效果，被评价为"可以以假乱真"。生成的图像模拟了短视频应用的手机自拍截图，具备特定视觉特征：包括低分辨率帧、美颜滤镜平滑、压缩模糊、柔焦及动态模糊。画面主体为一位动漫cosplay风格的女性，外貌、发型、服装和普通卧室背景均有细致描述，并包含了应用界面UI元素，整体风格追求真实手机拍摄的质感。

Emily: Exploring the possibilities GPT Image Gen V2 Vertical smartphone screenshot from a Chinese short-video app. Front phone ...

OpenAI 图像生成教程/实践

14:05

宝玉@dotey

Codex 这个小功能我很喜欢，直接一键 commit changes，自动生成 commit message

OpenAI 教程/实践编码

13:38

公众号：火山引擎

精选64

Vibe Creating：让创作回归「表达」本身

火山引擎 Seedance 2.0 提出 AI 视频创作新范式 Vibe Creating，核心是让创作者放下技术负担，用故事表达代替复杂 Prompt 参数。该范式强调用富有画面感的语言描述场景、情绪和叙事，模型自行理解意图并完成景别、光影、节奏的诠释，避免过度规定镜头调度。适用于文学作品可视化、影视预演等场景，并配套发布《Vibe Creating 实践手册》及可执行的 Prompt Skill，从创意到高质量提示词一步到位。

教程/实践视频

推荐理由：火山引擎把 Seedance 2.0 的用法提炼成「Vibe Creating」方法论，核心是教人用故事感代替镜头术语，虽然不涉及模型升级，但附带可直接套用的手册和 Skill，做 AI 短视频的可以当成 Prompt 指南。

12:07

向阳乔木@vista8

这个朋友写的Skill有意思，帮你监控Codex的重置消息，哈哈哈。第一时间切fast模型，消耗用量。安装指令有点长，见评论区，复制发给codex用就行。

MCP/工具 OpenAI 教程/实践

12:06

Hacker News 热门（buzzing.cc 中文翻译）

我们如何为RAG建立图像索引

为解决检索增强生成（RAG）系统处理图像时的挑战，Kapa.ai提出了一种方法。他们使用GPT-4 Vision模型为每张图像生成文本描述。处理流程包括将图片压缩至512×512像素并批量生成描述。最终，这些图像描述与元数据一同存入向量数据库。该方法使RAG能够检索图像内容，实现约70%的检索准确率，且成本极低，每张图片处理成本约0.01美元。

检索增强多模态教程/实践部署/工程

10:02

公众号：数字生命卡兹克

同事件精选66

Claude Code团队工程总监分享5条AI原生工作原则

Claude Code团队工程总监Fiona Fung提出，AI时代软件工程瓶颈从“写代码太贵”转移至验证、评审与安全。团队采用JIT规划，先做原型再补文档；遇到重复工作追问“能否自动化”，形成肌肉记忆。代码评审中Claude承担60-70%风格检查与漏洞捕捉，人类聚焦法律、安全与产品判断。角色边界模糊，PM写代码、工程师用Claude起草文案，招聘看重品味与判断力而非代码产出速度。

智能体 Anthropic 教程/实践部署/工程

同一事件，精选展示《Claude Code团队实践：智能体编程如何重塑工程组织与流程》

推荐理由：瓶颈从写代码转移到验证，这判断太准了。更实际的是自动化那些重复三次以上的事，这套逻辑正在Claude Code团队验证，值得每个带团队的人照抄。

09:16

MarkTechPost（RSS）

如何在 Google Colab 上使用 QLoRA 和 DPO 微调 LFM2：完整分步编码教程

本教程详细介绍了如何在 Google Colab 环境中，使用 QLoRA 和 DPO 方法对 LFM2 模型进行微调。内容涵盖了使用 TRL 和 PEFT 库进行监督微调、DPO 对齐以及适配器合并的完整分步编码过程。

教程/实践数据/训练

09:13

meng shao@shao__meng

精选75

智能体工程实战窍门全录

该内容源自@mvanhorn的分享，介绍了“智能体工程”如何重塑软件开发。其核心是从“人主导编码”转向“人主导方向、智能体执行”，中心从IDE变为终端与计划文件。方法论遵循Research → Plan → Work循环，核心是让plan.md约束智能体行为。分享者总结了22条实战技巧，涵盖规划、并行执行、输入方式、远程控制等方面，并列出了完整的工具栈。

Matt Van Horn: http://x.com/i/article/2061440101411102721

智能体教程/实践编码部署/工程

推荐理由：mvanhorn 三个月从零到 27K stars 的实战手册，22 条 hack 把 agentic 开发从规划到执行到语音全打通，开发者能直接套用。

08:12

meng shao@shao__meng

BigSet：AI生成B2B SaaS清单的开源工具

开源项目 BigSet 允许用户用自然语言描述数据需求，从实时网络中构建并定期刷新结构化数据集。研发团队负责人邵猛在实际工作中使用它，自动生成了一份 B2B SaaS 产品清单，内容涵盖产品分类、免费方案说明及官方定价页面链接，省去了逐一查找官网的繁琐工作。该项目已在 GitHub 上开源。

TinyFish: What if you and your agent had all the data that always stays fresh? Structured, on demand, never stale. Introducing Big...

GitHub 搜索教程/实践

04:24

ClaudeDevs@ClaudeDevs

精选73

如何让 Claude Code 在交回工作前检查自己的成果？看看如何编码你的手动检查，让 Claude 自己关闭反馈循环：

智能体 Anthropic 教程/实践编码

推荐理由：如果你用Claude Code写代码，这个官方视频值得立刻打开——它教你把手动检查编码进去，让Claude自己形成反馈循环，能省掉大量反复修改的时间。

03:59

fofr@fofrAI

这是🔥 【引用 @DavidMaliglowka】：Gemini Omni 🏕️ 提示词在 🧵

David Maliglowka: Gemini Omni 🏕️ prompt in 🧵

Google 多模态教程/实践

03:06

向阳乔木@vista8

论文图表生成框架Harness的架构与实践

Hugging Face 上一篇热门论文介绍了名为 Harness 的 AI 论文图表生成框架。该框架围绕一个共享的结构化规格文档 S 运作，包含四个协作角色：设计者生成视觉方案，执行者渲染图像或代码，验证者输出带定位的诊断报告，修订者据此修改规格文档 S。作者参考该框架进行了简化实践，写成一个技能包，其中使用了 GPT-image-2 进行生图，并整合了 URL 抓取功能，可直接生成配图。

Hugging Face 图像生成多模态教程/实践

01:00

ViggleAI@ViggleAI

从角色创建到动捕和重定向，看到创作者们用@Viggle_PINOC将想法转化为可玩体验，真是太棒了。期待接下来的发展！

独立开发者William: 🤓rig+mocap+retarget整个流程走通了。下一步是完善游戏的controller,做state machine 然后明天开始演戏当动捕演员了🤓 准备给我的游戏设计几个酷炫的技能想想就好激动。

教程/实践视频

6月2日

19:56

ginobefun@hongming731

从 Markdown 文稿到视频：Cursor + Remotion + FFmpeg

Kent C. Dodds 🏹: In case you missed it, I published a video last week that was 100% edited by @cursor_ai + @Remotion + @FFmpeg turning th...

教程/实践编码视频

19:32

公众号：卡尔的AI沃茨

360安全龙虾云端版：龙虾教练可将GitHub项目拆解为垂直Agent

360安全龙虾云端版的龙虾教练可通过问答交互（约10轮），将开源项目整合为垂直Agent。以lenny-skills项目（86个产品管理技能）为例，生成了产品经理Agent“张伟”，可理解项目进度、拆解需求，并调用Claude Code和Codex实现AI新闻雷达v0.6版改进（增加AI占比评分、信任打分、事件去重）。另支持对话缓存（5分钟内复用系统提示语和TOOLS）、细粒度权限分级（文件/网络/系统/技能可单独配置本地访问）。

智能体开源生态教程/实践

19:10

AYi@AYi_AInotes

信息差副业：有人靠AI skills在小红书赚钱了

有用户发现“信息差”副业：在闲鱼、小红书上售卖AI合同审核skills。具体案例显示，一个skills定价69元，已售出超过5500元。主推文者认为，自己此前分享的一篇关于如何制作AI skills的文章提供了关键方法，使得这种“稳赚不赔的副业”成为可能。

AYi: http://x.com/i/article/2061406941541240838

教程/实践现象/趋势

12:56

Simon Willison 博客

粘贴文件编辑器

Simon Willison 开发了“粘贴文件编辑器”工具原型，灵感源于 Claude.ai 能将大段粘贴文本自动转为文件附件的功能。该工具支持粘贴文本、直接打开文件（包括图片缩略图显示）以及拖拽文件。它是由 Codex 桌面版协助构建的。

教程/实践编码

12:03

Tibo@thsottiaux

你只需用 Codex 就能……生成一个农场 https://chatgptpro.substack.com/p/hiroki-tomiyasu

OpenAI 教程/实践编码

12:00

swyx@swyx

标题低估了它--这个WorkOS的演讲表现很好，是几周来第一个真正挑战@mattpocockuk的。团队正在进行A/B测试。

Nick Nisi: My talk from AIE Europe is up! Come learn the lessons I learned while shipping real production AI systems. https://www.y...

教程/实践部署/工程

11:53

AYi@AYi_AInotes

门槛最低的云服务福利：Microsoft for Startups Founders Hub 深度解析

Microsoft for Startups Founders Hub 提供最高 $150k 的 Azure 云额度（含 Azure OpenAI 服务）。自助申请可获 $1000 起，随项目进展可升至 $25k，顶档 $150k 需 Series A+。其最大优势是门槛极低，无需风投或孵化器背景，在进行中的项目即可申请，并赠送 GitHub Enterprise、Microsoft 365 等权益。该福利近期更新后，与面向学生的、总价值 $3500+ 的 GitHub 学生大礼包形成对比，后者为学生提供 GitHub Copilot Pro、JetBrains 全家桶等 50 多种工具的免费/折扣权益，同样零门槛。

AYi: Damn,这绝对是学生党这辈子能薅到的最狠的羊毛,没有之一😭 GitHub学生大礼包2026年全面升级总价值直接干到$3500+!! 而且真的是零门槛, 只要你是学生,基本都能过。这可不是什么几块钱的优惠券啊宝子们, 这是GitHub...

GitHub Microsoft 教程/实践部署/工程

11:47

Berryxia.AI@berryxia

有朋友问我这个翻译工具是什么？

用户日常使用Memo和沉浸式翻译两款工具。Memo用于本地视频处理，先调用Whisper本地模型转录，再接入DeepSeek-V4-Flash进行翻译，最后在软件内完成字幕烧录与编辑导出。对于网页和在线视频，则使用沉浸式翻译，因其能较好保持原文格式。用户强调这两个工具自由度高，允许接入并自由切换不同的API模型。

Berryxia.AI: 特么终于搞完了,太费劲了! 整整花了1晚上才把它翻译中文、剪辑、上传完毕。富人也有富人的烦恼,只是我们的烦恼不一样罢了! 这两天刷屏的Ivanka Trump (特朗普的长女千金)的长播客采访。整个播客中有些观点不能说多么锐利,但是也从...

开源生态教程/实践