6月20日

03:24

Nathan Lambert@natolambert

主推文指出研究SFT方法的人仍然不足，尽管它是后训练的关键基础且实证文献有限。引用推文介绍了一项系统性研究：团队针对大量客户模型，在dense和MoE两类模型族（参数量达235B）上，每次只变动一个SFT杠杆，使用4个真实客户数据集，每个数据集配有与客户合作数周构建的评估，且训练输出直接为通过该评估生成，从而使监督目标与下游度量标准一致，消除了常见混淆因素。该研究旨在为微调提炼最佳实践。

Charlie O'Neill: 1/ We fine-tune a lot of customer models, so we decided to systematically try and figure out some best practices for fin...

大佬观点数据/训练

03:21

jason@jxnlco

你的很完美，大模型的气味吓到我了。

其他

02:53

宝玉@dotey

精选75

baoyu-design Skill迭代：修复导出样式与渐变丢失问题，支持AI配图导出PPTX

宝玉分享 baoyu-design Skill 的迭代过程：用户测试发现导出问题（样式表未铺满整页、渐变色丢失），他在本地复现后让 Agent 分析原因、给出解决方案并添加测试覆盖，修复后效果改善。该 Skill 可在制作 PPT、动画视频或网站时调用 AI 生图配图，支持 Codex 内置画图或配合 baoyu-image-gen Skill 调用 Codex CLI 画图，并能连同图片一起导出为 PPTX，在 PowerPoint/Keynote 中二次编辑。迭代循环：自己用 → 发现问题 → 让 Agent 分析 → 出方案 → 确认 → 更新 Skill。

宝玉: baoyu-design skill 更新:可以在制作 PPT、动画视频或者网站时调用 AI 生图技能配图了,当然需要你本地 Agent 有配置画图 Skill。如果是 Codex 可以直接调用内置画图工具,如果你用 Claude Cod...

智能体教程/实践

推荐理由：宝玉分享了一套用 Agent 自我诊断、自动修复 Skill 的迭代方法，从复现 bug 到让 AI 提出解决方案，开发者的打磨循环变成纯对话了，做 Agent 工具的人可以直接套用。

02:01

AYi@AYi_AInotes

OpenAI 推出 Codex for Open Source 计划：免费提供半年 ChatGPT Pro

OpenAI 正式推出 Codex for Open Source 计划，为开源项目维护者免费提供 6 个月 ChatGPT Pro（含完整 Codex 权限）及专项 API 额度，总价值 1200 美元。无硬性 Star 门槛，个位数 Star 的小项目也可申请。申请需说明具体维护工作、项目真实影响力及资源使用计划。审核采用 AI 加人工滚动处理，通过率较高，整个过程零成本，约十分钟即可完成。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

OpenAI 开源生态教程/实践

01:23

宝玉@dotey

哈哈，绝了，通过提示词注入让那些通过 AI 提交 PR 并且不人工审查的现出原形！

Seb ⚛️ ThisWeekInReact.com: 🤪 Great AI disclosure trick @mitchellh :D

教程/实践编码

01:14

Dwarkesh Patel：Podcast & Blog（RSS）

精选60

AI中心的数据黑洞

智能的一种定义是样本效率，但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据，再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例，数据行业年收入已达数十亿美元。近日Epoch报告，开源模型仅落后前沿闭源模型4个月，原因在于数据可从公开API蒸馏，而超参数等不易复制。人类一生接触约2亿token，前沿模型训练在数十到数百T token之间，相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。

大佬观点数据/训练现象/趋势

推荐理由：Dwarkesh 把 AI 的‘笨’归因于数据效率远低于人类，计算虽简但直指要害，他给出的一个逆向洞察是开源模型四个月追上闭源，正是数据驱动进步的最好证据。

01:01

AYi@AYi_AInotes

Theo 用 Codex 通宵清理 GitHub 僵尸 PR：分诊、关闭、复活双线程并行

开发者 Theo 让 Codex 通宵处理 GitHub 仓库中过时的 PR：自动分诊判断价值，关闭无用的，复活过时的。每个被复活的 PR 同时运行两个线程——Build 线程负责修复冲突和更新代码，Review 线程负责审查代码，形成写手+审稿人的双保险，降低单点幻觉风险。人类只需在关键节点做决策。工作流将仓库维护从个人拖延症转变为 agent 排班制度，实现“睡觉时自动干活，醒来只看决策”。主推文作者拆解出三步：Triage 分诊、关闭无用、复活并行推进，可直接复制使用。

Theo - t3.gg: I underestimated how cool this workflow is. Had Codex go through a bunch of stale PRs last night. Closed all the useless...

智能体教程/实践编码