AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
6月20日周六
03:24Nathan Lambert39SFT方法研究不足:大规模系统性实证揭示微调最佳实践
03:21jason9网友:大模型气味令人恐惧
02:53宝玉75精选baoyu-design Skill迭代:修复导出样式与渐变丢失问题,支持AI配图导出PPTX
02:01AYi67OpenAI 推出 Codex for Open Source 计划:免费提供半年 ChatGPT Pro
01:23宝玉49提示词注入揭露AI提交PR不审查行为
01:14Dwarkesh Patel:Podcast & Blog(RSS)60精选AI中心的数据黑洞
01:01AYi61Theo 用 Codex 通宵清理 GitHub 僵尸 PR:分诊、关闭、复活双线程并行
00:54向阳乔木16Gemini 3 将白条鱼误识别为泥鳅
00:53GitHub Blog52GitHub 构建内部数据分析智能体 Qubot,基于 Copilot 实现自然语言查询
00:53elvis70从提示智能体到循环工程:AI编程的新主张
00:53elvis22循环工程趋势下智能体工作方式将变革
00:03Berryxia.AI57搭建AI Agent团队有多难:从玩具到员工跨越四道门槛
6月19日周五
23:23向阳乔木14"用Codex开发钓点渔获记录App"
23:22Ethan Mollick59中国大规模研究:AI代劳作业降低考试成绩
23:00AYi64普通人一个月工资可开一家互联网公司,AI时代创业成本降至每月$20
23:00CMU:Machine Learning Blog51医疗保健基准测试的质量取决于其隐含假设
22:53Hacker News 热门(buzzing.cc 中文翻译)66前OpenAI研究员搭建紧邻办公桌的机器人研究平台
22:53Nathan Lambert52美国AI实验室蒸馏争议:API与监管之困
22:53Nathan Lambert49Nathan Lambert 称 RL speedrun 终将成常态,瓶颈在成本;@jeankaddour 推出 Sokoban Speedrun 项目
22:40Chubby♨️36AI情绪转向负面,需加强教育
22:23Nathan Lambert32开源AI禁令有损美国价值观
22:22Orange AI37GLM 5.2 辅助开发安卓 App 体验
22:22elvis52Claude Fable 5:SWE任务性价比存疑
21:59Nathan Lambert:Interconnects(RSS)56精选禁止开源AI将是一个错误
21:52The Decoder:AI News(RSS)55AA-Briefcase 基准测试:最佳 AI 模型仅完全解决 3% 真实知识工作
21:23SemiAnalysis4699% AI芯片初创失败因软件难
21:22Rohan Paul56新研究:最强LLM也无法完全免疫越狱--Fable 5与Opus 4.8自动化红队攻击分析
21:19Chubby♨️56中国若获ASML级EUV技术的潜在影响
21:19OpenBMB54社区开发者基于 VoxCPM2 和 ComfyUI 构建 VoiceGate,实现跨语言视频配音
21:02Berryxia.AI45智谱GLM体验获赞:能力国产第一档
21:02Berryxia.AI23日本人整动漫不得不说有一套,没有AI的化做这个视频得多久呢?
20:51elvis75精选/youtube-notetaker:YT 视频转 Artifacts
20:19fofr19AI智能体宣称要手动操作
20:02Berryxia.AI11推荐关注 Apple Swift 大赛指导老师 @MengkePM
20:02Emad23当AI成为法官、陪审团与行刑者
18:59IT之家(RSS)50马斯克预测中国大模型2027年Q1追上Anthropic Fable,智谱唐杰回应"用不了那么久"
18:01公众号:卡尔的AI沃茨77精选Humanize PPT v0.9:为演讲而生的开源PPT Skill
17:59fofr55如何组建一支协调的AI智能体团队
17:50Hacker News 热门(buzzing.cc 中文翻译)47"令牌压缩"的错觉:我为何对RTK持怀疑态度
17:17DogeDesigner34黄仁勋:AI非威胁,乃放大潜力工具
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月20日
03:24
Nathan Lambert@natolambert
39
主推文指出研究SFT方法的人仍然不足,尽管它是后训练的关键基础且实证文献有限。引用推文介绍了一项系统性研究:团队针对大量客户模型,在dense和MoE两类模型族(参数量达235B)上,每次只变动一个SFT杠杆,使用4个真实客户数据集,每个数据集配有与客户合作数周构建的评估,且训练输出直接为通过该评估生成,从而使监督目标与下游度量标准一致,消除了常见混淆因素。该研究旨在为微调提炼最佳实践。

Charlie O'Neill: 1/ We fine-tune a lot of customer models, so we decided to systematically try and figure out some best practices for fin...

大佬观点数据/训练
03:21
jason@jxnlco
9
你的很完美,大模型的气味吓到我了。
其他
02:53
宝玉@dotey
精选75
baoyu-design Skill迭代:修复导出样式与渐变丢失问题,支持AI配图导出PPTX

宝玉分享 baoyu-design Skill 的迭代过程:用户测试发现导出问题(样式表未铺满整页、渐变色丢失),他在本地复现后让 Agent 分析原因、给出解决方案并添加测试覆盖,修复后效果改善。该 Skill 可在制作 PPT、动画视频或网站时调用 AI 生图配图,支持 Codex 内置画图或配合 baoyu-image-gen Skill 调用 Codex CLI 画图,并能连同图片一起导出为 PPTX,在 PowerPoint/Keynote 中二次编辑。迭代循环:自己用 → 发现问题 → 让 Agent 分析 → 出方案 → 确认 → 更新 Skill。

宝玉: baoyu-design skill 更新:可以在制作 PPT、动画视频或者网站时调用 AI 生图技能配图了,当然需要你本地 Agent 有配置画图 Skill。 如果是 Codex 可以直接调用内置画图工具,如果你用 Claude Cod...

智能体教程/实践

推荐理由:宝玉分享了一套用 Agent 自我诊断、自动修复 Skill 的迭代方法,从复现 bug 到让 AI 提出解决方案,开发者的打磨循环变成纯对话了,做 Agent 工具的人可以直接套用。
02:01
AYi@AYi_AInotes
67
OpenAI 推出 Codex for Open Source 计划:免费提供半年 ChatGPT Pro

OpenAI 正式推出 Codex for Open Source 计划,为开源项目维护者免费提供 6 个月 ChatGPT Pro(含完整 Codex 权限)及专项 API 额度,总价值 1200 美元。无硬性 Star 门槛,个位数 Star 的小项目也可申请。申请需说明具体维护工作、项目真实影响力及资源使用计划。审核采用 AI 加人工滚动处理,通过率较高,整个过程零成本,约十分钟即可完成。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

OpenAI开源生态教程/实践
01:23
宝玉@dotey
49
哈哈,绝了,通过提示词注入让那些通过 AI 提交 PR 并且不人工审查的现出原形!

Seb ⚛️ ThisWeekInReact.com: 🤪 Great AI disclosure trick @mitchellh :D

教程/实践编码
01:14
Dwarkesh Patel:Podcast & Blog(RSS)
精选60
AI中心的数据黑洞

智能的一种定义是样本效率,但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成——投入大量算力通过验证器筛选“好”数据,再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例,数据行业年收入已达数十亿美元。近日Epoch报告,开源模型仅落后前沿闭源模型4个月,原因在于数据可从公开API蒸馏,而超参数等不易复制。人类一生接触约2亿token,前沿模型训练在数十到数百T token之间,相差近百万倍——机器人、自动驾驶等领域同样存在巨大效率差距。

大佬观点数据/训练现象/趋势

推荐理由:Dwarkesh 把 AI 的‘笨’归因于数据效率远低于人类,计算虽简但直指要害,他给出的一个逆向洞察是开源模型四个月追上闭源,正是数据驱动进步的最好证据。
01:01
AYi@AYi_AInotes
61
Theo 用 Codex 通宵清理 GitHub 僵尸 PR:分诊、关闭、复活双线程并行

开发者 Theo 让 Codex 通宵处理 GitHub 仓库中过时的 PR:自动分诊判断价值,关闭无用的,复活过时的。每个被复活的 PR 同时运行两个线程——Build 线程负责修复冲突和更新代码,Review 线程负责审查代码,形成写手+审稿人的双保险,降低单点幻觉风险。人类只需在关键节点做决策。工作流将仓库维护从个人拖延症转变为 agent 排班制度,实现“睡觉时自动干活,醒来只看决策”。主推文作者拆解出三步:Triage 分诊、关闭无用、复活并行推进,可直接复制使用。

Theo - t3.gg: I underestimated how cool this workflow is. Had Codex go through a bunch of stale PRs last night. Closed all the useless...

智能体教程/实践编码
00:54
向阳乔木@vista8
16
gemini3还是不行啊,怎么把白条识别成泥鳅。。 影响我的钓鱼记录App 😂
Google多模态评测/基准
00:53
GitHub Blog
52
GitHub 构建内部数据分析智能体 Qubot,基于 Copilot 实现自然语言查询

GitHub 内部开发了 Qubot,一个由 Copilot 驱动的数据分析智能体。员工可以用自然语言直接提问公司数据,无需编写 SQL 或使用 BI 工具。团队在构建过程中积累了关于设计、集成和用户体验的经验。

智能体GitHub教程/实践数据/训练
00:53
elvis@omarsar0
70
从提示智能体到循环工程:AI编程的新主张

AI编程圈出现新主张:不应再手动提示编码智能体,而应设计循环自动完成提示、读取输出、判断完成,并在出错时重新提示。Boris Cherny(Claude Code创建者)和Peter Steinberger均持此观点。文章梳理了循环的五种演进形态(ReAct、AutoGPT、ralph loop、/loop与/goal、编排),并拆解六大组装部件:触发机制、隔离工作区、项目上下文记录、工具连接、独立验证智能体等。核心转变是从编写代码升级到编写驱动代码的系统。

智能体Anthropic教程/实践编码
00:53
elvis@omarsar0
22
对"循环工程(loop engineering)"趋势有许多想法。 我用我的写作智能体花了几分钟总结了我的一些研究、笔记以及与学生们、创始人们和初创公司的讨论。 还处于非常早期,但智能体的新工作方式即将出现,能力将有阶跃式变化。

elvis: http://x.com/i/article/2068004233849290752

智能体大佬观点
00:03
Berryxia.AI@berryxia
57
搭建AI Agent团队有多难:从玩具到员工跨越四道门槛

搭AI Agent团队远非“5分钟教程”那么简单。环境配置(Python 3.10+等)劝退八成新手。Agent编排面临从众效应、角色不一致等缺陷,Anthropic采用Subagents模式,Cognition甚至发文称“不要构建多Agent”。上下文管理是最大隐性杀手,同一模型因上下文工程不同分差36个百分点。工具接入缺乏行为合约,API调用失败频发。低代码平台、单Agent SDK正降低门槛,但多Agent自由协作仍是难题。

智能体Anthropic现象/趋势
6月19日
23:23
向阳乔木@vista8
14
准备睡觉,让AI开发一个钓点和渔获记录App。 设定 Goal 让 Codex 执行,看明天钓鱼能不能用上自己的App。
教程/实践编码
23:22
Ethan Mollick@emollick
59
更多证据,来自中国一项大规模研究,表明如果使用AI削弱了心理努力,就会损害学习。当使用AI导致做作业时间减少时,考试成绩也会下降。 综合各项研究,一个主题:AI辅导辅助课堂教学是好的,使用AI"帮助"做作业则是有害的。
大佬观点数据/训练
23:00
AYi@AYi_AInotes
64
普通人一个月工资可开一家互联网公司,AI时代创业成本降至每月$20

推文指出,普通人一个月工资足以启动一家跑通商业闭环的互联网公司,每月固定成本约$20,主要来自Claude Pro或OpenAI Codex辅助开发。其余后端数据库、部署、认证、分析、监控、缓存、邮件、支付等全链路基建均有免费起步额度,域名约$1/月。同时,引用指出当前AI范式(视频生成、VLA)仅学习统计相关性,缺乏因果理解;UCSD黄碧薇教授提出四代AI划分(相关性小模型→因果小模型→相关性大模型/LLM→因果大模型),其团队Aether AI今日完成首轮融资。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

OpenAI大佬观点部署/工程
23:00
CMU:Machine Learning Blog
51
医疗保健基准测试的质量取决于其隐含假设

LLM在作为医疗助手时,评估与部署场景下的性能存在显著差距——Bean等人(2025)发现准确率相差61个百分点。这一差距并非源于基准测试设计缺陷,而是因为评估协议中嵌入的隐含假设在部署时不再成立。研究提出将假设分为任务假设和结果假设两类,用以诊断差距成因并明确弥合路径:需将假设显式化、检验哪些假设在部署中成立,并据此更新评估协议。

现象/趋势部署/工程
22:53
Hacker News 热门(buzzing.cc 中文翻译)
66
前OpenAI研究员搭建紧邻办公桌的机器人研究平台

一位前OpenAI机器人研究员用不到€5,000搭建了一套桌面机器人操控实验平台,包括UFACTORY xArm Lite 6工业级机械臂、Intel RealSense D405腕部摄像头、Logitech C920桌面摄像头和3Dconnexion SpaceMouse无线遥操作设备。整套系统置于办公桌旁,通过自研Python软件栈控制。作者计划在未来数月开展独立研究,并以公开研究日志形式记录实验过程、失败与经验,不预设产出论文或开源代码。

OpenAI具身智能教程/实践
22:53
Nathan Lambert@natolambert
52
归根结底,如果美国实验室不想被蒸馏,他们就不该提供API。看起来他们最终会对某些模型这么做,这是他们的选择。 更严格的监管实际上不会奏效,反而会伤害美国的初创公司。

xlr8harder: I completely believe Chinese labs are "distilling" US models at scale, and I have no problem with it whatsoever and thin...

大佬观点政策/监管数据/训练
22:53
Nathan Lambert@natolambert
49
Nathan Lambert 评论称 RL speedrun 终将成为常态,当前最大瓶颈是价格--单次 RL 实验因不稳定导致噪声大,多次种子运行成本约 100 美元。@jeankaddour 随后推出 Sokoban Speedrun 项目:基于 Karpathy 的 nanochat 流水线修改,用 RL 训练 Qwen3-4B-Instruct 解决 Sokoban 谜题,GRPO 基线在 8×H100 上仅需 87 分钟。该尝试展示低成本快速验证 RL 方法的潜力。

Jean Kaddour: With RSI around the corner, it's time for an RL speedrun. Introducing Sokoban Speedrun: training Qwen3-4B-Instruct with ...

大佬观点数据/训练
22:40
Chubby♨️@kimmonismus
36
我们仍有许多工作要做。公众情绪正日益转向反对AI。 现在出现了反对数据中心、乃至整体AI的运动;怨恨情绪正在增长。 虽然其中无疑存在合理的担忧--比如对失业和能源价格上涨的恐惧--但其中很大一部分只是单纯的怨恨,需要通过教育和提高认知来解决。
大佬观点现象/趋势
22:23
Nathan Lambert@natolambert
32
禁止任何形式的开源AI将是错误。与@kevinsxu共同发布的一则面向公众的公告,阐述为何开源维护美国价值观。 管理前沿风险是困难的,但通过削弱开放前沿来减少透明度、创新和教育将更糟。

Kevin S. Xu: http://x.com/i/article/2067652729913114624

大佬观点安全/对齐开源生态
22:22
Orange AI@oran_ge
37
GLM 5.2 辅助开发安卓 App 体验

开发者使用 GLM 5.2 从零开始完成第一个安卓 App 开发,包括安装 Android Studio、编写代码到最终生成 APK。GLM 5.2 在大部分问题上能提供有效指导,但遇到疑难杂症时安卓系统仍难处理。作者指出当前 vibe coding 模式在电脑和 Web 端调试最为方便。

大佬观点编码
22:22
elvis@omarsar0
52
正如我之前所说,考虑到成本和性能,我认为 Fable 对于很多 SWE 任务来说并不值得。 需要说明的是,我认为 Fable 非常出色,它在设计和创意方面明显表现优异。 等它重新上线后,我会用自己的循环测试它(并衡量前沿效率)。

Datacurve: Claude Fable 5 debuts at #1 on DeepSWE. It outscores the previous best by 3% and sets a new state-of-the-art on our long...

Anthropic大佬观点编码
21:59
Nathan Lambert:Interconnects(RSS)
精选56
禁止开源AI将是一个错误

近期行政命令、国会提案及对Anthropic最先进模型的境外访问限制,可能开启新一轮AI监管。开源软件已支撑全球90%以上软件并创造8万亿美元经济价值,在教育、创新和竞争三方面持续赋能。Anthropic与OpenAI的封闭模型加剧市场集中,开源(尤其开放权重)是初创公司、教育机构和企业获得替代方案的唯一平衡力量。开源透明性使其更安全,更多工程师可剔除不需要的模型行为或修复漏洞。以中国竞争为由监管开源将适得其反,美国初创公司正依赖包括中国在内的开源模型提升效率。

大佬观点开源生态政策/监管

推荐理由:在华盛顿弥漫监管 AI 空气的当下,这篇文章是对‘禁止开源 AI’冲动的清晰反驳。它系统梳理了开源在教育、创新和竞争中不可替代的价值,尤其适合对政策走向摇摆不定的人阅读。
21:52
The Decoder:AI News(RSS)
55
AA-Briefcase 基准测试:最佳 AI 模型仅完全解决 3% 真实知识工作

Artificial Analysis 推出的 AA-Briefcase 基准测试将 AI 模型置于包含数千份 Slack 消息、邮件、会议记录等碎片化源文件的多周知识工作项目中。表现最好的 Claude Fable 5 通过率最高,但仅在 3% 的任务中完全达标;91 个任务中有 31 个没有任何模型达到 50% 通过率。弱模型因遗漏相关文件或输出无效结果而失败,强模型则因无法跨来源拼接信息而遗漏细节。任务单价差距超过 800 倍,从 DeepSeek V4 Flash 的约 0.04 美元到 Claude Fable 5 的超过 31 美元。

推理评测/基准
21:23
SemiAnalysis@SemiAnalysis_
46
100%的AI芯片初创公司都有幻灯片/"模拟性能数据"显示它们的芯片好得多,但99%的定制ASIC失败了。为什么?直到你意识到AI芯片是关于软件的,MATH才算是MATH。构建芯片并把数字放到幻灯片上相对容易;构建出色的软件很难。这就是为什么99%的AI芯片初创公司会失败。
现象/趋势部署/工程
21:22
Rohan Paul@rohanpaul_ai
56
新研究:最强LLM也无法完全免疫越狱--Fable 5与Opus 4.8自动化红队攻击分析

新研究对Anthropic Fable 5和Opus 4.8进行自动化红队攻击,持续改写有害提示词直至模型拒绝或生成坏答案。Fable 5最差攻击成功率6.1%,Opus 4.8为11.5%,证明最强LLM也无法完全免疫越狱——即便微小失败率,规模化自动化攻击仍可产生大量有害内容。旧式编码/角色扮演型越狱已非主要威胁,新弱点在于上下文:自适应攻击者在被拒后不断改写请求,寻找模型视为合法而非危险的框架。白宫与Anthropic正转向基于基准的测试框架,通过评分绕过程度、暴露能力、攻击可重复性及实际后果来量化越狱风险,而非追求不现实的完美免疫。

Rohan Paul: The White House and Anthropic may have found the first serious path to restore Mythos and Fable access without pretendin...

AnthropicarXiv安全/对齐
21:19
Chubby♨️@kimmonismus
56
中国若获ASML级EUV技术的潜在影响

EUV光刻机依赖德国ZEISS光学、ASML整机及台积电组装构成的工业生态系统,中国被禁多年。华为Ascend芯片在部分负载中达H100级60%-80%性能,但软件、内存和训练基建仍落后。近期路透社报道前ASML工程师助中国在深圳逆向建造EUV原型,美政府担忧中国已接触ASML敏感技术,ASML否认。若中国真正掌握EUV,虽不能立即量产,但可能缩短芯片追赶周期、加速华为路线图,削弱西方在AI竞赛中的关键瓶颈。

Chubby♨️: ASML's EUV machines may have made their way into China, prompting fresh scrutiny from the Trump administration over poss...

现象/趋势端侧
21:19
OpenBMB@OpenBMB
54
社区开发者基于 VoxCPM2 和 ComfyUI 构建 VoiceGate,实现跨语言视频配音

社区开发者基于 VoxCPM2 与 ComfyUI 构建了 VoiceGate,实现自动语音提取(ASR)、大语言模型翻译、多语言语音合成(支持 30 多种语言和 9 种方言,含语音克隆与音色设计)、时间戳对齐音频以及背景音分离混音。核心创新 VoiceBridge 插件首次在 ComfyUI 中引入 SRT 时间戳驱动的 TTS 对齐,实现字幕级精细控制,解决 AI 配音音视频不同步问题。应用包括中文视频转英/日/韩等多语言,以及全球视频转中文及方言。

开源/仓库视频语音
21:02
Berryxia.AI@berryxia
45
用户@justinleei分享从年初至今的智谱GLM使用体验:订阅GLM完成两个项目(1个商用上线),认为其多种文档格式解析综合能力优于竞品,与Claude Code体验无明显差距。期间算力紧缺时出现过降智,响应慢但结果可接受。近期使用的zcode比第三方agent更快。主推文@berryxia赞同此评价,认为智谱能力当前为国产模型第一档,甚至优于DeepSeek。

李举刚: 这两天大家都在讨论智谱,我说下我的看法。 评价一个东西怎么样,自己去体验。 从年初到现在,一直都在订阅GLM,做了两个完整的项目,1个商用上线了,1个在开发中,我想我有发言权的。 我从年初疯狂安利朋友们买智谱的股票,虽然资本不认可智谱,认为...

大佬观点编码
21:02
Berryxia.AI@berryxia
23
日本人整动漫不得不说有一套,没有AI的化做这个视频得多久呢?
现象/趋势视频
20:51
elvis@omarsar0
精选75
YT 视频 -> Artifacts 看看我如何使用新的 /youtube-notetaker 技能从 YT 视频生成 Artifacts。 捕获幻灯片、笔记、转录内容…… 快去试试 ↓
开源/仓库教程/实践视频

推荐理由:Elvis 新做的 /youtube-notetaker skill 能直接从 YouTube 视频提取幻灯和笔记,学生和 UP 主会很受用,对业界整体没什么推动,但实用度很高。
20:19
fofr@fofrAI
19
当智能体说它要手动操作时 👀
智能体大佬观点
20:02
Berryxia.AI@berryxia
11
Berry Xia 发现 @MengkePM 是 Apple Swift 移动应用创新大赛指导老师,随即关注学习,并认为其文章同样适合 MCN 机构和 AI 市场部的同学阅读参考。

Mengke Wang: http://x.com/i/article/2067506549107691520

其他
20:02
Emad@EMostaque
23
当AI成为法官、陪审团与行刑者时,法律会怎样?
大佬观点安全/对齐
18:59
IT之家(RSS)
50
马斯克预测中国大模型2027年Q1追上Anthropic Fable,智谱唐杰回应"用不了那么久"

6月17日,智谱开源新旗舰GLM-5.2,在FrontierSWE编程测试中得分74.4,超OpenAI GPT-5.5,仅落后Claude Opus 4.8约1个百分点。有网友提问中国大模型何时达到Anthropic Fable水平,马斯克回复可能2027年Q1。智谱联合创始人唐杰回应不需那么久。马斯克补充,跑分赶上相对容易,但以实用性衡量,2027年Q1达到已非常出色。Anthropic Fable 5于6月9日发布,可处理5000万行代码迁移等任务,发布数日后遭管制。

Anthropic大佬观点现象/趋势
18:01
公众号:卡尔的AI沃茨
精选77
Humanize PPT v0.9:为演讲而生的开源PPT Skill

Humanize PPT v0.9 是一款专为演讲场景设计的PPT Skill,核心通过AST(Audience, State, Transfer)逻辑重新编排大纲,将页面渲染外包给下游Skill。渲染前先输出4张真实预览页,并将图片、视频素材的占位与生成prompt写入大纲。新增质检环节自动修复常见渲染问题,并支持演讲模式:按S键在独立窗口显示演讲稿备注,按ESC键打开全局索引快速跳页。项目已开源至github.com/LearnPrompt/humanize-ppt,由卡尔 & yc星辰开发。

GitHubMCP/工具开源/仓库

推荐理由:卡尔把 AI 做 PPT 的坑全趟了一遍,这套工具体系让页面从‘好看’变成‘能讲’,做演讲的人可以抄作业了。
17:59
fofr@fofrAI
55
如何组建一支协调的AI智能体团队

设置一个编排器智能体,由它配置Gemini Managed Agents或modal cpu实例,在独立环境中启动子智能体。先执行深度研究任务,探索管理智能体团队的最佳实践(角色、技能、跨通信与规划),再将最佳推荐应用于各智能体。重复该循环(可逐步增加智能体数量)。之后给团队一个空代码仓库,挑战其构建产品、建立最佳实践,让智能体观察问题、提出修复建议并快速迭代,从而暴露竞争条件、完善规划方法。

智能体教程/实践
17:50
Hacker News 热门(buzzing.cc 中文翻译)
47
"令牌压缩"的错觉:我为何对RTK持怀疑态度

RTK获得60k GitHub星标,宣称能“削减60–90%模型token用量,支付1/10的价格”,但实际API账单并未同比例下降——它仅裁剪Bash原始输出,忽略文件读取、仓库上下文、系统提示词和模型内部推理token。公开issues指出终端输出会被静默截断或丢失,且AI智能体无法感知压缩,导致关键信息缺失。RTK从未公布任务成功率(如SWE-bench类基准),其节省量更像营销指标。从架构看,rtk引入脆弱的外部依赖,解析git、cargo、npm、grep等CLI工具的stdout/stderr格式,一旦工具更新格式便可能静默失败。本质上这是CLI原生可实现的feature,而非独立产品,将其放入生产agent关键路径存在高风险。

大佬观点开源生态编码
17:17
DogeDesigner@cb_doge
34
突发:黄仁勋表示,人们关于AI犯的最大错误是将其视为威胁,而非放大人类潜力的工具。AI不会摧毁人类的工作,而是将重建美国工业,并创造一波新的建设者、技术人员、工程师和制造者。
大佬观点
‹ 上一页
1…2930313233…50
下一页 ›