5月7日
00:36
Yuchen Jin@Yuchenj_UW
精选76
Anthropic正从SpaceX获得22万台Nvidia GPU,并承诺投入2000亿美元采购Google TPU。 Claude Code的5小时速率限制将提升一倍。 Dario正积极从各渠道获取芯片,以应对OpenAI Codex的增长势头。
Anthropic行业动态
关联讨论 2The Decoder:AI News(RSS)X:Rohan Paul (@rohanpaul_ai)
推荐理由:Dario 终于撕下谨慎外衣,从 SpaceX 拿 GPU、砸 2000 亿美元给 Google,Claude 的算力军备竞赛正式开打,这直接决定谁能抢到下一个千万开发者。
00:36
ClaudeDevs@ClaudeDevs
精选73
Anthropic今日宣布全面提升Claude系列产品的使用限制。具体措施包括:将Claude Code在Pro、Max、Team及按席位计费的企业版计划中的5小时使用时长限制提升一倍;取消Pro和Max计划在高峰时段对Claude Code的限制削减;并大幅提高Opus模型的API速率限制。公司表示,此次调整主要得益于与SpaceX达成的合作伙伴关系以及其他近期算力协议,这些合作显著增加了Anthropic的计算容量,从而使其能够提升Claude Code和Claude API的服务上限。
智能体Anthropic产品更新编码
关联讨论 11Anthropic:Newsroom(网页)X:Thariq (@trq212)xAI:News(网页)Hacker News 热门(buzzing.cc 中文翻译)X:宝玉 (@dotey)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)
推荐理由:Claude Code 用量限制直接翻倍,对重度依赖的开发者是立竿见影的解放,背后是 Anthropic 从 SpaceX 拿到的算力大增,能实打实提升日常编码效率。
00:35
Rohan Paul@rohanpaul_ai
48
自适应健康生态系统:消费硬件的下一个十年,从可穿戴测量到主动干预

可穿戴设备1.0因仅测量数据(如心率、睡眠)而陷入停滞,用户需自行解读与行动。下一代消费硬件类别被命名为“自适应健康生态系统”,它能实时感知用户生理数据、自主决策并主动干预。例如,Dreamspan的Lucid Pro通过读取睡眠数据,自动调节床和周围空气以改善睡眠。未来将扩展至大脑、代谢等领域,所有硬件基于SpanOS平台协同工作,实现全栈生理读取。这标志着可穿戴设备的真正演进,率先推出并优化该系统的企业将主导未来十年消费健康市场。Dreamspan的最终目标是借助此技术推动人类实现150年的健康寿命。

现象/趋势端侧
00:27
elvis@omarsar0
60
利用智能体与LLM Artifacts革新AI论文研读方式

作者通过自动化流程每日筛选arXiv论文,并利用智能体将其转化为可交互的“LLM Artifacts”。这一系统基于LLM Wikis概念演进,使论文知识可操作化:Artifacts支持动态注入见解、组件及实验建议,并能通过智能体协调器直接提问或自动化执行实验。其核心在于通过多智能体主动协作,持续挖掘可行动的知识,帮助研究者高效学习与跟进前沿。

智能体MCP/工具教程/实践
00:22
歸藏(guizang.ai)@op7418
精选71
Anthropic 又从 SpaceX 买了一些算力,看起来最近估计算力问题能缓解一下,Opus 4.6 估计状态要正常了
Anthropic行业动态
关联讨论 11Anthropic:Newsroom(网页)X:Thariq (@trq212)xAI:News(网页)Hacker News 热门(buzzing.cc 中文翻译)X:宝玉 (@dotey)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)
推荐理由:算力焦虑是 Claude 用户的长期痛点,这次从 SpaceX 加购算力后 Opus 4.6 终于有望告别限流,API 和 Claude Code 用户都能喘口气了。
00:18
xAI@xai
精选67
SpaceXAI将为@AnthropicAI提供访问Colossus 1的权限,这是全球规模最大、部署速度最快的AI超级计算机之一,旨在为Claude提供额外算力 → http://x.ai/news/anthropic-compute-partnership
AnthropicxAI行业动态部署/工程
关联讨论 11Anthropic:Newsroom(网页)X:Thariq (@trq212)xAI:News(网页)Hacker News 热门(buzzing.cc 中文翻译)X:宝玉 (@dotey)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)
推荐理由:xAI把Colossus 1的算力开放给Anthropic,这种基础设施层的合作在头部公司间非常少见,对依赖Claude的开发者是个缓解供给侧焦虑的积极信号。
00:10
00:02
宝玉@dotey
58
OpenAI 联合多家巨头开源 AI 训练网络协议 MRC

OpenAI 联合 AMD、博通、英特尔、微软和英伟达,通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输,实现微秒级故障绕行,无需交换机重算路由。这简化了网络架构,将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层,降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算,并成功用于训练多个模型,显著提升了训练任务的鲁棒性。

OpenAI开源/仓库部署/工程
5月6日
23:57
向阳乔木@vista8
60
AI分析X平台数据揭示发帖效率与涨粉规律

通过将X平台创作者工作室近90天的数据分析数据输入大模型,AI提炼出关键运营规律。核心发现包括:每日发帖3-5条是曝光效率最佳区间,而非单纯追求数量;周三互动率最高,周四涨粉效果最好,周六则最利于冲击曝光量。此外,近44%的新增关注者集中来源于少数“高涨粉日”,表明涨粉主要依赖爆款帖文的拉动效应。

教程/实践数据/训练
23:37
宝玉@dotey
65
把视频变成图文博客:Agent + 豆包 Seed2.0 lite 重做 Karpathy 两年前的工作流

作者利用豆包Seed2.0-lite全模态理解模型,重新实践了将长视频自动转换为图文博客的工作流。传统ASR+LLM方案因信息丢失严重而效果不佳,新方案的核心在于模型能同时理解视频的音频、画面和屏幕文字,进行联合推理,从而保留技术视频中的关键视觉信息(如代码、图表)。通过将多模态能力封装为可复用的Agent Skill,并采用四步最佳实践——视频切片、生成结构化素材、反查关键帧配图、生成终稿——解决了传统流程的上下文割裂问题,使输出更接近人类技术编辑的整理成果。

智能体多模态教程/实践视频
23:27
叫我阿杭@Astronaut_1216
29
Solo π LAB社区助力个人成为AI时代的超级个体

作者宣布其创立的“Solo π LAB”社区已初具雏形,核心目标是分享个人已验证的独立项目,旨在帮助每个成员成为“超级个体”或“OPC”,并成功运营“一人公司”。为此,社区正在整理并推出“Solo π 计划”,旨在系统性地带领成员实践。作者强调,在AI时代,个人拥有无限可能,并希望陪伴所有热爱AI、积极探索一人公司模式的伙伴共同成长。

行业动态
23:23
23:22
Berryxia.AI@berryxia
精选76
姚老师将其公开分享的提示词整理并开源至GitHub仓库。该合集包含约100个提示词,覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等九大类场景。其中特别推荐的是对用户帮助显著的元提示词,包括简易版和进阶版。作者表示后续将通过该仓库持续更新经过验证的有价值提示词。

姚金刚开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方…

GitHub开源生态教程/实践

推荐理由:姚老师把一年沉淀的100个提示词整理开源,尤其元提示词部分能直接拉高AI工作流上限,属于那种收藏即赚到的实用合集。
23:21
Berryxia.AI@berryxia
精选73
Stanford CS336课程指出,过去三年主流大语言模型架构高度收敛,约90%组件形成共通模板。核心包括:架构普遍采用pre-norm、RMS Norm、无偏置、SwiGLU/GeGLU激活函数、RoPE位置编码;超参数如FFN维度比例、注意力头配置、模型纵横比等已成惯例。为保障训练稳定,Z-loss、QK norm等技术被广泛使用;GQA成为推理部署标配,局部与全局attention交替是处理长上下文的新趋势。这套模板被视为2026年开源LLM的"默认配置"。

Jason ZhuStanford CS336 上,Tatsu 讲了一节 LLM 架构课,把过去 3 年所有主流 LLM 拆开,看它们的共通模板 结论挺爆:90% 的架构选择已…

教程/实践

推荐理由:一份2026年训大模型的标准化配置单,把过去三年业界踩坑得出的最优设置全写清楚了,自己训模型直接抄就行,别费力试错。
23:19
阿绎 AYi@AYi_AInotes
69
从被轻视到行业颠覆者:苏姿丰带领AMD的八年逆袭

2018年F1中国站,AMD CEO苏姿丰曾遭遇记者带有种族微歧视的提问。八年间,她将公司市值从濒临破产的30亿美元提升至6500亿美元。最新财报显示,其数据中心营收同比暴涨57%,股价大涨。她预判AI Agent的兴起将使CPU与GPU需求比例从1:8转向1:1,这为AMD的混合方案开辟道路,并挑战NVIDIA的垄断。凭借Zen架构与MI300系列,AMD在数据中心市场份额已从近乎为零升至40%,完成了最有力的反击。

智能体推理现象/趋势
23:17
Berryxia.AI@berryxia
精选75
Warp 开源内部高效工具集 Skills,包含15个生产级技能

Warp 团队将其内部用于大幅提升工作流效率的“Skills”工具集完全开源。用户通过一条命令 `npx skills add warpdotdev/oz-skills` 即可安装包含 SEO 与无障碍审计、文档自动写作、Terraform/DevOps 配置、GitHub Issue 处理等在内的15个高质量生产级技能。团队此举旨在将其实用工具开放给整个社区,而非私有化,体现了开放精神。项目 GitHub 仓库已开放,并鼓励社区贡献。

MCP/工具开源/仓库部署/工程
关联讨论 1X:邵猛 (@shao__meng)
推荐理由:Warp 团队把内部压箱底的 15 个生产级 Skills 全开源了,一条命令就能装,SEO 审计、Terraform 配置这些真实场景的技能直接拿来用,开发效率飞起。
23:13
Nathan Lambert@natolambert
56
策略蒸馏成为后训练优化核心技术

作者在其著作中补充了关于策略蒸馏如何成为核心后训练优化技术的历史回顾。其数学原理相对简单,其发展得益于分布式训练系统的进步。关键转折在于强化学习设置中采用蒸馏目标,这启发了丰富的奖励塑造思路。策略蒸馏的普及也源于近年来强化学习算法工程的大规模投入。技术演进从学习教师示范转向学生自我推演,回顾看似明显,实则经历了大量工作。相关研究如MiniLLM率先提出了类似策略梯度的在策略推演蒸馏方法。

大佬观点
23:13
Berryxia.AI@berryxia
精选74
一个名为dFlash的GitHub项目宣称,能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速,并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注,被认为展现了民间开发者在模型优化方面的强大能力。

铁锤人这个项目能让Gemma 4 推理提速到6倍 比谷歌的3倍还快,而且不损失质量 https://github.com/z-lab/dflash

Google开源/仓库开源生态推理
关联讨论 1X:Berry Xia (@berryxia)
推荐理由:一个开源库把 Gemma 4 推理拉到官方的两倍速还不掉精度,这对正在用 Gemma 做部署的开发者简直是及时雨,直接抄作业比等谷歌快多了。
22:59
Chubby♨️@kimmonismus
49
Claude Mythos与GPT-5.5能力相近,未现性能飞跃

一篇关于Claude Mythos和GPT-5.5的分析文章指出,两者在网络安全能力上基本持平,GPT-5.5可能更具成本效益。Mythos在部分通用基准和SWE-bench Pro上略微领先,但并未形成显著的能力突破。分析认为Mythos的性能符合既往趋势,并非偏离趋势的巨大飞跃。与此同时,OpenAI近期发布了多项出色产品,这反衬出Claude Mythos为何仍保持高度保密状态。

AnthropicOpenAI推理编码
22:56
OpenAI@OpenAI
精选66
大规模AI超算需要新型网络来保持芯片同步。OpenAI专家讨论了在庞大芯片集群间可靠高效传输数据的挑战,并介绍了新发布的多路径可靠连接(MRC)网络协议。该协议由OpenAI与AMD、Broadcom、Intel、Microsoft、NVIDIA等行业伙伴共同推出,旨在帮助大型AI训练集群运行得更快、更可靠,减少GPU闲置时间。MRC是一个开放的行业协议,可供整个业界使用。
OpenAI数据/训练行业动态部署/工程
关联讨论 1OpenAI:官网动态(RSS · 排除企业/客户案例)
推荐理由:OpenAI 拉上 AMD、Broadcom、Intel、Microsoft、NVIDIA 一起搞的开源网络协议,专门解决万卡集群的通信瓶颈,做大规模训练的团队值得去翻翻官方博文。
22:31
SenseTime@SenseTime_AI
精选71
🚀 SenseNova-U1 更新: ⚡ 开源8步蒸馏LoRA:100 NFE降至8 NFE,H100推理时间从23秒缩短至2秒 🧩 现已支持ComfyUI,提供文生图、图像编辑和交错生成的即用工作流 试用链接 👇 https://github.com/OpenSenseNova/SenseNova-U1/
图像生成开源/仓库推理模型发布

推荐理由:从100步到8步,23秒压到2秒,商汤这个蒸馏LoRA把U1的推理成本打下来了,做实时图像应用的可以认真看看,ComfyUI一接就能跑。
22:09
22:08
向阳乔木@vista8
精选77
姚老师将其去年编写的提示词整理并开源,强调这些提示词以实干派风格为主,适用于商业场景,源于实际业务需求。合集包含约100个提示词,覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等9类场景,特别推荐其中的元提示词(包括简易版和进阶版)。项目已通过GitHub发布,并将持续更新验证过的有价值提示词,方便用户下载和迭代。

姚金刚开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方…

开源生态教程/实践

推荐理由:姚老师这套提示词不是纸上谈兵,全是商业场景里磨出来的,100个覆盖九类场景,尤其是元提示词,可以直接复制就用,做 AI 产品的赶紧收藏。
22:06
向阳乔木@vista8
62
打造拟人AI助理的实战经验与游戏从业者洞察

洛小山发布了一篇关于如何创建具有“活人感”AI助理的长文,内容包含大量实用干货与实战经验。文章指出,在该领域表现出色的实践者或项目,大多具有游戏开发背景或是资深游戏玩家。这一关联性提示,游戏行业在角色塑造、交互设计和叙事构建方面的经验,可能为开发更自然、拟人化的AI助理提供了关键的方法论借鉴。

智能体教程/实践