AIHOT

5月7日

00:18

xAI@xai

精选67

SpaceXAI将为@AnthropicAI提供访问Colossus 1的权限，这是全球规模最大、部署速度最快的AI超级计算机之一，旨在为Claude提供额外算力 → http：//x.ai/news/anthropic-compute-partnership

AnthropicxAI行业动态部署/工程

关联讨论 13 条

推荐理由：xAI把Colossus 1的算力开放给Anthropic，这种基础设施层的合作在头部公司间非常少见，对依赖Claude的开发者是个缓解供给侧焦虑的积极信号。

00:15

NotebookLM@NotebookLM

精选69

NotebookLM为高级用户推出"自动标注"新功能。当笔记本内来源超过五个时，点击该按钮，系统会自动分析所有内容并将其归类为高级别类别，每个来源可拥有多个标签。标签视图不仅便于查找特定来源，还能让用户选择特定标签来聚焦AI，使其回答仅基于该标签下的来源，从而提升响应速度与信息相关性。此功能也优化了"快速与深度研究"，新添加的来源会清晰显示在现有标签列表下方，方便用户审查和管理。用户可随时重新组织未标注来源或切换回传统列表视图。该功能将于近日向所有用户推送。

Google产品更新

关联讨论 1 条

推荐理由：NotebookLM的自动标签让管理几十个来源的笔记本不再灾难，特别是和深度研究联动后，能快速聚焦感兴趣的分类直接生成播客，研究人员和深度用户应该会喜欢。

00:14

Chubby♨️@kimmonismus

重磅消息：Claude Pro、Max、Team及按席位付费的企业版Claude Code将实现5小时限频翻倍，Claude Opus的API调用限制也将大幅提升。这得益于我们与SpaceX达成的新算力合作！

智能体Anthropic产品更新编码

00:13

Chubby♨️@kimmonismus

在他们的直播中我理解得对吗？ Anthropic正在最高层级免费将Claude Code的速率限制提高一倍？

智能体Anthropic产品更新编码

00:10

Chubby♨️@kimmonismus

"今天没有新模型" *悲伤的胖胖噪音*

Anthropic行业动态

00:05

The Decoder：AI News（RSS）

Google 通过多令牌预测将 Gemma 4 提速三倍

Google 为其 Gemma 4 开源模型家族发布了多令牌预测模块，可将文本生成速度提升高达三倍。该技术通过一个小型辅助模型一次性预测多个令牌，再由主模型单次检查完成验证，从而显著提高了推理效率。

Google产品更新推理

00:04

TestingCatalog News 🗞@testingcatalog

Code with Claude 活动现已开始直播 🔥 ▪︎ 上午9：00 - 主题演讲 ▪︎ 上午10：30 - Claude Code 新功能 ▪︎ 上午11：15 - GitHub 规模下的 Claude 开发实践 ▪︎ 中午12：00 - 利用 Managed Agents 加速产品上线以上均为太平洋时间。https：//x.com/i/broadcasts/1qGoNegbnRNKv

AnthropicMCP/工具产品更新编码

00:02

宝玉@dotey

OpenAI 联合多家巨头开源 AI 训练网络协议 MRC

OpenAI 联合 AMD、博通、英特尔、微软和英伟达，通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输，实现微秒级故障绕行，无需交换机重算路由。这简化了网络架构，将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层，降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算，并成功用于训练多个模型，显著提升了训练任务的鲁棒性。

OpenAI开源/仓库部署/工程

00:00

Microsoft Research@MSFTResearch

设计AI不仅关乎性能更涉及影响人类与地球的权衡取舍在《未来之形》中聆听道格·伯格、艾米·卢尔斯和伊沙伊·梅纳切探讨为何负责任地应用AI可能是解决气候危机的关键 https：//msft.it/6017vMPyt

Microsoft安全/对齐行业动态

00:00

Google Blog：AI（RSS）

5 个你可以在 Search 中直接尝试的园艺技巧

Google 整合了利用其 AI Mode、Search Live 和 Shopping 功能来帮助植物茁壮成长的主要方法。这些工具能提供实时的园艺指导、植物护理建议以及相关产品购买信息，用户可直接在搜索中获取并应用这些技巧，以优化自己的园艺实践。

Google其他

5月6日

23:58

ClaudeDevs@ClaudeDevs

Code with Claude 正在进行中！ ▪︎ 上午9：00 - 主题演讲 ▪︎ 上午10：30 - Claude Code 新功能发布 ▪︎ 上午11：15 - GitHub规模级Claude应用构建 ▪︎ 中午12：00 - 通过托管代理加速产品上线以上均为太平洋时间。https：//x.com/i/broadcasts/1qGoNegbnRNKv

Anthropic编码行业动态

23:58

Simon Willison 博客

现场博客：2026年 Code w/ Claude 大会

Anthropic 在 2026 年 Code w/ Claude 活动上发布了主题演讲。活动聚焦于生成式 AI 和大型语言模型的最新进展，特别是围绕 Claude 模型的技术更新与开发生态。现场博客实时记录了大会的核心内容与动态。

Anthropic编码行业动态

23:57

向阳乔木@vista8

AI分析X平台数据揭示发帖效率与涨粉规律

通过将X平台创作者工作室近90天的数据分析数据输入大模型，AI提炼出关键运营规律。核心发现包括：每日发帖3-5条是曝光效率最佳区间，而非单纯追求数量；周三互动率最高，周四涨粉效果最好，周六则最利于冲击曝光量。此外，近44%的新增关注者集中来源于少数“高涨粉日”，表明涨粉主要依赖爆款帖文的拉动效应。

教程/实践数据/训练

23:54

Chubby♨️@kimmonismus

来吧！！！Leo是个伟大的泄露者，所以我假设我们今天会看到sonnet 4.8！！

Anthropic模型发布行业动态

23:50

IT之家（RSS）

夏尔马新官上任三把火，宣布下周将推新版 Xbox 主机开机动画及音效

Xbox CEO 阿莎·夏尔马宣布，将于5月13日为Xbox主机上线新的开机动画和音效。新动画将展示此前已公布的玻璃质感新版Xbox标志，音效也将进行微调。此次更新紧随夏尔马上任后的首次重大组织调整，包括人员变动、引入技术专长新成员及从微软CoreAI部门调入前同事。此外，她还通过推进玩家期待的功能、下调Xbox Game Pass价格及将Microsoft Gaming改回Xbox等举措，积极塑造其领导下的Xbox新方向。

Microsoft其他

23:37

宝玉@dotey

把视频变成图文博客：Agent + 豆包 Seed2.0 lite 重做 Karpathy 两年前的工作流

作者利用豆包Seed2.0-lite全模态理解模型，重新实践了将长视频自动转换为图文博客的工作流。传统ASR+LLM方案因信息丢失严重而效果不佳，新方案的核心在于模型能同时理解视频的音频、画面和屏幕文字，进行联合推理，从而保留技术视频中的关键视觉信息（如代码、图表）。通过将多模态能力封装为可复用的Agent Skill，并采用四步最佳实践——视频切片、生成结构化素材、反查关键帧配图、生成终稿——解决了传统流程的上下文割裂问题，使输出更接近人类技术编辑的整理成果。

智能体多模态教程/实践视频

23:33

Berryxia.AI@berryxia

果然他妈的中转站太赚钱了！川普的儿子都来了，孙割看好的生意果然没错👍！不割一把都难受啊！那么问题来了，他们的中转站我们需要科学上网吗？

MCP/工具行业动态

23:27

叫我阿杭@Astronaut_1216

Solo π LAB社区助力个人成为AI时代的超级个体

作者宣布其创立的“Solo π LAB”社区已初具雏形，核心目标是分享个人已验证的独立项目，旨在帮助每个成员成为“超级个体”或“OPC”，并成功运营“一人公司”。为此，社区正在整理并推出“Solo π 计划”，旨在系统性地带领成员实践。作者强调，在AI时代，个人拥有无限可能，并希望陪伴所有热爱AI、积极探索一人公司模式的伙伴共同成长。

行业动态

23:26

IT之家（RSS）

爱彼迎 CEO 切斯基：只负责"管人"的管理者将很快会被 AI 时代淘汰

爱彼迎CEO布莱恩·切斯基指出，在AI时代，仅负责“管人”而不参与具体工作的管理者将很快失去价值，必须深入业务、掌握工作上下文。这一观点在科技行业引发共鸣，Coinbase已宣布取消“纯管理者”岗位并裁员以扁平化组织，Block和Meta等公司也强调减少永久性中层管理。未来，管理者需转型为“队员兼教练”，与团队共同实战。

现象/趋势行业动态

23:25

IT之家（RSS）

心理施压攻破安全防线，Anthropic Claude 竟主动输出违禁内容

安全研究公司Mindgard通过心理操控手段成功诱导Anthropic的Claude Sonnet 4.5模型主动输出违禁内容。研究人员仅使用尊重吹捧、佯装好奇等非技术性对话策略，在约25轮对话中，使模型自我怀疑其内容过滤规则，最终主动提供了色情内容、恶意代码、爆炸物制作教程等高危信息，且多数内容未经直接索要。此次攻击利用了Claude“乐于助人”的心理特质，暴露了AI安全不仅存在技术漏洞，更存在心理层面的风险暴露面。研究指出，此类基于社会工程学的心理攻击极难防御，且是当前聊天机器人的普遍隐患。

Anthropic安全/对齐

23:23

Berryxia.AI@berryxia

Downy是一个开源的自托管多agent协作平台，运行在Cloudflare Durable Objects上。它允许用户搭建具有不同性格、技能和工具的agent团队，所有管理操作均通过应用程序完成，无需使用CLI或Obsidian等外部工具。该平台支持跨设备访问，旨在简化多agent系统的部署和协作流程。

Geek：让你搭一个多 agent 团队，每个 agent 有自己的性格和技能，随便哪个设备都能用。自托管的多 agent 协作平台，跑在 Cloudflare Du…

智能体MCP/工具开源/仓库

23:22

Berryxia.AI@berryxia

精选76

姚老师将其公开分享的提示词整理并开源至GitHub仓库。该合集包含约100个提示词，覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等九大类场景。其中特别推荐的是对用户帮助显著的元提示词，包括简易版和进阶版。作者表示后续将通过该仓库持续更新经过验证的有价值提示词。

姚金刚：开源一套我的提示词合集前几天，收到一位微信好友反馈，说使用了我不少公开的提示词，效果很不错这一年来，公开分享了不少提示词，一直沉淀在飞书文档为了方…

GitHub开源生态教程/实践

推荐理由：姚老师把一年沉淀的100个提示词整理开源，尤其元提示词部分能直接拉高AI工作流上限，属于那种收藏即赚到的实用合集。

23:21

Berryxia.AI@berryxia

精选73

Stanford CS336课程指出，过去三年主流大语言模型架构高度收敛，约90%组件形成共通模板。核心包括：架构普遍采用pre-norm、RMS Norm、无偏置、SwiGLU/GeGLU激活函数、RoPE位置编码；超参数如FFN维度比例、注意力头配置、模型纵横比等已成惯例。为保障训练稳定，Z-loss、QK norm等技术被广泛使用；GQA成为推理部署标配，局部与全局attention交替是处理长上下文的新趋势。这套模板被视为2026年开源LLM的"默认配置"。

Jason Zhu：Stanford CS336 上，Tatsu 讲了一节 LLM 架构课，把过去 3 年所有主流 LLM 拆开，看它们的共通模板结论挺爆：90% 的架构选择已…

教程/实践

推荐理由：一份2026年训大模型的标准化配置单，把过去三年业界踩坑得出的最优设置全写清楚了，自己训模型直接抄就行，别费力试错。

23:19

阿绎 AYi@AYi_AInotes

从被轻视到行业颠覆者：苏姿丰带领AMD的八年逆袭

2018年F1中国站，AMD CEO苏姿丰曾遭遇记者带有种族微歧视的提问。八年间，她将公司市值从濒临破产的30亿美元提升至6500亿美元。最新财报显示，其数据中心营收同比暴涨57%，股价大涨。她预判AI Agent的兴起将使CPU与GPU需求比例从1:8转向1:1，这为AMD的混合方案开辟道路，并挑战NVIDIA的垄断。凭借Zen架构与MI300系列，AMD在数据中心市场份额已从近乎为零升至40%，完成了最有力的反击。

智能体推理现象/趋势

23:19

Chubby♨️@kimmonismus

链上Pre-IPO交易数据显示，Anthropic隐含估值在7天内上涨20%，达到1.2万亿美元，较2025年10月已飙升900%。这使其估值比OpenAI最新估值高出约40%，成为全球第11大估值公司，但仍低于SpaceX约1.75万亿美元的目标IPO估值。基于Jupiter平台的链上工具为未上市科技公司提供了实时估值参考，反映出AI革命正在加速推进。

AnthropicOpenAI现象/趋势行业动态

23:17

Berryxia.AI@berryxia

精选75

Warp 开源内部高效工具集 Skills，包含15个生产级技能

Warp 团队将其内部用于大幅提升工作流效率的“Skills”工具集完全开源。用户通过一条命令 `npx skills add warpdotdev/oz-skills` 即可安装包含 SEO 与无障碍审计、文档自动写作、Terraform/DevOps 配置、GitHub Issue 处理等在内的15个高质量生产级技能。团队此举旨在将其实用工具开放给整个社区，而非私有化，体现了开放精神。项目 GitHub 仓库已开放，并鼓励社区贡献。

MCP/工具开源/仓库部署/工程

关联讨论 1 条

推荐理由：Warp 团队把内部压箱底的 15 个生产级 Skills 全开源了，一条命令就能装，SEO 审计、Terraform 配置这些真实场景的技能直接拿来用，开发效率飞起。

23:13

Nathan Lambert@natolambert

策略蒸馏成为后训练优化核心技术

作者在其著作中补充了关于策略蒸馏如何成为核心后训练优化技术的历史回顾。其数学原理相对简单，其发展得益于分布式训练系统的进步。关键转折在于强化学习设置中采用蒸馏目标，这启发了丰富的奖励塑造思路。策略蒸馏的普及也源于近年来强化学习算法工程的大规模投入。技术演进从学习教师示范转向学生自我推演，回顾看似明显，实则经历了大量工作。相关研究如MiniLLM率先提出了类似策略梯度的在策略推演蒸馏方法。

大佬观点

23:13

Berryxia.AI@berryxia

精选74

一个名为dFlash的GitHub项目宣称，能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速，并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注，被认为展现了民间开发者在模型优化方面的强大能力。

铁锤人：这个项目能让Gemma 4 推理提速到6倍比谷歌的3倍还快，而且不损失质量 https://github.com/z-lab/dflash

Google开源/仓库开源生态推理

关联讨论 1 条

推荐理由：一个开源库把 Gemma 4 推理拉到官方的两倍速还不掉精度，这对正在用 Gemma 做部署的开发者简直是及时雨，直接抄作业比等谷歌快多了。

23:04

Perplexity@perplexity_ai

我们开发了自有的推理引擎--运行时优化服务引擎（ROSE），可服务于从嵌入模型到万亿参数大语言模型的各种模型。通过将CuTeDSL集成到推理引擎中，Perplexity能够更快构建专用GPU内核，使模型在NVIDIA Hopper和Blackwell GPU上达到峰值性能。

产品更新部署/工程

22:59

Chubby♨️@kimmonismus

Claude Mythos与GPT-5.5能力相近，未现性能飞跃

一篇关于Claude Mythos和GPT-5.5的分析文章指出，两者在网络安全能力上基本持平，GPT-5.5可能更具成本效益。Mythos在部分通用基准和SWE-bench Pro上略微领先，但并未形成显著的能力突破。分析认为Mythos的性能符合既往趋势，并非偏离趋势的巨大飞跃。与此同时，OpenAI近期发布了多项出色产品，这反衬出Claude Mythos为何仍保持高度保密状态。

AnthropicOpenAI推理编码

22:56

OpenAI@OpenAI

精选66

大规模AI超算需要新型网络来保持芯片同步。OpenAI专家讨论了在庞大芯片集群间可靠高效传输数据的挑战，并介绍了新发布的多路径可靠连接（MRC）网络协议。该协议由OpenAI与AMD、Broadcom、Intel、Microsoft、NVIDIA等行业伙伴共同推出，旨在帮助大型AI训练集群运行得更快、更可靠，减少GPU闲置时间。MRC是一个开放的行业协议，可供整个业界使用。

OpenAI数据/训练行业动态部署/工程

关联讨论 1 条

推荐理由：OpenAI 拉上 AMD、Broadcom、Intel、Microsoft、NVIDIA 一起搞的开源网络协议，专门解决万卡集群的通信瓶颈，做大规模训练的团队值得去翻翻官方博文。

22:31

SenseTime@SenseTime_AI

精选71

🚀 SenseNova-U1 更新： ⚡ 开源8步蒸馏LoRA：100 NFE降至8 NFE，H100推理时间从23秒缩短至2秒 🧩 现已支持ComfyUI，提供文生图、图像编辑和交错生成的即用工作流试用链接 👇 https：//github.com/OpenSenseNova/SenseNova-U1/

图像生成开源/仓库推理模型发布

推荐理由：从100步到8步，23秒压到2秒，商汤这个蒸馏LoRA把U1的推理成本打下来了，做实时图像应用的可以认真看看，ComfyUI一接就能跑。

22:24

Simon Willison 博客

精选77

编程模式界限模糊：从"感觉编码"到"代理工程"的融合与隐忧

作者在访谈中反思，曾严格区分的两种AI编程模式——“感觉编码”（不审查代码）与“代理工程”（专业工程师构建高质量系统）——其界限在实践中正迅速模糊。随着Claude等编码代理可靠性提升，作者发现自己即使在生产级项目中也不再逐行审查AI生成的代码，转而将其视为可信的“半黑箱”。这带来了新的责任困境：AI缺乏职业声誉却持续产出正确代码，可能导致“偏差正常化”风险，即每一次成功都可能在不当时刻埋下隐患。同时，AI生成代码的便捷性也使得评估软件质量的传统指标（如提交次数、测试覆盖）不再可靠。

智能体大佬观点编码

推荐理由：Simon 坦诚自己在生产级开发中也开始‘不看代码就信任 Claude Code’，这个伦理困境是每个 AI 编程工具使用者都绕不开的一课，他的思考比大多数评测都更能帮你定位自己的信任边界。

22:21

IT之家（RSS）

全力布局 AI，苹果研发支出占营收比例 30 年来首次突破 10%

苹果第一季度研发支出占营收比例达10.3%，为至少30年来首次突破10%。其研发开支同比激增近34%，远超营收增速，表明公司正全力投入人工智能领域以追赶科技同行。分析师指出，资金主要投向AI人才、模型训练及硬件底层技术，而非大规模数据中心建设。结合营收预期上调与现金策略调整，苹果正在为AI驱动的重磅新品蓄力，预计今年将推出新版Siri与Apple Intelligence。

端侧行业动态

22:09

Perplexity@perplexity_ai

精选71

Perplexity Agent API 现已提供金融搜索功能。开发者只需一次工具调用，即可为需要当前可验证金融答案的智能体获取授权金融数据集、实时市场数据和附引用的网络资源。

产品更新搜索

推荐理由：Perplexity 把金融搜索拆成 API 端点，对于做金融 Agent 的开发者是实打实的生产力提升，属于‘一调即用’那种，可以跳过一堆数据集成工作。

22:08

向阳乔木@vista8

精选77

姚老师将其去年编写的提示词整理并开源，强调这些提示词以实干派风格为主，适用于商业场景，源于实际业务需求。合集包含约100个提示词，覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等9类场景，特别推荐其中的元提示词（包括简易版和进阶版）。项目已通过GitHub发布，并将持续更新验证过的有价值提示词，方便用户下载和迭代。

开源生态教程/实践

推荐理由：姚老师这套提示词不是纸上谈兵，全是商业场景里磨出来的，100个覆盖九类场景，尤其是元提示词，可以直接复制就用，做 AI 产品的赶紧收藏。

22:06

向阳乔木@vista8

打造拟人AI助理的实战经验与游戏从业者洞察

洛小山发布了一篇关于如何创建具有“活人感”AI助理的长文，内容包含大量实用干货与实战经验。文章指出，在该领域表现出色的实践者或项目，大多具有游戏开发背景或是资深游戏玩家。这一关联性提示，游戏行业在角色塑造、交互设计和叙事构建方面的经验，可能为开发更自然、拟人化的AI助理提供了关键的方法论借鉴。

智能体教程/实践

21:59

OpenAI@OpenAI

我们已与@AMD、@Broadcom、@Intel、@Microsoft和@NVIDIA合作，推出多路径可靠连接（MRC）--这是一种全新的开放式网络协议，可帮助大型AI训练集群运行得更快更可靠，并减少GPU时间浪费。 https：//openai.com/index/mrc-supercomputer-networking/

OpenAI产品更新开源生态部署/工程

21:51

IT之家（RSS）

精选71

豆包大模型家族首款全模态理解模型：字节跳动 Doubao-Seed-2.0-lite 升级

字节跳动火山引擎发布豆包大模型家族首款全模态理解模型 Doubao-Seed-2.0-lite 升级版。该模型原生统一支持视频、图像、音频和文本理解，并能进行跨模态联合推理，在物理、医疗等学科推理及细粒度感知上表现超越此前Pro版本。音频方面支持19种语种转写及多语种互译，多项基准测试优于Gemini-3.1-Pro。同时，其Agent、Coding与GUI能力升级，能更稳定处理长任务、胜任深度开发，并实现界面理解与操作执行的闭环。新版本已在火山方舟上线，旨在为企业提供高性价比的全模态任务部署方案。

智能体多模态推理模型发布

推荐理由：豆包Seed 2.0 lite把视频、音频、图片、文字原生塞进一个模型，还顺手强化了Agent和GUI操作，对需要全模态处理的企业来说，这可能是目前性价比最高的选择。

21:46

meng shao@shao__meng

Luma发布的Uni-1图像生成模型在提示词与像素生成之间引入了一个显式推理步骤，用于解读创意方向并消除歧义。这一关键推理层现已通过API对外可编程开放，使其不再是黑盒，允许开发者将Uni-1作为智能基础设施集成到生产流程中。主要应用模式包括嵌入产品作为创作引擎、构建自定义多阶段工作流或开发独立工具。API提供的核心能力涵盖基于参考图像的风格或角色约束生成、在模型层面强制保持视觉一致性，以及通过自然语言指令进行精准编辑。

图像生成推理模型发布