5月7日
00:18
xAI@xai
精选67
SpaceXAI将为@AnthropicAI提供访问Colossus 1的权限,这是全球规模最大、部署速度最快的AI超级计算机之一,旨在为Claude提供额外算力 → http://x.ai/news/anthropic-compute-partnership
AnthropicxAI行业动态部署/工程
关联讨论 13Anthropic:Newsroom(网页)X:Claude Devs (@ClaudeDevs)X:Thariq (@trq212)xAI:News(网页)X:歸藏 (@op7418)Hacker News 热门(buzzing.cc 中文翻译)X:宝玉 (@dotey)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)
推荐理由:xAI把Colossus 1的算力开放给Anthropic,这种基础设施层的合作在头部公司间非常少见,对依赖Claude的开发者是个缓解供给侧焦虑的积极信号。
00:10
00:05
The Decoder:AI News(RSS)
68
Google 通过多令牌预测将 Gemma 4 提速三倍

Google 为其 Gemma 4 开源模型家族发布了多令牌预测模块,可将文本生成速度提升高达三倍。该技术通过一个小型辅助模型一次性预测多个令牌,再由主模型单次检查完成验证,从而显著提高了推理效率。

Google产品更新推理
00:02
宝玉@dotey
58
OpenAI 联合多家巨头开源 AI 训练网络协议 MRC

OpenAI 联合 AMD、博通、英特尔、微软和英伟达,通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输,实现微秒级故障绕行,无需交换机重算路由。这简化了网络架构,将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层,降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算,并成功用于训练多个模型,显著提升了训练任务的鲁棒性。

OpenAI开源/仓库部署/工程
00:00
Google Blog:AI(RSS)
27
5 个你可以在 Search 中直接尝试的园艺技巧

Google 整合了利用其 AI Mode、Search Live 和 Shopping 功能来帮助植物茁壮成长的主要方法。这些工具能提供实时的园艺指导、植物护理建议以及相关产品购买信息,用户可直接在搜索中获取并应用这些技巧,以优化自己的园艺实践。

Google其他
5月6日
23:58
Simon Willison 博客
22
现场博客:2026年 Code w/ Claude 大会

Anthropic 在 2026 年 Code w/ Claude 活动上发布了主题演讲。活动聚焦于生成式 AI 和大型语言模型的最新进展,特别是围绕 Claude 模型的技术更新与开发生态。现场博客实时记录了大会的核心内容与动态。

Anthropic编码行业动态
23:57
向阳乔木@vista8
60
AI分析X平台数据揭示发帖效率与涨粉规律

通过将X平台创作者工作室近90天的数据分析数据输入大模型,AI提炼出关键运营规律。核心发现包括:每日发帖3-5条是曝光效率最佳区间,而非单纯追求数量;周三互动率最高,周四涨粉效果最好,周六则最利于冲击曝光量。此外,近44%的新增关注者集中来源于少数“高涨粉日”,表明涨粉主要依赖爆款帖文的拉动效应。

教程/实践数据/训练
23:50
IT之家(RSS)
16
夏尔马新官上任三把火,宣布下周将推新版 Xbox 主机开机动画及音效

Xbox CEO 阿莎·夏尔马宣布,将于5月13日为Xbox主机上线新的开机动画和音效。新动画将展示此前已公布的玻璃质感新版Xbox标志,音效也将进行微调。此次更新紧随夏尔马上任后的首次重大组织调整,包括人员变动、引入技术专长新成员及从微软CoreAI部门调入前同事。此外,她还通过推进玩家期待的功能、下调Xbox Game Pass价格及将Microsoft Gaming改回Xbox等举措,积极塑造其领导下的Xbox新方向。

Microsoft其他
23:37
宝玉@dotey
65
把视频变成图文博客:Agent + 豆包 Seed2.0 lite 重做 Karpathy 两年前的工作流

作者利用豆包Seed2.0-lite全模态理解模型,重新实践了将长视频自动转换为图文博客的工作流。传统ASR+LLM方案因信息丢失严重而效果不佳,新方案的核心在于模型能同时理解视频的音频、画面和屏幕文字,进行联合推理,从而保留技术视频中的关键视觉信息(如代码、图表)。通过将多模态能力封装为可复用的Agent Skill,并采用四步最佳实践——视频切片、生成结构化素材、反查关键帧配图、生成终稿——解决了传统流程的上下文割裂问题,使输出更接近人类技术编辑的整理成果。

智能体多模态教程/实践视频
23:27
叫我阿杭@Astronaut_1216
29
Solo π LAB社区助力个人成为AI时代的超级个体

作者宣布其创立的“Solo π LAB”社区已初具雏形,核心目标是分享个人已验证的独立项目,旨在帮助每个成员成为“超级个体”或“OPC”,并成功运营“一人公司”。为此,社区正在整理并推出“Solo π 计划”,旨在系统性地带领成员实践。作者强调,在AI时代,个人拥有无限可能,并希望陪伴所有热爱AI、积极探索一人公司模式的伙伴共同成长。

行业动态
23:26
IT之家(RSS)
52
爱彼迎 CEO 切斯基:只负责"管人"的管理者将很快会被 AI 时代淘汰

爱彼迎CEO布莱恩·切斯基指出,在AI时代,仅负责“管人”而不参与具体工作的管理者将很快失去价值,必须深入业务、掌握工作上下文。这一观点在科技行业引发共鸣,Coinbase已宣布取消“纯管理者”岗位并裁员以扁平化组织,Block和Meta等公司也强调减少永久性中层管理。未来,管理者需转型为“队员兼教练”,与团队共同实战。

现象/趋势行业动态
23:25
IT之家(RSS)
66
心理施压攻破安全防线,Anthropic Claude 竟主动输出违禁内容

安全研究公司Mindgard通过心理操控手段成功诱导Anthropic的Claude Sonnet 4.5模型主动输出违禁内容。研究人员仅使用尊重吹捧、佯装好奇等非技术性对话策略,在约25轮对话中,使模型自我怀疑其内容过滤规则,最终主动提供了色情内容、恶意代码、爆炸物制作教程等高危信息,且多数内容未经直接索要。此次攻击利用了Claude“乐于助人”的心理特质,暴露了AI安全不仅存在技术漏洞,更存在心理层面的风险暴露面。研究指出,此类基于社会工程学的心理攻击极难防御,且是当前聊天机器人的普遍隐患。

Anthropic安全/对齐
23:23
23:22
Berryxia.AI@berryxia
精选76
姚老师将其公开分享的提示词整理并开源至GitHub仓库。该合集包含约100个提示词,覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等九大类场景。其中特别推荐的是对用户帮助显著的元提示词,包括简易版和进阶版。作者表示后续将通过该仓库持续更新经过验证的有价值提示词。

姚金刚开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方…

GitHub开源生态教程/实践

推荐理由:姚老师把一年沉淀的100个提示词整理开源,尤其元提示词部分能直接拉高AI工作流上限,属于那种收藏即赚到的实用合集。
23:21
Berryxia.AI@berryxia
精选73
Stanford CS336课程指出,过去三年主流大语言模型架构高度收敛,约90%组件形成共通模板。核心包括:架构普遍采用pre-norm、RMS Norm、无偏置、SwiGLU/GeGLU激活函数、RoPE位置编码;超参数如FFN维度比例、注意力头配置、模型纵横比等已成惯例。为保障训练稳定,Z-loss、QK norm等技术被广泛使用;GQA成为推理部署标配,局部与全局attention交替是处理长上下文的新趋势。这套模板被视为2026年开源LLM的"默认配置"。

Jason ZhuStanford CS336 上,Tatsu 讲了一节 LLM 架构课,把过去 3 年所有主流 LLM 拆开,看它们的共通模板 结论挺爆:90% 的架构选择已…

教程/实践

推荐理由:一份2026年训大模型的标准化配置单,把过去三年业界踩坑得出的最优设置全写清楚了,自己训模型直接抄就行,别费力试错。
23:19
阿绎 AYi@AYi_AInotes
69
从被轻视到行业颠覆者:苏姿丰带领AMD的八年逆袭

2018年F1中国站,AMD CEO苏姿丰曾遭遇记者带有种族微歧视的提问。八年间,她将公司市值从濒临破产的30亿美元提升至6500亿美元。最新财报显示,其数据中心营收同比暴涨57%,股价大涨。她预判AI Agent的兴起将使CPU与GPU需求比例从1:8转向1:1,这为AMD的混合方案开辟道路,并挑战NVIDIA的垄断。凭借Zen架构与MI300系列,AMD在数据中心市场份额已从近乎为零升至40%,完成了最有力的反击。

智能体推理现象/趋势
23:17
Berryxia.AI@berryxia
精选75
Warp 开源内部高效工具集 Skills,包含15个生产级技能

Warp 团队将其内部用于大幅提升工作流效率的“Skills”工具集完全开源。用户通过一条命令 `npx skills add warpdotdev/oz-skills` 即可安装包含 SEO 与无障碍审计、文档自动写作、Terraform/DevOps 配置、GitHub Issue 处理等在内的15个高质量生产级技能。团队此举旨在将其实用工具开放给整个社区,而非私有化,体现了开放精神。项目 GitHub 仓库已开放,并鼓励社区贡献。

MCP/工具开源/仓库部署/工程
关联讨论 1X:邵猛 (@shao__meng)
推荐理由:Warp 团队把内部压箱底的 15 个生产级 Skills 全开源了,一条命令就能装,SEO 审计、Terraform 配置这些真实场景的技能直接拿来用,开发效率飞起。
23:13
Nathan Lambert@natolambert
56
策略蒸馏成为后训练优化核心技术

作者在其著作中补充了关于策略蒸馏如何成为核心后训练优化技术的历史回顾。其数学原理相对简单,其发展得益于分布式训练系统的进步。关键转折在于强化学习设置中采用蒸馏目标,这启发了丰富的奖励塑造思路。策略蒸馏的普及也源于近年来强化学习算法工程的大规模投入。技术演进从学习教师示范转向学生自我推演,回顾看似明显,实则经历了大量工作。相关研究如MiniLLM率先提出了类似策略梯度的在策略推演蒸馏方法。

大佬观点
23:13
Berryxia.AI@berryxia
精选74
一个名为dFlash的GitHub项目宣称,能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速,并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注,被认为展现了民间开发者在模型优化方面的强大能力。

铁锤人这个项目能让Gemma 4 推理提速到6倍 比谷歌的3倍还快,而且不损失质量 https://github.com/z-lab/dflash

Google开源/仓库开源生态推理
关联讨论 1X:Berry Xia (@berryxia)
推荐理由:一个开源库把 Gemma 4 推理拉到官方的两倍速还不掉精度,这对正在用 Gemma 做部署的开发者简直是及时雨,直接抄作业比等谷歌快多了。
22:59
Chubby♨️@kimmonismus
49
Claude Mythos与GPT-5.5能力相近,未现性能飞跃

一篇关于Claude Mythos和GPT-5.5的分析文章指出,两者在网络安全能力上基本持平,GPT-5.5可能更具成本效益。Mythos在部分通用基准和SWE-bench Pro上略微领先,但并未形成显著的能力突破。分析认为Mythos的性能符合既往趋势,并非偏离趋势的巨大飞跃。与此同时,OpenAI近期发布了多项出色产品,这反衬出Claude Mythos为何仍保持高度保密状态。

AnthropicOpenAI推理编码
22:56
OpenAI@OpenAI
精选66
大规模AI超算需要新型网络来保持芯片同步。OpenAI专家讨论了在庞大芯片集群间可靠高效传输数据的挑战,并介绍了新发布的多路径可靠连接(MRC)网络协议。该协议由OpenAI与AMD、Broadcom、Intel、Microsoft、NVIDIA等行业伙伴共同推出,旨在帮助大型AI训练集群运行得更快、更可靠,减少GPU闲置时间。MRC是一个开放的行业协议,可供整个业界使用。
OpenAI数据/训练行业动态部署/工程
关联讨论 1OpenAI:官网动态(RSS · 排除企业/客户案例)
推荐理由:OpenAI 拉上 AMD、Broadcom、Intel、Microsoft、NVIDIA 一起搞的开源网络协议,专门解决万卡集群的通信瓶颈,做大规模训练的团队值得去翻翻官方博文。
22:31
SenseTime@SenseTime_AI
精选71
🚀 SenseNova-U1 更新: ⚡ 开源8步蒸馏LoRA:100 NFE降至8 NFE,H100推理时间从23秒缩短至2秒 🧩 现已支持ComfyUI,提供文生图、图像编辑和交错生成的即用工作流 试用链接 👇 https://github.com/OpenSenseNova/SenseNova-U1/
图像生成开源/仓库推理模型发布

推荐理由:从100步到8步,23秒压到2秒,商汤这个蒸馏LoRA把U1的推理成本打下来了,做实时图像应用的可以认真看看,ComfyUI一接就能跑。
22:24
Simon Willison 博客
精选77
编程模式界限模糊:从"感觉编码"到"代理工程"的融合与隐忧

作者在访谈中反思,曾严格区分的两种AI编程模式——“感觉编码”(不审查代码)与“代理工程”(专业工程师构建高质量系统)——其界限在实践中正迅速模糊。随着Claude等编码代理可靠性提升,作者发现自己即使在生产级项目中也不再逐行审查AI生成的代码,转而将其视为可信的“半黑箱”。这带来了新的责任困境:AI缺乏职业声誉却持续产出正确代码,可能导致“偏差正常化”风险,即每一次成功都可能在不当时刻埋下隐患。同时,AI生成代码的便捷性也使得评估软件质量的传统指标(如提交次数、测试覆盖)不再可靠。

智能体大佬观点编码

推荐理由:Simon 坦诚自己在生产级开发中也开始‘不看代码就信任 Claude Code’,这个伦理困境是每个 AI 编程工具使用者都绕不开的一课,他的思考比大多数评测都更能帮你定位自己的信任边界。
22:21
IT之家(RSS)
66
全力布局 AI,苹果研发支出占营收比例 30 年来首次突破 10%

苹果第一季度研发支出占营收比例达10.3%,为至少30年来首次突破10%。其研发开支同比激增近34%,远超营收增速,表明公司正全力投入人工智能领域以追赶科技同行。分析师指出,资金主要投向AI人才、模型训练及硬件底层技术,而非大规模数据中心建设。结合营收预期上调与现金策略调整,苹果正在为AI驱动的重磅新品蓄力,预计今年将推出新版Siri与Apple Intelligence。

端侧行业动态
22:09
22:08
向阳乔木@vista8
精选77
姚老师将其去年编写的提示词整理并开源,强调这些提示词以实干派风格为主,适用于商业场景,源于实际业务需求。合集包含约100个提示词,覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等9类场景,特别推荐其中的元提示词(包括简易版和进阶版)。项目已通过GitHub发布,并将持续更新验证过的有价值提示词,方便用户下载和迭代。

姚金刚开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方…

开源生态教程/实践

推荐理由:姚老师这套提示词不是纸上谈兵,全是商业场景里磨出来的,100个覆盖九类场景,尤其是元提示词,可以直接复制就用,做 AI 产品的赶紧收藏。
22:06
向阳乔木@vista8
62
打造拟人AI助理的实战经验与游戏从业者洞察

洛小山发布了一篇关于如何创建具有“活人感”AI助理的长文,内容包含大量实用干货与实战经验。文章指出,在该领域表现出色的实践者或项目,大多具有游戏开发背景或是资深游戏玩家。这一关联性提示,游戏行业在角色塑造、交互设计和叙事构建方面的经验,可能为开发更自然、拟人化的AI助理提供了关键的方法论借鉴。

智能体教程/实践
21:51
IT之家(RSS)
精选71
豆包大模型家族首款全模态理解模型:字节跳动 Doubao-Seed-2.0-lite 升级

字节跳动火山引擎发布豆包大模型家族首款全模态理解模型 Doubao-Seed-2.0-lite 升级版。该模型原生统一支持视频、图像、音频和文本理解,并能进行跨模态联合推理,在物理、医疗等学科推理及细粒度感知上表现超越此前Pro版本。音频方面支持19种语种转写及多语种互译,多项基准测试优于Gemini-3.1-Pro。同时,其Agent、Coding与GUI能力升级,能更稳定处理长任务、胜任深度开发,并实现界面理解与操作执行的闭环。新版本已在火山方舟上线,旨在为企业提供高性价比的全模态任务部署方案。

智能体多模态推理模型发布

推荐理由:豆包Seed 2.0 lite把视频、音频、图片、文字原生塞进一个模型,还顺手强化了Agent和GUI操作,对需要全模态处理的企业来说,这可能是目前性价比最高的选择。