5月19日

16:57

Alibaba Cloud@alibaba_cloud

AI推理任务耗时长且不可预测--传统消息队列限流已力不从心。📉 Apache RocketMQ 5.x 引入 LiteTopic，实现细粒度、毫秒级流量治理。立即掌握您的AI流量！🔗 https://int.alibabacloud.com/m/1000413081/ #RocketMQ #AI

产品更新部署/工程

16:03

Claude@claudeai

来自Code with Claude伦敦现场：我们正在Claude Managed Agents中推出自托管沙箱（公测版）和MCP隧道（研究预览版）。在您自己的安全边界内运行代理，默认应用您的安全控制。

Anthropic MCP/工具产品更新部署/工程

10:59

歸藏(guizang.ai)@op7418

英伟达首款自研CPU Vera交付

英伟达正式开始交付其首款自研通用CPU——NVIDIA Vera。该芯片专门针对AI Agent时代高并发、高吞吐的长期运行场景进行优化，核心功能是作为Agent编排与工具调用的调度中枢。它旨在将原本由GPU承担的密集调度与I/O任务分离，由CPU专门处理，从而构建更高效的AI系统。首批Vera CPU由英伟达高管亲自送至Anthropic、OpenAI、xAI及甲骨文云（OCI），其中xAI由马斯克亲自接待。此举标志着英伟达正从GPU主导的推理市场，深入布局为AI Agent时代定制计算基础设施的新赛道。

NVIDIA: NVIDIA's Ian Buck hand-delivered the first-ever NVIDIA Vera CPUs to our partners @AnthropicAI, @OpenAI, @SpaceX, and @Or...

智能体 Anthropic OpenAI 产品更新

06:55

OpenClaw🦞@openclaw

OpenClaw 2026.5.18 已上线 🤖 xAI/Grok OAuth + sidecar 认证修复 🎙️ 实时 Android 对话模式 💬 Telegram 媒体 + 论坛主题推送修复 🪟 浏览器对话框可见且可应答一周的打磨、优化，减少小问题。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.18

智能体开源/仓库部署/工程

06:06

Chubby♨️@kimmonismus

智能成本低到难以计量。这是真正的突破。Composer 2.5是效率怪兽。

Chubby♨️: Huge, did NOT expect that release. Evals looks very solid, significant jump compared to composer 2! But: it's 10x more e...

模型发布部署/工程

01:20

Anthropic@AnthropicAI

Anthropic正在收购@stainlessapi，这是一个SDK和MCP服务器平台，自我们API早期以来就为所有Anthropic SDK提供支持。阅读更多：https://www.anthropic.com/news/anthropic-acquires-stainless

Anthropic MCP/工具行业动态部署/工程

00:39

Microsoft Research@MSFTResearch

研究聚焦新动态：云效率、更智能的智能体成本削减、3D远程医疗随机试验，以及面向非洲包容性AI语言项目的公开征集。

智能体 Microsoft 行业动态部署/工程

00:13

ClaudeDevs@ClaudeDevs

精选73

在大规模运行Claude Code有哪些最佳实践？关于我们从团队在数百万行单体仓库、数十年历史的遗留系统和分布式微服务中运行的经验总结，新博客文章已发布： https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start

Anthropic 教程/实践编码部署/工程

推荐理由：官方终于出了一份给百万行单仓库和遗留系统的实操指南，比社区零散经验靠谱得多，做工程团队的可以抄作业。

00:04

向阳乔木@vista8

AI自动修复Shadowrocket与Tailscale网络冲突

用户在使用Shadowrocket时发现，安装Tailscale后网络连接出现异常：关闭Shadowrocket时可正常进行远程桌面连接，但开启后便无法连接。最终通过AI工具Codex自动执行网络联通测试，并修改本地规则数据库成功修复问题。此案例表明，复杂网络配置问题可由AI高效解决，未来或可广泛应用于自动化编写Shadowrocket等工具的配置规则。

教程/实践部署/工程

5月18日

23:45

AYi@AYi_AInotes

AI生成内容该用HTML还是Markdown的实用判断标准

推文提出了一个核心判断标准：根据AI产出内容的最终用途来选择格式——如果是为了“阅读”，就用Markdown；如果是为了“使用”，则用HTML。推文指出，许多内容（如项目计划）本质上属于“使用”范畴，但常被错误地用Markdown交付，导致效果不佳。为此，作者推荐了三种适合用HTML生成的实用场景：项目计划页（含时间线与交互图表）、数据看板（支持排序筛选的交互表格），以及各类临时小工具。

AYi: http://x.com/i/article/2053129966217277440

教程/实践部署/工程

22:41

OpenRouter@OpenRouter

新功能：一个更易使用的 playground 侧边栏，可适配您正在尝试的模型类型查看 @Kling_ai Video v3 的实际效果：

产品更新部署/工程

15:32

向阳乔木@vista8

不得不说，哪怕在大模型这么厉害的今天。 DeepL的翻译质量还是很优秀。淘宝上几块钱买个 API，配置到Bob翻译里，用了一年多了。。。

教程/实践部署/工程

12:03

Yuchen Jin@Yuchenj_UW

GPU短缺比以往任何时候都更严重。 H100现在的价格比三年前更高，而且无法按需获取。大型AI实验室已锁定了未来数年的绝大部分供应。我担心大学研究人员和独立开发者将根本无法获得GPU。

现象/趋势部署/工程

08:54

Berryxia.AI@berryxia

开源工具揭露AI API中转站安全风险与检测差异

针对AI API中转站可能存在的“掺水”、“造假”等安全风险，开源项目api-relay-audit通过双论文锚定路线，对AC-1工具调用改写、AC-2错误响应泄漏、上下文截断等常见攻击进行可验证的三态判定，并提供透明日志。对比hvoy.ai和cctest.ai等工具，其透明度和可审计性更为可靠。项目作者已将完整方法论、对比结果和功能速查表公开，并开源了该检测工具。

李韭二: http://x.com/i/article/2052006162804125696

开源/仓库部署/工程

08:53

meng shao@shao__meng

KroWork提出LLM应用固化方案

LLM应用层产物形态从chat演进到agent，两者输出均受限于会话，每次运行都需冷启动、重输上下文并消耗token。KroWork推出第三步应用固化，通过将对话编译为本地可执行App，使后续运行完全避免token消耗，实现一次编译后多次调用，提升效率并降低成本。

智能体现象/趋势部署/工程

5月17日

21:04

Chubby♨️@kimmonismus

能源而非算力，可能成为人工智能的真正瓶颈。犹他州拟建的Stratos数据中心在完全建成后，耗电量可能高达9吉瓦，使其成为全球最大的数据中心项目之一。这大致相当于纽约市的平均电力需求--或约九座核电站的发电量--仅用于一个数据中心。

行业动态部署/工程

16:10

Rohan Paul@rohanpaul_ai

ASML是人工智能和半导体革命的无形支柱。没有ASML： 🚫 就没有英伟达H100 🚫 就没有AI超级计算机 🚫 就没有GPT-3/4/5或Claude 🚫 就没有可扩展的数据中心他们制造这些价值4亿美元的机器，基本上支撑着所有先进芯片的生产。

大佬观点部署/工程

13:44

AYi@AYi_AInotes

AI工具时代的生产悖论：demo易得，工程难行

一条关于游戏开发的推文引发广泛共鸣：利用3D Gaussian Splatting技术生成的单颗树莓模型精度极高且运行流畅，但若将一整筐此类高精度模型放入游戏，帧率会骤降至2 FPS。这现象揭示了AI工具领域的普遍困境：生成单张图像、短视频或代码片段时效果出色，一旦进行批量生产或系统集成，就会出现质量崩溃、性能低下或依赖混乱等问题。其核心在于，新工具极大降低了创意demo的制作门槛，但将其转化为稳定、可交付的生产级应用，所需的工程优化与整合能力反而变得更加稀缺和关键。AI让创意唾手可得，但跨越demo到生产的鸿沟，仍需扎实的工程能力。

Naz: Cant wait for an indie dev to accidentally put a carton of these in his game as a prop and wonder why his game runs at 2...

图像生成现象/趋势部署/工程

11:12

SemiAnalysis@SemiAnalysis_

MLSys 2026下周开幕！ MLSys是展示AI研究者正在攻克的最重要系统问题的会议，SemiAnalysis将亲临现场。以下是我们发现的一些有趣研究 🧵

行业动态部署/工程

10:00

向阳乔木@vista8

Hermes框架在代码质量与稳定性上优于OpenClaw，支持多机器人独立配置与远程协同

Hermes框架在代码质量和稳定性方面显著优于OpenClaw。用户可通过命令行快速创建多个独立机器人角色，并为每个角色分别配置不同的AI模型（如OpenAI GPT、GLM、Kimi等）和即时通讯平台（如飞书、微信）连接。配置过程通过引导式指令和扫码完成，简化了网关设置，实现了多机器人的远程协同工作流。

智能体教程/实践部署/工程

04:41

SemiAnalysis@SemiAnalysis_

AMD代码贡献获NVIDIA接纳，开源社区迎里程碑

NVIDIA的AI性能基准测试项目AIPerf接受了来自AMD的上游代码贡献，这被认为是AMD代码首次被纳入NVIDIA官方仓库。此举被视为开源社区的重要时刻，意味着高质量的、不依赖特定厂商的代码将能供所有人使用。社区期待未来能有更多此类合作，例如将AMD的RIXL部分代码整合进NVIDIA的NIXL，而非维持独立分支。

开源生态行业动态部署/工程

00:41

Peter Steinberger 🦞@steipete

BlackBar 0.2.0 已为 @useblacksmith 上线 📈 24小时vCPU与工作流图表 🔔 可选状态/任务通知 🧰 更丰富的Blacksmith任务行 🟢 紧凑状态徽标小巧菜单栏，减少CI猜测。 https://black.bar

产品更新部署/工程

5月16日

23:33

Chubby♨️@kimmonismus

这就是你要面对的竞争。 30天130万token。燃烧更多token，否则你将无法成功。【引用 @steipete】：The latest CodexBar update renders API costs wayyyy nicer. https://codex.bar

Peter Steinberger 🦞: The latest CodexBar update renders API costs wayyyy nicer. https://codex.bar

大佬观点部署/工程

22:54

Berryxia.AI@berryxia

长上下文LLM竞争已转向：从堆token转向精细的架构优化

长上下文大型语言模型的竞争焦点已从单纯增加上下文长度，转向通过精细的架构优化来提升计算效率。Sebastian Raschka的新文章通过可视化方式，解析了从Gemma 4到DeepSeek V4等模型在生产环境中应用的关键效率优化技术，如KV缓存共享、分层嵌入和压缩注意力等。这些技术旨在更智能地分配计算资源，已成为决定模型性能差异的关键。对于从事长上下文模型、智能体或RAG开发的团队而言，文章中的视觉图解与效率对比具有重要的参考价值。

Sebastian Raschka: New article: a visual tour of recent LLM architecture advances, from Gemma 4 to DeepSeek V4. I focus on long-context eff...

推理现象/趋势部署/工程

22:41

Peter Steinberger 🦞@steipete

Lossless为OpenClaw引入了一个实现"无限"上下文窗口或记忆的有趣概念。其核心机制是将对话内容压缩成可引用的数据块，并构建树状结构以检索历史信息。最新发布的lossless-claw 0.10.0版本旨在确保长对话的持久性，关键改进包括：采用全局压缩替代增量压缩以减少缓存抖动，保护高频提示缓存，修复启动与重启时的转录异常，并简化了新安装的配置流程。

Josh Lehman: lossless-claw 0.10.0 - the "long chats survive" release 🧵 recall spans rotated conversation segments 🧹 full-sweep comp...

智能体产品更新部署/工程

22:22

meng shao@shao__meng

硅谷管理者如何亲自动手：四类工作与关键禁忌

硅谷资深管理者普遍被要求亲自动手使用AI工具，以判断团队效率与技术方向。管理者应选择非关键路径、高杠杆且视角独有的工作，具体包括优化团队内部效率工具、改进产品生活质量、制作庆祝团队成果的物料以及创建展示未来愿景的演示。核心禁忌是介入有关键截止日期和依赖关系的核心产品任务，以免因日程碎片化成为瓶颈，导致交付或管理失败。

Julie Zhuo: What kind of IC work can you do if you are a manager? Attended two dinners with dozens of senior Bay Area tech managers ...

现象/趋势部署/工程

07:09

SemiAnalysis@SemiAnalysis_

正如我们对DeepSeek发布的期待，DeepSeek V4带来了更多炫目的ML系统优化。这次是MegaMoE，一个1400行融合CUDA内核，可计算整个MoE前向传播。让我们看看它是如何工作的（1/4）🧵

DeepSeek 大佬观点数据/训练部署/工程

5月15日

23:44

宝玉@dotey

Forward Deployed Engineer：AI 时代的新宠岗位，到底干什么？

Forward Deployed Engineer（FDE）是AI落地应用的关键角色，负责在客户现场部署和集成AI系统。近期，OpenAI成立独立部署公司，Anthropic与华尔街巨头合作，Google也简化流程大力招聘，显示行业重心正从模型竞赛转向商业落地。FDE工作介于工程师与顾问之间，需写代码、调试并深度理解业务。此岗位为毕业生提供了接触企业级项目的机会，也帮助资深工程师贴近业务需求，成为推动AI创造实际价值的重要力量。

现象/趋势部署/工程

23:37

OpenRouter@OpenRouter

精选74

OpenRouter BYOK 三项重大升级 🔑 1/ 可在同一工作空间为同一服务商添加多个密钥，并设置调用顺序。便于在速率限制间轮换、区分开发与生产凭证，或在团队账户间分配使用量！

产品更新部署/工程

推荐理由：OpenRouter这次BYOK升级很实在，多了多密钥管理和顺序设置，做API分发的团队终于能告别手工切换凭证的痛了。

21:20

OpenClaw🦞@openclaw

产品更新部署/工程

16:54

ginobefun@hongming731

Agent 工程化的全面落地

近期AI领域焦点从模型能力转向Agent工程化落地。Anthropic发布Claude Code实践，强调放弃RAG索引，采用Agentic Search导航大型代码库，并推出管理并行会话的Agent View及Computer Use最佳实践。OpenAI的Codex推出独立光标的Computer Use功能，解决了Windows平台沙箱安全问题，其负责人指出Codex正演变为可执行长期自主任务的本地Agent。国内厂商如阿里、腾讯等也在同步推进Multi-Agent实战，标志着AI Agent进入全面工程化应用阶段。

智能体 Anthropic OpenAI 开源生态

12:06

Orange AI@oran_ge

开源一个月的时间，飞书 CLI 在 Github 破万星了。相比同期的一些 CLI，飞书这个确实是群里口碑最好的。为 Agent 做软件这件事，飞书践行得很好。

智能体开源/仓库部署/工程

10:54

歸藏(guizang.ai)@op7418

ChatGPT手机端现可远程控制Codex

Codex现已支持通过手机上的ChatGPT应用进行远程控制，实现了跨设备对话同步与指令操作。用户需在桌面端Codex客户端内启动设置，并完成多重因素验证（推荐使用Google Authenticator）。绑定后，手机ChatGPT App将出现Codex侧边栏，可查看并控制已绑定桌面设备的所有对话，直接发送命令。目前该功能仅支持Mac版Codex，Windows版本仍在开发中。

智能体 OpenAI 教程/实践部署/工程

09:08

SemiAnalysis@SemiAnalysis_

Cerebras今日IPO涨幅达90%，团队早有预判--但乔丹首先讨论了特朗普访华期间无人机警察小队追访福克斯新闻记者的事件。

行业动态部署/工程

05:12

Epoch AI@EpochAIResearch

服务器占有一座1吉瓦AI数据中心总持有成本的60%。典型的1吉瓦AI数据中心前期资本投入约为380亿美元，年运营成本为9亿美元。将资本支出按设备寿命折算为年度成本，相当于每年85亿美元，其中50亿美元用于服务器。

数据/训练论文/研究部署/工程

01:40

AYi@AYi_AInotes

吴恩达新课拆解Transformer，聚焦LLM生产落地与优化

吴恩达与AMD合作推出新课《Transformers in Practice》，旨在将Transformer从学术概念转化为可调试的工程工具。课程提供交互式可视化，让开发者深入模型内部，观察自回归生成、注意力头分工及幻觉产生过程。核心聚焦生产中的推理优化难题，指出大部分延迟源于内存带宽与注意力计算，而非参数量。课程将系统讲解量化、KV Cache、Flash Attention、投机解码等关键技术，以实现数倍速度提升且精度损失极小。其最大价值在于培养能诊断问题、优化成本的稀缺人才，弥补了仅关注CUDA而缺乏硬件感知优化的市场空白。

Andrew Ng: New course: Transformers in Practice. You'll get a practical view of how transformer-based LLMs work, so you can reason ...

推理教程/实践部署/工程

01:08

SemiAnalysis@SemiAnalysis_

在拉斯维加斯举行的最近一次Google Cloud Next大会上，谷歌发布了专注于推理的新型TPU，其采用名为"Broadfly"的新型网络拓扑结构。通过采用高基数设计，谷歌可在单个集群中扩展至1，152个TPU。与Ironwood相比，这使集群规模扩大4.5倍，同时减少网络直径，任意两芯片间最多仅需7次跳转。（1/3） 🧵

Google 产品更新部署/工程

00:51

Berryxia.AI@berryxia

Anthropic CFO首度长谈：掌千亿算力分配权，CFO或成AI公司新核心

Anthropic首席财务官Krishna Rao在首次深度访谈中透露，其加入公司两年来，年化营收从2.5亿美元激增至300亿美元，并主导筹集近750亿美元资金。他手握超过1000亿美元的AI算力采购承诺，全权负责Trainium、TPUs和GPUs等资源在训练与推理间的动态分配。访谈核心指出，随着模型能力趋同，算力获取与调配能力已成为顶尖AI公司的决胜关键，CFO可能取代首席科学家成为战略掌控者。节目还深入探讨了不确定性决策、前沿智能回报递增等议题。

Patrick OShaughnessy: Krishna Rao is the CFO of Anthropic, and this is his first podcast appearance. He joined the company two years ago when ...

Anthropic 大佬观点部署/工程

5月14日

22:29

Baidu Inc.@Baidu_Inc

随着智能体应用迈向更大规模部署，其背后的云技术栈也需同步扩展。在百度Create大会上，百度集团执行副总裁、百度智能云事业群总裁沈抖宣布推出专为大规模智能体应用打造的全新全栈AI云，其升级涵盖智能体基础设施与AI基础设施。基于我们自研的昆仑芯AI芯片构建的专用集群，已支持ERNIE 5.1系列中一个关键模型的训练。

智能体产品更新部署/工程

21:59

Baidu Inc.@Baidu_Inc

随着智能体应用迈向更大规模部署，其背后的云技术栈也必须随之扩展。在百度Create大会上，百度集团执行副总裁、百度智能云事业群总裁沈抖宣布推出全新的全栈AI云，专为大规模智能体应用构建，其升级涵盖智能体基础设施和AI基础设施。基于我们自研的昆仑芯AI芯片的专用集群，已经支持了ERNIE 5.1系列中一个关键模型的训练。

智能体产品更新部署/工程