4月28日

01:20

SemiAnalysis@SemiAnalysis_

很棒的框图，@GoogleCloudTech。这里有个错误。根据图示，HBM3E 是 12 层而非 8 层。对于 TPU 8t 的 6 个 HBM 堆栈容量，必须是 12 层才能达到所引用的 216GB HBM 容量。

Google Cloud Tech: Zoom in on this TPU 8t ASIC block diagram. Optimized for massive-scale pre-training and embedding-heavy workloads, TPU 8...

行业动态部署/工程

00:55

Hacker News 热门（buzzing.cc 中文翻译）

精选71

GitHub Copilot 将转为按使用量计费

GitHub Copilot 宣布将转向按使用量计费模式。这一变化意味着用户的付费方式将从现行的固定订阅制，转变为根据实际使用量来计算费用。具体计费细节和转换时间表尚未公布，但此举旨在为不同使用强度的用户提供更灵活的付费选项。该消息在技术社区引发关注，在Hacker News上获得了111个讨论点数。

产品更新编码部署/工程

推荐理由：GitHub Copilot 从固定订阅转向按量计费，这不是小调整而是定价范式切换，所有重度用户和企业采购方都得重新算账，Cursor 和 Windsurf 的定价战终于把 GitHub 逼到了牌桌上。

00:46

CMU：Machine Learning Blog

精选58

介绍ARFBench：基于真实事件的时间序列问答基准

每年系统故障导致损失超万亿美元，工程师需通过分析时间序列数据快速定位问题。时间序列问答（TSQA）是关键运维任务，对AI模型构成挑战。为此，研究团队推出ARFBench基准，基于Datadog真实内部事件及遥测数据构建。测试显示，当前领先的大型语言模型、视觉语言模型和时间序列基础模型在ARFBench上表现均有较大改进空间。团队提出混合TSFM-VLM模型，其整体性能接近前沿水平，为TSQA任务提供了新评估框架和改进方向。

论文/研究评测/基准部署/工程

推荐理由：CMU 和 Datadog 联手搞了个基于真实事故的时序问答基准，结论很诚实，现有模型全拉胯。做 SRE Agent 的团队该看看，这比合成数据的 benchmark 有说服力得多。

00:33

elvis@omarsar0

一项针对AI智能体在编码任务中token消耗成本的系统性研究发现，其消耗量可达聊天或代码推理的约1000倍，且相同任务在不同运行中的消耗差异高达30倍。更高的token支出并不直接带来更高的准确性，性能在中等成本时达到峰值后趋于饱和。模型自身也难以预测其token使用量，自我预测相关性最高仅0.39。不同模型在相同任务上可能多消耗150万token而并无质量提升。这表明智能体的运行时成本具有高方差、与质量关联弱、甚至模型自身也无法预测的特性，这将影响团队的预算规划、模型间路由策略以及终止任务运行的决策。

DAIR.AI: How do AI Agents spend your money? Most teams treat agent token costs as a rounding error even though the data says they...

智能体论文/研究部署/工程

00:24

凡人小北@frxiaobei

OpenClaw 这么频繁的发版，我一开始以为他们掌握了什么自动化测试的黑科技，直到我最近做了两次升级。 😤 虽然 AI 时代讲究一个快，但好歹咱尊重下测试环节。

OpenClaw🦞: OpenClaw 2026.4.25 🦞 🔊 TTS got serious 🧩 Plugins start faster 📊 OTEL can see the weird stuff 🛠️ Browser + install/u...

开源/仓库行业动态部署/工程

4月27日

23:58

GitHub Blog

精选79

GitHub Copilot 将转向基于使用量的计费模式

自6月1日起，GitHub Copilot 的使用将开始消耗 GitHub AI Credits，计费模式正式从固定订阅制转变为基于实际使用量的计费。这一变化意味着用户的费用将与 AI 助手的具体调用量直接挂钩，而非统一的月费或年费。

编码行业动态部署/工程

推荐理由：GitHub Copilot 从订阅制转向按量计费，这是 AI 编程工具定价范式的标志性拐点，所有重度用户和竞品都得重新算账。