5月27日

16:14

IT之家（RSS）

首批第三方 PCIe Gen6 SSD 将至：十铨 T-CREATE MASTER Ai I6E 顺序读可达 28GB/s

十铨科技将在Computex 2026展出一系列存储器新品。核心产品是面向AI训练、超大规模推理等高性能计算场景的T-CREATE MASTER Ai I6E固态硬盘。作为首批第三方PCIe Gen6 SSD，它采用EDSFF E1.S规格，顺序读取速度可达28GB/s。面向消费市场，将发布以碳纤维设计为核心的CARBON STYLE系列，涵盖DELTA RGB DDR5、XTREEM DDR5内存及基于群联E37T主控的Z54E固态硬盘。此外，整合微型风扇与水冷系统的T-FORCE LIQUID II SSD散热器、CQDIMM版本的T-CREATE EXPERT AI内存条等新品也将亮相。

产品更新数据/训练部署/工程

15:37

MarkTechPost（RSS）

认识 EAGLE 3.1：修复 LLM 推理中注意力偏移的投机解码算法

EAGLE团队与vLLM、TorchSpec联合发布EAGLE 3.1，旨在修复大语言模型推理过程中的投机解码算法不稳定性问题。

开源/仓库推理部署/工程

14:14

IT之家（RSS）

年产 1533 亿 Gb DRAM 内存芯片，三星越南首座半导体测试工厂有望明年投产

三星计划在越南太原省投资约100.23亿元人民币，建设其首座芯片测试工厂。该厂已动工，目标2027年11月投产，年测试产能规划为1533亿Gb DRAM芯片与2556亿Gb NAND芯片。此举旨在应对成熟存储芯片因产能转向AI相关领域而出现的短缺，提升芯片交付链条的出货效率与供应稳定性。

行业动态部署/工程

14:14

IT之家（RSS）

全球首次实现：我国突破超大规模AI药物筛选技术，千亿级分子库秒级检索

国家超级计算天津中心与清华大学团队联合发布了面向超大规模药物发现的人工智能虚拟筛选平台GalaxyVS。该平台依托新一代天河超算系统，在全球范围内首次实现对近千亿级可合成化合物空间的秒级虚拟筛选。实测数据显示，系统单次检索千亿分子库几十秒内即可完成，平均单个靶点口袋检索用时不到1秒，日吞吐量达约16万亿次分子对接。该平台旨在破解传统药物研发难题，为肿瘤、罕见病等领域的先导分子发现提供新路径。

产品更新部署/工程

13:13

IT之家（RSS）

华为发布"韬定律"引发全球热议

华为董事何庭波发布“韬（τ）定律”，提出通过“逻辑折叠”等系统级创新对冲传统制程限制。摩根士丹利将其视为“AI与高速光通信产业的超级催化剂”；彭博社称其为对美国制裁的“系统级反绞杀宣言”。《EE Times》指出华为过去6年量产了381款系统级芯片，新款麒麟芯片晶体管密度将大幅提升。SemiAnalysis认为其核心优势在AI算力集群的高速互联。TechInsights则质疑其垂直堆叠带来的严重散热挑战。

行业动态部署/工程

11:35

公众号：面壁智能（MiniCPM）

精选64

AI 制造 AI：面壁智能发布并开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain

面壁智能联合清华大学、OpenBMB发布ForgeTrain，全球首个完全由AI编写、零人类代码介入的生产级大模型训练框架。在英伟达H100上训练速度超越Megatron 10%，节省10%算力；在华为昇腾上完整跑通预训练，并训出MiniCPM5-1B模型，综合性能在AA榜单2B规模以下Top1。框架及Agent Harness工具链一并开源。

开源/仓库数据/训练部署/工程

关联讨论 1 条

推荐理由：面壁这波把 AI 写代码从玩具推进到了生产车间，ForgeTrain 跑得比英伟达 Megatron 还快 10%，而且直接在昇腾上训出了 MiniCPM5-1B，国产算力跟 AI 自举这两条线在这一刻交汇了，做训练的可以认真看看。

10:19

HuggingFace Daily Papers（社区热门论文）

MUSE-Autoskill：通过技能创建、记忆、管理与评估实现智能体的自我进化

MUSE-Autoskill 提出了一个以技能为核心的智能体框架，使智能体能够通过统一的技能生命周期（创建、记忆、管理、评估与精炼）持续提升任务解决能力。该框架支持按需创建技能、跨任务存储与重用，并借助单元测试和运行时反馈进行持续改进。它还引入了技能级记忆，用于为每个技能积累跨任务经验。在 SkillsBench 上的初步实验表明，经过生命周期管理的技能可以提升任务成功率、效率、重用性及跨智能体迁移能力，突显了将技能作为长期、可感知经验且可测试的资产的重要性。

智能体 MCP/工具论文/研究部署/工程

10:13

IT之家（RSS）

台积电2026H2将调升3nm报价，AI需求强劲

消息称，受AI服务器领域强劲需求驱动，台积电将于2026年下半年再次上调3nm晶圆代工报价，涨幅最高达15%，并在2027年仍有5~10%的增长空间。其主力3nm厂区Fab18产能利用率维持高位，月产能已从年初约13万片提升至本季度的16~17.5万片。产业链同时指出，当前AI芯片供应瓶颈主要在前端晶圆产能。

行业动态部署/工程

09:13

IT之家（RSS）

精选70

消息称高通与字节跳动达成 AI ASIC 芯片合作，采购量在数百万颗级别

行业动态部署/工程

关联讨论 1 条

推荐理由：字节跳动数百万颗的采购量，意味着自研芯片落地不只是PPT，高通在ASIC定制上的生意也正式开张了，这会加速大厂从通用GPU转向定制芯片的浪潮。

08:00

HuggingFace Daily Papers（社区热门论文）

将混合专家模型剪枝蒸馏为密集语言模型

提出首个将已训练MoE模型转换为标准全密集架构的系统性框架：对专家进行评分、选择和分组，拼接为密集前馈网络并通过知识蒸馏精炼。在Qwen3-30B-A3B、DeepSeek-V2-Lite和GPT-OSS-20B上评估了7种评分、5种分组和2种幅度缩放方法共350种配置。新提出的多样性感知评分方法一致优于此前方法。在同等参数量下，MoE转密集相比密集到密集剪枝，经过约4B token蒸馏后平均下游准确率提升6.3个百分点，训练速度提升1.6倍。

开源生态论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

FRAPPE：全输入、残差输出自编码器与投影追踪编码器

针对现有媒体压缩标准在率失真复杂度权衡上的瓶颈，研究者提出了一种名为FRAPPE的新型自编码框架。该框架利用投影追踪编码器从全输入预测残差输出，实现了零开销的变速率编码。基于此构建的FRAPPE-Image可变速率RGB图像编解码器，在高压缩比（约0.1 bpp）下，其感知质量优于AVIF，且编码速度提升47倍，能够仅依靠CPU实现实时1080p 30fps的编码。相关代码与预训练模型已开源。

论文/研究部署/工程

07:37

MarkTechPost（RSS）

使用 ZeroEntropy Zerank-2 Reranker 设计高精度检索-重排流水线

介绍如何使用基于 Qwen3、参数规模为 4B 的交叉编码器重排器 Zerank-2 Reranker 构建检索-重排流水线。该流水线先通过快速双编码器检索候选文档，再由 Zerank-2 进行重排以提升检索精度。

检索增强教程/实践部署/工程

07:13

IT之家（RSS）

小米 MiMo-V2.5 系列 API 永久降价：降幅 57%-99%，Token Plan 计费体系优化、用量提升至原来的 5-8 倍

小米宣布对 MiMo-V2.5 系列 API 进行永久降价，降幅达 57%-99%，且不再区分上下文窗口长度。同时，Token Plan 计费体系优化，套餐用量提升至原 5-8 倍，计费规则更清晰。所有有效套餐用户的 Credits 额度已于 5 月 27 日按新规则全量重置。

产品更新部署/工程

04:07

Ars Technica：AI（RSS）

开源软件包 Starlette 中的关键漏洞威胁数百万 AI 智能体

开源 Python Web 框架 Starlette 中发现名为“BadHost”的关键漏洞。该软件包每周下载量高达 325 million 次，其漏洞可能直接威胁大量依赖它构建的 AI 智能体（AI Agent）服务。

MCP/工具安全/对齐开源/仓库部署/工程

02:37

TechCrunch：AI（RSS）

OpenRouter一年内估值翻倍至13亿美元

AI模型路由平台OpenRouter完成由CapitalG领投的1.13亿美元B轮融资，公司估值在一年内突破13亿美元，实现翻倍以上增长。其平台使用量在六个月内增长5倍，印证了多模型融合应用的趋势正在加速。

行业动态部署/工程

02:11

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选70

我们如何对不同产品中的Claude进行隔离控制

Anthropic通过三重机制控制Claude智能体的部署风险，包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面：通过沙箱、虚拟机和网络出口控制限制智能体运行环境；利用系统提示词和模型训练引导其行为；以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例，阐述了不同产品如何设计对应的隔离架构。

智能体 Anthropic 安全/对齐部署/工程

推荐理由：Anthropic 这次没画饼，实打实把 Claude 三款产品两年来的安全坑和架构演变全摊开讲了，从沙箱逃逸到钓鱼攻击，做 agent 的人读一遍能少踩很多坑。

00:15

公众号：小米 MiMo

MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官

MiMo-V2.5 系列 API 永久降价，新定价最高降幅达 99%，不再区分上下文窗口长度，于北京时间 5 月 27 日 0 点生效。Token Plan 计费优化，用量提升至原来 5-8 倍，计费规则更清晰。百万亿 Token 创造者激励计划提前收官，100T Tokens 已全部发放。现有 Token Plan 用户额度于 5 月 27 日 0 点全量重置，按新规则执行。推理优化基于 SGLang HiCache 支持 SWA，KV Cache 搬运量降至近 1/7，可缓存 token 数量提升至近 5 倍。

产品更新推理部署/工程

00:01

Hacker News 热门（buzzing.cc 中文翻译）

与前沿实验室相比，外包加本地AI的方案很快将更具成本效益

一项分析指出，通过将任务外包给第三方并结合本地部署的大语言模型（LocalAI），企业或很快能在成本效益上超越仅依赖前沿实验室（如 OpenAI 或 Anthropic）的方案。该观点预测了 AI 服务交付模式的转变。

现象/趋势部署/工程

5月26日

20:12

公众号：百度智能云（文心）

百度伐谋2.0赋能排产排程，产能提升20%

百度伐谋2.0产业决策智能体落地排产场景，业务人员用自然语言描述优先级和现场变化（如设备故障、工人请假），系统自动将约束转化为优化模型并迭代求解，将顾问数小时的建模压缩到对话内完成。每次纠偏实时调整方案，隐性经验被结构化沉淀为企业可复用模型。在日均数百订单、十几条产线的大型家具制造企业中，产能提升20%。

智能体教程/实践部署/工程

15:11

IT之家（RSS）

映众推出 NVIDIA MGX 4U GPU 服务器：第六代英特尔至强平台，8 块 RTX Pro 6000 Blackwell

产品更新部署/工程

11:11

IT之家（RSS）

思特威与紫光展锐合作开发 MicroLED 光互连方案

思特威与紫光展锐达成战略合作，将结合思特威的光电技术与紫光展锐的高速 SerDes 等核心技术，联合研发新一代 MicroLED CPO 光互连解决方案。该方案采用并行架构，单位传输能耗可降至铜缆方案的 5%，旨在解决传统光互连成本高、集成度低、功耗高的痛点。合作目标是为 AI 数据中心算力集群、智能汽车、工业机器人等场景提供高带宽、低功耗的国产化核心方案。

行业动态部署/工程

11:11

IT之家（RSS）

消息称英特尔加码玻璃基板，新墨西哥州工厂瞄准全球首座量产基地

英特尔计划将新墨西哥州里奥兰乔工厂改造为全球首个玻璃基板量产基地，以推进先进封装技术。相比传统有机基板，玻璃基板更平整、不易翘曲，可提升封装密度与芯片互连能力。该工厂占地218英亩，自1980年启用，2021年后转向先进封装，现已成为美国最先进的一体化封装设施，同时也在为外部客户制造硅光子产品。从产能布局看，该工厂比钱德勒的试产线更接近规模化量产。

行业动态部署/工程

11:11

IT之家（RSS）

Perplexity 开源内部安全扫描工具 Bumblebee，助力行业应对软件供应链投毒

开源/仓库部署/工程

09:11

IT之家（RSS）

不换设计直接降温：SK 海力士发布控温散热存储技术"iHBM"，降低热阻超 30%

SK海力士推出“iHBM”控温散热存储技术，在HBM封装内直接集成名为“ICE”的冷却元件，为芯片热点构建专用散热通道。该技术使热阻降低超过30%，并兼容现有封装设计。SK海力士计划将其应用于下一代HBM5产品。

行业动态部署/工程

06:58

Hacker News 热门（buzzing.cc 中文翻译）

挪威采购2拍字节华为闪存用于LLM训练

根据报道，挪威采购了2拍字节（PB）的华为闪存存储设备。这批高性能存储设备将被用于支持大型语言模型（LLM）的训练工作。此举反映了AI模型开发对大规模、高吞吐量存储解决方案的持续需求。

数据/训练行业动态部署/工程

05:36

MarkTechPost（RSS）

Together AI开源OSCAR：面向长上下文大语言模型服务的注意力感知2位KV缓存量化系统

Together AI开源OSCAR，一种用于长上下文大语言模型服务的注意力感知2位KV缓存量化方法。该方法在离线状态下，从注意力感知的协方差结构中为键和值推导出独立的旋转。在2.28 bits per KV element的量化精度下，OSCAR将通义千问（Qwen3-4B-Thinking-2507）和通义千问（Qwen3-8B）的BF16精度差距分别缩小至3.78点和1.42点，同时实现约8倍的KV内存缩减，并在100K上下文长度下带来高达3倍的解码速度提升。

开源/仓库推理部署/工程

5月25日

23:11

IT之家（RSS）

美光 HBM4 增产进展顺利，HBM4E 计划明年启动大规模生产

数据/训练行业动态部署/工程

19:28

Hacker News 热门（buzzing.cc 中文翻译）

用树莓派搭建树莓派

有作者分享了一个技术实践，其核心是利用一台树莓派来构建（或安装、设置）另一个树莓派的操作系统。这本质上是一个计算机领域的“自举”（bootstrapping）过程，即系统用自身来构建或启动自身。该文章（原英文标题为“Building Pi with Pi”）的分享在 Hacker News 社区获得了关注。此摘要严格依据原文信息生成。

教程/实践部署/工程

18:36

MarkTechPost（RSS）

2026年AI智能体与MCP服务器的最佳认证平台

随着MCP月SDK下载量超过9700万且AI智能体进入生产工作流，认证已成为团队面临的关键基础设施决策。文章评估了八家领先平台——WorkOS、Stytch、Auth0 by Okta、Composio、Nango、Arcade、TrueFoundry和Cloudflare在规范合规性、企业身份深度、集成广度以及2026年部署的现实适用性方面的表现。

智能体 MCP/工具教程/实践部署/工程

18:11

IT之家（RSS）

重磅特别来宾：英伟达黄仁勋将参与 Marvell 台北国际电脑展主题演讲

行业动态部署/工程

16:06

MarkTechPost（RSS）

WorkOS 发布 auth.md：一种基于 OAuth 标准的开放智能体注册协议

WorkOS 推出 auth.md 协议，为 AI 智能体提供标准化注册流程。这是一个部署在应用域名的 Markdown 文件，告知智能体支持哪些注册流程、请求哪些权限范围以及如何获取绑定真实用户的凭证，无需人工填写表单。该协议建立在现有 OAuth 标准之上。

智能体开源/仓库部署/工程

12:28

Hacker News 热门（buzzing.cc 中文翻译）

精选70

感知图像编解码器：实用学习型图像压缩中的关键因素

苹果公司的研究探讨了感知图像编解码器，分析其在实用学习型图像压缩中的关键作用。该研究聚焦于提升压缩效率与视觉质量平衡的实际需求。

开源/仓库论文/研究部署/工程

推荐理由：苹果官方把学习型图像压缩落地时真正重要的几个因素讲透了，附带代码，做视频编码和图像传输的同行值得看。

11:11

IT之家（RSS）

芯动科技国产首发全套 UALink 纵向扩展高速互联 IP 组合

产品更新部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

从模型扩展到系统扩展：扩展AI智能体的执行层

本研究指出，AI智能体的下一个主要瓶颈是系统扩展，而非单纯的模型扩展。研究提出了“扩展执行层”的概念，即需要将基础模型周围的结构化执行层作为首要设计对象。该执行层由记忆、检索、工具使用、编排和验证等组件构成，它们的交互共同决定了智能体的长期行为。论文聚焦于扩展执行层的三大核心瓶颈：上下文治理、可信记忆与动态技能路由。为进行具体讨论，研究开发了CheetahClaws这一参考实现，并与Claude Code、OpenClaw进行了对比。其核心观点是，AI智能体的未来进展将同样依赖于更强的基础模型与更优的系统设计。

智能体 arXiv GitHub 论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

CollectionLoRA：通过多教师在策略蒸馏将50种效果统一于1个LoRA

CollectionLoRA是一个多教师在策略蒸馏框架，旨在解决为扩散模型定制大量视觉效果时，因存储、加载多个LoRA导致的部署开销及参数干扰问题。该框架可将多达50种独立的效果LoRA概念与少步生成能力统一蒸馏到一个单一的LoRA模型中。其核心技术包括概率双流路由机制、非对称正交提示策略以及粗到精蒸馏目标，用以增强泛化、隔离概念并弥合教师与学生模型间的分布差异。评估显示，CollectionLoRA在显著降低部署成本的同时，实现了与独立教师模型相当或更优的概念保真度。

arXiv 图像生成论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

三元组块扩散 RWKV

B³D-RWKV 是一种扩散 RWKV 变体，旨在统一因果大语言模型与离散扩散模型。它通过三元组块布局方法，将 RWKV 的 O(L) 线性推理效率与并行、双向的离散扩散过程相结合。该模型在 7.2B 参数规模下，在 8 项任务套件中达到了与现有模型相当的准确率，同时解码吞吐量显著优于基线，平均速度提升达 1.6 倍。

arXiv 推理论文/研究部署/工程

07:06

MarkTechPost（RSS）

构建完整的 Langfuse 可观测性与评估流水线以实现追踪、提示词管理、评分与实验

本教程详细演示了如何使用 Langfuse（一个开源大语言模型工程平台）构建一套完整的可观测性与评估流水线。内容覆盖了追踪、提示词管理、评分、数据集与实验等核心功能。教程设计了一个可独立运行的完整工作流，用户既可接入真实的 OpenAI API 密钥，也可使用确定的模拟大语言模型，以便在无需付费模型访问的前提下，理解 Langfuse 的所有主要特性。

开源生态教程/实践部署/工程

5月24日

12:11

IT之家（RSS）

华为自研 DoB 封装技术，绕过先进制程造出百TB级 SSD

华为在巴黎展示了基于自研Die-on-Board封装技术的大容量SSD。该技术将更多NAND裸片直接封装在电路板上，最高实现36层堆叠，突破了传统封装最多16层的限制，从而绕开了对400层以上先进制程NAND芯片的依赖。华为已量产61.44TB和122.88TB型号，并计划推出245TB版本。这些产品已应用于OceanStor Pacific 9926存储系统，在2U机箱中可提供4.42PB原始容量，压缩后有效容量达11PB。

产品更新部署/工程

12:00

公众号：腾讯混元

清华联合腾讯混元在MLSys 2026 MoE推理优化竞赛中夺冠，NPU推理提速4.1倍

在MLSys 2026 MoE模型推理优化竞赛中，清华联合腾讯混元获得冠军。针对MoE架构在异构芯片（NPU）上面临的推理性能挑战，其提出的优化方案在NPU上实现4.1倍推理速度提升。

推理论文/研究部署/工程

08:11

IT之家（RSS）

神舟二十三号今晚发射；苹果iPhone 17系列领跑Q1全球畅销榜；人形机器人全生命周期管理平台发布；小米冠名三大汽车赛事

神舟二十三号载人飞船瞄准5月24日23:08发射，朱杨柱任指令长，香港航天员黎家盈将首飞。苹果iPhone 17系列领跑2026年Q1全球畅销榜，前十机型贡献25%出货量。闻泰科技声明安世荷兰剥夺控制权并阻挠审计。全国首个人形机器人管理平台发布，已为超2.8万台机器人赋予唯一“身份证号”。DeepSeek API完成扩容，默认支持500并发。小米宣布冠名中国三大汽车赛事，其YU7 GT医疗车首次亮相赛道。

DeepSeek 编码行业动态部署/工程