5月25日

23:54

elvis@omarsar0

微软研究院提出了SkillOpt方法，将AI智能体的技能文档视为可训练的外部状态，而非由工程师手动编写。该方法利用一个优化器模型对技能文件进行验证门控编辑，通过添加、删除或替换指令来优化文档，并引入文本学习率控制每轮重写力度，而智能体本身保持不变。实验显示，在全部52个测试单元（涵盖不同模型、基准测试和工具链）中，SkillOpt均达到最佳或并列最佳。具体在GPT-5.5上，相比无技能文档，SkillOpt在直接聊天、Codex和Claude Code下分别取得23.5、24.8和19.1分的提升，超越人类手写技能及其他自动化方法，且不增加推理时开销，学到的技能还能跨模型和工具链迁移。

智能体 Microsoft 论文/研究

19:28

Rohan Paul@rohanpaul_ai

华为发布突破性芯片设计方法"LogicFolding"

华为提出了“τ缩放”和“LogicFolding”两种新方法，旨在不依赖最先进光刻工具的前提下，缩小与台积电的性能差距。其核心思想是将衡量芯片进步的指标从晶体管尺寸转向信号传输延迟（τ）。LogicFolding作为具体实现，通过垂直堆叠逻辑电路层并采用混合键合，将需要通信的电路紧邻放置，从而缩短关键线路、降低电阻和寄生电电容，提升信号速度。华为表示，其下一代麒麟手机芯片将是对τ缩放规律的首次全面测试。

Rohan Paul: 🇨🇳 Huawei reveals a new chip design breakthrough under US sanctions pressure. A design approach meant to close the gap...

端侧论文/研究

关联讨论 1 条

03:57

Rohan Paul@rohanpaul_ai

全注意力回归：将全注意力转化为稀疏，训练步骤在百步之内

阿里巴巴与南京大学提出RTPurbo，一种轻量级适配方法。该方法发现，已训练的全注意力模型内存在隐藏的稀疏结构。它利用一个轻量的16维token查找器作为“侦察兵”，为少数需要长程信息的关键注意力头定位重要token，而让其他头主要关注局部文本。基于此，RTPurbo在100万token预填充任务上，相比FlashAttention-2实现了高达9.36倍的加速，解码阶段也约有2倍加速，同时在长上下文和推理基准上保持了接近全注意力模型的精度。该研究表明，长上下文推理中的计算浪费具有可挖掘的结构性。

arXiv 推理论文/研究

02:57

Chubby♨️@kimmonismus

又有九个Erdős问题被解决了。但这次，是Google DeepMind完成的。这不容小觑，因为一方面它加剧了竞争压力，另一方面也证明了其他前沿实验室可以轻松跟上。

Przemek Chojecki | PC: Another 9 open Erdos problems solved, this time by DeepMind team. Interesting loop of LLM - Lean agents working autonomo...

DeepMind 推理论文/研究

02:57

Rohan Paul@rohanpaul_ai

大型MoE模型或在无需专家帮助的简单token上浪费半数计算

论文提出ZEDA框架，可将训练后固定的静态MoE模型（如Qwen3、GLM）转变为动态模型，允许路由器在token过于简单时跳过专家调用。实验显示，在Qwen3-30B-A3B和GLM-4.7-Flash上，ZEDA可移除约50%的专家计算量，仅带来轻微准确率损失，并实现约20%的实际推理速度提升。研究发现，计算分配主要依据模型的不确定性，而非单纯跟随任务难度。

推理论文/研究部署/工程

5月24日

20:27

Chubby♨️@kimmonismus

德国研究：普通WiFi路由器可近乎完美识别个人身份

德国KIT研究人员展示，使用普通WiFi路由器即可近乎完美地识别个人身份，无需手机、特殊硬件或视线。该系统利用每个已连接设备都在广播的未加密波束成形反馈（beamforming feedback）。在197名受试者的测试中，识别准确率接近100%。该研究指出，此类监控基础设施（如咖啡馆、机场、办公室中的路由器）已普遍存在，核心问题在于谁将开始读取并利用这些信号。

安全/对齐论文/研究

5月23日