AIHOT

4月29日

08:00

HuggingFace Daily Papers（社区热门论文）

本研究提出将Sigmoid注意力作为Softmax注意力的直接替代方案，用于构建更稳定的生物基础模型。在六个单细胞数据集上的实验表明，Sigmoid注意力能提升25%的细胞类型分离度，改善细胞类型内聚性，并降低验证损失，同时训练速度提升高达10%。理论分析揭示，Sigmoid具有全局有界导数和对角雅可比结构，这缓解了Softmax的稠密耦合带来的不稳定性。在压力测试中，训练1.6亿参数模型时，Softmax出现梯度爆炸，而Sigmoid保持稳定。团队开源了高性能GPU内核TritonSigmoid，在H100上实现515 TFLOPS，性能超越现有方案，并原生支持生物序列所需的填充处理。

开源/仓库数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Prox-E：通过基于基元的抽象实现细粒度3D形状编辑

研究团队提出Prox-E，一个无需训练即可实现细粒度3D控制的框架。该方法先将输入3D形状抽象为一组紧凑的几何基元，再利用预训练的视觉语言模型对该抽象进行基元层级的编辑指定，最终引导3D生成模型完成局部结构修改，同时严格保持物体未变化区域的原始身份。实验表明，该方法在身份保持、形状质量和指令遵循度上，均优于现有的基于2D的3D编辑器和需要训练的方法。

arXiv图像生成论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Web2BigTable：面向互联网规模信息搜索与提取的双层多智能体LLM系统

Web2BigTable是一个支持广度和深度搜索的双层多智能体框架。上层编排器将任务分解为子问题，下层工作智能体并行求解。系统通过运行-验证-反思的闭环流程，利用持久化外部记忆联合改进任务分解与执行，并实现单智能体的自我进化。工作智能体通过共享工作空间协调，减少冗余探索、调和冲突证据并适应覆盖缺口。该系统在广度搜索基准WideSearch上达到新SOTA：Avg@4成功率为38.50（是第二名的7.5倍），行F1为63.53，项F1为80.12。在深度搜索基准XBench-DeepSearch上也取得73.0的准确率。代码已开源。

智能体搜索论文/研究

08:00

Apple Machine Learning Research（RSS）

精选57

Adaptive Thinking：大型语言模型知道何时在潜在空间中思考

研究提出了一种名为“自适应思考”的新方法，使大型语言模型能够动态决定是否需要执行链式思考推理。该方法利用自我一致性作为判断标准，当模型对简单问题已有高置信度答案时，会跳过显式推理步骤，直接生成最终答案。实验表明，在保持相同性能水平下，该方法在GSM8K和MATH基准测试上分别减少了20.3%和41.7%的推理计算量，实现了更高效的计算最优推理。

推理论文/研究

推荐理由：苹果这篇论文用自一致性作为「要不要深度思考」的代理，把推理预算分配从玄学变成了可计算的优化问题，做推理加速的同行值得细读。

08:00

Apple Machine Learning Research（RSS）

精选56

DSO：用于缓解偏见的直接引导优化

研究团队提出DSO方法，旨在缓解视觉语言模型决策中的社会偏见。该方法允许用户在模型部署时，通过单一标量参数直接、实时地控制偏见缓解程度，实现无需重新训练的动态调整。实验表明，DSO能在偏见指标上实现高达90%的改善，同时将性能损失控制在10%以内，有效平衡了偏见缓解与任务性能。这一技术为需要根据具体场景权衡公平性与效用的应用提供了灵活解决方案。

多模态安全/对齐论文/研究

推荐理由：Apple 这篇提出了一个直接操控生成方向的优化方法，把偏见缓解变成了可调节的旋钮，而不是一刀切地牺牲性能，做公平性研究的人可以仔细读一下。