AIHOT

4月29日

14:36

IT之家（RSS）

蚂蚁数科亮相 2026 数字中国建设峰会，推出 DataX 智能体数据生态平台

蚂蚁数科在2026数字中国建设峰会上发布DataX智能体数据生态平台。该平台通过接入模型上下文协议（MCP）和专用智能体DTClaw，旨在降低数据使用门槛、缩短数据价值转化周期。DataX汇聚隐私计算、数据加工等Skills库，将传统数据服务转化为标准MCP协议以提升AI接入效率。DTClaw可将复杂的数据处理逻辑封装为即用型Skill与Agent，实现“开箱即用”。平台还构建了基于数据的图谱知识库，支持通过自然语言进行智能编排与高效检索，帮助企业快速构建专业智能体。

智能体MCP/工具产品更新数据/训练

14:13

IT之家（RSS）

结束与微软独家合作，OpenAI 模型接入亚马逊 AWS

OpenAI与微软调整独家合作协议后，迅速与亚马逊AWS达成合作。AWS宣布将OpenAI最新大模型（如GPT-5.5）接入其Amazon Bedrock平台，并提供Codex代码Agent及由OpenAI赋能的托管Agent（均为有限预览版）。企业可通过现有Bedrock接口直接调用这些模型，无需额外部署基础设施或适配新安全体系。服务用量可抵扣企业AWS合约额度，并支持命令行工具、桌面客户端及VS Code插件。

OpenAI行业动态部署/工程

关联讨论 6 条

14:09

Hacker News 热门（buzzing.cc 中文翻译）

克劳德：创意作品

Anthropic公司发布了Claude for Creative Work，这是其AI助手Claude的创意专用版本，专注于优化创意任务。该发布在Hacker News上获得102点社区评分，显示高度关注。新工具增强了创意能力，包括改进的文本生成、构思辅助和设计支持，旨在提升写作、艺术、营销等领域的效率和质量。

Anthropic多模态教程/实践

13:59

IT之家（RSS）

微软 Win11 更新已触及 5GB，累积机制和 AI 组件成推手

Windows 11月度累积更新体积已从2024年的约300MB激增至近期的5GB。媒体分析指出，主因在于“累积更新”机制，每个更新包都包含历史所有补丁。同时，2025年5月新增的数十个语义搜索和端侧AI相关文件，导致更新包体积环比激增约3GB，解压后文件达2.8万个，体积逼近9GB。虽然普通用户实际下载量仅1.5-2GB，但企业需存储完整包，单架构年度存储需求已从2024年的11GB飙升至2026年的52GB，成本压力骤增。

Microsoft现象/趋势端侧

13:40

IT之家（RSS）

系 AI 误报：微软回应称 4 月 Win11 更新未引发大规模黑屏死机

微软澄清，关于Windows 11四月更新KB5083769引发大规模黑屏死机和“死亡循环”的报道不实。调查发现，相关传闻仅源于微软问答论坛上一条仅有4名用户反馈的帖子，后续传播的部分文章被证实为缺乏证据的AI生成劣质内容。微软官方表示未收到该更新的重大问题报告，并指出月度更新稳定性已显著提升。目前该更新仅确认两个已知问题：特定企业配置可能触发BitLocker恢复，以及多显示器不同缩放比例下远程桌面警告对话框可能显示异常。

行业动态

13:22

IT之家（RSS）

华硕无畏 14 酷睿版 2026 轻薄本上架：搭载英特尔酷睿 Ultra 5 325，5999 元起

华硕无畏 14 酷睿版 2026 轻薄本现已上架京东，搭载英特尔酷睿 Ultra 5 325 处理器。提供 16GB+1TB 和 32GB+1TB 两种配置，售价分别为 5999 元和 6999 元。该笔记本采用全金属机身，厚 15.9mm，重 1.25kg，性能释放达 40W。配备一块 2.5K 分辨率、144Hz 可变刷新率、400nits 亮度的护眼屏，并内置 70Wh 电池，官方标称续航可达 22.9 小时。

其他端侧

13:15

IT之家（RSS）

微软酝酿 Win11 新版时钟应用：专注模式支持"反思"，任务集成 AI 建议

微软正测试Windows 11新版时钟应用，重点升级“专注”功能并集成任务管理与AI辅助。新界面采用圆角设计，任务面板占据半屏，支持排序并深度联动Microsoft To Do。专注模式可最小化运行，允许自定义时长与休息间隔，新增“反思”环节供用户记录专注状态。AI能为任务步骤提供智能建议，可能依托本地NPU运行。当前测试版尚不完善，基础模块如闹钟暂缺，且运行时内存占用接近旧版两倍。

产品更新

13:02

IT之家（RSS）

2025 年我国用于人工智能训练和推理的数据总量达 199.48EB，同比增长 42.86%

国家数据局数据显示，2025年我国用于人工智能训练和推理的数据总量达199.48EB，同比增长42.86%。其中，推理数据量首次超过训练数据量，达到101.34EB。同年，由系统软件和人工智能产生的数据量达26.92ZB，首次超越传统占主体的物联感知数据量。测算显示，未来推理算力需求与训练算力需求之比可能达到3:1或更高。此外，全国日均词元调用量在2025年末已增至100万亿，全年累计调用量约21100万亿。

推理数据/训练行业动态

12:43

IT之家（RSS）

Adobe Photoshop 引入 AI 3D 旋转对象功能，光影可自动匹配

Adobe于4月29日更新了Photoshop和Lightroom。Photoshop引入了全新的AI“旋转对象”工具，用户可在3D空间中实时旋转、倾斜和翻转素材，点击“协调”按钮可自动调整光照和阴影以匹配背景。同时，Photoshop还推出了“图层清理”工具，能智能清理、组织并自动重命名图层，移除空图层。Lightroom的搜索功能现支持自然语言描述查找照片，新增多款胶片风格预设，且辅助筛选速度更快，交互式滑块性能提升最高达5倍。

产品更新图像生成多模态

12:40

IT之家（RSS）

腾讯张军：腾讯文档正式"塞进"WorkBuddy，变成 AI 工具一个真正的原子组件

腾讯公关总监张军宣布，腾讯文档已正式集成至全场景AI智能体WorkBuddy中，成为其一个真正的原子组件。此次整合后，WorkBuddy支持直接连接腾讯文档，用户修改文档后可即时保存至云端。同时实现了小程序与电脑端的能力体验同步，用户可通过手机指挥AI处理云端文档，提升了办公场景下的易用性和效率。

智能体产品更新

12:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选56

Intelligence Age 下的网络安全

OpenAI 发布了一份旨在强化 Intelligence Age 网络安全的五点行动计划。该计划的核心是推动 AI 驱动的网络防御民主化，并保护关键基础设施系统。OpenAI 强调，面对日益复杂的网络威胁，必须广泛普及 AI 安全工具，以提升整体防御能力。

OpenAI安全/对齐

推荐理由：网络安全是 AI 军备竞赛的下半场，OpenAI 这份行动框架把威胁模型和方法论都摆出来了，做安全的人可以把它当 checklist。

11:45

IT之家（RSS）

华为乾崑 | 启境汽车详解新一代面向自动驾驶全链路冗余架构，支持备用系统即时生效

华为乾崑与启境汽车发布了新一代面向自动驾驶的全链路冗余架构。该架构具备硬件八大冗余系统，包括供电、转向、制动、通信、定位、算力域控、感知及HMI交互，支持备用系统在主系统失效时即时无感切换，以保障安全。例如采用双路独立供电、双SOC芯片算力协同，并通过触觉、视觉、听觉多模态交互提示接管。搭载此架构的启境GT7智能猎装车计划于6月上市。

具身智能端侧行业动态

11:43

IT之家（RSS）

没用一颗 GPU 加速卡：纯国产 CPU 架构 E 级超算"灵晟"在深圳点亮，持续性能超 2EFlops 剑指世界第一

国产E级超算“灵晟”在深圳全面点亮并完成测试，正式开放应用。该系统由卢宇彤担任总设计师，完全依托国产通用CPU实现软硬件全栈自主可控，未使用任何GPU加速卡。其持续双精度浮点运算性能超过2EFlops，理论上超越当前全球公开超算榜首。系统采用分阶段建设与大规模液冷技术，存储容量达650PB，并已在遥感、气象、药物研发等九大领域取得重要应用成果。

行业动态部署/工程

11:29

Claude Code：GitHub Releases（RSS）

v2.1.123

本次更新修复了一个关键的OAuth身份验证故障。当环境变量`CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS`被设置为1时，系统此前会陷入401错误的重试循环，导致认证失败。此问题现已得到解决，确保了在该特定配置下身份验证流程的正常运行。

Anthropic产品更新编码

11:28

IT之家（RSS）

全国首家宇树科技直营店开业

宇树科技全国首家直营店在北京王府井银泰in88商场1层开业，消费者可近距离体验机器狗和人形机器人。该店在2025年底已开始装修围挡，近期通过招聘信息透露门店产品顾问岗位薪资为10-15K·13薪，并要求具备一年以上消费电子门店工作经验。

具身智能行业动态

11:19

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ling-2.6-1T

inclusionAI 发布了 Ling-2.6-1T 模型，这是一个包含 1 万亿参数的大型语言模型。该模型基于开源与开放科学理念构建，旨在推动人工智能技术的进步与民主化。新模型在多项基准测试中展现出更强的语言理解与生成能力，同时提供了更高效的推理性能。这一发布标志着开源社区在规模化 AI 模型开发上的重要进展，为研究者和开发者提供了可访问的高性能工具。

Hugging Face开源生态模型发布

关联讨论 1 条

11:07

IT之家（RSS）

谷歌翻译 20 周年：最常见短语为"谢谢"，新增发音练习功能

谷歌翻译迎来20周年，目前支持近250种语言和逾6万个语言对，覆盖全球约95%人口。官方推出发音练习功能，在安卓版应用中利用AI分析用户语音并提供即时反馈，帮助改善发音，该功能已在美国和印度上线，支持英语、西班牙语和印地语。数据显示，谷歌翻译最常用短语为“谢谢”，其他热门查询包括“你好吗？”、“我爱你”、“你好”和“请”。

Google产品更新语音

10:57

IT之家（RSS）

谷歌 Pixel 11 系列手机 Tensor G6 芯片爆料：7 核 CPU，沿用 5 年前 GPU

据爆料，谷歌预计于2026年发布的Pixel 11系列手机将搭载Tensor G6芯片。该芯片的CPU架构将改为1+4+2的7核设计，大核升级为ARM C1 Ultra或C1 Pro，主频达4.11GHz。但其GPU被指将沿用2021年发布的PowerVR CXT-48-1536，被称为“古董级”图形技术。为弥补GPU弱势，谷歌增强了NPU以优化AI负载，并集成了全新的Titan M3安全协处理器以提升硬件级数据保护。这一“重NPU、轻GPU”的策略被认为有助于控制成本，但可能影响游戏体验。

Google产品更新端侧

10:56

IT之家（RSS）

2026 年中国网络文明大会 5 月 19 日举办，将发布《人工智能应用伦理安全指引（1.0 版）》

2026年中国网络文明大会将于5月19日至20日在广西南宁举办，主题为“文明网络空间昂扬奋进力量”。大会包含开幕式、主论坛及14场分论坛。主论坛将发布2026年全国网络文明建设优秀案例，并启动全民数字素养与技能提升月活动。本届大会特设人工智能赋能网络文明建设分论坛，届时将发布《人工智能应用伦理安全指引（1.0版）》。该指引聚焦人工智能对社会关系、公共秩序等方面的影响，旨在为实践提供参考，守好安全底线。

安全/对齐政策/监管

10:56

IT之家（RSS）

我国 2025 全年词元累计调用量约 21100 万亿

《全国数据资源调查报告（2025 年）》在第九届数字中国建设峰会发布，显示数据资源正强力赋能人工智能创新。2025年，全国日均词元调用量从年初超万亿增长到年末100万亿，呈现指数级跃升；全年累计调用量达到约21100万亿。词元是AI模型处理信息的最小单元，调用量增长直接反映模型使用活跃度与产业价值创造能力。

数据/训练行业动态

10:38

IT之家（RSS）

Anthropic Claude Code 大幅涨价：从预估每日 6 美元翻倍至 13 美元

Anthropic 近期将其AI编程助手Claude Code的token成本悄然翻倍。根据官网最新说明，每个开发者每个活跃日的平均成本从约6美元升至约13美元，90%用户每日成本上限也从12美元提高到30美元。每个开发者月成本现约为150-250美元。此次未发公告的涨价反映了AI使用成本全面上升的行业趋势。公司增长负责人承认，现有订阅计划已无法适应当前用户的高使用强度。

Anthropic产品更新编码

10:25

Hacker News 热门（buzzing.cc 中文翻译）

Claude 系统的提示词漏洞导致用户蒙受经济损失，并使受管代理无法正常工作

Claude AI系统的一个提示词漏洞被曝光，导致用户遭受直接经济损失，并使受管代理完全失效无法工作。该漏洞通过GitHub issue报告，在技术社区引发热议，在Hacker News上获得107点关注度。此问题突显了AI代理在提示词安全方面的缺陷，可能影响依赖此类系统的商业应用和用户体验。

智能体Anthropic安全/对齐行业动态

10:18

IT之家（RSS）

华硕灵耀 14/16 Air 骁龙版开售：后者 X2 Elite Extreme 处理器，48GB+1TB 售 13999 元

华硕灵耀14 Air和16 Air骁龙版轻薄本现已开售。14 Air搭载骁龙X2 Elite处理器、16GB内存和1TB固态硬盘，售价11999元；16 Air则采用性能更强的骁龙X2 Elite Extreme处理器，配备48GB内存和1TB固态硬盘，售价13999元。两款机型均采用陶瓷铝材质，重量分别为980克和1.2千克，厚度13.9毫米。它们配备了2.8K 120Hz OLED屏幕，峰值亮度1100尼特，覆盖100% DCI-P3色域，并内置70Wh电池，续航时间分别达29.6小时和21小时。

其他端侧

10:06

IT之家（RSS）

特斯拉用 V14 Lite 让 HW3 老车主体验 FSD 最新功能，后续扩展至更多国际市场

特斯拉宣布将于6月底在美国为搭载HW3硬件的车辆推出FSD v14 Lite软件更新。该版本是完整v14的压缩蒸馏版，旨在让老款车型体验最新的全自动驾驶功能，如自主驶出车位、城市道路导航等，其行为逻辑与HW4车辆相同，但反应速度和决策全面性可能稍逊。特斯拉计划将此更新后续扩展至更多国际市场，但暂无确切时间表。对于硬件瓶颈，公司正筹备名为“AI4”或“AI4-plus”的硬件升级方案，并为老车主提供摄像头升级或以旧换新折扣。

产品更新端侧

09:37

Hacker News 热门（buzzing.cc 中文翻译）

ChatGPT 会展示广告。以下是完整的归因流程

ChatGPT 已开始展示广告，并公开了完整的广告归因流程。该流程详细描述了广告从展示、用户互动到转化跟踪的全链条机制，确保广告效果可准确测量和优化。文章源自 buchodi.com，在 Hacker News 上获得 114 点关注，探讨了这一商业化功能的技术实现与行业影响。

OpenAI产品更新行业动态

09:27

IT之家（RSS）

蚂蚁集团百灵大模型开源 Ling-2.6-flash，提供 BF16、FP8、INT4 等版本

蚂蚁集团百灵大模型宣布开源Ling-2.6-flash，提供BF16、FP8、INT4等多个版本供开发者灵活选用。该模型总参数量104B，激活参数7.4B，是一款Instruct模型。官方基于开发者反馈优化了中英文切换及主流编程框架适配效果。其核心优势包括：采用混合线性架构，在4卡H20上推理速度最快达340 tokens/s；通过Token效率优化，在评测中消耗的tokens仅为同类模型的约1/10；针对Agent场景增强了工具调用与任务执行能力，在多项评测中达到先进水平。模型已在Hugging Face和ModelScope平台开源。

智能体开源生态模型发布

09:16

IT之家（RSS）

吉利银河 M7 上市 12 小时大定破 1 万台，限时 10.98 万元起

吉利银河M7上市12小时内大定订单突破1万台。新车定位紧凑型插电混动SUV，共推出4款配置，限时起售价为10.98万元。其核心亮点包括采用GEA Evo架构，CLTC纯电续航最高225公里，综合续航达1730公里，并支持15分钟快充。车辆搭载Flyme Auto 2智能座舱与千里浩瀚H3智驾方案，具备高速NOA和全场景泊车辅助功能。动力上搭载1.5L发动机与前置单电机，0-100公里/小时加速时间为7.7秒。

行业动态

08:52

IT之家（RSS）

全新一代红旗 H9 汽车官图发布：中式宫殿礼序章法外观、首搭华为乾崑智驾 ADS 5

一汽红旗正式发布全新一代红旗H9官图。新车外观采用中式宫殿礼序章法设计，主打中式豪华美学。核心亮点是首次搭载华为乾崑智驾ADS 5系统、鸿蒙智舱HarmonySpace及红旗自研智能底盘，配备双光路896线激光雷达等硬件，智能驾驶能力显著提升。内饰采用中轴对称环抱式设计，配备智能语音助手、舒享座椅及HUAWEI SOUND音响。动力方面搭载首创的2.0T纵置两档混动系统，并配备主动可变阻尼减震与四挡空气悬架。

端侧行业动态

08:45

IT之家（RSS）

远程执行漏洞被 GitHub 紧急修复：1 条 git push 命令，可访问数百万代码库

安全机构披露 GitHub 存在高危漏洞 CVE-2026-3854，攻击者仅需一条标准 git push 命令，即可利用 X-Stat 标头注入缺陷在 GitHub 后端执行任意代码，从而访问数百万公共和私有仓库。GitHub 在接报后 6 小时内修复了云端平台并发布了企业版补丁，但仍有 88% 的企业版实例未升级，需立即更新至 3.19.3 或更高版本。此次漏洞是首次利用 AI 辅助工具发现，标志着 AI 技术正重塑安全研究。

GitHub行业动态

08:44

IT之家（RSS）

美国国防部确认与谷歌 AI 合作并暗讽 Anthropic：过度依赖单一供应商不是好事

美国国防部AI负责人确认，正扩大使用谷歌Gemini AI模型于机密项目，并已签署相关协议。此举发生在约两个月前国防部将Anthropic列为供应链风险并终止合作之后。国防部强调避免过度依赖单一供应商，目前也在与OpenAI等其他供应商合作以实现作战能力现代化。与此同时，国防部与Anthropic的法律纠纷持续，联邦上诉法院近期驳回了Anthropic要求暂缓将其列入黑名单的请求。

Anthropic政策/监管行业动态

08:17

Hacker News 热门（buzzing.cc 中文翻译）

一份优秀的 AGENTS.md 文件相当于模型的升级；而一份糟糕的文件，其效果甚至不如完全没有文档

AGENTS.md文件的质量直接影响AI代理的性能表现。一份优秀的AGENTS.md文件能像模型升级一样显著提升代理能力，而一份糟糕的文档反而会损害性能，其效果甚至不如完全没有文档。该观点源自技术社区讨论，相关文章在Hacker News上获得了100点热度，强调了为AI代理编写清晰、有效文档的重要性。

智能体教程/实践编码

08:13

IT之家（RSS）

iPad 版 AI 浏览器 Comet 上线，适配苹果 iPadOS 多任务处理

Perplexity公司宣布其AI浏览器Comet现已全面适配iPadOS。新版本原生支持iPad的多任务处理功能，允许用户同时开启多个浏览器窗口进行操作。除了传统网页浏览，该浏览器深度整合了OpenAI和Anthropic等主流AI模型，为用户提供智能搜索与交互体验。这是Comet在苹果生态内的又一次重要扩展，继今年3月登陆iPhone和此前推出Mac版之后，现已覆盖iPad平台。此外，该公司近期还在Mac平台推出了名为“Personal Computer”的智能体助手功能。

产品更新搜索

08:00

HuggingFace Daily Papers（社区热门论文）

HiL-Bench（人在回路基准测试）：智能体知道何时该求助吗？

HiL-Bench 基准测试旨在评估智能体在任务信息不完整或模糊时，能否判断何时应自主执行、何时需向人类求助。该测试包含人为设置的障碍信息，核心指标 Ask-F1 综合衡量提问精准度与障碍召回率，以平衡过度提问与盲目猜测。评估显示，当前前沿模型在判断求助时机上存在普遍缺陷，其完整信息性能仅能恢复一小部分。失败模式主要体现为三种：过度自信未察觉信息缺口、虽检测到不确定性但仍持续出错、以及提出宽泛模糊的求助。通过基于 Ask-F1 的强化学习训练，一个 32B 模型在求助质量与任务通过率上均获得提升，且能力可跨领域迁移，表明判断力可通过训练改进。

智能体arXiv论文/研究评测/基准

08:00

HuggingFace Daily Papers（社区热门论文）

ComboStoc：扩散生成模型中的组合随机性

本文针对扩散生成模型中未被充分研究的组合复杂性问题，指出现有训练方案可能难以充分覆盖高维数据样本及其附加属性所构成的空间，从而限制模型性能。为此，我们提出了ComboStoc方法，通过构建充分利用组合结构的随机过程，显著加速了图像和3D形状等多种数据模态的网络训练。此外，该方法还支持在测试时生成过程中，为不同维度和属性使用异步时间步，从而实现对它们不同程度的灵活控制。代码已开源。

arXiv图像生成多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

更优模型，更快训练：用于单细胞基础模型的Sigmoid注意力机制

本研究提出将Sigmoid注意力作为Softmax注意力的直接替代方案，用于构建更稳定的生物基础模型。在六个单细胞数据集上的实验表明，Sigmoid注意力能提升25%的细胞类型分离度，改善细胞类型内聚性，并降低验证损失，同时训练速度提升高达10%。理论分析揭示，Sigmoid具有全局有界导数和对角雅可比结构，这缓解了Softmax的稠密耦合带来的不稳定性。在压力测试中，训练1.6亿参数模型时，Softmax出现梯度爆炸，而Sigmoid保持稳定。团队开源了高性能GPU内核TritonSigmoid，在H100上实现515 TFLOPS，性能超越现有方案，并原生支持生物序列所需的填充处理。

开源/仓库数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Prox-E：通过基于基元的抽象实现细粒度3D形状编辑

研究团队提出Prox-E，一个无需训练即可实现细粒度3D控制的框架。该方法先将输入3D形状抽象为一组紧凑的几何基元，再利用预训练的视觉语言模型对该抽象进行基元层级的编辑指定，最终引导3D生成模型完成局部结构修改，同时严格保持物体未变化区域的原始身份。实验表明，该方法在身份保持、形状质量和指令遵循度上，均优于现有的基于2D的3D编辑器和需要训练的方法。

arXiv图像生成论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Web2BigTable：面向互联网规模信息搜索与提取的双层多智能体LLM系统

Web2BigTable是一个支持广度和深度搜索的双层多智能体框架。上层编排器将任务分解为子问题，下层工作智能体并行求解。系统通过运行-验证-反思的闭环流程，利用持久化外部记忆联合改进任务分解与执行，并实现单智能体的自我进化。工作智能体通过共享工作空间协调，减少冗余探索、调和冲突证据并适应覆盖缺口。该系统在广度搜索基准WideSearch上达到新SOTA：Avg@4成功率为38.50（是第二名的7.5倍），行F1为63.53，项F1为80.12。在深度搜索基准XBench-DeepSearch上也取得73.0的准确率。代码已开源。

智能体搜索论文/研究

08:00

Apple Machine Learning Research（RSS）

精选57

Adaptive Thinking：大型语言模型知道何时在潜在空间中思考

研究提出了一种名为“自适应思考”的新方法，使大型语言模型能够动态决定是否需要执行链式思考推理。该方法利用自我一致性作为判断标准，当模型对简单问题已有高置信度答案时，会跳过显式推理步骤，直接生成最终答案。实验表明，在保持相同性能水平下，该方法在GSM8K和MATH基准测试上分别减少了20.3%和41.7%的推理计算量，实现了更高效的计算最优推理。

推理论文/研究

推荐理由：苹果这篇论文用自一致性作为「要不要深度思考」的代理，把推理预算分配从玄学变成了可计算的优化问题，做推理加速的同行值得细读。

08:00

Apple Machine Learning Research（RSS）

精选56

DSO：用于缓解偏见的直接引导优化

研究团队提出DSO方法，旨在缓解视觉语言模型决策中的社会偏见。该方法允许用户在模型部署时，通过单一标量参数直接、实时地控制偏见缓解程度，实现无需重新训练的动态调整。实验表明，DSO能在偏见指标上实现高达90%的改善，同时将性能损失控制在10%以内，有效平衡了偏见缓解与任务性能。这一技术为需要根据具体场景权衡公平性与效用的应用提供了灵活解决方案。

多模态安全/对齐论文/研究

推荐理由：Apple 这篇提出了一个直接操控生成方向的优化方法，把偏见缓解变成了可调节的旋钮，而不是一刀切地牺牲性能，做公平性研究的人可以仔细读一下。

08:00

HuggingFace Daily Papers（社区热门论文）

面向高效计算机使用代理的步骤级优化

现有计算机使用代理在长周期图形界面任务中因每一步都调用大型多模态模型而导致效率低下。此类任务轨迹具有高度异质性：多数步骤可由轻量策略可靠处理，而错误多集中于少数高风险时刻，表现为进度停滞与语义漂移。为此，本文提出一种事件驱动的步骤级级联框架，默认运行轻量策略，仅当轻量监测器识别到风险升高时才升级至强模型。该框架整合了停滞监测器与里程碑监测器，能根据交互进程自适应分配计算资源，将始终开启的前沿模型推理转变为按需调用。该模块化设计无需改变现有代理架构或重新训练大模型即可直接集成。

智能体arXiv推理论文/研究