# 小红书发布 SWE-Bench Mobile：当 AI Agent 面对亿级用户 App 代码库，最高通过率仅12%？

- 来源：公众号：小红书技术（dots.llm）
- 作者：小红书技术REDtech
- 发布时间：2026-02-27 18:00
- AIHOT 分数：44
- AIHOT 链接：https://aihot.virxact.com/items/cmq2l8neq004ssl6nffh0r9bv
- 原文链接：https://mp.weixin.qq.com/s/g1nZPkDWwt3weGUhjcfsuQ

## AI 摘要

小红书发布移动端代码库基准测试 SWE-Bench Mobile，用于评估 AI Agent 修复亿级用户 App 代码库中 bug 的能力。测试结果显示，当前最高通过率仅为12%。

## 正文

公众号正文需在微信内阅读，站内仅提供摘要。
