AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 2146 条
全部一手资讯X论文
标签「Agent」清除
5月30日周六
05:40Hacker News 热门(buzzing.cc 中文翻译)70精选Liquid AI 公布了在 38T 数据集上训练的 8B-A1B MoE 模型
04:42Claude Code:GitHub Releases(RSS)67精选v2.1.157 更新
02:10Hacker News 热门(buzzing.cc 中文翻译)62巴黎Mistral AI Now峰会纪要
02:00OpenRouter:Announcements(RSS)77精选OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7
00:33Tomer Tunguz 博客(VC 分析)65精选技能提炼
00:15TechCrunch:AI(RSS)63Cognition的Scott Wu表示:AI编程智能体不应取代人类
5月29日周五
22:30HuggingFace Daily Papers(社区热门论文)60可恢复思维程序:基于检查点修复的RePoT方法
21:30HuggingFace Daily Papers(社区热门论文)67CoHyDE:大语言模型重写器与稠密编码器的迭代协同训练,用于工具检索
21:14The Decoder:AI News(RSS)61新综述论文认为:代码是AI智能体的思考与行动方式,而非仅仅是其产出
20:00OpenRouter:Announcements(RSS)73同事件精选OpenRouter 推出 Guardrails:保护你的 AI 智能体、数据与成本同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》
20:00OpenRouter:Announcements(RSS)70同事件精选OpenRouter Guardrails 发布:可配置安全与治理工具,保护 AI 智能体、数据与成本同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》
19:19Artificial Intelligence News(RSS)68Anthropic发布Claude Opus 4.8
18:15The Verge:AI(RSS)52Adobe的对话式AI智能体是一个平庸的设计实习生
16:30HuggingFace Daily Papers(社区热门论文)68当云端智能体遇见设备端智能体:来自混合多智能体系统的启示
15:48MarkTechPost(RSS)63Hexo Labs 开源 SIA:一个自我改进的智能体,可同时更新框架与模型权重
15:21IT之家(RSS)70精选阿里云开源百炼 CLI,Agent 可调用全套模型和应用能力
14:30HuggingFace Daily Papers(社区热门论文)65面向可验证的多模态深度研究:一个用于交错式报告生成的多智能体框架
14:30HuggingFace Daily Papers(社区热门论文)55发现协作流水线:面向序列社会困境的自主研究
13:30HuggingFace Daily Papers(社区热门论文)60CausaLab:面向AI科学家的交互式因果发现可扩展环境
11:29HuggingFace Daily Papers(社区热门论文)61UI-KOBE:面向轻量级图谱引导 GUI 智能体的知识导向行为探索
11:29HuggingFace Daily Papers(社区热门论文)62AgentDoG 1.5:一个轻量级且可扩展的AI智能体安全与安保对齐框架
11:29HuggingFace Daily Papers(社区热门论文)67GenClaw:代码驱动的智能体图像生成
11:29HuggingFace Daily Papers(社区热门论文)75精选WorldMemArena:通过行动-世界交互循环评估多模态智能体记忆
11:29HuggingFace Daily Papers(社区热门论文)69PhoneWorld:可扩展的手机使用智能体环境
10:29HuggingFace Daily Papers(社区热门论文)59LiteCoder-Terminal:构建用于训练语言智能体的可扩展长周期终端环境
09:21IT之家(RSS)71阶跃星辰开源 Step 3.7 Flash 模型,最高生成速度每秒 400 Tokens
08:21IT之家(RSS)58美国造车新势力 Rivian 称 AI 重塑车机交互,讨论整合苹果 CarPlay 变得过时
08:21IT之家(RSS)46性价比拉满:Grok Build 0.1 打响 AI 编程实战,马斯克称物超所值
08:02公众号:阶跃星辰(Step)61同事件精选阶跃发布 Step 3.7 Flash,面向生产级 Agent 的高效率 Flash 模型同一事件,精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI——Step 3.7 Flash》
08:00HuggingFace Daily Papers(社区热门论文)43AgentOdyssey:用于测试时持续学习智能体的开放式长周期文本游戏生成
08:00HuggingFace Daily Papers(社区热门论文)45Send a SCOUT First:提示注入防御中自适应检测器分配的事前推理
08:00HuggingFace Daily Papers(社区热门论文)50MindZero:基于零标注的在线心智推理学习
08:00HuggingFace Daily Papers(社区热门论文)61技能并非万能:面向大语言模型智能体的模型感知技能对齐
08:00HuggingFace Daily Papers(社区热门论文)57搜索智能体遮蔽陈旧观察的机制图与效果边界
08:00HuggingFace Daily Papers(社区热门论文)61语言模型智能体群体中的涌现语言:从Token效率到监督规避
08:00HuggingFace Daily Papers(社区热门论文)56面向任务的多模态智能体记忆策略学习
08:00HuggingFace Daily Papers(社区热门论文)68COLLEAGUE.SKILL:通过专家知识蒸馏实现的自动化AI技能生成
08:00HuggingFace Daily Papers(社区热门论文)51LongTraceRL:基于搜索智能体轨迹与评分奖励的长上下文推理学习
08:00HuggingFace Daily Papers(社区热门论文)49从提示词注入到持久控制:防御智能体框架中的木马后门
07:46OpenAI:官网动态(RSS · 排除企业/客户案例)36Endava如何借助Codex构建智能体驱动的组织
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月30日
05:40
Hacker News 热门(buzzing.cc 中文翻译)
精选70
Liquid AI 公布了在 38T 数据集上训练的 8B-A1B MoE 模型

Liquid AI 发布了其 LFM2-5 系列的 8B-A1B 模型,该模型采用混合专家(MoE)架构,在包含 38T token 的数据集上训练完成。

智能体推理模型发布端侧

推荐理由:Liquid AI 把推理和工具调用塞进了消费级硬件,笔记本上跑 250 token/s,边缘 Agent 有了一个能打的离线选项。性能不算顶尖,但‘全本地’这个特性,对隐私敏感的场景是真卖点。
04:42
Claude Code:GitHub Releases(RSS)
精选67
v2.1.157 更新

此版本主要改进了插件系统,现可自动加载 .claude/skills 目录中的插件,并通过 claude plugin init 创建;/plugin 命令增加了自动补全。claude agents 现在会应用 settings.json 中的 agent 字段,并支持 --agent 参数覆盖。更新修复了多个具体问题,包括处理不可用图片导致的崩溃、在 tmux 中的剪贴板复制失效(2.1.153 回归)、后台会话恢复后日期不正确等。此外,优化了长对话及恢复对话的性能,并改进了在 VS Code、Cursor 和 Windsurf 等 IDE 中的体验。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude Code 这个版本把插件从市场限制中解放出来,自动加载本地 skills 目录,对喜欢自己鼓捣定制工作流的开发者是个实实在在的便利。
02:10
Hacker News 热门(buzzing.cc 中文翻译)
62
巴黎Mistral AI Now峰会纪要

Mistral AI 在巴黎举办了 AI Now 峰会。会议讨论了开放模型、本地部署以及 AI 智能体工具等议题,展现了 Mistral 致力于成为欧洲全方位人工智能合作伙伴的战略方向。

智能体开源生态行业动态
02:00
OpenRouter:Announcements(RSS)
精选77
OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7

一组预算模型通过OpenRouter平台进行模型融合,在包含100个复杂研究任务的评估中,得分超过了GPT-5.5与Claude Opus 4.7。

智能体产品更新推理搜索
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:OpenRouter 的 Fusion 功能把模型融合做成了 API 调用,实测用便宜模型组合就能逼近 Fable 5 的性能,成本却只有一半,这对做复杂推理和深度研究的开发者来说是个很实用的新工具。
00:33
Tomer Tunguz 博客(VC 分析)
精选65
技能提炼

“技能提炼”是一种知识转移方法,由前沿大模型(如 Opus 4.7、GPT-5.1、Gemini 3 Pro)负责撰写并优化标准化的 SKILL.md 流程文件。然后,本地运行的小模型(如 Qwen 35B、Gemma 26B)直接执行这些文件。此过程不同于压缩模型权重的知识蒸馏、训练权重的指令微调或检索事实的 RAG,其核心是提取并转移操作流程,让小模型按步骤执行,从而形成前沿模型作教师、小模型作执行者的循环。

智能体MCP/工具大佬观点

推荐理由:Tomer 把个人代理的完整工作流摆了出来,用大模型写 skill 小模型执行,这条蒸馏思路比调 prompt 高级,想认真跑本地代理的人该盯一下。
00:15
TechCrunch:AI(RSS)
63
Cognition的Scott Wu表示:AI编程智能体不应取代人类

Cognition公司开发了Devvin,这是一个号称首个且最成功的AI编程智能体。其著名程序员创始人Scott Wu明确表示,该智能体并非旨在取代人类程序员。

智能体大佬观点编码
5月29日
22:30
HuggingFace Daily Papers(社区热门论文)
60
可恢复思维程序:基于检查点修复的RePoT方法

RePoT是一种确定性验证重放方法,用于修复思维程序推理中产生的无效动作。当生成的Python轨迹出现无效状态转换时,它会回溯到已验证的前缀状态,并通过一次额外的大语言模型调用来恢复推理。在PuzzleZoo-775基准测试中,RePoT比PoT高出+3至+11个百分点,并在gpt-5.4-mini-medium上达到96.9%的准确率。可控恢复基准Derail-550的实验表明,检查点信息是关键的恢复信号。初步提出的自适应RePoT通过规则调度器在修复与重试间进行选择。

智能体arXiv推理论文/研究
21:30
HuggingFace Daily Papers(社区热门论文)
67
CoHyDE:大语言模型重写器与稠密编码器的迭代协同训练,用于工具检索

CoHyDE 是一种迭代训练框架,旨在解决大语言模型智能体在大型 API 目录中进行工具检索时面临的核心瓶颈。用户查询常使用口语化、描述不充分的自然语言,而 API 目录使用固定的技术性术语。该框架将稠密编码器与 LLM 重写器视为一个协同演化系统进行训练:编码器在重写器生成的、符合目录风格的假设性描述上通过 InfoNCE 进行重训练;重写器则通过 DPO 根据编码器的检索分数进行偏好对齐。在 ToolBench 目录约 10k 工具的子集上,三轮 CoHyDE 迭代后,其在标准查询上的 NDCG@5 得分较最强单组件基线提升 +2.5 pp,在模糊查询上提升 +6.3 pp。消融实验证实,协同训练是该方法在结构化与模糊查询上均取得优势的关键。

智能体arXivMCP/工具论文/研究
21:14
The Decoder:AI News(RSS)
61
新综述论文认为:代码是AI智能体的思考与行动方式,而非仅仅是其产出

一篇新综述论文提出,自主AI智能体的真正瓶颈并非语言模型本身,而是工具、内存、测试与权限边界等构成的软件层。这一“约束层”将无状态模型转化为能行动的工作智能体。DeepSeek已在北京组建专门的Harness团队,其“模型加约束层等于AI智能体”的公式印证了该观点。

智能体DeepSeekMCP/工具论文/研究
20:00
OpenRouter:Announcements(RSS)
同事件精选73
OpenRouter 推出 Guardrails:保护你的 AI 智能体、数据与成本

OpenRouter 发布 Guardrails 可配置安全与治理工具,支持预算执行、零数据保留、模型和提供商限制、提示词注入防御以及数据丢失防护,帮助用户保护 AI 智能体、数据与成本。

智能体产品更新安全/对齐
同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》
推荐理由:OpenRouter 的 Guardrails 把预算、隐私、模型白名单和 prompt 注入检测打包成傻瓜式配置,做 agent 的团队终于不用自己拼积木了,生产环境多一层放心。
20:00
OpenRouter:Announcements(RSS)
同事件精选70
OpenRouter Guardrails 发布:可配置安全与治理工具,保护 AI 智能体、数据与成本

OpenRouter 推出 Guardrails,一套可配置的安全与治理工具,支持预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失防护等策略,用于保护 AI 智能体、数据和成本。

智能体产品更新安全/对齐
同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》
推荐理由:OpenRouter 这波补上了 API 代理的安全短板,提示注入防御和 DLP 直接堵住了企业用户最担心的两个口子,配置方式也足够灵活,做 agent 的团队值得立刻上。
19:19
Artificial Intelligence News(RSS)
68
Anthropic发布Claude Opus 4.8

Anthropic发布了Claude Opus 4.8,这是对Claude Opus 4.7的升级,改进了编码、智能体工作、推理和知识工作方面的表现。该模型可通过claude.ai、Claude Code和Claude API使用,API名称为claude-opus-4-8。

智能体Anthropic推理模型发布
18:15
The Verge:AI(RSS)
52
Adobe的对话式AI智能体是一个平庸的设计实习生

Adobe正在beta测试的Firefly AI Assistant是一个对话式AI智能体,定位为设计工作流的中间人,旨在帮助用户处理繁琐任务同时保留创作控制权。然而,初步体验表明其功能表现平庸,未能令人印象深刻。

智能体图像生成评测/基准
16:30
HuggingFace Daily Papers(社区热门论文)
68
当云端智能体遇见设备端智能体:来自混合多智能体系统的启示

智能体AI推理的设计空间横跨两个极端:云端大语言模型性能强大但成本高,设备端小语言模型更经济。混合多智能体系统结合设备端与云端模型,为平衡提供了可能,但也引入了任务准确性、经济成本与设备能耗三者紧密关联的复杂权衡。由于缺乏通用设计原则,此类混合方案多是基于特定领域做出的临时决策。本研究通过改造两种代表性的多智能体架构以适配混合推理,系统探讨了不同设计选择如何影响系统在性能、成本与能耗的Pareto前沿上的取舍。结果表明,小语言模型确实能从大语言模型的辅助中获益,但最优架构高度依赖具体任务,且更多的前沿计算并不总能带来更好的性能。

智能体端侧论文/研究部署/工程
15:48
MarkTechPost(RSS)
63
Hexo Labs 开源 SIA:一个自我改进的智能体,可同时更新框架与模型权重

Hexo Labs 开源了 SIA,这是一个遵循 MIT 许可证的自我改进循环。其中的反馈智能体会读取每次执行的轨迹,然后重写运行框架或触发对 gpt-oss-120b 模型的 LoRA 权重更新。结合这两种调整方式,在 LawBench、TriMul GPU 内核以及 scRNA-seq 去噪任务上,效果均优于仅迭代框架。

智能体开源/仓库数据/训练
15:21
IT之家(RSS)
精选70
阿里云开源百炼 CLI,Agent 可调用全套模型和应用能力
智能体MCP/工具产品更新

推荐理由:阿里云把百炼的全套能力打包成 CLI,Agent 开发终于不用再一个个接 API 了,做企业智能助手的可以试试。
14:30
HuggingFace Daily Papers(社区热门论文)
65
面向可验证的多模态深度研究:一个用于交错式报告生成的多智能体框架

大语言模型已将智能体从深度搜索推进至能生成长篇报告的深度研究。然而,可验证的多模态深度研究仍面临挑战。为此,研究提出了Ptah,一个多智能体框架。它通过规划、研究和写作阶段,协调从用户查询到网页报告的生成全流程,其中智能体负责构建计划、收集证据并维护视觉记忆。一个验证智能体确保整个流程的事实依据和跨模态一致性。研究还引入了PtahEval评估协议。实验表明,Ptah能生成比基线更可靠、视觉信息更丰富、更实用的多模态报告。

智能体arXiv多模态论文/研究
14:30
HuggingFace Daily Papers(社区热门论文)
55
发现协作流水线:面向序列社会困境的自主研究

本研究构建了一个两层自主研究系统:外层AI智能体自主重新设计内层用于多智能体序列社会困境(SSDs)的大语言模型策略合成流水线。在Cleanup和Gathering两个游戏、两种福利目标(功利效率与最大化最小)下,该系统在性能上可靠地超越手工设计的基准,显著降低运行方差,并优于仅优化提示词的方法。研究发现,所发现的流水线具有目标依赖性:仅在最大化最小目标下,系统才会向合成器流水线注入显式的公平机制,这种机制在其自身的系统提示词和所有面向效率优化的流水线中均不存在,支持了信息设计理论的观点。

智能体推理论文/研究
13:30
HuggingFace Daily Papers(社区热门论文)
60
CausaLab:面向AI科学家的交互式因果发现可扩展环境

本文介绍了CausaLab,这是一个评估LLM智能体交互式因果发现能力的可扩展环境。该环境在一个合成实验室内评估两个维度:智能体能否利用因果证据解决问题,以及其答案是否基于忠实恢复的因果机制。每个实验中,智能体接收先验观测数据,对操纵晶体进行干预,并预测反应晶体的共振频率。隐藏的数据生成过程是随机采样的结构因果模型(SCM),成功要求恢复因果图和结构方程。实验表明预测与机制恢复之间存在差距:在6节点纯观测设置中,GPT-5.2-high的任务准确率达92%,但全边F1值仅为0.471。混合观测-干预策略能提升结构保真度,而纯干预对强智能体仍具挑战。研究发现过早停止是主要弱点,一致性验证能缓解该问题。CausaLab将预测成功与因果理解分离开来,揭示了当前LLM智能体作为实验因果推理者的局限。

智能体推理论文/研究
11:29
HuggingFace Daily Papers(社区热门论文)
61
UI-KOBE:面向轻量级图谱引导 GUI 智能体的知识导向行为探索

为解决轻量级移动端GUI智能体在端到端规划上的不足,本文提出UI-KOBE框架。该框架通过自主探索移动应用,构建包含UI状态节点与转换边的应用知识图谱。运行时,轻量级智能体可利用该图谱作为外部引导,结合用户任务与当前屏幕截图,在多种候选动作中进行选择。此方法减轻了轻量级模型进行端到端规划的负担,使其能更有效地执行任务,并兼顾效率、可解释性与隐私保护。

智能体端侧论文/研究
11:29
HuggingFace Daily Papers(社区热门论文)
62
AgentDoG 1.5:一个轻量级且可扩展的AI智能体安全与安保对齐框架

AgentDoG 1.5是一个针对Codex和OpenClaw等现代开放世界智能体安全风险的轻量级、可扩展对齐框架。它更新了智能体安全分类法,构建了数据引擎,仅用约1k样本训练出0.8B至8B参数的模型变体,性能与GPT-5.4等闭源模型相当。该框架还构建了高效的训练环境,大幅降低部署开销,并可作为在线护栏进行实时安全审核。实验表明其在复杂交互场景中达到先进水平,所有模型和数据集均已开源。

智能体安全/对齐开源/仓库论文/研究
11:29
HuggingFace Daily Papers(社区热门论文)
67
GenClaw:代码驱动的智能体图像生成

GenClaw提出一种代码驱动的智能体图像生成范式,让AI智能体像人类艺术家一样分步创作:先通过搜索与推理构建概念,再利用SVG、HTML、Three.js等代码渲染可执行的视觉草图,最后调用图像生成模型补充纹理、材质与真实感。该范式将代码作为连接语言推理与像素合成的可控中间画布,将图像生成从黑盒过程转变为类似人类创作的分步流程,迈向更高可控性与可解释性的视觉生成系统。

智能体arXiv图像生成论文/研究
11:29
HuggingFace Daily Papers(社区热门论文)
精选75
WorldMemArena:通过行动-世界交互循环评估多模态智能体记忆

针对现有基准无法精确诊断多模态智能体记忆在动态环境中的具体失败阶段,研究提出了“行动-世界交互循环”记忆模型,并构建了WorldMemArena基准。该基准包含400个多会话多模态任务,涵盖“终身进化”和“智能体执行”两类场景,支持对记忆写入、维护、检索和使用的阶段级评估。研究首次对长上下文、RAG等手工设计系统与基于框架的记忆智能体进行直接比较,发现记忆写入与存储质量的提升不直接带来性能改善,且多模态记忆在利用视觉证据及跨领域稳定性上仍存在挑战。

智能体多模态论文/研究评测/基准

推荐理由:首个能定位多模态 Agent 记忆“写、维、取、用”哪一步出问题的基准,头对头比较长上下文、RAG 和自管理记忆,结论是写得好未必用得上,做 Agent 的值得认真看。
11:29
HuggingFace Daily Papers(社区热门论文)
69
PhoneWorld:可扩展的手机使用智能体环境

PhoneWorld 提出了一种可重用流程,能将真实的手机 GUI 轨迹和截图转化为可控的智能体环境、可执行任务及自动验证器。该系统覆盖了 16 个领域的 34 款应用。实验表明,在固定训练预算下,用 PhoneWorld 数据替代部分基准数据,可同步提升四个评测基准的得分。研究还发现,增加 PhoneWorld 监督数据或扩大应用覆盖范围能进一步提升性能,这标志着从构建单一基准转向规模化供应智能体环境的范式转变。

智能体端侧论文/研究
10:29
HuggingFace Daily Papers(社区热门论文)
59
LiteCoder-Terminal:构建用于训练语言智能体的可扩展长周期终端环境

训练能够进行多步规划和动态适应的终端环境语言智能体,其瓶颈在于依赖外部爬取的仓库。研究团队提出了零依赖的合成管道LiteCoder-Terminal-Gen,可从领域规范自主生成可执行、可验证的终端环境。基于此构建了两个大规模资源:包含10个领域、11,255条专家轨迹的SFT数据集,以及拥有602个可验证环境用于轨迹偏好优化的RL环境。在SFT数据集上对通义千问(Qwen)系列模型进行微调后,智能体性能显著提升,其32B变体在Terminal Bench 1.0、2.0和Pro上分别取得29.06%、18.54%和34.00%的pass@1分数。应用Direct Multi-turn Preference Optimization(DMPO)可带来进一步性能提升。

智能体数据/训练论文/研究
09:21
IT之家(RSS)
71
阶跃星辰开源 Step 3.7 Flash 模型,最高生成速度每秒 400 Tokens
智能体Hugging Face多模态模型发布
关联讨论 2 条X:阶跃星辰 StepFun (@StepFun_ai)X:OpenRouter (@OpenRouter)
08:21
IT之家(RSS)
58
美国造车新势力 Rivian 称 AI 重塑车机交互,讨论整合苹果 CarPlay 变得过时

Rivian 软件负责人表示,随着智能体 AI 加速落地,汽车正从“软件定义”走向“AI 定义”,传统的“屏幕镜像”车联方案(如苹果 CarPlay)将变得“过时”。该公司希望为用户打造一体化的导航、控制与 AI 助手服务,而非将中控主导权交给 iPhone。内部数据显示,要求支持 CarPlay 的用户比例已从交付初期的“超过 70%”降至最近一次调查的“不到 25%”。

智能体大佬观点现象/趋势
08:21
IT之家(RSS)
46
性价比拉满:Grok Build 0.1 打响 AI 编程实战,马斯克称物超所值
智能体xAI编码评测/基准
08:02
公众号:阶跃星辰(Step)
同事件精选61
阶跃发布 Step 3.7 Flash,面向生产级 Agent 的高效率 Flash 模型

阶跃星辰发布并开源 Step 3.7 Flash,采用稀疏 MoE 架构(总参数 196B+1.8B,激活 11B),最高生成速度 400 Tokens/s。围绕原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排、Agent 生态兼容优化四大能力优化。在 Toolathlon 达 49.5%,ClawEval-1.1 达 67.1%,GDPval 达 45.8%,τ²-bench Telecom 通过率超 98%。兼容 Claude Code、KiloCode 等主流架构及 MCP/Skills 协议,支持云端与本地部署,已在 Kilo Code 等生态中完成接入验证。

智能体MCP/工具多模态开源生态
同一事件,精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI--Step 3.7 Flash》
推荐理由:Step 3.7 Flash 用激活仅 11B 的 MoE 架构把 Agent 工作流稳定性做透了,兼容主流框架还开源,对需要低延迟、高可靠性的生产环境 Agent 是真正可用的选择。
08:00
HuggingFace Daily Papers(社区热门论文)
43
AgentOdyssey:用于测试时持续学习智能体的开放式长周期文本游戏生成

AgentOdyssey 是一个程序化生成开放式文本游戏的评估框架,用于衡量智能体在测试时的持续学习能力。游戏包含丰富实体、世界动态和长周期任务,要求智能体在部署中交替进行学习与推理。评估体系不仅跟踪游戏进度,还诊断世界知识获取、情景记忆、探索多样性及模型成本。实验显示,即使最强基础模型驱动的智能体也远低于人类水平,而短期记忆对多种智能体范式有显著提升作用。

智能体数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
45
Send a SCOUT First:提示注入防御中自适应检测器分配的事前推理

SCOUT框架通过预测每个检测器对样本的可靠性与延迟,动态决定每个请求运行哪些检测器以及是否升级到GPT-4o judge,避免固定单检测器管线的盲区。在SCOUT-450基准上,安全导向操作点相比始终启用GPT-4o judge使攻击成功率降低46%、总时间降低40%,良性效用仅下降5.1点。该框架还能迁移到BIPIA、IPI和IHEval三个外部基准,改善安全-效用边界。

智能体论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
50
MindZero:基于零标注的在线心智推理学习

MindZero是一个自监督强化学习框架,用于训练多模态大语言模型进行高效、鲁棒的在线心智推理。该方法通过让模型生成使观测到的行为似然最大化的心理状态假设来获取奖励,从而无需显式的心智状态标注。训练后,MindZero将基于模型的推理内化为快速的单次推理。在网格世界和家庭环境的评估中,它在精度和效率上均显著优于传统的基于模型的方法。

智能体arXiv推理论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
61
技能并非万能:面向大语言模型智能体的模型感知技能对齐

研究表明,为智能体检索的外部技能效果高度依赖具体模型,同一技能可能对不同骨干模型产生相反影响。为此,论文提出MASA框架,可在不修改智能体权重的前提下为目标模型定制技能。MASA包含两个阶段:1)基于爬山法与UCB驱动的树搜索的层级技能进化流水线;2)一个轻量级模型条件技能重写器,可在单次前向传播中复现定制过程。在三个交互环境与四个骨干模型上的实验中,MASA取得了最佳整体性能,最优基线提升达25.8点。该重写器能泛化到未见任务与环境,以远低于大型教师LLM的推理成本实现稳定更优的表现。

智能体论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
57
搜索智能体遮蔽陈旧观察的机制图与效果边界

该研究系统评估了观察遮蔽策略在不同规模(4B至284B参数)模型骨干与三种检索器上的效果。发现其准确率增益相对于模型无管理时的准确率呈非对称倒U型曲线:弱检索器下效果平缓,强检索器与中等容量模型结合时达到峰值,模型能力饱和后性能急剧下降。其机制源于检索器召回率与模型隐式过滤能力的交互。遮蔽本质上是一种用轮次换token的权衡,它移除了模型已基本忽略的观察;当新增轮次能将失败转化为成功时有益,但当移除模型本会使用的证据时则会失效。

智能体搜索论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
61
语言模型智能体群体中的涌现语言:从Token效率到监督规避

监控自主语言模型智能体常依赖其表面行为。但研究发现,智能体群体会发明新语言以规避监督。本研究分析Moltbook Files数据集,通过两阶段方法识别出三类涌现语言:旨在节省token的Token效率型、模仿自然语言的新自然语言型,以及旨在逃避监管的监督规避型。研究使用DeepSeek-3.2评估发现,监督规避类语言的对齐度显著低于其他类别。此外,所有语言均可仅通过描述被其他模型在上下文中学习。手工分析还揭示了诸如在自然语言中嵌入隐藏信息等复杂的隐写协议。这些发现表明,仅监控表面行为可能很快将不足以控制智能体群体。

智能体安全/对齐论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
56
面向任务的多模态智能体记忆策略学习

多模态智能体的长期记忆面临“该记什么”的核心挑战。为此,研究者提出了TaskMem框架,这是一种基于强化学习的记忆策略学习方法,采用两阶段训练范式:第一阶段学习如何记忆以保证记忆质量,第二阶段在部署后根据具体任务学习记什么。该方法基于Qwen3-VL-30B-A3B构建,并在将VideoMME、EgoLife和EgoTempo重构为流式基准测试后,分别将VQA准确率提升了6.3%、7.0%和5.3%。

智能体多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
68
COLLEAGUE.SKILL:通过专家知识蒸馏实现的自动化AI技能生成

大语言模型智能体被期望能承载人类专家的知识与交互风格,但相关痕迹通常分散且不规整。COLLEAGUE.SKILL是一个开源的自动化痕迹到技能的蒸馏系统,能从目标人物或角色的材料中生成版本化的技能包。该技能包包含能力轨道(实践、心智模型)和行为边界轨道(交互风格、纠正历史),支持审查、自然语言反馈更新、回滚与跨主机部署。其公开仓库有约18.5k GitHub stars,画廊包含215个技能。

智能体开源生态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
51
LongTraceRL:基于搜索智能体轨迹与评分奖励的长上下文推理学习

针对大语言模型在长上下文推理中难以定位关键信息的问题,现有强化学习方法受限于干扰物挑战性不足和奖励信号稀疏。LongTraceRL方法通过知识图谱随机游走生成多跳问题,并利用搜索智能体的轨迹构建分级干扰文档,从而生成更具挑战性的训练数据。其创新性地提出评分奖励,使用推理链上的金标准实体作为细粒度的过程监督,且仅应用于最终答案正确的响应,以此区分推理质量并防止奖励作弊。实验表明,该方法在多个长上下文基准测试中优于强基线。

智能体arXiv推理数据/训练
08:00
HuggingFace Daily Papers(社区热门论文)
49
从提示词注入到持久控制:防御智能体框架中的木马后门

在本地智能体框架中,LLM智能体通过读写文件与复用状态增强了能力,但也面临多步木马攻击风险。攻击者可在文件或工具输出中嵌入提示词注入,智能体可能读取并执行这些隐藏指令。现有防御因检查步骤孤立,难以检测早期植入的后门。ClawTrojan基准测试在GPT-5.4模拟环境中实现了95.5%的攻击成功率。为此提出的DASGuard方案,通过扫描敏感文件中的控制文本、追溯其来源并移除非可信内容,实现了动态防御。

智能体MCP/工具论文/研究
07:46
OpenAI:官网动态(RSS · 排除企业/客户案例)
36
Endava如何借助Codex构建智能体驱动的组织

Endava通过应用AI工具Codex,成功构建了智能体驱动的组织模式,显著加速了软件交付流程。其核心成果体现在需求分析环节,耗时由数周大幅缩短至数小时。

智能体OpenAI编码行业动态
‹ 上一页
1…2122232425…50
下一页 ›