6月26日

08:00

HuggingFace Daily Papers（社区热门论文）

ProMSA是一种渐进式多模态搜索智能体，用于知识型视觉问答（KB-VQA）。给定图像-问题对，智能体在明确的工具调用预算和去重机制下，迭代选择图像搜索、文本搜索或停止。训练先通过拒绝采样SFT学习有效工具使用格式，再使用TN-GSPO序列级RL目标优化，该目标按生成长度和工具交互深度归一化更新。在E-VQA和InfoSeek基准上，ProMSA持续优于强RAG和智能体基线，提升了检索和端到端准确率。代码已开源。

智能体多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

迈向自动化科学评审：Google 的 Paper Assistant Tool（PAT）

Google 发布 Paper Assistant Tool（PAT），一个用于深度科学评审和验证的智能体 AI 框架。PAT 能摄取完整学术论文，生成综合评估，包括检查理论结果、验证实验、提出改进建议和识别潜在缺陷。通过利用推理扩展技术，PAT 在 SPOT 基准上对数学错误的召回率比零样本提升 34%。该工具已在 STOC 和 ICML 两大计算机科学会议上作为作者预提交工具进行试点，可发现关键错误并提出实质性改进，在保留评审员对结果控制权的同时减轻其认知负担。

智能体 Google 推理论文/研究

07:20

ginobefun@hongming731

BestBlogs 早报 · 06-26|Dropbox DSPy 评测优化、Cloudflare Workflows Saga 回滚与出海 C-Corp 架构准备

Dropbox用DSPy构建两阶段评测闭环：人工标注校准LLM裁判后，自动优化Dash Chat提示词，使不完整答案减少26%，遗漏关键信息点减少13%，Token用量下降5.4%。Cloudflare Workflows正式发布Saga回滚，支持在step.do()中声明补偿逻辑，引擎自动逆序执行已注册回滚，具备持久化、重试和超时保障。此外介绍出海AI创业者需了解的特拉华州C-Corp架构选型、股权分配原则和Vesting安排。

智能体现象/趋势

06:51

OpenAI Developers@OpenAIDevs

Builders Unscripted with @skirano Pietro 与 @romainhuet 讨论了如何拓展 GPT-5.5 的创意边界，以及使用 Codex 将想法转化为软件。 03：45 图像转化为声音 07：57 多智能体 Codex 工作流 14：34 用 Codex 复活硬件 25：27 从动手到指挥

智能体 OpenAI 教程/实践编码

06:12

Claude Code：GitHub Releases（RSS）

精选61

Claude Code v2.1.193 发布

Claude Code v2.1.193 新增 autoMode.classifyAllShell 设置，将全部 Bash/PowerShell 命令经自动模式分类器处理。自动模式拒绝原因现加入转录、拒绝提示及 /permissions 页面。新增 claude_code.assistant_response OpenTelemetry 日志事件（默认不记录，需设置 OTEL_LOG_ASSISTANT_RESPONSES=1）。Bash 模式支持实时文件路径自动补全；MCP 服务器需认证时显示启动提示。新增空闲后台 shell 命令自动内存压力回收（可禁用）。修复 /model UI 状态滞后、后台任务误取消、子 agent 隐藏同级等问题，并改进了后台 agent 启动指令、MCP 认证重连、插件自动重命名等行为。

智能体产品更新编码

推荐理由：一次扎实的工具更新，自动模式覆盖所有 shell 命令和 MCP 认证重连是最实用的改进，后台任务内存回收也解决了长期痛点，Claude Code 用户值得更新。

05:56

elvis@omarsar0

Elvis Saravia（DAIR.AI）推荐ashwingop分析称，Claude Tag看似让Slack中的AI像队友般流畅协作，实则导致"上下文锁定"--公司运营记忆（异常处理、客户承诺、失败经验等）被锁定在Anthropic的agent层。模型可换，上下文几乎无法迁移；基于token的无限计价使劳动支出被单一供应商捕获。正确架构：从任何顶级模型供应商租用智能，但企业自己拥有可检查、有权限、可移植、模型中立的上下文层。

Ashwin Gopinath: Claude Tag is a Trojan horse. Not because Anthropic is doing anything evil. Because the incentives are obvious. Day one,...

智能体 Anthropic 大佬观点

05:53

Rohan Paul@rohanpaul_ai

BabelTele：LLM间通信压缩文本至27.9%保语义99.5%

新论文"LLMs Do Not Always Need Readable Language"提出BabelTele压缩写作风格，让LLM间通信混合缩写、符号、多语言片段及非传统结构，替代人类自然语言的长文本。即使失去人类可读性，模型仍能回答、记忆并在智能体间传递信息。最强结果：BabelTele保持约99.5%语义保真度，同时将文本压缩至原始长度的27.9%。

智能体 arXiv 推理论文/研究