AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Agent」清除
6月26日周五
08:00HuggingFace Daily Papers(社区热门论文)47ProMSA:渐进式多模态搜索智能体用于知识型视觉问答
08:00HuggingFace Daily Papers(社区热门论文)55迈向自动化科学评审:Google 的 Paper Assistant Tool(PAT)
07:20ginobefun45BestBlogs 早报 · 06-26|Dropbox DSPy 评测优化、Cloudflare Workflows Saga 回滚与出海 C-Corp 架构准备
06:51OpenAI Developers57GPT-5.5 与 Codex 创意边界对话
06:12Claude Code:GitHub Releases(RSS)61精选Claude Code v2.1.193 发布
05:56elvis72Claude Tag深度分析:企业应"租用智能,但拥有上下文"
05:53Rohan Paul67BabelTele:LLM间通信压缩文本至27.9%保语义99.5%
05:26elvis14Viktor:多模型AI员工,支持3200+工具
04:38TechCrunch:AI(RSS)56Patronus AI 获 5000 万美元 B 轮融资,构建"数字世界"压力测试 AI 智能体
04:25elvis41Meta Autodata:智能体自动构建合成训练数据
04:25elvis49Elvis Saravia 分享动态工作流讨论笔记
04:22Thariq33Thariq 将深入探讨 Claude Tag
04:17ClaudeDevs72同事件精选Claude Tag:下一代主动多玩家智能体同一事件,精选展示《Anthropic 推出 Claude Tag:在 Slack 中通过 @Claude 协作》
03:26Ars Technica:AI(RSS)54Notion 宣布 9 月 22 日关闭 Notion Mail,全力投入 AI 智能体
03:23Rohan Paul80同事件精选OpenAI 内部论文:Codex 已占 99.8% 内部输出 tokens,智能体正向全部门扩散同一事件,精选展示《OpenAI内部报告:智能体Codex如何改变工作》
02:53Rohan Paul50i10X发布Superagent:AI首席幕僚实现业务自动化
02:49Runway53Runway Agent 2.0 发布,可生成营销素材
02:42Replit ⠕54Replit 现支持 450+ 集成服务
02:41Runway:News(网页)65精选Runway发布Agent 2.0
02:23Rohan Paul41sazabi 获 800 万美元融资,押注日志驱动 AI 可观测性平台
02:23Rohan Paul53麦肯锡:AI智能体正接管零售购物车,2030年将调解3-5万亿美元消费商务
02:18Tibo38OpenAI 用 Codex 搞定一切
01:47Greg Brockman43OpenAI 智能体加速内部工作
01:44🚨 AI News | TestingCatalog41Gemini macOS 将获 Computer Use 远程操控
01:34MarkTechPost(RSS)66DeepReinforce 发布 Ornith-1.0 开源编码模型族
01:25elvis47OpenRouter MCP 让实时模型智能融入 Agent
01:25OpenAI30OpenAI 内部工作正被智能体全面改变
01:12jason47OpenAI 论文:从聊天到智能体委托
00:53Rohan Paul38Viktor 构建 AI 工作流层连接 3000+ 工具
00:40Google DeepMind63Gemini 3.5 Flash 支持原生计算机使用
00:37TechCrunch:AI(RSS)71精选General Intuition 完成 3.2 亿美元融资,用游戏数据训练通用 AI 智能体
00:24AK24智能体原生记忆系统,准备好了吗?
00:19Berryxia.AI76精选Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模
00:15Google AI Developers73同事件精选Gemini 3.5 Flash 的 Computer Use 工具正式可用同一事件,精选展示《Gemini 3.5 Flash 引入 computer use 功能》
00:04Hacker News:AI 热帖71精选OpenKnowledge:开源、AI 优先的 Obsidian/Notion 替代品
6月25日周四
23:53Rohan Paul43Eric Schmidt:智能体AI时代到来
23:53Rohan Paul72DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0(MIT 许可)
23:24elvis20Hyperagent:AI智能体专属云端机器解决本地运行难题
23:22meng shao48SuperNori:首个主动式家庭AI智能体
23:14OpenRouter72OpenRouter MCP 为智能体实时选择模型
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月26日
08:00
HuggingFace Daily Papers(社区热门论文)
47
ProMSA:渐进式多模态搜索智能体用于知识型视觉问答

ProMSA是一种渐进式多模态搜索智能体,用于知识型视觉问答(KB-VQA)。给定图像-问题对,智能体在明确的工具调用预算和去重机制下,迭代选择图像搜索、文本搜索或停止。训练先通过拒绝采样SFT学习有效工具使用格式,再使用TN-GSPO序列级RL目标优化,该目标按生成长度和工具交互深度归一化更新。在E-VQA和InfoSeek基准上,ProMSA持续优于强RAG和智能体基线,提升了检索和端到端准确率。代码已开源。

智能体多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
迈向自动化科学评审:Google 的 Paper Assistant Tool(PAT)

Google 发布 Paper Assistant Tool(PAT),一个用于深度科学评审和验证的智能体 AI 框架。PAT 能摄取完整学术论文,生成综合评估,包括检查理论结果、验证实验、提出改进建议和识别潜在缺陷。通过利用推理扩展技术,PAT 在 SPOT 基准上对数学错误的召回率比零样本提升 34%。该工具已在 STOC 和 ICML 两大计算机科学会议上作为作者预提交工具进行试点,可发现关键错误并提出实质性改进,在保留评审员对结果控制权的同时减轻其认知负担。

智能体Google推理论文/研究
07:20
ginobefun@hongming731
45
BestBlogs 早报 · 06-26|Dropbox DSPy 评测优化、Cloudflare Workflows Saga 回滚与出海 C-Corp 架构准备

Dropbox用DSPy构建两阶段评测闭环:人工标注校准LLM裁判后,自动优化Dash Chat提示词,使不完整答案减少26%,遗漏关键信息点减少13%,Token用量下降5.4%。Cloudflare Workflows正式发布Saga回滚,支持在step.do()中声明补偿逻辑,引擎自动逆序执行已注册回滚,具备持久化、重试和超时保障。此外介绍出海AI创业者需了解的特拉华州C-Corp架构选型、股权分配原则和Vesting安排。

智能体现象/趋势
06:51
OpenAI Developers@OpenAIDevs
57
Builders Unscripted with @skirano Pietro 与 @romainhuet 讨论了如何拓展 GPT-5.5 的创意边界,以及使用 Codex 将想法转化为软件。 03:45 图像转化为声音 07:57 多智能体 Codex 工作流 14:34 用 Codex 复活硬件 25:27 从动手到指挥
智能体OpenAI教程/实践编码
06:12
Claude Code:GitHub Releases(RSS)
精选61
Claude Code v2.1.193 发布

Claude Code v2.1.193 新增 autoMode.classifyAllShell 设置,将全部 Bash/PowerShell 命令经自动模式分类器处理。自动模式拒绝原因现加入转录、拒绝提示及 /permissions 页面。新增 claude_code.assistant_response OpenTelemetry 日志事件(默认不记录,需设置 OTEL_LOG_ASSISTANT_RESPONSES=1)。Bash 模式支持实时文件路径自动补全;MCP 服务器需认证时显示启动提示。新增空闲后台 shell 命令自动内存压力回收(可禁用)。修复 /model UI 状态滞后、后台任务误取消、子 agent 隐藏同级等问题,并改进了后台 agent 启动指令、MCP 认证重连、插件自动重命名等行为。

智能体产品更新编码

推荐理由:一次扎实的工具更新,自动模式覆盖所有 shell 命令和 MCP 认证重连是最实用的改进,后台任务内存回收也解决了长期痛点,Claude Code 用户值得更新。
05:56
elvis@omarsar0
72
Elvis Saravia(DAIR.AI)推荐ashwingop分析称,Claude Tag看似让Slack中的AI像队友般流畅协作,实则导致"上下文锁定"--公司运营记忆(异常处理、客户承诺、失败经验等)被锁定在Anthropic的agent层。模型可换,上下文几乎无法迁移;基于token的无限计价使劳动支出被单一供应商捕获。正确架构:从任何顶级模型供应商租用智能,但企业自己拥有可检查、有权限、可移植、模型中立的上下文层。

Ashwin Gopinath: Claude Tag is a Trojan horse. Not because Anthropic is doing anything evil. Because the incentives are obvious. Day one,...

智能体Anthropic大佬观点
05:53
Rohan Paul@rohanpaul_ai
67
BabelTele:LLM间通信压缩文本至27.9%保语义99.5%

新论文"LLMs Do Not Always Need Readable Language"提出BabelTele压缩写作风格,让LLM间通信混合缩写、符号、多语言片段及非传统结构,替代人类自然语言的长文本。即使失去人类可读性,模型仍能回答、记忆并在智能体间传递信息。最强结果:BabelTele保持约99.5%语义保真度,同时将文本压缩至原始长度的27.9%。

智能体arXiv推理论文/研究
05:26
elvis@omarsar0
14
如我所言,已有公司把"AI员工"这件事做得非常出色。 @viktor__com 就是其中之一。 最棒的是你不会被锁定在单一模型上--你确实需要这一点。Viktor 可在 Slack 和 Teams 中运行,支持任意模型,连接 3200+ 工具。

Fryd Wiatrowski: http://x.com/i/article/2070125273790492672

智能体其他
04:38
TechCrunch:AI(RSS)
56
Patronus AI 获 5000 万美元 B 轮融资,构建"数字世界"压力测试 AI 智能体

Patronus AI 宣布完成 5000 万美元 B 轮融资,由 Greenfield Partners 领投,Notable Capital、Lightspeed、Datadog 和 Samsung 参投,累计融资达 7000 万美元。该公司由前 Meta AI 研究员于 2023 年创立,利用“数字世界模型”创建网站和内部系统的模拟副本,通过强化学习对 AI 智能体进行压力测试,迭代奖励成功并惩罚错误。目前服务覆盖软件工程和金融领域,几乎所有前沿 AI 实验室和初创公司均为客户,过去一年收入增长 15 倍。

智能体安全/对齐行业动态
04:25
elvis@omarsar0
41
Meta Autodata:智能体自动构建合成训练数据

Meta 发布新研究 Autodata,提出 Agentic Self-Instruct 方法。该方法将 AI 智能体视为数据科学家,通过智能体规划与工具使用,替代传统手工调优后固定的合成数据流水线。该智能体自身可通过元优化持续改进,从而生成更强训练数据。实验在计算机科学、法律推理、数学对象推理三个领域均超越经典合成数据方法,且元优化带来更大提升。论文见 arxiv。

智能体Meta数据/训练论文/研究
04:25
elvis@omarsar0
49
Elvis Saravia 分享动态工作流讨论笔记

动态工作流仅适用于少量用例,可视为测试时计算(TTC)新范式,对爬山式研究实验有效。仔细规划及提升推理级别均可改善效果。/goal + /loop 是其子集,验证者/评判者至关重要。结合不同编码智能体能获更好结果,适合需要多智能体视角的 LLM 评审团场景。前沿模型不擅即时生成 harnesses,但 Mythos 等新模型可能更优地处理智能体编排。TTC 基准尚缺,需建立。元提示动态工作流很有趣,Opus 4.8 也可能带来惊喜。动态工作流可打包为技能以便进一步优化。

智能体大佬观点推理
04:22
Thariq@trq212
33
我将与 @petergyang 以及在 AIE 上与 @_catwu 进一步讨论 Claude Tag。 如果你们有任何希望我们深入探讨的内容,请告诉我!

ClaudeDevs: Claude Tag is the next evolution of agents. It's a proactive, multiplayer agent with memory and identity, built on top o...

智能体Anthropic产品更新
04:17
ClaudeDevs@ClaudeDevs
同事件精选72
Claude Tag 是智能体的下一代进化。它是一个主动的、多玩家智能体,具有记忆和身份,构建在 Claude Code 之上。了解更多关于 Claude Tag 的工作原理以及使用它的最佳实践,请看这篇深度解析。
智能体Anthropic产品更新
同一事件,精选展示《Anthropic 推出 Claude Tag:在 Slack 中通过 @Claude 协作》
推荐理由:Claude Tag把agent从单人工具变成多人协作系统,记忆和身份让agent真正有状态,做AI原生团队的开发者必须看。
03:26
Ars Technica:AI(RSS)
54
Notion 宣布 9 月 22 日关闭 Notion Mail,全力投入 AI 智能体

Notion 今日宣布将于 9 月 22 日关闭 Notion Mail(网页、桌面和 iOS)。公司表示,超过半数用户通过 AI 智能体管理邮件而无需打开收件箱,因此决定全力投入智能体方案。用户邮件历史仍保留在 Gmail,但须在 9 月 21 日前导出草稿和定时邮件。依赖 HIPAA 覆盖的组织需在 2026 年 6 月 30 日前迁移。Notion Mail 由收购的 Skiff 团队打造,Skiff 曾服务 200 万用户。

智能体行业动态
03:23
Rohan Paul@rohanpaul_ai
同事件精选80
OpenAI 内部论文:Codex 已占 99.8% 内部输出 tokens,智能体正向全部门扩散

OpenAI 发布内部论文,显示 Codex 已成为公司主力 AI,产出 99.8% 内部输出 tokens,而一年前这一比例低于 10%。除工程部门外,法务、财务、招聘、支持及业务团队使用量快速增长。自 Aug-25 以来,非开发者个人使用增长 137 倍,组织使用增长 189 倍。重度用户日均运行约 71 小时代理任务,28.6% 的用户管理 5 个以上并发 agent,25.6% 的个体提交过超过 8 小时人工等价的任务。OpenAI 称,Agent 正使工作更复杂、更长期、更跨职能。

OpenAI: Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...

智能体OpenAI论文/研究
同一事件,精选展示《OpenAI内部报告:智能体Codex如何改变工作》
推荐理由:OpenAI 内部 agents 采用数据首次公开,非开发者使用暴增 137 倍,工作单元从“提问”变成了“分配任务”,这是 AI 融入日常运作的最强信号。
02:53
Rohan Paul@rohanpaul_ai
50
i10X发布Superagent:AI首席幕僚实现业务自动化

i10X推出Superagent,号称世界首个AI首席幕僚。用户输入业务目标,即可部署智能体团队端到端处理销售、内容创作和SEO。Superagent的核心设计是吸收协调层:自动规划步骤、收集信息、调用100+工具、云端产出成果,无需人工持续监督。关键创新在于审批门控——低风险任务静默执行,涉及发邮件或发布页面等高后果操作时先请求批准,将自主变为受监督的自主,避免盲目委托。

i10X: Today we're introducing the world's first AI Chief of Staff. Enter your business goal and it deploys a team of AI agents...

智能体MCP/工具产品更新
02:49
Runway@runwayml
53
推出 Agent 2.0 从简单的提示词到完整生成的营销简报和活动素材,全都在 Runway Agent 内完成。你还可以轻松分析你的表现数据,以改善你的创意,并跨平台、格式和市场进行扩展。 Agent 正在被打造成为最强大的自主智能体,用于真实世界的工作。
智能体产品更新多模态
02:42
Replit ⠕@Replit
54
Replit 现已支持 450 多项集成。 无论你在构建什么,Replit Agent 都能将它与你已使用的工具连接起来:支付、消息、数据、CRM、设计工具、分析工具,以及数百种其他工具。 只需描述你的需求,我们来处理连接。
智能体MCP/工具产品更新
02:41
Runway:News(网页)
精选65
Runway发布Agent 2.0

Runway发布Agent 2.0,帮助营销人员创建、测试和优化广告、视频及营销活动。品牌营销人员可在对话中开发活动概念、生成变体并自动本地化;绩效营销人员可上传创意并导入Meta、YouTube、TikTok或Google广告数据,由Agent分析后生成下一轮待测广告。社交媒体营销人员可一次性生成一周内容,自动裁切为9:16、16:9、1:1等格式;产品营销人员可借助Agent确定定位角度并构建活动资产。Agent 2.0面向所有用户开放。

智能体产品更新视频

推荐理由:Runway的Agent 2.0不只是生成视频,它试图打通从广告数据分析到全平台素材生成的闭环,做增长和社交内容的团队可以观望一下。
02:23
Rohan Paul@rohanpaul_ai
41
AI 可观测性初创公司 sazabi 获得 800 万美元融资,其平台将日志(logs)作为唯一事实来源,让 AI 自动检测问题、调查故障并协助准备修复方案。该平台从团队已有的原始日志中推导指标、追踪和可能修复,旨在替代传统手动监控。sazabi 定位为下一代通用可观测性方案,适用于任何工作负载(包括 AI 智能体),而非另一款 AI SRE 或 LLM 可观测性工具。2026 年软件更新速度极快,该平台希望通过 AI 最大化自动化和速度,实现自我修复软件。

Sherwood: We raised $8m to build self-healing software. In 2026, software moves fast. But monitoring and observability are still m...

智能体行业动态部署/工程
02:23
Rohan Paul@rohanpaul_ai
53
麦肯锡:AI智能体正接管零售购物车,2030年将调解3-5万亿美元消费商务

麦肯锡报告指出,AI智能体可跨多家商店扫描库存、比对价格并构建可立即购买的购物车,预计到2030年将调解3万亿至5万亿美元全球消费商务。自动化分为6个层级:最低级仅比较价格与功能,最高级由个人AI智能体直接与商店AI智能体谈判价格和运输条款。品牌将更多竞争以赢得算法而非人类消费者。零售商店需通过API使产品目录和退货政策机器可读;隐藏数据的品牌会被AI忽略,而开放定价和库存的商店将主导市场。

智能体现象/趋势
02:18
Tibo@thsottiaux
38
在 OpenAI,Codex 用于一切。

OpenAI: Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...

智能体OpenAI现象/趋势
01:47
Greg Brockman@gdb
43
智能体正在被迅速采用,并加速工作进程。这在 OpenAI 内部的表现如下:

OpenAI: Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to...

智能体OpenAI大佬观点
01:44
🚨 AI News | TestingCatalog@testingcatalog
41
GOOGLE 🔥: macOS 版 Gemini 应用将获得 Computer Use 支持,并能远程操控其他桌面设备。 用户可从提示栏的附件菜单中选择"连接另一台 Mac"。 缩小功能差距 🤖
智能体Google产品更新
01:34
MarkTechPost(RSS)
66
DeepReinforce 发布 Ornith-1.0 开源编码模型族

DeepReinforce 发布 Ornith-1.0 开源编码模型族,基于 Gemma 4 和 Qwen 3.5 后训练,提供 9B、31B、35B-MoE(每 token 激活约 3B 参数)和 397B-MoE 四个尺寸,均以 MIT 许可在 HuggingFace 开放。与固定人工设计框架的编码智能体不同,Ornith-1.0 在强化学习中联合优化框架与解决方案,并引入三层防御(固定信任边界、确定性监视器、冻结 LLM 裁判)防止奖励黑客。旗舰版 Ornith-1.0-397B 在 Terminal-Bench 2.1 上得分 77.5、在 SWE-Bench Verified 上得分 82.4,超越 Claude Opus 4.7(70.3)但低于 Claude Opus 4.8(85)和 GLM-5.2-744B(81.0)。支持 vLLM、SGLang 等推理框架,9B 模型(bf16 约 19GB)可部署在单张 80GB GPU 上。

智能体开源/仓库模型发布编码
01:25
elvis@omarsar0
47
我猜 MCP 赢了。 玩笑归玩笑,OpenRouter 这波操作太酷了。 让开发者能更轻松地用合适的智能层级运行他们的长期 Agent。 请多来点这样的。

OpenRouter: Introducing the OpenRouter MCP, live model intelligence right inside your agent Your agent builds and ships, but when it...

智能体MCP/工具产品更新
01:25
OpenAI@OpenAI
30
OpenAI 的工作正在被智能体改变,在每个部门。 整个公司里,人们正在使用 Codex
智能体OpenAI行业动态
01:12
jason@jxnlco
47
Codex 在 OpenAI 的使用为我们预览了未来智能体工作的可能面貌。 在一篇新论文中,OpenAI 经济研究团队着眼于从聊天到委托的更广泛转变:人们使用 AI 智能体不仅为了获取答案,还要委托更长时间、更复杂的工作。 https://openai.com/index/how-agents-are-transforming-work

OpenAI Newsroom: Codex usage at OpenAI gives us a preview of what agentic work may look like in the future. In a new paper, the OpenAI Ec...

智能体OpenAI论文/研究
00:53
Rohan Paul@rohanpaul_ai
38
模型本身不再是产品。 价值在于将模型转化为可靠行动的系统,即模型周围的"缰绳"。每瓦特效用。 大型实验室或许拥有模型,但 @viktor__com 正押注:最贴近工作流的公司才能拥有用户。 Viktor 正在为 Slack 和 Microsoft Teams 构建一个工作流层,可连接 3000 多个工具,Viktor 能对这些工具进行读写。两个平台,一名 AI 员工。

Fryd Wiatrowski: http://x.com/i/article/2070125273790492672

智能体MCP/工具大佬观点
00:40
Google DeepMind@GoogleDeepMind
63
Gemini 3.5 Flash 现支持原生计算机使用。 这一内置工具让开发者能够构建可跨浏览器、移动和桌面界面进行观察和操作的自定义 AI 智能体。 了解更多 → https://goo.gle/4f4sNQA
智能体Google产品更新
00:37
TechCrunch:AI(RSS)
精选71
General Intuition 完成 3.2 亿美元融资,用游戏数据训练通用 AI 智能体

General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,累计披露融资 4.54 亿美元。公司从旗下游戏剪辑平台 Medal 获取数亿小时含精确按键动作标签的游戏操作数据,训练单一模型同时驾驭 Fortnite 等虚拟环境和四足机器人。演示中,AI 智能体在游戏中连续运行 100 小时,机器人仅靠 8 分钟真实街道数据微调即可自主探索办公室。本轮由 Khosla Ventures 领投,General Catalyst、Jeff Bezos、Eric Schmidt 等参投。资金将用于通过 CoreWeave 扩大计算规模、预训练下一代模型,计划夏末前开放 API。

智能体具身智能数据/训练行业动态

推荐理由:用游戏按键数据训练世界模型,并在真机上八分钟完成适配,这个思路让具身智能看到了一条可规模化的路径。投资人押注的其实是 Medial 独有的动作标注数据飞轮。
00:24
AK@_akhaliq
24
我们准备好迎接智能体原生记忆系统了吗?
智能体论文/研究
00:19
Berryxia.AI@berryxia
精选76
Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模

Ornith-1.0 开源模型家族发布,专注智能体编程(Agentic Coding),覆盖 9B Dense、31B Dense、35B MoE 及 397B MoE 全参数规模。在 Agent Coding 基准上达开源顶尖:SWE-Bench Verified 82.4、SWE-Bench Pro 62.2、Terminal-Bench 2.1 77.5、NL2Repo 48.2、SWE Atlas 41.2 QnA、ClawEval 77.1。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架(scaffold)与最终解决方案,让模型自主改进执行框架。全系列 MIT 开源,提供 GGUF 版本,支持 Ollama、Unsloth 等本地运行。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

智能体开源生态模型发布编码
关联讨论 1 条X:Kim (@kimmonismus)
推荐理由:Ornith-1.0 不是又刷 benchmark,而是第一次把‘任务脚手架’的生成也纳入 RL 优化,这个思路可能改变 agent coding 的训练范式。MIT 开源加 GGUF,本地党可以立刻跑起来。
00:15
Google AI Developers@googleaidevs
同事件精选73
Gemini 3.5 Flash 的 Computer Use 工具正式可用

Google AI 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用,支持构建能观察并操作浏览器、移动端和桌面环境的 AI 智能体,可处理长期任务。新特性包括:内置移动与桌面操作系统支持;所有函数调用配备 intent arguments;可定制的客户端函数实现人工接管(HITL);提示词注入检测及可配置的 action-level 安全策略。可用于自动化 QA 测试、业务流程等场景。

智能体Google产品更新多模态
同一事件,精选展示《Gemini 3.5 Flash 引入 computer use 功能》
推荐理由:Computer Use 从浏览器扩展到移动和桌面,Google 正式把 agent 战场拉到全部界面。安全策略的加入说明不是 demo,而是认真考虑落地。
00:04
Hacker News:AI 热帖
精选71
OpenKnowledge:开源、AI 优先的 Obsidian/Notion 替代品

OpenKnowledge 是一款开源、本地优先的 Markdown 编辑器,私密免费,提供完整的所见即所得编辑体验。支持 macOS 桌面应用和 Web UI,内置文件导航、搜索、标签和图谱 wiki 链接查看器。可与 Claude、Codex、Cursor 等桌面应用协同实现 AI 编辑,并通过 MCP/CLI 兼容任意 AI 智能体框架。自带 MCP、技能和智能搜索,支持 LLM Wiki 和知识图谱。团队协作基于 Git/GitHub 实现无代码共享与自动同步。支持嵌入 HTML 及富文本组件。桌面应用内建 TUI,Linux/Windows/Intel Mac 用户可通过 CLI(Node.js 24+)以本地 Web 应用运行。可直接打开任何包含 Markdown/MDX 文件的文件夹。开源协议 GPL-3.0-or-later。

智能体MCP/工具产品更新

推荐理由:把 Claude、Codex 等 AI 代理直接嵌进知识库编辑器,想法比 Notion AI 更灵活,但这类工具最终拼的是细节打磨和生态,现阶段可以尝鲜但别急着切换主力。
6月25日
23:53
Rohan Paul@rohanpaul_ai
43
"如果你真的想赚钱,就创办一家智能体AI公司。 我的意思是,构建一个能做某事的智能体。现在是AI的智能体时期。每个人都将构建智能体。所有智能体都将互相竞争。" ~ Eric Schmidt,前谷歌CEO
智能体大佬观点现象/趋势
23:53
Rohan Paul@rohanpaul_ai
72
DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0(MIT 许可)

DeepReinforce 发布 Ornith-1.0,一个 MIT 许可的开源智能体编码大语言模型家族,涵盖 9B Dense、31B Dense、35B MoE 及旗舰 397B MoE(17B 活跃参数)。旗舰模型在 SWE-Bench Verified 上取得 82.4,Terminal-Bench 2.1 上取得 77.5,均超越 Claude Opus 4.7;并在 SWE-Bench Pro(62.2)、Multilingual(78.9)等基准上达到开源同尺寸最佳。模型基于 Gemma 4 和 Qwen 3.5 后训练,采用新型自我改进策略:强化学习不仅生成解决方案,还联合优化任务特定的 scaffold(包含计划、记忆模式、工具节奏、错误处理等)。最小的 9B 模型也在 SWE-Bench Verified 上达到 69.4。全部模型以 MIT 许可证发布,支持商用与研究。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

智能体开源生态模型发布编码
23:24
elvis@omarsar0
20
Hyperagent 为每个 AI 智能体提供专用云端机器,托管基础设施,无需笔记本常开也能持续运行。针对 OpenClaw 等本地框架常见的问题(每日崩溃、泄露秘密、频繁监控),Hyperagent 提供稳定安全替代方案。限时优惠:注册即获 $100 推理积分,迁移首个智能体再获 $500。

Andrew Busse: If OpenClaw feels more like babysitting, you're not alone. Skip the daily crashes, leaked secrets, and constant monitori...

智能体行业动态部署/工程
23:22
meng shao@shao__meng
48
SuperNori:首个主动式家庭AI智能体

SuperNori 是一个专为家庭照顾者设计的 Proactive Family AI Agent。与现有AI专注于工作场景不同,它能主动感知堵车、冰箱快空、孩子学习进度、纪念日冲突等家庭事务,再询问用户是否处理。旨在减轻家中“一直记事、提醒、安排、照顾所有人”的成员的负担。目前开放候补名单。

Isaac: Most AI helps you write, design, code, and ship faster at work. Nothing was built for the person quietly holding the fam...

智能体产品更新
23:14
OpenRouter@OpenRouter
72
推出 OpenRouter MCP,将实时模型智能直接嵌入你的智能体 你的智能体负责构建和交付,但在为具体任务选择合适模型时,它只能依据 6 个月前的训练数据来猜测 看它如何挑选、定价并测试合适的模型:
智能体MCP/工具产品更新
关联讨论 1 条OpenRouter:Announcements(RSS)
‹ 上一页
1…89101112…50
下一页 ›