AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Agent」清除
6月9日周二
04:16elvis62AI智能体重塑知识工作的三个维度
04:07宝玉54豆包手机团队招聘设计工程师,要求 Android 平台经验
03:21IT之家(RSS)53苹果发布 Xcode 27 Beta 与 Core AI 框架,称其为构建 AI 智能体"最佳场所"
03:14Apple:Newsroom(RSS)66同事件精选Apple 推出 Siri AI:由 Apple Intelligence 驱动的更强大、更个性化的个人助理同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
02:51Anthropic61Anthropic:AI编码快于生物学的缘由
02:26Josh Woodward67NotebookLM 新增外源搜索与多格式导出
02:21IT之家(RSS)71苹果推出 Siri AI:独立 App,为灵动岛优化
02:12Rohan Paul58提示词时代落幕,AI智能体循环开启
01:51jason18Codex与Computer Use功能强大
01:49OpenAI Developers53OpenAI Developers 五月更新:Codex 新增移动端持续运行、Mac 后台、电脑使用、Chrome 插件等,Realtime API 推出 Realtime-2
01:49Boris Cherny65Claude Code GA一周年:Boris Cherny谈auto mode与手机编程
01:46Anthropic:Research(发表成果 · 网页)77精选为生物学AI智能体铺路
01:42Yuchen Jin57编码智能体应设计循环而非提示
01:41Rohan Paul63"CL-BENCH 基准测试:AI 智能体全上下文记忆优于复杂记忆系统"
01:17ClaudeDevs74精选Claude Code GA一周年回顾:验证与自动模式
01:12Yuchen Jin57循环提示智能体:LLM判断力不足的临时方案
01:05宝玉61宝玉评微信AI:超级入口或非微信,Agent才是未来
00:57Perplexity76精选Perplexity与哈佛:AI智能体提效87%降本94%
00:49NotebookLM67NotebookLM重大升级:智能体能力+高级推理
00:46🚨 AI News | TestingCatalog48NotebookLM 支持高级智能体推理与新输出格式
6月8日周一
23:54OpenRouter66OpenRouter 成本削减月 每周推新功能
23:44elvis65运行Claude Opus自主Agent数小时/天的5条技巧
23:38TechCrunch:AI(RSS)40WWDC 2026 前瞻:Siri 备受期待的改造、Apple Intelligence 与 iOS 27
23:24OpenRouter72同事件精选OpenRouter Advisor 助小模型问高级模型同一事件,精选展示《OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成》
23:20IT之家(RSS)67美团接入微信 AI 生态,未来提供外卖等 AI 生活服务体验
23:20IT之家(RSS)48Kimi 官宣将用 300 子 Agent 并行预测 104 场世界杯赛事,德国队或成市场低估黑马
23:12Chubby♨️78精选Hivemind推出面向AI编程智能体的持续学习功能,即日起开放
22:54gabriel40所有工作将变成向AI解释意图
22:46🚨 AI News | TestingCatalog69Kimi for Work AI Agent发布:原生Agent Swarm、Browser Use
22:34Kimi.ai76同事件精选Kimi Work:本地桌面AI智能体,支持300智能体并行同一事件,精选展示《Kimi Work Beta版发布:面向知识工作者的本地Agent》
22:14elvis53新LLM训练:循环编码提示实现长时执行
22:09The Decoder:AI News(RSS)62Frontier Radar #3:智能体AI如何将token转化为业务指标
22:02公众号:月之暗面(Kimi)76同事件精选Kimi Code 焕新升级(附视频教程)同一事件,精选展示《Kimi Code 焕新升级(附视频教程)》
21:50Hugging Face:Blog(RSS)62精选开源社区支持 OpenEnv 用于智能体强化学习
21:50Hugging Face:Blog(RSS)57精选五个模型经济体中消失的崩溃:控制与涌现
21:43公众号:月之暗面(Kimi)62精选Kimi Code 焕新升级(附视频教程)
21:20IT之家(RSS)539.9元/月起,字节火山引擎Agent Plan和Coding Plan限时优惠
21:20IT之家(RSS)62携程作为首批内测团队接入微信 AI 生态,聚焦酒旅出行等场景
20:36小互45人机协作优于完全自动化:关键节点人工介入
20:14歸藏(guizang.ai)67笑林老师总结设计工程师五种画像
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月9日
04:16
elvis@omarsar0
62
AI智能体重塑知识工作的三个维度

一篇新论文从自主性、效率和工人移交任务的范围三个维度,分析AI智能体如何重塑知识工作。研究指出,当前人们使用智能体的主要障碍并非模型质量,而是几乎没有人接受过如何以这种方式工作的培训。

智能体arXiv论文/研究
04:07
宝玉@dotey
54
字节跳动豆包手机团队招聘设计工程师,需具备 Android 平台经验。团队调研总结了五种设计工程师画像:AI Design Engineer(转译 AI 能力为交互产品体验,处理 agent workflow、tool call、状态反馈等)、Product UI Craft Engineer(打磨高质量前端原型和交互细节)、Design Systems Engineer(建立设计系统与前端基础设施,连接 Figma 变量和代码组件)、Creative Technologist / Motion & Graphics Engineer(负责动效、实时图形、3D/空间交互)、AI Design Workflow Architect(搭建 AI 辅助设计工作流,使用 Claude Code、Cursor、v0 等工具)。多数设计工程师技能交叉,欢迎感兴趣者联系。

笑林: Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...

智能体MCP/工具大佬观点
03:21
IT之家(RSS)
53
苹果发布 Xcode 27 Beta 与 Core AI 框架,称其为构建 AI 智能体"最佳场所"

在 2026 全球开发者大会(WWDC)上,苹果发布 Xcode 27 Beta 并推出 Core AI 框架。新版 Foundation Models 框架支持图像输入,开发者可将图片与文本一并传给设备端模型,处理多模态任务。Xcode 编码助手升级为智能体式编码工作流,已覆盖应用本地化、与模拟设备交互以及测试与调试环节。苹果软件工程高级副总裁 Craig Federighi 称 Xcode 已成为构建智能体 AI 应用的“最佳场所”。

智能体产品更新多模态编码
03:14
Apple:Newsroom(RSS)
同事件精选66
Apple 推出 Siri AI:由 Apple Intelligence 驱动的更强大、更个性化的个人助理

Apple 发布了 Siri AI,一款由 Apple Intelligence 驱动的个人助理,具备个人上下文、世界知识和屏幕感知能力,能提供更强大、更个性化的交互体验。

智能体产品更新多模态端侧
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
推荐理由:苹果对 Siri 的这次重构不是简单地换个模型,它把个人上下文、屏幕感知和视觉智能实际嵌进了系统,对普通用户来说日常交互方式可能要变。
02:51
Anthropic@AnthropicAI
61
新的科学博客:为什么 AI 在编码方面的进步比在生物学方面更快? 对智能体而言,生物数据库就像汽车发明前建造的城市--开进去会让人抓狂,因为它们是针对不同的交通流量设计的。 我们如何构建智能体可以使用的基础设施? https://www.anthropic.com/research/agents-in-biology
智能体Anthropic现象/趋势
02:26
Josh Woodward@joshwoodward
67
NotebookLM 今日迎来重大升级,对话中新增智能体能力与更强推理,并可搜索用户源文件之外的网络内容。同时支持导出为 PDF、DOCX、XLSX、PPTX 及图表等新格式。该更新已向 Google AI Ultra 订阅者开放。

NotebookLM: Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning...

智能体Google产品更新搜索
02:21
IT之家(RSS)
71
苹果推出 Siri AI:独立 App,为灵动岛优化

苹果在 2026 年全球开发者大会(WWDC)上发布 Siri AI,称为“全新版本的 Siri”,具备更强的对话能力和表现力,用户可自定义语速、语气和口音。Siri AI 支持系统范围内读取屏幕内容并与应用互动,配有独立 App,灵动岛会显示大气泡。苹果强调每一步以隐私为重。语音优化同时适用于 CarPlay 和 AirPods,可用于查询演唱会信息、提醒报名抽奖、搜索照片等场景。

智能体产品更新语音
关联讨论 8 条TechCrunch:AI(RSS)X:Kim (@kimmonismus)Apple:Newsroom(RSS)IT之家(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)X:Testing Catalog (@testingcatalog)Apple Machine Learning Research(RSS)
02:12
Rohan Paul@rohanpaul_ai
58
提示词时代正在终结。那太线性了,太受人类瓶颈限制了。 我们正在进入AI智能体的循环机器。 价值在于将判断上移,让人类设计流程,模型处理重复出现的摩擦。

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体大佬观点
01:51
jason@jxnlco
18
Codex和Computer Use非常强大
智能体OpenAI大佬观点编码
01:49
OpenAI Developers@OpenAIDevs
53
OpenAI Developers 五月更新:Codex 新增移动端持续运行、Mac 后台、电脑使用、Chrome 插件等,Realtime API 推出 Realtime-2

OpenAI Developers 五月发布多项更新:Codex 用户突破 500 万;新增 ChatGPT 移动端持续运行、Mac 后台运行、跨 Mac 应用电脑使用、Chrome 插件支持网页测试与 DevTools;⌘+⌘ 快捷键截图直达 Codex;Windows 版也支持电脑使用。Realtime API 推出新模型 Realtime-2,用于语音智能体、实时翻译与转录,并提供提示词指南。Agents SDK 新增 TypeScript 支持、沙箱智能体和开源 harness。私有 MCP 服务器可通过 HTTPS 连接 OpenAI 产品。

智能体OpenAI产品更新编码
01:49
Boris Cherny@bcherny
65
Claude Code GA一周年之际,Anthropic工程师Boris Cherny与@_catwu回顾产品演进。此前内部首次演示时在Slack上引发两种截然不同的反应。Cherny分享了他为何偏好auto mode而非plan mode,routines如何在bug出现前自动修复,以及他如今大部分编码都在手机上完成。视频访谈还探讨了Claude Code的未来方向。

ClaudeDevs: Claude Code's first demo got two Slack reactions. One year after GA, @bcherny and @_catwu look back: verification best p...

智能体Anthropic大佬观点编码
01:46
Anthropic:Research(发表成果 · 网页)
精选77
为生物学AI智能体铺路

一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后,准确率接近100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。

智能体Anthropic论文/研究

推荐理由:再强的模型在 NCBI Virus 上检索病毒序列都会翻车,Anthropic 加了个确定性检索层后准确率飙到近 100%。做 AI for science 的人该看看这个基础设施层的解法。
01:42
Yuchen Jin@Yuchenj_UW
57
总体来说: "你不应该再提示编码智能体了。你应该设计循环来提示你的智能体。" 循环是临时解决方案:如今的大语言模型判断力很差。它们难以判断何时继续、何时停止或何时调用工具。循环强制智能体更长时间地工作。 对于目前可验证的目标,循环非常强大,正如AutoResearch所示。
智能体大佬观点编码
01:41
Rohan Paul@rohanpaul_ai
63
"CL-BENCH 基准测试:AI 智能体全上下文记忆优于复杂记忆系统"

新论文构建 CL-BENCH 基准,评估 AI 智能体在编程、数据库、预测、无线电信号、扑克、疾病研究 6 个领域中的持续学习能力。每个任务隐藏可随时间习得的模式,考察智能体能否超越预训练知识。测试前沿 LLM 系统采用全上下文记忆、草稿笔记、检索记忆、剧本式记忆及编码智能体设置,结果发现当前记忆密集型 AI 智能体并未可靠优于简单保留完整对话上下文。Claude Sonnet 4.6 使用普通上下文取得最佳总体分数。论文指出智能体仍需更好方法记住有用经验、遗忘过时信息并适应环境变化。

智能体arXiv论文/研究
01:17
ClaudeDevs@ClaudeDevs
精选74
Claude Code 的第一个演示收到了两个 Slack 反应。 GA 一周年之际,@bcherny 和 @_catwu 回顾:验证最佳实践、为何构建自动模式、例程和循环,以及下一步计划。 https://www.youtube.com/watch?v=Hth_tLaC2j8
智能体Anthropic教程/实践编码

推荐理由:Claude Code 一周年复盘,两位核心开发者把 auto mode 和 verification 的设计逻辑讲透了,比任何第三方教程都值得认真看。
01:12
Yuchen Jin@Yuchenj_UW
57
"你应该设计循环来提示你的智能体。" 循环是临时方案:今天的LLM判断力很差。它们很难知道何时继续、何时停止、何时调用工具。 对于可验证的目标,循环非常强大,正如AutoResearch所示。

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体大佬观点
01:05
宝玉@dotey
61
宝玉评微信AI:超级入口或非微信,Agent才是未来

微信发布《开发者接入微信 AI 生态的指引》,引导小程序开发者接入微信 AI,让 AI 控制小程序。宝玉对此评论称,微信试图通过让 AI 操作小程序来维持自身超级入口地位,但未来年轻人不会主动打开微信,而是直接向自己的 Agent(如"帮我总结群聊"或"给妈妈发消息")发出指令。承担超级入口职责的很可能不是微信 AI。

歸藏(guizang.ai): 微信终于要加 AI Agent 能力了? 微信发布了《开发者接入微信 AI 生态的指引》这篇文章,引导小程序开发者接入微信 AI 生态,让微信的 AI 控制小程序。 感觉这个可能是未来微信 AI 上一个非常重要的功能

智能体MCP/工具大佬观点现象/趋势
00:57
Perplexity@perplexity_ai
精选76
我们与哈佛大学发表新研究,关于从聊天界面转向像Computer这样的自主智能体的转变。 超过3个月的研究结果表明,使用Computer的工人在完成任务上比仅使用搜索快87%,成本低94%,且满意度更高。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work
智能体论文/研究
关联讨论 1 条X:邵猛 (@shao__meng)
推荐理由:Perplexity 和哈佛的联合研究,用三个月数据把“AI 代理取代聊天界面”从口号变成了硬数字——87% 时间缩减和 94% 成本下降,做企业决策的人该仔细读一下。
00:49
NotebookLM@NotebookLM
67
NotebookLM 迎来重大更新,在对话中新增智能体能力、更高级推理及多种新输出格式,旨在简化复杂多步骤研究。该更新面向 Google AI Ultra 订阅者以及拥有 AI Ultra Access 和 AI Expanded Access 的 Workspace 业务客户率先推出,后续计划扩展至更多用户。

NotebookLM: Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning...

智能体Google产品更新推理
关联讨论 1 条X:NotebookLM (@NotebookLM)
00:46
🚨 AI News | TestingCatalog@testingcatalog
48
GOOGLE 🔥: @NotebookLM 现在在聊天中支持高级智能体推理,并新增了包括 Excel 表格和图片在内的输出格式。 仅限 Ultra 订阅用户 👀

🚨 AI News | TestingCatalog: NotebookLM updates soon 👀 We are expecting Gemini 3.5 Flash and Gemini Omni upgrades, aside a bunch of new features. Wh...

智能体Google产品更新
6月8日
23:54
OpenRouter@OpenRouter
66
本月不出所料是成本削减月。 根据我们过去3年的数据,重大突破之后往往会出现成本压力。 我们将从今天开始,每周至少推出一次主要功能,帮助您降低推理成本。 持续更新列表 👇

OpenRouter: New server tool: Advisor Let smaller models consult a higher-intelligence "advisor" model. Helps them escape doom loops,...

智能体产品更新部署/工程
关联讨论 1 条OpenRouter:Announcements(RSS)
23:44
elvis@omarsar0
65
@bcherny 分享5条技巧:1) 开启自动权限模式,免手动确认;2) 采用动态工作流,让Opus协调数百/数千Agent;3) 使用/goal或/loop指令促使持续执行;4) 在云端运行Claude Code,可关闭笔记本;5) 确保Opus能端到端自验证--通过Chrome扩展验证网页、iOS/Android模拟MCP验证移动端、启动完整后端服务验证后端。Elvis Saravia强调/goal/loop和验证是关键。

Boris Cherny: Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...

智能体Anthropic教程/实践
23:38
TechCrunch:AI(RSS)
40
WWDC 2026 前瞻:Siri 备受期待的改造、Apple Intelligence 与 iOS 27

苹果 WWDC 2026 临近,Siri 备受期待的改造、Apple Intelligence 和 iOS 27 是本次大会的主要看点。

智能体行业动态语音
23:24
OpenRouter@OpenRouter
同事件精选72
新服务器工具:Advisor 让较小的模型咨询一个更高智能的"顾问"模型。 帮助它们逃出困境循环,并帮助你迁移到更便宜的模型!🧵
智能体MCP/工具产品更新
同一事件,精选展示《OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成》
推荐理由:OpenRouter 这个 Advisor 工具,用大模型给小模型当顾问,专治死循环。想降本到小模型又怕质量跳水的团队,可以试试这个方案。
23:20
IT之家(RSS)
67
美团接入微信 AI 生态,未来提供外卖等 AI 生活服务体验

微信宣布向开发者提供 AI 生态接入功能,目前处于内测阶段。美团作为首批内测团队,已与微信联合开发并测试接入。未来用户可通过微信 Agent 调用美团外卖等本地生活服务,实现智能便捷的 AI 生活服务体验。此前携程已官宣接入微信 AI 生态,围绕酒店预订、机票等核心场景接入微信 AI Agent。另有传闻称京东也已作为首批内测团队接入。

智能体行业动态
23:20
IT之家(RSS)
48
Kimi 官宣将用 300 子 Agent 并行预测 104 场世界杯赛事,德国队或成市场低估黑马

月之暗面 Kimi 宣布调度 300 个子 Agent 并行分析 104 场世界杯赛事。每个 Agent 有独立视角,覆盖战术、球员、伤病、赛程、历史、舆情、赔率等维度,采用 Elo、FIFA 排名、Poisson、Dixon-Coles、xG/xT、Monte Carlo 模拟、贝叶斯等模型。最终以概率呈现并标注风险,不简单多数决。Kimi 框架认为西班牙、法国是夺冠热门,但模型发现德国队夺冠概率可能被市场低估。历史回测显示高置信度预测准确率约 85%-90%,中等约 55%-65%,低置信度接近随机。官方提示结果不构成投注建议。

智能体产品更新推理
23:12
Chubby♨️@kimmonismus
精选78
Hivemind推出面向AI编程智能体的持续学习功能,即日起开放

Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。

Davit: Coding agents that actually get better the more your team uses them. Introducing Hivemind: continual learning for AI cod...

智能体开源/仓库编码

推荐理由:Hivemind 让 Claude Code、Cursor 等不同 AI 编码助手互相学习,团队用得越多代理越准,开源一行安装,做工程管理的值得立刻试试。
22:54
gabriel@gabriel1
40
每份工作都将变成向 AI 解释你的意图 向 AI 解释你想要什么其实相当耗时,程序员已经有 80% 的时间花在这上面,而这对每个人来说都将如此。
智能体现象/趋势
22:46
🚨 AI News | TestingCatalog@testingcatalog
69
Kimi for Work AI Agent已发布,支持原生Agent Swarm(多智能体群)、Browser Use(通过WebBridge实现)以及自有记忆系统。该应用可在macOS和Windows上运行,用户可本地启动多达300个智能体。官方表示这仅是开始,未来将增加更多数据源、工具和Agent能力。

Kimi.ai: 🔗Try it now: https://www.kimi.com/products/kimi-work We're just getting started. More data sources, more tools, more ag...

智能体产品更新
22:34
Kimi.ai@Kimi_Moonshot
同事件精选76
Kimi Work:本地桌面AI智能体,支持300智能体并行

Kimi发布Kimi Work,一款本地运行的桌面AI智能体。支持最多300个AI智能体同时在本地机器并行运行;配合WebBridge浏览器扩展,智能体可在浏览器中导航、搜索、点击、填写并完成任务;内置全球市场数据工具,可直接调用Yahoo Finance和世界银行数据,无需复杂API设置;记忆系统会记录用户偏好、过往决策和上下文。支持macOS(Apple Silicon)和Windows。

智能体MCP/工具产品更新端侧
同一事件,精选展示《Kimi Work Beta版发布:面向知识工作者的本地Agent》
推荐理由:这个产品把AI agent从聊天窗口搬到了桌面,300个并行agent和内置金融工具直接对标专业人群,如果它能稳定运行,个人AI助手的形态又要被重新定义了。
22:14
elvis@omarsar0
53
关键在于,你应该开始实施在自动化中编码带有明确目标的指令/提示词的方法。 这并不是什么新鲜事,但较新的大语言模型正在被训练以更长时间不间断地执行。循环就是利用这一点的一种方式。

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体大佬观点编码
22:09
The Decoder:AI News(RSS)
62
Frontier Radar #3:智能体AI如何将token转化为业务指标

生成式AI商业模式正从月订阅制转向按token消耗计费。智能体工作流消耗数倍于传统对话的token,可自主运行数小时,使固定费率不可持续。token价格因响应速度、专业化程度及结果经济价值而异。本期报告梳理订阅制向消费制迁移、看似低廉的token单价背后的实际成本,以及为何仅凭token消耗量衡量AI价值创造是片面的。

智能体现象/趋势
22:02
公众号:月之暗面(Kimi)
同事件精选76
Kimi Code 焕新升级(附视频教程)

Kimi Code 开源 Coding Agent 迎来大版本升级:一行命令安装,毫秒级启动;新增视频理解能力,支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码;集成同花顺、天眼查等权威数据源,可查询股票价格、财报、学术论文;支持 ACP 协议,可在 JetBrains、Zed 中使用;丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。

智能体产品更新开源生态编码
同一事件,精选展示《Kimi Code 焕新升级(附视频教程)》
推荐理由:Kimi Code 这次更新把安装和视频处理的门槛压到了最低,一行命令加拖拽视频就能用,开源 Agent 的体验终于开始反超商业版本。
21:50
Hugging Face:Blog(RSS)
精选62
开源社区支持 OpenEnv 用于智能体强化学习

今日,Hugging Face 宣布 OpenEnv 项目进一步开放,由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调,并获得 PyTorch Foundation、vLLM、SkyRL(UCB)等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具,定位为训练器与环境间的互操作层,标准化环境的发布、部署和消费,但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API(reset()、step()、state()),支持 HTTP、WebSocket、Docker 打包,并将 MCP 作为一等公民,使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证,以推动开源智能体 RL 基础建设。

智能体Hugging FaceMCP/工具Meta

推荐理由:开源社区在 agent RL 环境上终于开始合流,Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准,不做奖励框架,只做插线板。搞开源 agent 训练的人,这是少有的统一基础设施的机会。
21:50
Hugging Face:Blog(RSS)
精选57
五个模型经济体中消失的崩溃:控制与涌现

用五个不同实验室的AI模型(OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型)各自驱动一个智能体构建经济市场,试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积,导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格,使崩溃成为设计事实。实验表明,AI智能体的涌现行为是偶然的而非稳健的,有效系统需在涌现纹理与确定性控制之间找到精确接缝。

智能体大佬观点

推荐理由:做 agent 的人必读,自己动手构建一个多模型经济体后才发现,涌现行为脆弱,控制要卡在结算层而非输入层,廉价模拟器会给你虚假信心。这篇复盘比成功案例更值钱。
21:43
公众号:月之暗面(Kimi)
精选62
Kimi Code 焕新升级(附视频教程)

Kimi Code 开源 Coding Agent 大版本升级:一行命令安装,毫秒级启动;新增视频理解,可提取参考视频色调生成 LUT、将长视频切分为短视频、根据录屏生成代码;接入同花顺、天眼查等权威数据源,支持实时查询股票价格、财报和学术论文;兼容 ACP 协议,可在 JetBrains、Zed 等 IDE 使用;拓展 hook 生态方便集成。视频理解基于 Kimi K2.6 模型。通过 /plugins 安装 kimi-datasource 插件即可使用权威数据源。

智能体产品更新开源生态编码

推荐理由:Kimi Code 这次把视频理解功能做进了编码工作流,一行安装和 ACP 协议接入让上手成本几乎为零,做视频剪辑和自动化开发的同好值得一试。
21:20
IT之家(RSS)
53
9.9元/月起,字节火山引擎Agent Plan和Coding Plan限时优惠

字节跳动火山引擎宣布Agent Plan和Coding Plan限时优惠,两款套餐均集成MiniMax M3、DeepSeek V4系列、GLM-5.1等模型。即日起至2026年8月27日,新购、升级或续费Coding Plan Lite(原价40元/月)和Coding Plan Pro(原价200元/月),以及Agent Plan Small(原价40元/月)和Agent Plan Medium(原价200元/月),首两个月享2.5折,对应限时价9.9元/月和49.9元/月,第三个月起恢复原价。Agent Plan为火山引擎首推的“Agent套餐包”,内置字节自研Doubao-Seed、Seedance、Seedream模型,支持文本、代码、视频等多模态任务。

智能体编码行业动态
21:20
IT之家(RSS)
62
携程作为首批内测团队接入微信 AI 生态,聚焦酒旅出行等场景

6 月 8 日,微信开放平台发布指引,为开发者提供接入微信 AI 生态的能力,开发者可主动授权接入。携程小程序已作为首批内测开发者完成初步适配,未来将围绕酒店预订、机票查询、旅游度假、出行服务等核心场景接入微信 AI Agent。微信提供两种接入模式:自动模式(授权平台读取小程序源码,无需额外开发)和开发模式(开发者自主个性化开发,通过评测后可被微信 AI 调用),两种模式可同时开启。

智能体行业动态
20:36
小互@xiaohu
45
人机协作优于完全自动化:关键节点人工介入

小互分享个人经验:此前追求完全自动化,导致不断与AI扯皮、对技能和系统频繁修改,效果反而更差。现在删除所有规则,只在关键节点人工介入,与AI共同完成任务,不仅效果更好,人也轻松许多,不再频繁抱怨AI。

智能体大佬观点
20:14
歸藏(guizang.ai)@op7418
67
在字节工作8年的动效设计师笑林(@xiaolinbythesea)分享了设计工程师的五种画像:1) AI Design Engineer--将AI能力转化为可交互产品;2) Product UI Craft Engineer--从Figma写出高质量React原型;3) Design Systems Engineer--建立设计系统与代码基础设施;4) Creative Technologist--负责Canvas/WebGL动效与生成式视觉;5) AI Design Workflow Architect--搭建AI工具协作流程。他所在的豆包手机团队也在招聘侧重Android的设计工程师。

笑林: Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...

智能体现象/趋势
‹ 上一页
1…3435363738…50
下一页 ›