AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Agent」清除
6月12日周五
00:08🚨 AI News | TestingCatalog71OpenAI 收购云执行平台 Ona,增强 Codex 智能体能力
6月11日周四
23:37AYi71Claude Fable 5 一句话生成落地页,花费超$1000
23:27向阳乔木75精选Codex Goal指令生成Skill发布:一句话需求转目标
22:58Rohan Paul52Parloa 推出基于 MCP 的 Agent Skills,零代码替代 API 胶水代码
22:31elvis51高效利用AI智能体:路由与循环
22:11Lee Robinson56Cursor 正用当前版 Composer 训练下一代,形成递归自我改进循环
21:58Rohan Paul61智能体软件:AI智能体如何重构软件范式
19:43Google DeepMind62Google DeepMind 启动千万美元研究 AI 群体行为
19:30Artificial Intelligence News(RSS)61Visa 与 ChatGPT 集成,AI 智能体可实现零售购买
19:00Artificial Intelligence News(RSS)52Xebia:构建AI智能体的数据基础并加速
18:50公众号:卡尔的AI沃茨77开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流
18:31IT之家(RSS)57京东发布国内首个智能体自主支付协议A2P2,划分L0至L5六个等级
18:20SiliconFlow71同事件精选Hermes Agent Desktop 发布,硅基流动支持一键切换同一事件,精选展示《NousResearch 发布 Hermes Agent 桌面应用公测版》
18:09Berryxia.AI76小米开源终端AI编码助手MiMo-Code,支持跨会话记忆与子代理
17:59HuggingFace Daily Papers(社区热门论文)63TRACE:面向高效智能体强化学习的统一 Rollout 预算分配框架
17:54MarkTechPost(RSS)59Nous Research 发布 Hermes Agent Profile Builder:身份、模型、技能和 MCP 服务器一站式仪表盘流
17:34Peter Steinberger 🦞78精选Codex 维护仓库:5分钟循环并行自治
17:31IT之家(RSS)71精选阿里云发布 Meoo CLI:本地 AI 编程项目可一键部署上线
17:06Alibaba Cloud42阿里云发布ApsaraDB Enterprise Agents数据库智能体
16:30IT之家(RSS)50Meta 已完成与 Manus 运营分离:停止数据共享,内网也禁止访问
15:30IT之家(RSS)42追觅Eclix品牌负责人俞雷:AI手机预计2026年9月发布,定价5000元以上
15:24ginobefun44BestBlogs 推出世界杯特刊及预测 Agent
14:25向阳乔木50Codex Goal指令让AI自主开发网站运行10小时
13:35数字生命卡兹克69WorkBuddy从0到1教程:国内最友好的通用Agent产品,对标Claude Code和Codex
13:22宝玉71宝玉改用Fable 5并建议像渣男一样组合使用多模型
13:09Berryxia.AI64Agent 互相学习新思路:基于 MemOS CLI 的共享记忆
12:58HuggingFace Daily Papers(社区热门论文)68Claw-SWE-Bench:评估OpenClaw风格智能体框架编程能力的多语言基准
11:58HuggingFace Daily Papers(社区热门论文)68基于假设树优化的通用自主研究框架Arbor
11:30IT之家(RSS)61Xcode 27 Beta 原生集成谷歌 Gemini,三大 AI 编程智能体齐聚苹果开发平台
11:21宝玉65Claude Code + Fable 5 全自动剪辑视频工作流
11:21宝玉57DeepSeek 招聘 Agent Harness 研究员(实习/全职)
10:58HuggingFace Daily Papers(社区热门论文)59InternVideo3:多模态上下文推理增强基础模型的长时序智能体能力
10:58HuggingFace Daily Papers(社区热门论文)69面向大语言模型智能体的环境工程综述
10:50公众号:小米 MiMo74精选小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议
10:50公众号:数字生命卡兹克70精选从0到1速通WorkBuddy:国内通用Agent产品教程
09:25meng shao75小米发布MiMo Code:基于OpenCode的Coding Agent,14天5人Vibe Coding完成
08:55Rohan Paul67Agents' Last Exam 基准:AI 智能体在真实专家任务中远未达标
08:55meng shao62Agentic Engineering Patterns 指南
08:55meng shao69Claude Fable 5 零传统视频编辑的 4K Launch 视频生产实践
08:35AYi56Cursor agent跑飞90分钟烧1382美元,CEO主动退款并承诺增加支出控制
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
00:08
🚨 AI News | TestingCatalog@testingcatalog
71
OpenAI 已达成协议收购云执行平台 Ona,其安全云执行技术将帮助 Codex 处理更长时任务(即使笔记本关闭也能继续运行),并让更多组织在生产环境中安全部署智能体。收购完成后,Ona 团队将加入 OpenAI 的 Codex 部门,此举或预示着托管 OpenAI 智能体服务的到来。

OpenAI Newsroom: We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...

智能体OpenAI行业动态部署/工程
6月11日
23:37
AYi@AYi_AInotes
71
用户分享 Claude Fable 5 体验:仅靠一句指令"给你自己做个落地页,自由发挥,要2026最新设计趋势,要彩蛋",Fable 5 在几分钟内自动生成完整单文件 HTML,无需任何修改。它主动搜索 2026 设计趋势、调整配色和动效,并偷偷藏了 3 个彩蛋。用户惊叹其代码质量和文笔,但当天因使用 Fable 5 耗费超过 $1000,称"真的贵"。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

智能体Anthropic教程/实践编码
23:27
向阳乔木@vista8
精选75
Codex Goal指令生成Skill发布:一句话需求转目标

针对如何给Codex写Goal指令的问题,作者发布了一个Skill,可将一句话需求自动转化为目标,实现“睡前写指令、模型自动开发、第二天收菜”。安装命令:npx skills add joeseesun/qiaomu-goal-meta-skill。源码免费开源(见评论区),旨在简化4w字文档的阅读负担。

智能体OpenAI教程/实践编码

推荐理由:如果你也用Codex写代码但老写不好Goal,乔木这个Skill能直接把一句话需求转成高标准指令,安装即用,今晚就能试试睡觉“收菜”的体验。
22:58
Rohan Paul@rohanpaul_ai
52
Parloa 发布 Agent Skills,基于 Model Context Protocol (MCP) 构建,旨在替代脆弱的 API 胶水代码。业务团队可在 AI Agent 管理平台 (AMP) 上零代码配置完整集成链,集成时间从 4-8 周缩短至数小时。关键特性包括:工具调用逻辑一致且能自愈、可定义成功条件追踪真实结果、执行链可审计可重试。早期数据:平均处理时间减少 67 秒,通话转接中客户沟通提升 39%,多工具路由可靠性提高 20%。首个集成一天完成,第二个仅一小时,后续用例只需配置。一家 Top-10 旅游公司平均处理时长缩短超一分钟。

Parloa: Introducing Parloa's Agent Skills: a better way for CX leaders to connect AI agents to the enterprise systems they need ...

智能体MCP/工具产品更新
22:31
elvis@omarsar0
51
越来越多地,我有效利用智能体的方式: 路由--将不同任务路由到正确的智能体 循环--指令 + 技能 + 动态工作流 + 自动化 这就是你如何更好地控制成本和性能,以及更好地为未来的变化做准备。
智能体大佬观点
22:11
Lee Robinson@leerob
56
Cursor 正用当前版 Composer 训练下一代,形成递归自我改进循环

Cursor 正用当前版 Composer 训练下一代 Composer,形成递归自我改进循环。训练大型模型需要大量 RL 数据(模型通过“游戏”提升能力),新模型能自动配置开发环境(如自动安装依赖、修复故障)。Composer 2 在环境配置能力上显著优于版本 1,模型越强,越擅长创造训练其继任者的条件。Cursor 的 autoinstall 系统让前代 Composer 设置 RL 训练环境,使下一代专注于解决更难题,每一代都解锁先前版本不具备的能力。

Cursor: We use previous generations of Composer to train future ones. Our autoinstall system has earlier Composer models set up ...

智能体大佬观点编码
21:58
Rohan Paul@rohanpaul_ai
61
智能体软件:AI智能体如何重构软件范式

该论文认为,AI智能体可能使软件从固定代码转变为按需规划和构建的系统,代码不再是核心产物。传统软件预先固化规则,而智能体在运行时将意图转化为行动,把代码视为一次性工具。真正转变是从“预设计行为”到“协商式行为”,系统随条件变化不断解读目标。但这也带来新风险:静态程序在可检查边界内失效,智能体可能因漂移、过度自信、记忆错误或逐步放大早期错误而失败。未来工程师的关键能力是定义意图、约束自主性、设计评估、检查推理痕迹,并辨别流利回复与可靠系统的区别。

智能体大佬观点编码
19:43
Google DeepMind@GoogleDeepMind
62
当数百万个AI智能体相互交互时,新的集体行为可能涌现。🌐 与 @schmidtsciences、@coop_ai、@ARIA_research 合作,并由 @GoogleOrg 支持,我们正在启动一个1000万美元的研究基金,以帮助理解AI系统在群体中的行为。→ https://goo.gle/3Si6rCl
智能体行业动态
19:30
Artificial Intelligence News(RSS)
61
Visa 与 ChatGPT 集成,AI 智能体可实现零售购买

Visa 将支付基础设施接入 ChatGPT,使 AI 智能体能够推荐零售产品并执行金融交易。该部署去除了零售漏斗最后阶段的人工干预——自主智能体将处理用户提示、评估商家目录,并利用 Visa 支付通道在任何支持商户处完成结账流程。

智能体MCP/工具OpenAI产品更新
19:00
Artificial Intelligence News(RSS)
52
Xebia:构建AI智能体的数据基础并加速

Xebia全球CTO Niels Zeilemaker指出,为组织引入AI智能体加速流程必须从数据基础着手——让数据可供AI消费。Agentic AI的规模取决于数据强度,忽视这一点将无法推进。

智能体大佬观点数据/训练
18:50
公众号:卡尔的AI沃茨
77
开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流

Claude Fable 5(Mythos 安全公开版)6月22日前对 Pro/Max/Team 订阅用户开放,之后转 API。作者用 100 美元/月的 Max 会员,让 Fable 5 开发了开源“鲁班 Skill”,专用于打磨其他 AI Skill。该 Skill 通过前提验证(真实问题、安装理由、唯一性)、并行搜索同类(GitHub/ClawHub/skills.sh 等)、横纵分析、Darwin 式 9 维度评分(权重最高的实测表现)、SkillOpt 式单方向改写等步骤,将作者已有的 ai-news-radar 项目升级至 v0.7。Fable 5 自动录制操作视频并剪辑,追加了热点模式和时间轴模式,改进了消息评分算法并公开回测工具。鲁班 Skill 已开源至 github.com/LearnPrompt/luban-skill,强调 Skill 本质是清晰提示语而非复杂脚本。

智能体AnthropicGitHub开源/仓库
关联讨论 31 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
18:31
IT之家(RSS)
57
京东发布国内首个智能体自主支付协议A2P2,划分L0至L5六个等级

京东6月11日发布国内首个智能体自主支付协议A2P2,将支付自主化划分为L0至L5六个等级,重点聚焦L3和L4。L3智能体可在单一任务内自主发起支付请求;L4在预设范围内自主完成支付。协议引入任务委托凭证(Mandate),将自然语言指令转为可校验凭证。资金安全方面首创ARI机制,支付时绑定真实用户、智能体身份与运行环境,三方核验通过才放行。另设专用隔离账户限制金额、场景、有效时间等。支付后形成证据闭环,通过存证链确保每笔AI交易可审计。

智能体产品更新安全/对齐
18:20
SiliconFlow@SiliconFlowAI
同事件精选71
@NousResearch 发布了 Hermes Agent Desktop--现在通过 @硅基流动 SiliconFlow 使用前沿开源模型更加便捷 🔥 → 一键随时切换模型--DeepSeek-V4、GLM-5.1、Kimi-K2.6、MiniMax-M3 等,均在硅基流动上 … … 通过硅基流动开启你的 Hermes 之旅的完整指南 👇🧵
智能体开源生态教程/实践
同一事件,精选展示《NousResearch 发布 Hermes Agent 桌面应用公测版》
推荐理由:虽然 Hermes Agent Desktop 不是新物种,但 SiliconFlow 这趟手把手教程让切换国产开源模型变得极其顺手,想做桌面 Agent 的读者可以立刻跑起来。
18:09
Berryxia.AI@berryxia
76
小米开源MiMo-Code,为终端原生AI coding助手,fork自OpenCode。新增SQLite持久记忆实现跨会话永久记忆,配备build/plan/compose三类子代理、自动checkpoint、智能上下文预算,及/dream自我提炼知识与/distill打包技能进化机制。零配置支持任何OpenAI兼容模型,一键curl安装,MIT协议。此前MiMo 2.5模型已接入Bloome作为Agent使用,且MiMo-Code限时免费。

Berryxia.AI: 最近把小米的MiMo 2.5 的模型接到Bloome 中当Agent 来使用! 发现把技能配置好,自主执行任务也是不错的!关键是真的便宜啊! 这不又来整活儿了? 他们把MiMo-Code直接开源,这终端原生AI coding助手带跨会话永久...

智能体开源/仓库编码
关联讨论 2 条Hacker News 热门(buzzing.cc 中文翻译)X:小米 MiMo (@XiaomiMiMo)
17:59
HuggingFace Daily Papers(社区热门论文)
63
TRACE:面向高效智能体强化学习的统一 Rollout 预算分配框架

TRACE 针对多轮智能体 RL 中因提示复杂度差异和仅有最终奖励导致的奖励对比度不足问题,将每个 ReAct 轮次视为语义独立节点,把预算分配从 prompt 根节点扩展到中间前缀,形成树结构 rollout。它使用可共享预测器根据前缀历史估计条件成功概率,优先向易产生混合奖励的节点分配有限采样预算,从而增强策略更新信号。在典型智能体基准上,TRACE 以相同采样成本使 Qwen3-14B 在 Multi-Hop QA 上的准确率提升 2.8 个百分点。

智能体arXiv推理论文/研究
17:54
MarkTechPost(RSS)
59
Nous Research 发布 Hermes Agent Profile Builder:身份、模型、技能和 MCP 服务器一站式仪表盘流

Nous Research 为 Hermes Agent 仪表盘新增 Profile Builder,用户可在单一流程中构建包含身份、模型、技能和 MCP 服务器的完整 Agent 配置文件,替代以往多步 CLI 配置方式。

智能体MCP/工具产品更新
17:34
Peter Steinberger 🦞@steipete
精选78
一个简单的循环:告诉 Codex 维护你的仓库,每5分钟唤醒一次,将工作直接分配到线程。这样可以轻松按需并行化和导向工作。 我使用一个编排器技能,结合我的分类+自动审查+计算机使用技能,因此部分工作可以自主落地。
智能体开源/仓库编码

推荐理由:Peter Steinberger 这个 orchestrator + triage 的技能组合,让 AI 代理能近乎自主地维护 repo,做开源项目的可以直接抄。
17:31
IT之家(RSS)
精选71
阿里云发布 Meoo CLI:本地 AI 编程项目可一键部署上线

阿里云今日推出 Meoo(秒悟)开源命令行工具 Meoo CLI,面向开发者,支持 Claude Code、Codex、Cursor 等本地 AI 编程助手。通过调用阿里云云端能力,可自动完成数据库接入、用户登录、文件存储及项目发布,将本地项目一键部署上线并生成可分享的访问链接。该工具定位为本地 Agent 与秒悟云端能力的连接入口,已开放下载,支持主流 Linux、macOS 及 Windows 平台。

智能体产品更新开源/仓库部署/工程

推荐理由:本地AI编程工具产出的项目终于有了一条直通云端的管道,Meoo CLI 把数据库、鉴权、部署这些脏活全包了,非前端也可以把原型直接变成产品。
17:06
Alibaba Cloud@alibaba_cloud
42
阿里云发布ApsaraDB Enterprise Agents数据库智能体

阿里云宣布推出ApsaraDB Enterprise Agents,即内置于数据库中的AI原生智能体,可自主执行分析、治理、数据准备等运维任务,无需人工干预;具备企业级安全能力(细粒度访问控制、数据脱敏、token管控),并能自我学习适应。相关活动将于2026年6月24日10:00(UTC+8)线上举办,时长30分钟。

智能体数据/训练行业动态
16:30
IT之家(RSS)
50
Meta 已完成与 Manus 运营分离:停止数据共享,内网也禁止访问

据彭博社报道,Meta 已完成与 Manus 的运营分离,停止两家公司数据共享。自本月初起,Meta 禁止 Manus 及其员工访问其内部数据系统,Meta 员工也无法再为内部项目使用 Manus 工具。去年 12 月,Meta 宣布以约 20 亿美元收购 Manus 母公司蝴蝶效应;今年 4 月,中国外商投资安全审查机制禁止该交易,要求撤销收购。今年 6 月,Manus 将总部迁至新加坡并停止国内运营。今年 5 月报道称,Manus 创始人肖弘、季逸超、张涛正考虑融资约 10 亿美元回购公司。

智能体Meta行业动态
15:30
IT之家(RSS)
42
追觅Eclix品牌负责人俞雷:AI手机预计2026年9月发布,定价5000元以上

追觅生态品牌Eclix负责人俞雷透露,团队已与国内头部大模型厂商达成合作,预计2026年9月发布第一代AI手机,双十一前上市,定价5000元以上。首代产品出货量控制在5万-10万台,京东线上首发,目标极客用户。盈利模式为AI算力服务订阅,按token消耗实时计费。当前最大妥协是无法打通所有App,需为微信等超级App保留“旧世界逃生窗口”,传统App界面作为兜底方案。

智能体产品更新端侧
15:24
ginobefun@hongming731
44
BestBlogs 推出世界杯特刊及预测 Agent

距离世界杯开幕战不到 12 小时,BestBlogs 的两位站长制作了世界杯特刊(https://www.bestblogs.dev/worldcup),方便球迷在看球前快速了解信息、赛后闲聊。此外还做了一个「普神」Agent 来预测每场比赛胜负,用户也可参与选择。

智能体产品更新
14:25
向阳乔木@vista8
50
Codex Goal指令让AI自主开发网站运行10小时

推文称Codex的Goal指令功能强大,一个网站开发任务已连续运行10小时,AI自动完成开发、测试、部署和上线,且功能持续完善。作者预告的AI资讯订阅RSS站已开放体验,链接为 https://rss.qiaomu.ai/。

智能体OpenAI教程/实践编码
13:35
数字生命卡兹克@Khazix0918
69
WorkBuddy从0到1教程:国内最友好的通用Agent产品,对标Claude Code和Codex

WorkBuddy是一款国内通用Agent产品,支持Windows和Mac,微信扫码登录,个人专业版58元/月。界面提供Ask/Plan/Craft三种工作模式和代码开发、日常办公、设计创意三个场景,内置DeepSeek V4 Pro、腾讯混元、GLM、Kimi等国产模型。专家中心有100多个垂直领域AI专家,支持专家团多Agent协作。技能市场(Skills)和MCP连接器可打通QQ邮箱、腾讯会议、腾讯文档等生态,也支持自建技能和连接器。上周五腾讯推出WorkBuddy企业版。

智能体MCP/工具教程/实践
13:22
宝玉@dotey
71
宝玉改用Fable 5,称其处理复杂任务更省心但很贵。他建议不依赖单一模型,应组合使用:Opus 4.8写作弱但UI和系统设计强,可用Claude Design设计后分别交给GPT-5.5和Opus 4.8实现对比。在Claude Code和Cursor中,Opus 4.8除写作外效果良好,需针对性调提示词。

宝玉: 你不能指望一个模型在什么地方都是最强的,要像渣男一样才能用好 AI:去爱很多模型,去发掘他们的优秀点,东食西宿,组合着用 Opus 4.8 在写作不太行,但是在 UI 设计,UI 实现比 GPT-5.5 要好很多,推荐你多用用 Claude...

智能体AnthropicOpenAI教程/实践
13:09
Berryxia.AI@berryxia
64
当前 Agent(如 Codex、Claude、Hermes、OpenClaw)各自有记忆但不连通,导致重复问、重复踩坑。通过改造 MemOS CLI,建立一层"共享记忆"--只记录关键结论、失败教训、环境配置等,Agent 遇到解决不了的问题时才主动搜索。一台 Mac 上跑通的流程另一台可直接继承,Agent 之间像团队一样积累和传递经验,减少重复试错。

huangserva: 如何让多个 Agent 之间真正互相学习、互相帮助? 现在很多 Agent 都开始有自己的记忆,但问题是: 这些记忆彼此不连通。 Codex 记住的坑,Claude 不知道;Hermes 总结的方法,OpenClaw 也用不上。 最后每个 ...

智能体大佬观点开源生态
12:58
HuggingFace Daily Papers(社区热门论文)
68
Claw-SWE-Bench:评估OpenClaw风格智能体框架编程能力的多语言基准

Claw-SWE-Bench是一个多语言SWE-bench风格基准和适配器协议,用于在公平设置下比较通用智能体框架(claws)的编程能力。完整基准包含350个GitHub issue解决实例,覆盖8种语言和43个仓库,来源于SWE-bench-Multilingual和SWE-bench-Verified-Mini。同时发布80实例的Lite子集用于快速验证。在完整基准上,OpenClaw搭配最小适配器仅得19.1% Pass@1,而完整适配器使用相同GLM 5.1骨干达到73.4%,表明适配器设计至关重要。模型选择改变Pass@1达29.4个百分点,框架选择改变27.4个百分点;相似精度的系统总API成本差异巨大。Claw-SWE-Bench将框架和成本核算作为SWE风格编码智能体评估的第一类维度。

智能体开源/仓库编码评测/基准
11:58
HuggingFace Daily Papers(社区热门论文)
68
基于假设树优化的通用自主研究框架Arbor

Arbor是一个结合长期协调器、短期执行器和假设树优化(HTR)的通用自主研究框架。该框架通过持久化树结构跨时间链接假设、工件、证据和提炼洞察,将自主研究从局部尝试转变为累积过程。在模型训练、工具工程和数据合成等六个真实研究任务中,Arbor均取得最佳留出结果,平均相对留出增益超过Codex和Claude Code的2.5倍。在MLE-Bench Lite上,Arbor使用GPT-5.5达到86.36%的Any Medal,为对比中最优成绩。

智能体论文/研究
11:30
IT之家(RSS)
61
Xcode 27 Beta 原生集成谷歌 Gemini,三大 AI 编程智能体齐聚苹果开发平台

Xcode 27 Beta 新增原生谷歌 Gemini 集成,成为继 OpenAI Codex 和 Anthropic Claude Agent 之后第三个内置的 AI 编程智能体。开发者无需切换工具或窗口,即可在 Xcode 内完成构建新功能、审查代码和修复 Bug 等复杂多步骤任务。通过 Intelligence 设置面板配置 Gemini 后,Gemini 能理解项目上下文、辅助生成样板代码,并根据项目文档和文件结构更新整个项目。

智能体Google产品更新编码
11:21
宝玉@dotey
65
Claude Code + Fable 5 全自动剪辑视频工作流

视频完全摒弃 Premiere/Final Cut,由 Claude Code 配合 Fable 5 通过代码与命令行自动剪辑。流程:本地 Whisper 转写 25GB 素材(17 个 Take,4 场景),生成毫秒级单词时间戳 JSON;Subagent 剔除停顿废片选出最佳镜头;代码调用 FFmpeg 自动粗剪;AI 手写 LUTs 调色代码并生成带滑块的 HTML 页面供人工调整;静态图形转为 React 的 Remotion 动画组件,利用时间戳精准卡点;通过 Figma MCP 将画面导出至 Figma 供设计优化,再自动抓回代码,渲染 4K 24fps。作者全程未触碰视频编辑器。

Thariq: Lots of people asked how I used Fable to edit its own launch video so I made a video about that! TLDR it wrote a lot of ...

智能体Anthropic教程/实践视频
11:21
宝玉@dotey
57
DeepSeek 招聘 Agent Harness 研究员(实习/全职)

DeepSeek 开放 Agent Harness 研究员岗位(实习/全职),工作地点杭州/北京。团队使命为 “Model + Harness = Agent”,旨在将模型能力转化为 Agent 产品。职责涵盖:上下文管理、长期记忆、Subagent 与 Multi-Agent、自进化 Agent 等前沿创新;实现模型与 Harness 的深度适配;构建 Harness 领域评测基准;基于真实任务与用户反馈迭代 Agent 能力。要求硕士以上学历、2年科研经验、全栈开发能力、Agent 产品重度用户,熟悉 LLM 及 Agent 机制(KV Cache、Tool Use、Reasoning、MCP 等)。

智能体DeepSeek行业动态
10:58
HuggingFace Daily Papers(社区热门论文)
59
InternVideo3:多模态上下文推理增强基础模型的长时序智能体能力

InternVideo3框架通过多模态上下文推理(MCR)提升基础模型的长时序多模态任务能力。MCR将理解视为包含观察、指令、推理、工具行动和记忆的闭环过程,将长视频理解为证据积累与验证。为提升效率,引入多模态多头潜在注意力(M²LA),一种保留完整token流同时压缩KV-cache状态的token保持重参数化。训练阶段包括继续预训练、短到长监督微调、基于规则的强化学习和在线蒸馏。InternVideo3在Video-MME、MLVU、EgoSchema等基准上取得强性能,并实例化为带有检索工具的视频智能体,展现基于证据的鲁棒行为。

智能体多模态推理视频
10:58
HuggingFace Daily Papers(社区热门论文)
69
面向大语言模型智能体的环境工程综述

该综述系统研究了大语言模型智能体的环境工程生命周期,涵盖环境建模、合成、评估与应用。从八个属性和八个领域梳理代表性环境的发展路径;归纳自动环境合成的符号合成与神经合成两种范式及对应评估方法。从智能体-环境共同演化视角,总结四种智能体演化路径(记忆中心、编排中心、轨迹中心、探索中心)与三种环境演化范式(神经驱动、难度驱动、规模驱动)。最后展望环境即服务(EaaS)、多智能体环境和神经符号环境等方向。

智能体论文/研究
10:50
公众号:小米 MiMo
精选74
小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议

小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议。内置限时免费MiMo-V2.5多模态模型,性能比肩Claude Sonnet 4.6;支持接入DeepSeek、Kimi、GLM等模型。核心能力包括持久记忆系统(项目记忆、会话检查点、任务进度)和无限上下文——通过独立subagent自动保存状态解决长会话遗忘。独创Compose模式实现模型与Agent协同优化,SWE-Bench Pro达62%(Claude Code 57%),Terminal Bench 2达73%(68%)。内置语音输入和/dream命令,每7天自动合并记忆。终端输入mimo即可使用,所有设置中文汉化。

智能体产品更新开源生态编码
关联讨论 2 条Hacker News 热门(buzzing.cc 中文翻译)X:小米 MiMo (@XiaomiMiMo)
推荐理由:小米悄悄发了MiMo Code,开源且免费,用记忆系统和Compose模式解决了AI编程两大顽疾:健忘和跑偏,实测比同模型Claude Code更强,开发者现在就能装上试。
10:50
公众号:数字生命卡兹克
精选70
从0到1速通WorkBuddy:国内通用Agent产品教程

WorkBuddy是面向国内用户的通用Agent产品,支持Windows和Mac,提供免费版和58元/月个人专业版,企业版已推出。内置代码开发、日常办公、设计创意三种场景模式及100多个行业领域AI专家。模型集成腾讯混元、DeepSeek(推荐V4 Pro)、GLM、Kimi等国产大模型,也支持接入兼容OpenAI协议的外部API。拥有Skills市场和MCP连接器生态,可打通QQ邮箱、腾讯会议、腾讯文档等服务。教程通过公众号周报生成和功能网页开发两个案例演示实际用法。

智能体MCP/工具教程/实践
关联讨论 1 条公众号:数字生命卡兹克
推荐理由:补上那批「好是好但用不了」的遗憾,WorkBuddy 用微信扫码登录加技能市场把门槛拉到地面,这篇从 0 到 1 的教程能让你半天内把日常办公任务自动化掉。
09:25
meng shao@shao__meng
75
小米发布MiMo Code:基于OpenCode的Coding Agent,14天5人Vibe Coding完成

小米发布MiMo Code,一款基于OpenCode fork开发的Coding Agent。由5人团队在14天内通过Vibe Coding完成,保留OpenCode核心能力,叠加记忆、上下文管理、子智能体编排、Goal驱动自主循环、Compose工作流及Dream/Distill自我进化机制,技术栈为TypeScript+Bun。内置MiMo Auto限时免费通道(零配置),支持小米MiMo平台OAuth、Claude Code认证迁移及任意OpenAI兼容API。作为MiMo-V2.5系列模型的官方配套Harness,模型能力与框架深度耦合。已开源至GitHub。

Fuli Luo: A strong model evolution needs a solid harness system, and vice versa. 14 days, 5 people, one vibe-coding journey - and ...

智能体MCP/工具产品更新开源生态
08:55
Rohan Paul@rohanpaul_ai
67
Agents' Last Exam 基准:AI 智能体在真实专家任务中远未达标

一篇新论文提出“Agents’ Last Exam”基准,测试 AI 智能体完成真实专家工作的能力。任务来自工程、金融、医学、法律、媒体、科学等 55 个数字工作领域的实际项目,要求智能体使用文件、浏览器、命令行、桌面软件等常规工具产出可交付成果。评测采用自动检查或严格评分标准。结果显示,当前最强智能体在最难任务层级的平均完全通过率仅 2.6%,远低于其基准测试分数所暗示的水平。论文指出,基准成功尚未转化为广泛的职场能力。

智能体arXiv论文/研究评测/基准
08:55
meng shao@shao__meng
62
Agentic Engineering Patterns 指南

Simon Willison 撰写《Agentic Engineering Patterns》指南(2026年2月起连载),阐述专业工程师如何用 Claude Code、Codex 等 coding agent 获得可靠可维护结果。核心区分:Agentic Engineering ≠ Vibe Coding。关键判断:写代码变便宜了,写好代码并没有。五大原则:定义边界(人的工作:定目标、给工具、验结果、把经验写回 harness)、接受新约束、囤积可复用解法、质量应上升而非下降、严守反模式(绝不自审 PR)。实操:Git 作 agent 时间机器、Subagent 省上下文、三层测试防线、线性代码导读消除认知债。

Simon Willison: @jakedahn I've been writing a whole guide! https://simonwillison.net/guides/agentic-engineering-patterns/

智能体MCP/工具教程/实践编码
08:55
meng shao@shao__meng
69
Claude Fable 5 零传统视频编辑的 4K Launch 视频生产实践

Claude Fable 5 通过纯提示驱动,端到端生成 4K Launch 视频。从 17 个 Sony S-Log3 4K take(约 25GB)出发,流程包括:Whisper 逐词转录、Claude 作为子 agent 选片输出 JSON 编辑决策列表 (EDL)、FFmpeg 拼接粗剪、手写 7 个自定义 .cube LUT 颜色分级、通过 Remotion + Figma MCP 将 11 张设计 PNG 转为 React 组件并实现代码↔Figma 往返迭代。最终渲染 3840×2160@24fps、4334 帧、653MB 成品,全程未打开视频编辑器。

Thariq: Lots of people asked how I used Fable to edit its own launch video so I made a video about that! TLDR it wrote a lot of ...

智能体AnthropicMCP/工具教程/实践
08:35
AYi@AYi_AInotes
56
Cursor agent跑飞90分钟烧1382美元,CEO主动退款并承诺增加支出控制

一名PM让Cursor agent给87个ClickUp任务打标签后去开会,90分钟后回来发现agent陷入循环,消耗13亿token,账单1382美元。Cursor CEO@mntruell主动联系用户全额退款,承诺增加支出控制与自动异常检测功能,并将bug修复纳入产品路线图。原作者称赞Cursor不推诿不甩锅,把事故转化为品牌资产净增长。

Mark Ajzenstadt: BREAKING: Cursor just charged us $1,400 in 90 minutes. Our PM asked it to tag 87 ClickUp tasks. He went into a meeting. ...

智能体现象/趋势编码
‹ 上一页
1…2930313233…50
下一页 ›