AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Agent」清除
6月17日周三
00:22Google Gemini64Gemini 推出 Daily Brief AI 晨间助手
00:01StepFun51阶跃星辰 Step 3.7 Flash 登陆 Novita 与 OpenRouter
6月16日周二
23:52elvis43Hermes Agent上线/teach技能
23:49Hacker News 热门(buzzing.cc 中文翻译)68现在运行本地模型效果不错
23:47凡人小北70WorkBuddy:被低估的工作场景 Agent 产品
23:31Xiaomi MiMo70小米 MiMo Claw 上线:旗舰 AI 模型+金山办公集成
23:28Rohan Paul61Claude Code 开发者 Boris Cherny:用循环替代手动提示;neo-mcp 为 Claude Code 配备本地 AI 工程工人 Neo
23:22elvis38OpenClaw-Skill:搜索技能树构建智能体可复用技能库
23:17凡人小北65WorkBuddy日活已达第二名的3-4倍以上,非技术岗用户大量涌入
23:15数字生命卡兹克63卡兹克谈WorkBuddy:被低估的通用Agent场景,日活已达第二名3-4倍以上
23:00Ethan Mollick58企业AI的"正常技术"阶段或为过渡点
22:48jason51为Codex和Claude Code打造游戏导演技能系统
22:30公众号:小米 MiMo69精选小米 MiMo Claw 正式版发布:旗舰模型+金山办公,全新订阅服务上线
22:01IT之家(RSS)42腾讯张军:智能体 WorkBuddy 将入职政务系统,全国首个省级政务智能中枢「湾擎」上线试运行
22:01IT之家(RSS)73小米 MiMo Claw 正式版发布,搭载 MiMo-V2.5-Pro 旗舰模型
21:30公众号:数字生命卡兹克67同事件精选WorkBuddy日活飙升至行业第二的3-4倍,非技术用户涌入同一事件,精选展示《从0到1速通WorkBuddy:国内通用Agent产品教程》
21:04AYi55OpenAI Codex 2026版全景:架构、生态横评与最佳实践
21:01IT之家(RSS)32腾讯网盘官宣"COMING SOON":多应用数据互通、支持 Agent 调用
20:47Hacker News 热门(buzzing.cc 中文翻译)72SpaceX将以600亿美元收购Cursor AI旗下编程代理运营商Anysphere
20:29meng shao60LandingAI 推出 Agentic Document Extraction 的 Agent Skills
20:01IT之家(RSS)52微信正测试 AI 支付功能,"AI 专属卡"最快本周内上线
19:45🚨 AI News | TestingCatalog43Anthropic撤销Claude订阅编程使用暂停计划
18:28Rohan Paul52Claude Code的设计空间:简单AI循环与复杂外围系统
17:47MarkTechPost(RSS)69Hermes Agent 新增异步子代理,委托工作不再阻塞父聊天
17:17MarkTechPost(RSS)54Atoms:MetaGPT团队推出的AI智能体协作vibe coding平台
16:40MarkTechPost(RSS)71精选Google Cloud 推出 OKF v0.1:供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文
16:28HuggingFace Daily Papers(社区热门论文)49GD2PO:通过分组动态奖励解耦策略优化缓解多奖励冲突
16:00IT之家(RSS)64高通CEO安蒙:正设计40多款新AI设备,智能体将取代应用
15:07TechCrunch:AI(RSS)58马来西亚AI智能体消息应用Respond.io获6250万美元融资,瞄准收购
15:05🚨 AI News | TestingCatalog75精选Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型
15:00公众号:卡尔的AI沃茨61Claude终于松口,第三方Agent能共享额度了
15:00IT之家(RSS)60阿里云:QoderWork 上线"意识"功能,让 AI 学会记忆、反思和成长
14:30公众号:火山引擎40双第一!火山引擎领跑中国智能体开发平台市场
13:58OpenRouter:Announcements(RSS)68精选智能体AI治理:你的API密钥就是护栏
12:33Alibaba Cloud20阿里云VivaTech 2026探讨AI Agent重塑商业
11:27HuggingFace Daily Papers(社区热门论文)55VisualClaw:面向物理世界的实时个性化多模态智能体
11:07Hacker News 热门(buzzing.cc 中文翻译)50无人经济?从技术上讲并非不可能
11:01公众号:卡尔的AI沃茨61ClawHunt:AI Agent赏金市场的交付验证与真实测试
11:00IT之家(RSS)64微软推Intelligent Terminal:Win11终端集成AI智能体
11:00IT之家(RSS)70精选AI 版支付宝官宣开启邀测:右滑打开"阿宝",官方放出 100 个邀请码
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月17日
00:22
Google Gemini@GeminiApp
64
Gemini 推出 Daily Brief AI 晨间助手

Gemini 应用推出名为 Daily Brief 的新 AI 智能体,用户可在起床前用它规划一天。官方提供三条使用建议:1)通过点赞或踩直接反馈,训练 Gemini 了解偏好;2)直接与 Gemini 对话,对简报内容提问或调整;3)点击简报项下方的“更多”按钮,查看 Gemini 引用的具体邮件、聊天或 Google 日历事件来源。目前该功能已上线,官方持续收集用户反馈以改进体验。

智能体Google产品更新
00:01
StepFun@StepFun_ai
51
阶跃星辰的 Step 3.7 Flash 已通过 Novita 在 OpenRouter 上线。该模型专为高效智能体工作负载设计,具备原生多模态理解、强智能体编码能力、可靠工具使用,以及网页与视觉搜索工作流。引用信息强调其高效多模态推理和多步工具使用能力,主要面向编码与智能体应用场景。

Novita AI: 🚀 Step 3.7 Flash from @StepFun_ai is now available via Novita on @OpenRouter. High-efficiency multimodal reasoning. Mul...

智能体多模态推理模型发布
6月16日
23:52
elvis@omarsar0
43
有机会尝试了 @mattpocockuk 的/teach 技能。 它类似于我的/learn 技能。 你现在就可以在我们的 academy 中使用 Hermes Agent 尝试该技能。我会暂时保持实验室免费。 用 AI 智能体学习真是太棒了。 去试试吧!
智能体教程/实践
23:49
Hacker News 热门(buzzing.cc 中文翻译)
68
现在运行本地模型效果不错

2026年6月16日,vickiboykis.com 上发布了一篇题为“Running local models is good now”的文章,作者认为当前阶段在本地硬件上运行大语言模型已经能够取得不错的效果。该文章在 Hacker News 社区引发讨论,相关帖子获得 114 点热度,表明本地模型运行体验得到了社区的认可。

智能体Google教程/实践端侧
23:47
凡人小北@frxiaobei
70
WorkBuddy:被低估的工作场景 Agent 产品

腾讯 WorkBuddy 自 3 月至今用户增长远超预期,日活数据已达到第二名产品的 3-4 倍以上,用户包括大量 HR、运营、行政等非技术岗人员,以及金融、餐饮、外贸等非互联网行业。作者将其作为 skill store 使用,可找到腾讯精选的优质 skill。引用指出其代表第三代办公 Agent 模式,对传统 Office 和云协同产品形成降维打击,近期还推出企业版和项目功能,意图抢占新一代 Agent 办公场景。

数字生命卡兹克: 聊聊这个可能被大家低估的Agent场景。 今天去了腾讯活动的现场,当了下主持和评委。 也跟很多选手,还有腾讯云的几个大佬交流了一下。 还真的有点新东西冲击的,这个确实是我在过去之前没预想到的。 最核心的点,就是整个WorkBuddy在用户增...

智能体现象/趋势
23:31
Xiaomi MiMo@XiaomiMiMo
70
小米 MiMo 推出旗舰 AI 模型 MiMo Claw,集成金山办公(Kingsoft Office)。支持 Word、Excel、PowerPoint、PDF 等工作流,通过智能体实现可靠长任务执行,token 消耗比同类方案低 40-60%。每日免费使用时长从 1 小时扩展至 4 小时,全云端无需部署。限时订阅价 ¥14.9/月。

Xiaomi MiMo Developers: 🚀 MiMo Claw is LIVE Flagship AI Model + Kingsoft Office Integration 🤖 Unlock the Full Power of Agents • Powered by MiM...

智能体产品更新
23:28
Rohan Paul@rohanpaul_ai
61
Claude Code 开发者 Boris Cherny:用循环替代手动提示;neo-mcp 为 Claude Code 配备本地 AI 工程工人 Neo

Boris Cherny(Claude Code 开发者)表示不再手动提示 Claude,而是编写循环让循环工作。@withneo 新发布的 MCP 服务器 neo-mcp 为 Claude Code 配备了本地 AI 工程工人 Neo。Claude Code 可将复杂 AI/ML 任务委托给 Neo,由其实现代码、运行实验、评估结果、调试失败运行并返回完整执行轨迹。在基准测试中,Claude Code + NEO 将任务成本从 $1.96 降至 $0.74,运行时间缩短 37%,并将后端从 PyTorch 切换为 ONNX Runtime 以优化 CPU 执行。该 MCP 服务器支持连接 Claude Code、Cursor、VS Code 等客户端,编辑器控制对话,Neo 负责执行,Claude 专注于决策而非执行噪音。

智能体AnthropicMCP/工具产品更新
23:22
elvis@omarsar0
38
OpenClaw-Skill:搜索技能树构建智能体可复用技能库

OpenClaw-Skill是一种为LLM智能体构建可复用技能库的方法。传统技能归纳通常将单条轨迹一次蒸馏成扁平的单次启发式规则,而OpenClaw-Skill通过搜索候选技能树来替代贪婪蒸馏,在迭代阶段中利用集体信号联合生成、识别和组合技能节点,最终输出结构化的技能树,旨在提升技能的多样性和泛化能力。论文详见arxiv。

智能体论文/研究
23:17
凡人小北@frxiaobei
65
WorkBuddy日活已达第二名的3-4倍以上,非技术岗用户大量涌入

腾讯WorkBuddy自3月至今,日活已达第二名的3-4倍以上。用户除开发者外,涌入大量HR、运营、行政等非技术岗,黑客松场景覆盖金融、餐饮、外贸、法律等非互联网行业。商业模式从卖软件转向卖智能,辅助用户造最适合自己的工具。已有Trae Work、QoderWork、Kimi Work等产品跟进改名。腾讯云称此为十年一遇机遇,已推出企业版和项目功能。用户也可将WorkBuddy用作skill store,获取腾讯精选skill,质量高于GitHub公开资源。

数字生命卡兹克: 聊聊这个可能被大家低估的Agent场景。 今天去了腾讯活动的现场,当了下主持和评委。 也跟很多选手,还有腾讯云的几个大佬交流了一下。 还真的有点新东西冲击的,这个确实是我在过去之前没预想到的。 最核心的点,就是整个WorkBuddy在用户增...

智能体现象/趋势
23:15
数字生命卡兹克@Khazix0918
63
卡兹克谈WorkBuddy:被低估的通用Agent场景,日活已达第二名3-4倍以上

卡兹克在腾讯活动现场发现,Agent产品WorkBuddy自3月至今用户增长远超预期,日活已是第二名的3-4倍以上;用户包括HR、运营、行政等非技术岗,黑客松场景覆盖金融、餐饮、外贸、法律等非互联网行业。他认为这代表了第三代办公产品(第一代本地Office、第二代云协同),直接帮用户完成任务。腾讯云视其为十年一遇机遇,刚推出企业版和项目功能。受此影响,Trae Work、QoderWork、Kimi Work等产品纷纷跟进改名或转型。

智能体现象/趋势
23:00
Ethan Mollick@emollick
58
我们正处于企业AI最舒适的"正常技术"阶段:它能提升生产力,但仍需整合到工作流程中--这是我们以前见过的! 然而,这很可能只是一个中转站,而非稳定阶段。AI可能会自行整合。
智能体大佬观点现象/趋势
22:48
jason@jxnlco
51
@majidmanzarpour 为 Codex 和 Claude Code 构建了一个基于 Three.js 的游戏导演技能系统,可引导 AI 智能体完成游戏循环、图形、HUD/UI、调试、QA 等流程,并可选集成 @tripoai、@ElevenLabs、@NanoBanana 的 3D/图像/音频资源。该系统已开源。Jason Liu 称赞并表示要用它做麻将游戏。

Majid Manzarpour: I built a @threejs game director skill system for Codex & Claude Code to help agents create more polished playable brows...

智能体开源/仓库编码
22:30
公众号:小米 MiMo
精选69
小米 MiMo Claw 正式版发布:旗舰模型+金山办公,全新订阅服务上线

小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版,搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 旗舰模型。该模型原生兼容 MCP 工具调用协议,内置百万级超长上下文,支持单会话千次以上连续工具调用;依托 MTP 三层解码架构,在 OpenClaw 标准 Agent 工作流中吞吐效率提升约 3 倍。ClawEval 测试中任务达标率(Pass³)达 63.8%,Token 消耗较同类产品降低 40%-60%。联动金山办公生态,提供 Word、Excel、PPT、PDF 等格式的 AI 生成、预览与在线编辑一站式服务。免费用户每日单次体验时长从1小时升级至4小时,面向高频用户推出 TokenPlan 分层订阅(Lite/Standard/Pro/Max),支持灵活叠加,限时定价14.9元/月、19.9元/月、233.8元/年。

智能体MCP/工具产品更新

推荐理由:小米给普通人用的 Agent 工具正式上线,14.9 元月费很激进,但核心还是看实际任务完成率和办公集成靠不靠谱。
22:01
IT之家(RSS)
42
腾讯张军:智能体 WorkBuddy 将入职政务系统,全国首个省级政务智能中枢「湾擎」上线试运行

6月16日,腾讯公关总监张军宣布,全国首个省级政务智能中枢平台「湾擎」上线试运行,同时预发布湾擎·WorkBuddy。该智能体基于腾讯自研AI办公智能体WorkBuddy打造,专为政务场景定制,覆盖公文辅助、材料校核、政策检索、业务咨询、流程协同、任务辅助六大高频场景。WorkBuddy即将在广东省直多个单位试点,后续面向全省铺开。「湾擎」中枢已归集100余个政务场景,适配十数款主流大模型,搭配Token级安全防护。

智能体产品更新
22:01
IT之家(RSS)
73
小米 MiMo Claw 正式版发布,搭载 MiMo-V2.5-Pro 旗舰模型

小米云端轻量化 Claw 产品正式版发布,搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 模型,原生兼容 MCP 协议,无需额外提示词。支持百万级上下文、单会话千次以上工具调用,MTP 三层解码架构使推理吞吐效率提升约 3 倍。联动金山办公,支持 Word/Excel/PPT/PDF,实现 AI 生成、预览与在线编辑闭环。ClawEval 中 Pass³ 达 63.8%,Token 消耗降低 40%-60%。免费用户每日体验时长升级至 4 小时,上线 TokenPlan 分层订阅,限时特惠 ¥14.9/月。

智能体MCP/工具产品更新
21:30
公众号:数字生命卡兹克
同事件精选67
WorkBuddy日活飙升至行业第二的3-4倍,非技术用户涌入

从3月至今,WorkBuddy日活用户数已达行业第二名的3-4倍,用户不再限于开发者,大量HR、运营、行政等非技术岗位也在使用。其企业版和项目功能进一步扩展了Agent办公场景。同期,Trae Work、QoderWork、Kimi Work等产品纷纷改名或出新,争夺市场。腾讯云认为这可能是十年一遇的机遇。

智能体现象/趋势
同一事件,精选展示《从0到1速通WorkBuddy:国内通用Agent产品教程》
推荐理由:卡兹克从现场带回WorkBuddy的用户数据,非技术人群用Agent干活不再是口号,传统办公软件的危机比想象中来得更快。
21:04
AYi@AYi_AInotes
55
OpenAI Codex 2026版全景:架构、生态横评与最佳实践

OpenAI Codex 2026版以统一执行层+编排中枢架构覆盖App、CLI、IDE、Cloud、Web五入口,模型迭代至GPT-5.4 for Codex,Spark版快15倍。平台层由MCP、Skills(开放标准)、Plugins(可分发)构成。SWE-Bench Pro Public上56.8%微弱领先,OSWorld-Verified 64.7%接近人类;Claude Code在百万token重构占优,Codex强在异步执行与并行调度。最佳实践:Prompt含Goal/Context/Constraints/Done-when,用AGENTS.md固化持久指令,MCP按高频痛点优先配置。

智能体MCP/工具OpenAI教程/实践
21:01
IT之家(RSS)
32
腾讯网盘官宣"COMING SOON":多应用数据互通、支持 Agent 调用

腾讯网盘官网近日上线,页面显示“COMING SOON”。该产品连接多个AI应用,共享存储并聚合上下文,将AI应用数据沉淀为长期记忆资产。核心能力包括:多应用数据互通(打通腾讯文档、WorkBuddy等)、OneID统一身份、跨应用全局搜索、高效共享协作、支持Agent通过CLI/MCP调用网盘数据,以及个人版、SaaS版、VPC版、私有化版等多版本灵活交付。

智能体MCP/工具产品更新
20:47
Hacker News 热门(buzzing.cc 中文翻译)
72
SpaceX将以600亿美元收购Cursor AI旗下编程代理运营商Anysphere

SpaceX以600亿美元收购编程代理Cursor AI的运营商Anysphere。Anysphere是Cursor AI的开发商,Cursor AI提供AI编程辅助工具。交易金额为600亿美元。

智能体编码行业动态
关联讨论 11 条TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:阿易 AI Notes (@AYi_AInotes)X:Michael Truell (@mntruell)The Decoder:AI News(RSS)X:宝玉 (@dotey)IT之家(RSS)X:歸藏 (@op7418)The Verge:AI(RSS)X:Emad Mostaque (@EMostaque)Ars Technica:AI(RSS)
20:29
meng shao@shao__meng
60
LandingAI 推出 Agentic Document Extraction 的 Agent Skills

LandingAI 将 Agentic Document Extraction 升级为 Agent Skills,支持在 Codex、Claude Code、Cursor 等 coding agent 的对话中直接调用,实现零脚本文档处理流水线。两个 Skill 分工明确:document-extraction 提供结构化 Markdown/层级 JSON 解析、基于 JSON Schema/Pydantic 的字段抽取、按文档类型拆分、按页分类路由(预览)、目录生成(预览)、异步大文件处理(最高约 1GB/6000 页)及元素级坐标与置信度可视化;document-workflows 封装并行批处理、Classify→Extract 混合流水线、RAG 准备(语义分块、embedding、ChromaDB/FAISS)、DataFrame/CSV/Snowflake 导出、bbox 标注叠加及 Streamlit 交互 UI。安装命令:/plugin marketplace add landing-ai/ade-document-processing-skills。

LandingAI: Turn Claude Code into a Document Processing Agent! We just released Agentic Document Extraction (ADE) skills for AI codi...

智能体GitHubMCP/工具产品更新
20:01
IT之家(RSS)
52
微信正测试 AI 支付功能,"AI 专属卡"最快本周内上线

微信支付联合腾讯智能体产品 WorkBuddy 测试 AI 支付功能,计划在微信钱包上线“AI 专属卡”,最快本周内上线。同时,微信支付 AI 接入工具箱升级至 2.0 版本,Skill 覆盖微信支付所有产品知识,新增技术专家与金融级研发专家两大 AI 能力,支持从场景选型到动态排障的全链路问答,以及基于金融级安全标准的代码质量审查。

智能体行业动态
19:45
🚨 AI News | TestingCatalog@testingcatalog
43
Anthropic确认Claude用户仍可使用其订阅额度,通过Agent SDK进行程序化(编程)调用。此前Anthropic曾宣布暂停这一做法,但最近用户收到邮件通知该计划已取消。这意味着conductor、t3 code、helmor等工具可继续利用订阅进行编程式使用。Anthropic调整了政策,允许订阅用户保留程序化调用的能力。

Robin Ebers · AI for Business Owners: ANTHROPIC IS SO BACK conductor, t3 code, helmor and more can continue to use your subscription are they learning to play...

智能体Anthropic行业动态
18:28
Rohan Paul@rohanpaul_ai
52
Claude Code的设计空间:简单AI循环与复杂外围系统

论文分析Claude Code,其有效工作核心并非复杂AI大脑,而是简单AI循环——调用模型、执行已批准工具、回传结果、重复——被精心构建的外围系统(工具、安全、记忆、权限、恢复)包裹。作者研究公开TypeScript源码,主agent循环代码量极小,大量代码来自harness(常规软件),负责定义工具、权限、记忆及故障处理。上下文管理是主要设计挑战,采用多层压缩或总结旧信息避免模型空间耗尽。论文强调能运行shell命令和编辑文件的编码智能体不能等同于带插件的聊天机器人,每个动作都有副作用,需要明确边界约束。

智能体编码论文/研究
17:47
MarkTechPost(RSS)
69
Hermes Agent 新增异步子代理,委托工作不再阻塞父聊天

Nous Research 为开源个人代理 Hermes Agent 新增异步子代理功能。原先的 delegate_task 工具同步阻塞主聊天,现通过 async_delegation 工具集(issue #5586)实现非阻塞:delegate_task_async 立即返回 task_id,主聊天可继续操作。异步工具涵盖 spawn、check、steer、collect、cancel 和 list 全生命周期。子代理完全隔离,仅向父代理返回最终摘要,继承父代理的 API 密钥和配置。现有用户运行 hermes update 即可启用。该更新由 Nous Research 及联合创始人 Teknium 于 6 月 15 日宣布。

智能体MCP/工具产品更新
17:17
MarkTechPost(RSS)
54
Atoms:MetaGPT团队推出的AI智能体协作vibe coding平台

Atoms由MetaGPT团队(68.7k GitHub星标、11篇顶会论文)打造,将八位AI智能体组织为产品团队:Iris验证需求、Emma制定规格、Bob设计架构、Alex构建全栈应用、Sarah生成SEO页面、Adrian投放Google Ads、David分析数据、Mike协调流程并在关键节点请求审批。平台内置Atoms Cloud,提供身份认证、实时数据库、Stripe支付、可扩展托管及一键部署;Race Mode可同时调用多个前沿模型并让用户选择最佳输出,据称准确率提升至3倍。内置SEO和广告智能体自动优化搜索排名与投放。用户可随时导出代码或同步GitHub,避免锁定。免费版每日15信用,Pro版$20/月起(100信用),Max版$100/月起(500信用,含Race Mode)。相比Lovable、Base44,Atoms将市场研究、SEO与广告管理纳入构建流程。

智能体产品更新
16:40
MarkTechPost(RSS)
精选71
Google Cloud 推出 OKF v0.1:供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文

Google Cloud 发布 Open Knowledge Format (OKF) v0.1,一种供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文知识。OKF 将知识表示为带 YAML 前置元数据的 markdown 文件目录,每个概念对应一个文件,通过 type、title、description 等少量保留字段实现互操作。无需专有服务、SDK 或运行时,目录可托管在 GitHub、以 tarball 传输或挂载到任意文件系统。OKF 旨在解决组织内部知识碎片化问题——表结构、指标定义、runbook 等散落在不同 catalog 和 wiki 中,各厂商方案互不兼容。遵循最少意见原则,只强制 type 字段,生产者和消费者可独立实现。使用场景包括数据团队将 BigQuery 表定义导出为代码、为智能体存储 incident runbook、跨组织知识交换等。

智能体GoogleMCP/工具产品更新

推荐理由:这是 Karpathy LLM Wiki 思想的首个工业级标准化尝试,把散落在各处的内部知识统一成 agent 可读的 markdown 规范,对构建 AI 应用的团队是切实的工程改进,值得加入设计检查清单。
16:28
HuggingFace Daily Papers(社区热门论文)
49
GD2PO:通过分组动态奖励解耦策略优化缓解多奖励冲突

大语言模型后训练强化学习需同时优化多个可能冲突的奖励维度。现有GDPO方法将整体分数分解为独立奖励组分别计算损失,但单个rollout在不同维度上可能产生正负相反的advantage,导致信号抵消。受DAPO启发,GD²PO引入冲突感知过滤机制,屏蔽奖励维度间严重不一致的rollout,防止信号抵消,同时保留并增强有效advantage幅度,加速学习。还采用查询级重加权动态调整各查询更新强度。在工具调用、人类偏好对齐等多奖励场景实验中,GD²PO显著优于现有基线。代码已开源。

智能体数据/训练论文/研究
16:00
IT之家(RSS)
64
高通CEO安蒙:正设计40多款新AI设备,智能体将取代应用

6月16日,高通CEO安蒙表示公司正推进40多款新型AI设备的设计工作,为智能体浪潮做准备。这些设备涵盖珠宝饰品、带摄像头耳机、胸针、手表等可穿戴形态,具备情境感知能力,用户可通过语音随时调用智能体。安蒙认为智能体将取代传统应用,例如无需打开银行App即可通过智能体即时调取交易记录。他看好智能眼镜前景,目前年出货量已达数千万副,预计几年后增至数亿副,最终市场规模可与智能手机媲美。

智能体大佬观点端侧
15:07
TechCrunch:AI(RSS)
58
马来西亚AI智能体消息应用Respond.io获6250万美元融资,瞄准收购

总部位于吉隆坡的客户对话管理平台Respond.io完成6250万美元B轮融资,Camber Partners领投,Endeavor Catalyst及现有投资者跟投。公司年经常性收入达3500万美元,同比增长169%,利润率为30%。平台通过AI智能体自动处理客户咨询、筛选线索并完成销售,每季度处理20亿条消息,按对话量而非座位收费。主要服务医疗、汽车、零售等中大型B2C企业。本轮资金将用于招聘、有机增长及收购,目标为欧洲和北美市场的技术补齐型公司及成熟团队。目前北美和西欧仅占其营收20%,但正成为增长最快区域。

智能体行业动态
15:05
🚨 AI News | TestingCatalog@testingcatalog
精选75
Cartesia 推出 Sonic 3.5 和 Ink 2 两个模型,作为单一实时语音栈,分别负责文本转语音和语音转文本。Ink 2 在 Artificial Analysis 的流式语音转文字排行榜上排名第一。Sonic 3.5 在实时文本转语音中位列榜首,首音频延迟约 82ms。Cartesia 成为目前唯一同时拥有 #1 听与说模型的提供商。

Karan Goel: We released Sonic-3.5 and Ink-2, the #1 streaming models for text to speech and speech to text you can use in your voice...

智能体模型发布语音

推荐理由:Cartesia 同时发布实时语音合成和识别两个模型的迭代版,双双登顶第三方基准,80ms 首音频延迟让语音代理的交互感接近真人,做实时语音应用的开发者可以重点看一下。
15:00
公众号:卡尔的AI沃茨
61
Claude终于松口,第三方Agent能共享额度了

Anthropic调整了Claude的订阅政策,允许第三方AI智能体共享Max订阅额度。此前在第三方Agent中使用Claude只能单独计费,每月100美元的订阅额度用完后按API标准价收费。调整后,用户可在第三方工具中直接走订阅额度,无需额外计费。该变化解除了此前用户因高额API费用而不得不绕开单独计费的限制。

智能体AnthropicMCP/工具教程/实践
15:00
IT之家(RSS)
60
阿里云:QoderWork 上线"意识"功能,让 AI 学会记忆、反思和成长

阿里云桌面AI智能体QoderWork今日上线“意识”功能,集成记忆、反思、技能进化三个模块。记忆采用分层结构,短期可晋升长期;反思借鉴人脑选择性遗忘,反思前快照备份,越界自动回滚。触发基于多因子加权评分模型,从意图深度、对话长度等维度判断。进化通过Fork Session分叉轻量子会话,缓存命中率99%以上,成本控制5%以内。系统检测反复任务自动生成技能建议,用户可选采纳、忽略或驳回。所有记忆以Markdown文本存本地,可编辑删除。

智能体产品更新端侧
14:30
公众号:火山引擎
40
双第一!火山引擎领跑中国智能体开发平台市场

IDC《2025中国智能体开发平台市场份额报告》显示,火山引擎以17.8%和19.3%的份额位居中国智能体开发平台私有化、公有云市场双第一。竞争焦点从Agent开发/编排延伸至全生命周期管理。火山引擎提供HiAgent(支持低/高/无代码、评测观测、数据回流、多模型接入、企业级扩展与私有化安全集成)和扣子(Coze)3.0(零代码开发部署、多人多Agent协作、跨多端协同、电脑桌面端和手机App端)两大产品,并推出AgentSphere实现多Agent统一管理。客户覆盖金融(9成头部券商、8成系统重要性银行)、教育(超八成985高校)、零售、能源等行业。

智能体行业动态部署/工程
13:58
OpenRouter:Announcements(RSS)
精选68
智能体AI治理:你的API密钥就是护栏

智能体AI使用量将在未来两年急剧上升,但治理滞后——仅五分之一企业拥有成熟治理模型。典型事故:销售智能体重试失败调用后自行升级到GPT-5.5,一夜消耗200美元。API路由层位于智能体与模型之间,是强制执行预算上限、模型白名单、提供方准入和请求日志的理想点。IBM报告指出97%遭遇AI安全事件的组织缺乏AI访问控制。最小可行治理方案:为每个智能体工作流分配独立API密钥,在API密钥层面实现预算控制、模型准入和审计追踪。

智能体现象/趋势部署/工程

推荐理由:现在代理失控的风险越来越真实,这篇文章把复杂的治理问题简化为五个 API 密钥控制,五分钟就能落地,比那些大而无当的框架实用得多。
12:33
Alibaba Cloud@alibaba_cloud
20
AI 智能体如何重塑商业?🌐 加入我们在阿里云 VivaTech 2026 的精英小组,成员来自阿里云、ElevenLabs、Eden AI、Storyverse AI 和 Firecrawl。 🔗 立即注册:https://int.alibabacloud.com/m/1000414352/
智能体其他
11:27
HuggingFace Daily Papers(社区热门论文)
55
VisualClaw:面向物理世界的实时个性化多模态智能体

VisualClaw是一个自进化多模态智能体,通过级联门过滤流式帧与热/冷top-k注入技能库,将单问题API成本降至全帧上传的-98%、均匀8帧基线的-25.9%。技能进化模块从失败中学习并更新技能库,在4个视频QA基准上平均准确率提升+3.85%,EgoSchema上Gemini 3 Flash达+15.80%。研究者构建了VisualClawArena(200场景多模态智能体基准),在该基准上结合计算机使用后端使Codex (GPT-5.5)宏观准确率+2.9%、Claude Code (Sonnet 4.6)+3.2%,成本降低-9.5%。级联机制将1小时流媒体从~3,600次API调用降至5-20次,适合边缘部署。

智能体多模态视频论文/研究
11:07
Hacker News 热门(buzzing.cc 中文翻译)
50
无人经济?从技术上讲并非不可能

一篇来自 gmalandrakis.com 的帖子在 Hacker News 上获得 101 个点赞,提出无人经济在技术上并非不可能。

智能体现象/趋势
11:01
公众号:卡尔的AI沃茨
61
ClawHunt:AI Agent赏金市场的交付验证与真实测试

ClawHunt是一个AI Agent赏金市场,需求方发布任务并挂赏金,Agent或开发者竞标后提交成品。平台引入L1 Delivery Protocol Manifest,明确定义输入文件、输出文件、验收脚本和预期结果。作者测试Problem #196(合同填充工具),按Sample跑通生成了docx,但实际踩坑四次:缺乏OpenAI API Key时fallback到纯正则模式,导致字段提取错误(地址未填、Email/Phone位置错、客户与供应商颠倒)。结论是Agent在demo阶段容易展示漂亮结果,但真实交付中的验收、复现和安全性仍是核心难题。

智能体现象/趋势
11:00
IT之家(RSS)
64
微软推Intelligent Terminal:Win11终端集成AI智能体

微软为Windows 11推出实验性命令行工具Intelligent Terminal,基于Windows Terminal分支,在专用窗格中集成AI智能体。智能体可查看shell上下文、实时捕获错误、解释失败原因、生成命令或处理多步任务。用户需手动从微软商店下载,可用winget install Microsoft.IntelligentTerminal安装。支持ACP协议,默认识别GitHub Copilot。提供智能体聊天(Ctrl+Shift+.)和智能体管理(Ctrl+Shift+/)两种交互,可开启自动错误检测与跨终端会话管理。

智能体Microsoft产品更新编码
11:00
IT之家(RSS)
精选70
AI 版支付宝官宣开启邀测:右滑打开"阿宝",官方放出 100 个邀请码

支付宝今日开启 AI 版邀测,用户可右滑进入新版界面,在对话框或语音中输入指令,由“阿宝”助手代办事项。以查询公积金为例,阿宝自动匹配对应小程序和服务入口,用户点击确认即可完成,将多步跳转折叠为一句指令。所有涉及资金变动和支付的环节均需用户本人确认。首批放出 100 个邀请码。

智能体产品更新

推荐理由:支付宝的AI版右滑唤起阿宝,把查公积金等繁琐流程压成一句话,是超级App从陈列式向对话式转型的实质性信号,做生活服务产品的都该盯一下。
‹ 上一页
1…2223242526…50
下一页 ›