Gemini 应用推出名为 Daily Brief 的新 AI 智能体,用户可在起床前用它规划一天。官方提供三条使用建议:1)通过点赞或踩直接反馈,训练 Gemini 了解偏好;2)直接与 Gemini 对话,对简报内容提问或调整;3)点击简报项下方的“更多”按钮,查看 Gemini 引用的具体邮件、聊天或 Google 日历事件来源。目前该功能已上线,官方持续收集用户反馈以改进体验。
Gemini 应用推出名为 Daily Brief 的新 AI 智能体,用户可在起床前用它规划一天。官方提供三条使用建议:1)通过点赞或踩直接反馈,训练 Gemini 了解偏好;2)直接与 Gemini 对话,对简报内容提问或调整;3)点击简报项下方的“更多”按钮,查看 Gemini 引用的具体邮件、聊天或 Google 日历事件来源。目前该功能已上线,官方持续收集用户反馈以改进体验。
🚀 Step 3.7 Flash from @StepFun_ai is now available via Novita on @OpenRouter. High-efficiency multimodal reasoning. Mul...
2026年6月16日,vickiboykis.com 上发布了一篇题为“Running local models is good now”的文章,作者认为当前阶段在本地硬件上运行大语言模型已经能够取得不错的效果。该文章在 Hacker News 社区引发讨论,相关帖子获得 114 点热度,表明本地模型运行体验得到了社区的认可。
腾讯 WorkBuddy 自 3 月至今用户增长远超预期,日活数据已达到第二名产品的 3-4 倍以上,用户包括大量 HR、运营、行政等非技术岗人员,以及金融、餐饮、外贸等非互联网行业。作者将其作为 skill store 使用,可找到腾讯精选的优质 skill。引用指出其代表第三代办公 Agent 模式,对传统 Office 和云协同产品形成降维打击,近期还推出企业版和项目功能,意图抢占新一代 Agent 办公场景。
聊聊这个可能被大家低估的Agent场景。 今天去了腾讯活动的现场,当了下主持和评委。 也跟很多选手,还有腾讯云的几个大佬交流了一下。 还真的有点新东西冲击的,这个确实是我在过去之前没预想到的。 最核心的点,就是整个WorkBuddy在用户增...
🚀 MiMo Claw is LIVE Flagship AI Model + Kingsoft Office Integration 🤖 Unlock the Full Power of Agents • Powered by MiM...
Boris Cherny(Claude Code 开发者)表示不再手动提示 Claude,而是编写循环让循环工作。@withneo 新发布的 MCP 服务器 neo-mcp 为 Claude Code 配备了本地 AI 工程工人 Neo。Claude Code 可将复杂 AI/ML 任务委托给 Neo,由其实现代码、运行实验、评估结果、调试失败运行并返回完整执行轨迹。在基准测试中,Claude Code + NEO 将任务成本从 $1.96 降至 $0.74,运行时间缩短 37%,并将后端从 PyTorch 切换为 ONNX Runtime 以优化 CPU 执行。该 MCP 服务器支持连接 Claude Code、Cursor、VS Code 等客户端,编辑器控制对话,Neo 负责执行,Claude 专注于决策而非执行噪音。
OpenClaw-Skill是一种为LLM智能体构建可复用技能库的方法。传统技能归纳通常将单条轨迹一次蒸馏成扁平的单次启发式规则,而OpenClaw-Skill通过搜索候选技能树来替代贪婪蒸馏,在迭代阶段中利用集体信号联合生成、识别和组合技能节点,最终输出结构化的技能树,旨在提升技能的多样性和泛化能力。论文详见arxiv。
腾讯WorkBuddy自3月至今,日活已达第二名的3-4倍以上。用户除开发者外,涌入大量HR、运营、行政等非技术岗,黑客松场景覆盖金融、餐饮、外贸、法律等非互联网行业。商业模式从卖软件转向卖智能,辅助用户造最适合自己的工具。已有Trae Work、QoderWork、Kimi Work等产品跟进改名。腾讯云称此为十年一遇机遇,已推出企业版和项目功能。用户也可将WorkBuddy用作skill store,获取腾讯精选skill,质量高于GitHub公开资源。
聊聊这个可能被大家低估的Agent场景。 今天去了腾讯活动的现场,当了下主持和评委。 也跟很多选手,还有腾讯云的几个大佬交流了一下。 还真的有点新东西冲击的,这个确实是我在过去之前没预想到的。 最核心的点,就是整个WorkBuddy在用户增...
卡兹克在腾讯活动现场发现,Agent产品WorkBuddy自3月至今用户增长远超预期,日活已是第二名的3-4倍以上;用户包括HR、运营、行政等非技术岗,黑客松场景覆盖金融、餐饮、外贸、法律等非互联网行业。他认为这代表了第三代办公产品(第一代本地Office、第二代云协同),直接帮用户完成任务。腾讯云视其为十年一遇机遇,刚推出企业版和项目功能。受此影响,Trae Work、QoderWork、Kimi Work等产品纷纷跟进改名或转型。
I built a @threejs game director skill system for Codex & Claude Code to help agents create more polished playable brows...
小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版,搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 旗舰模型。该模型原生兼容 MCP 工具调用协议,内置百万级超长上下文,支持单会话千次以上连续工具调用;依托 MTP 三层解码架构,在 OpenClaw 标准 Agent 工作流中吞吐效率提升约 3 倍。ClawEval 测试中任务达标率(Pass³)达 63.8%,Token 消耗较同类产品降低 40%-60%。联动金山办公生态,提供 Word、Excel、PPT、PDF 等格式的 AI 生成、预览与在线编辑一站式服务。免费用户每日单次体验时长从1小时升级至4小时,面向高频用户推出 TokenPlan 分层订阅(Lite/Standard/Pro/Max),支持灵活叠加,限时定价14.9元/月、19.9元/月、233.8元/年。
6月16日,腾讯公关总监张军宣布,全国首个省级政务智能中枢平台「湾擎」上线试运行,同时预发布湾擎·WorkBuddy。该智能体基于腾讯自研AI办公智能体WorkBuddy打造,专为政务场景定制,覆盖公文辅助、材料校核、政策检索、业务咨询、流程协同、任务辅助六大高频场景。WorkBuddy即将在广东省直多个单位试点,后续面向全省铺开。「湾擎」中枢已归集100余个政务场景,适配十数款主流大模型,搭配Token级安全防护。
小米云端轻量化 Claw 产品正式版发布,搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 模型,原生兼容 MCP 协议,无需额外提示词。支持百万级上下文、单会话千次以上工具调用,MTP 三层解码架构使推理吞吐效率提升约 3 倍。联动金山办公,支持 Word/Excel/PPT/PDF,实现 AI 生成、预览与在线编辑闭环。ClawEval 中 Pass³ 达 63.8%,Token 消耗降低 40%-60%。免费用户每日体验时长升级至 4 小时,上线 TokenPlan 分层订阅,限时特惠 ¥14.9/月。
从3月至今,WorkBuddy日活用户数已达行业第二名的3-4倍,用户不再限于开发者,大量HR、运营、行政等非技术岗位也在使用。其企业版和项目功能进一步扩展了Agent办公场景。同期,Trae Work、QoderWork、Kimi Work等产品纷纷改名或出新,争夺市场。腾讯云认为这可能是十年一遇的机遇。
同一事件,精选展示《从0到1速通WorkBuddy:国内通用Agent产品教程》OpenAI Codex 2026版以统一执行层+编排中枢架构覆盖App、CLI、IDE、Cloud、Web五入口,模型迭代至GPT-5.4 for Codex,Spark版快15倍。平台层由MCP、Skills(开放标准)、Plugins(可分发)构成。SWE-Bench Pro Public上56.8%微弱领先,OSWorld-Verified 64.7%接近人类;Claude Code在百万token重构占优,Codex强在异步执行与并行调度。最佳实践:Prompt含Goal/Context/Constraints/Done-when,用AGENTS.md固化持久指令,MCP按高频痛点优先配置。
腾讯网盘官网近日上线,页面显示“COMING SOON”。该产品连接多个AI应用,共享存储并聚合上下文,将AI应用数据沉淀为长期记忆资产。核心能力包括:多应用数据互通(打通腾讯文档、WorkBuddy等)、OneID统一身份、跨应用全局搜索、高效共享协作、支持Agent通过CLI/MCP调用网盘数据,以及个人版、SaaS版、VPC版、私有化版等多版本灵活交付。
SpaceX以600亿美元收购编程代理Cursor AI的运营商Anysphere。Anysphere是Cursor AI的开发商,Cursor AI提供AI编程辅助工具。交易金额为600亿美元。
关联讨论 11 条TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:阿易 AI Notes (@AYi_AInotes)X:Michael Truell (@mntruell)The Decoder:AI News(RSS)X:宝玉 (@dotey)IT之家(RSS)X:歸藏 (@op7418)The Verge:AI(RSS)X:Emad Mostaque (@EMostaque)Ars Technica:AI(RSS)LandingAI 将 Agentic Document Extraction 升级为 Agent Skills,支持在 Codex、Claude Code、Cursor 等 coding agent 的对话中直接调用,实现零脚本文档处理流水线。两个 Skill 分工明确:document-extraction 提供结构化 Markdown/层级 JSON 解析、基于 JSON Schema/Pydantic 的字段抽取、按文档类型拆分、按页分类路由(预览)、目录生成(预览)、异步大文件处理(最高约 1GB/6000 页)及元素级坐标与置信度可视化;document-workflows 封装并行批处理、Classify→Extract 混合流水线、RAG 准备(语义分块、embedding、ChromaDB/FAISS)、DataFrame/CSV/Snowflake 导出、bbox 标注叠加及 Streamlit 交互 UI。安装命令:/plugin marketplace add landing-ai/ade-document-processing-skills。
Turn Claude Code into a Document Processing Agent! We just released Agentic Document Extraction (ADE) skills for AI codi...
微信支付联合腾讯智能体产品 WorkBuddy 测试 AI 支付功能,计划在微信钱包上线“AI 专属卡”,最快本周内上线。同时,微信支付 AI 接入工具箱升级至 2.0 版本,Skill 覆盖微信支付所有产品知识,新增技术专家与金融级研发专家两大 AI 能力,支持从场景选型到动态排障的全链路问答,以及基于金融级安全标准的代码质量审查。
ANTHROPIC IS SO BACK conductor, t3 code, helmor and more can continue to use your subscription are they learning to play...
论文分析Claude Code,其有效工作核心并非复杂AI大脑,而是简单AI循环——调用模型、执行已批准工具、回传结果、重复——被精心构建的外围系统(工具、安全、记忆、权限、恢复)包裹。作者研究公开TypeScript源码,主agent循环代码量极小,大量代码来自harness(常规软件),负责定义工具、权限、记忆及故障处理。上下文管理是主要设计挑战,采用多层压缩或总结旧信息避免模型空间耗尽。论文强调能运行shell命令和编辑文件的编码智能体不能等同于带插件的聊天机器人,每个动作都有副作用,需要明确边界约束。
Nous Research 为开源个人代理 Hermes Agent 新增异步子代理功能。原先的 delegate_task 工具同步阻塞主聊天,现通过 async_delegation 工具集(issue #5586)实现非阻塞:delegate_task_async 立即返回 task_id,主聊天可继续操作。异步工具涵盖 spawn、check、steer、collect、cancel 和 list 全生命周期。子代理完全隔离,仅向父代理返回最终摘要,继承父代理的 API 密钥和配置。现有用户运行 hermes update 即可启用。该更新由 Nous Research 及联合创始人 Teknium 于 6 月 15 日宣布。
Atoms由MetaGPT团队(68.7k GitHub星标、11篇顶会论文)打造,将八位AI智能体组织为产品团队:Iris验证需求、Emma制定规格、Bob设计架构、Alex构建全栈应用、Sarah生成SEO页面、Adrian投放Google Ads、David分析数据、Mike协调流程并在关键节点请求审批。平台内置Atoms Cloud,提供身份认证、实时数据库、Stripe支付、可扩展托管及一键部署;Race Mode可同时调用多个前沿模型并让用户选择最佳输出,据称准确率提升至3倍。内置SEO和广告智能体自动优化搜索排名与投放。用户可随时导出代码或同步GitHub,避免锁定。免费版每日15信用,Pro版$20/月起(100信用),Max版$100/月起(500信用,含Race Mode)。相比Lovable、Base44,Atoms将市场研究、SEO与广告管理纳入构建流程。
Google Cloud 发布 Open Knowledge Format (OKF) v0.1,一种供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文知识。OKF 将知识表示为带 YAML 前置元数据的 markdown 文件目录,每个概念对应一个文件,通过 type、title、description 等少量保留字段实现互操作。无需专有服务、SDK 或运行时,目录可托管在 GitHub、以 tarball 传输或挂载到任意文件系统。OKF 旨在解决组织内部知识碎片化问题——表结构、指标定义、runbook 等散落在不同 catalog 和 wiki 中,各厂商方案互不兼容。遵循最少意见原则,只强制 type 字段,生产者和消费者可独立实现。使用场景包括数据团队将 BigQuery 表定义导出为代码、为智能体存储 incident runbook、跨组织知识交换等。
大语言模型后训练强化学习需同时优化多个可能冲突的奖励维度。现有GDPO方法将整体分数分解为独立奖励组分别计算损失,但单个rollout在不同维度上可能产生正负相反的advantage,导致信号抵消。受DAPO启发,GD²PO引入冲突感知过滤机制,屏蔽奖励维度间严重不一致的rollout,防止信号抵消,同时保留并增强有效advantage幅度,加速学习。还采用查询级重加权动态调整各查询更新强度。在工具调用、人类偏好对齐等多奖励场景实验中,GD²PO显著优于现有基线。代码已开源。
6月16日,高通CEO安蒙表示公司正推进40多款新型AI设备的设计工作,为智能体浪潮做准备。这些设备涵盖珠宝饰品、带摄像头耳机、胸针、手表等可穿戴形态,具备情境感知能力,用户可通过语音随时调用智能体。安蒙认为智能体将取代传统应用,例如无需打开银行App即可通过智能体即时调取交易记录。他看好智能眼镜前景,目前年出货量已达数千万副,预计几年后增至数亿副,最终市场规模可与智能手机媲美。
总部位于吉隆坡的客户对话管理平台Respond.io完成6250万美元B轮融资,Camber Partners领投,Endeavor Catalyst及现有投资者跟投。公司年经常性收入达3500万美元,同比增长169%,利润率为30%。平台通过AI智能体自动处理客户咨询、筛选线索并完成销售,每季度处理20亿条消息,按对话量而非座位收费。主要服务医疗、汽车、零售等中大型B2C企业。本轮资金将用于招聘、有机增长及收购,目标为欧洲和北美市场的技术补齐型公司及成熟团队。目前北美和西欧仅占其营收20%,但正成为增长最快区域。
We released Sonic-3.5 and Ink-2, the #1 streaming models for text to speech and speech to text you can use in your voice...
Anthropic调整了Claude的订阅政策,允许第三方AI智能体共享Max订阅额度。此前在第三方Agent中使用Claude只能单独计费,每月100美元的订阅额度用完后按API标准价收费。调整后,用户可在第三方工具中直接走订阅额度,无需额外计费。该变化解除了此前用户因高额API费用而不得不绕开单独计费的限制。
阿里云桌面AI智能体QoderWork今日上线“意识”功能,集成记忆、反思、技能进化三个模块。记忆采用分层结构,短期可晋升长期;反思借鉴人脑选择性遗忘,反思前快照备份,越界自动回滚。触发基于多因子加权评分模型,从意图深度、对话长度等维度判断。进化通过Fork Session分叉轻量子会话,缓存命中率99%以上,成本控制5%以内。系统检测反复任务自动生成技能建议,用户可选采纳、忽略或驳回。所有记忆以Markdown文本存本地,可编辑删除。
IDC《2025中国智能体开发平台市场份额报告》显示,火山引擎以17.8%和19.3%的份额位居中国智能体开发平台私有化、公有云市场双第一。竞争焦点从Agent开发/编排延伸至全生命周期管理。火山引擎提供HiAgent(支持低/高/无代码、评测观测、数据回流、多模型接入、企业级扩展与私有化安全集成)和扣子(Coze)3.0(零代码开发部署、多人多Agent协作、跨多端协同、电脑桌面端和手机App端)两大产品,并推出AgentSphere实现多Agent统一管理。客户覆盖金融(9成头部券商、8成系统重要性银行)、教育(超八成985高校)、零售、能源等行业。
智能体AI使用量将在未来两年急剧上升,但治理滞后——仅五分之一企业拥有成熟治理模型。典型事故:销售智能体重试失败调用后自行升级到GPT-5.5,一夜消耗200美元。API路由层位于智能体与模型之间,是强制执行预算上限、模型白名单、提供方准入和请求日志的理想点。IBM报告指出97%遭遇AI安全事件的组织缺乏AI访问控制。最小可行治理方案:为每个智能体工作流分配独立API密钥,在API密钥层面实现预算控制、模型准入和审计追踪。
VisualClaw是一个自进化多模态智能体,通过级联门过滤流式帧与热/冷top-k注入技能库,将单问题API成本降至全帧上传的-98%、均匀8帧基线的-25.9%。技能进化模块从失败中学习并更新技能库,在4个视频QA基准上平均准确率提升+3.85%,EgoSchema上Gemini 3 Flash达+15.80%。研究者构建了VisualClawArena(200场景多模态智能体基准),在该基准上结合计算机使用后端使Codex (GPT-5.5)宏观准确率+2.9%、Claude Code (Sonnet 4.6)+3.2%,成本降低-9.5%。级联机制将1小时流媒体从~3,600次API调用降至5-20次,适合边缘部署。
一篇来自 gmalandrakis.com 的帖子在 Hacker News 上获得 101 个点赞,提出无人经济在技术上并非不可能。
ClawHunt是一个AI Agent赏金市场,需求方发布任务并挂赏金,Agent或开发者竞标后提交成品。平台引入L1 Delivery Protocol Manifest,明确定义输入文件、输出文件、验收脚本和预期结果。作者测试Problem #196(合同填充工具),按Sample跑通生成了docx,但实际踩坑四次:缺乏OpenAI API Key时fallback到纯正则模式,导致字段提取错误(地址未填、Email/Phone位置错、客户与供应商颠倒)。结论是Agent在demo阶段容易展示漂亮结果,但真实交付中的验收、复现和安全性仍是核心难题。
微软为Windows 11推出实验性命令行工具Intelligent Terminal,基于Windows Terminal分支,在专用窗格中集成AI智能体。智能体可查看shell上下文、实时捕获错误、解释失败原因、生成命令或处理多步任务。用户需手动从微软商店下载,可用winget install Microsoft.IntelligentTerminal安装。支持ACP协议,默认识别GitHub Copilot。提供智能体聊天(Ctrl+Shift+.)和智能体管理(Ctrl+Shift+/)两种交互,可开启自动错误检测与跨终端会话管理。
支付宝今日开启 AI 版邀测,用户可右滑进入新版界面,在对话框或语音中输入指令,由“阿宝”助手代办事项。以查询公积金为例,阿宝自动匹配对应小程序和服务入口,用户点击确认即可完成,将多步跳转折叠为一句指令。所有涉及资金变动和支付的环节均需用户本人确认。首批放出 100 个邀请码。