Gemini应用推出两项重要升级:Gemini Spark作为全天候个人AI代理,可在用户授权下自动操作,无缝整合Gmail、Google Docs和Slides等工作流,甚至在笔记本电脑关闭时也能持续运行。Daily Brief则提供基于个人目标的定制化摘要与下一步建议。Daily Brief已向美国18岁以上Google AI订阅用户推出,Gemini Spark将于下周开始上线。
在2026年I/O开发者大会上,谷歌宣布推出Antigravity 2.0,这是一款围绕智能代理编排构建的独立桌面应用程序。同时发布的还包括Antigravity命令行工具(CLI)和软件开发工具包(SDK),并在Gemini API中引入了托管代理功能。此外,通过Gemini Enterprise提供企业级支持。此次发布标志着谷歌从工具集成迈向构建完整代理开发生态的重要转变。
Google AI Edge Gallery 应用在安卓平台上扩展了设备端 AI 能力,通过引入对开源模型上下文协议(MCP)的实验性支持,使得 Gemma 4 模型能够协调处理跨 Google Workspace 和 Google Maps 等外部数据源的复杂任务。此次更新添加了“定时通知”技能,用于实现日常事务的自动化管理,并新增了持久化聊天记录功能,允许用户近乎即时地恢复长会话上下文。该平台依托开源工具包,积极鼓励社区开发者通过其 GitHub 仓库构建并分享专注实用的工作流、提示配置与工具集成。
Introducing Gemini Spark ✨ It's your 24/7 personal AI agent that helps you navigate your digital life, taking action on ...
InsForge是一个专为AI编码智能体设计的一站式开源后端平台。它通过MCP Server和CLI+Skills两种接口,让智能体能像后端工程师一样直接操作数据库、认证、存储、边缘函数、模型网关等全套后端服务,从而端到端地构建全栈应用。平台支持云托管与基于Docker的自托管,可一键部署至Railway、Zeabur等主流平台。
推文聚焦于一篇探讨AI代理(Agent)开发框架的百页报告,其核心主张是“代码作为代理框架”具有重要潜力。报告总结了相关方法与应用,并论证该路径可能推动更广泛的科学框架工程。论文进一步提出,未来的智能系统必须具备四项关键特性:可执行、可检查、有状态以及受控。报告旨在为构建有效AI代理提供参考,并推荐相关学习资源。
Bug fixes shipping for Grok Build - Fix Windows contrast/color/theme rendering - Fix German QWERTZ AltGr on Windows - Co...
We built one skill that connects any agent to any API. Stripe. NASA Mars Rover. The ISS tracker. The Evil Insult Generat...
Live from Code with Claude London: we're launching self-hosted sandboxes (public beta) and MCP tunnels (research preview...
Anthropic宣布扩展其Claude Managed Agents平台,新增自托管沙箱和MCP隧道两项关键功能。企业现在能够将AI Agent的工具执行环境部署在自己的基础设施中,提升了数据安全性和操作灵活性。值得注意的是,此次更新并未转移Agent本身的控制权,其核心管理仍由Anthropic平台负责。这一举措旨在满足企业对敏感数据处理和本地化部署的需求,同时保持托管服务的便捷性。
Anthropic为其Claude智能体托管平台推出两项更新:自托管沙箱允许用户在自有基础设施或合作云平台上运行工具,确保敏感数据与服务保留在用户控制范围内;MCP隧道则通过轻量网关,使智能体能安全连接企业私有网络内的数据库与API,无需暴露于公网。目前沙箱功能已进入公测,隧道处于研究预览阶段。这两项更新进一步增强了企业用户对智能体执行环境与内部资源访问的安全管控能力。
summary_zh
Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。 一条命令,全部装进你的Claude Code, ...
介绍一款名为 seo-audit 的AI技能工具,可通过命令行安装,用于快速分析网站SEO状况。该工具能检测 Sitemap 状态、301重定向、noindex和canonical标签设置等常见基础问题,适用于初步排查网站收录不佳的原因。实际案例显示其生成的报告质量可靠,能有效发现潜在的技术SEO缺陷。
近期研究表明,在新兴智能体系统中,代码的角色正从目标输出转变为智能体的运行基础。本文提出“代码作为智能体的运行基础”这一统一视角,系统梳理了支撑智能体系统的三个核心层次:连接智能体与外部世界的操作接口层;支撑长期执行的规划、记忆与反馈控制机制层;以及支持多智能体协作的共享代码层。该视角涵盖了编程助手、操作系统自动化等多个应用领域,并指出了评估验证、状态一致性等工程挑战,为构建可执行、可验证、有状态的智能体系统提供了清晰的路线图。
“藏师傅”前端视频生成技能已完成,当前重点在于提升工程化水平与降低Token消耗。对一段40秒视频案例的分析显示,总消耗达145万Token,其中视频组合部分占比极高,但得益于92%的缓存率成本可控。该方案由PPT Skill(美学动效)、HyperFrames(时间线渲染)、Listenhub Skill(配音)及即梦CLI(生成演示镜头)协同完成。
让 Codex 自己做了一条视频介绍了一下这个视频生成方案 藏师傅的 PPT Skill 负责美学、版式、动效 HyperFrames 负责时间线和渲染、字幕 Listenhub Skill 负责配音 即梦 CLI 负责 前端无法生成的演示...
Claude Code核心开发者Thariq认为,Markdown在复杂任务中可读性差,导致人类易脱离协作循环。而HTML作为可视化、可交互的界面,能将人重新拉回人机协作回路,适配AI时代“算力分配者”的新角色。他提出了三个可落地的工作流:用交互式HTML进行头脑风暴;为特定任务生成“一次性微应用”;构建人机双向可读的“活体设计系统”。核心判断包括:媒介选择决定人类参与度;生成式算力应主要投入在对齐与沟通的“脚手架”上;软件边际成本趋零;以及明确信任指令能激发更创造性的输出。
Soooo @trq212 has straight up changed my life with these 5 words: "HTML is the new markdown." It's so obvious in hindsig...
Anthropic宣布收购长期合作的SDK及MCP平台Stainless。这看似技术补全,实则意味着开发者自主权的进一步流失。此前Stainless作为中立第三方,其开发工具可被多家AI公司共用;收购后将成为Anthropic专属部分。未来SDK形态、MCP协议及默认工具链都将被深度嵌入Anthropic的产品哲学与安全策略,开发者可能在无感中被绑定于单一生态。AI公司真正的护城河在于定义人与模型之间的接触界面,#KeepSonnet45的呼声背后,大家真正担忧的正是这种自主权的逐渐丧失。
Anthropic is acquiring @stainlessapi, an SDK and MCP server platform that has powered every Anthropic SDK since the earl...
本文聚焦AI编码领域正从追求“写得快”向“做得对”的工程化范式转变。文章通过三条核心线索展开:Cursor发布Composer 2.5并公开训练栈,标志着从产品公司转向模型迭代;Anthropic工程师提出对抗式生成-评估架构,将长时Agent自主运行时间从1小时提升至12小时;阿里云CIO则指出“AI生码率”是危险指标,强调代码是负债,工程化与组织能力才是关键。这共同指向一个结论:AI降低了代码生成成本,但将其转化为资产需要深度工程化。
当前AI发展的核心瓶颈已从模型智能转向架构编排。LobeHub推出了名为Chief Agent Operator(CAO)的后端管理层,能够根据高层级策略自动组建代理团队并行处理任务。该平台作为编排系统无缝集成到Claude Code、Cursor等开发者环境中,接入庞大的技能市场,并在云端全天候运行,无需本地维护,从而显著降低运营成本。用户专注于制定宏观策略,而由CAO负责管理和执行具体的代理工作。
Meet your Chief Agent Operator in LobeHub now. You don't manage agents. Your CAO does. LobeHub hires agents from a 273K-...
Anthropic is acquiring @stainlessapi, an SDK and MCP server platform that has powered every Anthropic SDK since the earl...
Anthropic is acquiring @stainlessapi, an SDK and MCP server platform that has powered every Anthropic SDK since the earl...
Anthropic宣布收购SDK与MCP服务器工具开发商Stainless。Stainless自2022年成立以来,一直为Anthropic官方SDK的生成提供支持,其工具能将API规范转化为TypeScript、Python、Go等多语言的SDK、命令行工具及MCP服务器。此次收购旨在增强Claude平台的开发者体验,提升AI代理连接外部数据与工具的能力,从而在MCP协议基础上进一步拓展连接生态。
TRAE团队基于真实的用户技能调用数据(而非安装量),分析了用户实际高频使用的Agent Skills Top 10。这些技能覆盖了从UI设计、流程规划到测试调试的产品开发全链路,甚至包含一个带有反讽意味的“PUA”高压问责技能。其设计具有清晰的分层逻辑,从元层的技能检索与调度,到行为层的约束护栏,再到具体的执行与验证层,共同构成了一个“想清楚→拆细→做精→验透→担责”的结构化、负责任的闭环工作流。
We analyzed real skill call data from TRAE users. Here are the 10 Most Popular Agent Skills that people actually use, no...
ORCA是一款新开源的Agent IDE,提供iOS及移动端客户端,支持多账号切换(例如多个ChatGPT订阅),并显示Token消耗与5小时重置信息。它能自动检测电脑中已安装的CLI工具,如Claude Code CLI、Codex CLI、Gemini CLI等,支持目录文件拖拽对话及内置Markdown预览。该工具优化了Tui工具的常见痛点,但安装包体积较大。开源地址及官网已公布。
腾讯云正式公测自研AI设计智能体平台Ardot。该平台核心功能包括:用户通过一句话指令即可生成App页面、官网、海报等可编辑设计稿;支持调用团队自有组件库生成规范稿,并能直接导入Figma文件保留原有设计。同时,Ardot具备设计稿一键转换为代码的能力,可对接CodeBuddy等开发工具实现代码还原。平台还提供多人在线实时评论、标注反馈和版本对比等协作功能,其微信小程序即将上线。
Hermes 支持配置多种国内外主流 AI 模型,包括 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini 系列、DeepSeek V4 系列、智谱 GLM-5 系列、Kimi K2.6 以及小米 Mimo V2.5-pro。用户需通过相应服务的订阅或 API 进行配置,完成后可使用 /model 指令指定模型及提供者来切换对话模型,例如输入“/model gpt-5.5 --provider openai-codex”即可切换至对应模型。该功能方便用户根据需求灵活调用不同模型的优势。
EnvFactory 是一个全自动框架,旨在解决大语言模型在智能体强化学习中工具使用能力的瓶颈,即缺乏可扩展、健壮的执行环境和能捕捉隐式推理逻辑的高质量训练数据。该框架能自主探索并验证来自真实资源的有状态可执行环境,并通过拓扑感知采样与校准精炼合成自然的多轮交互轨迹,生成蕴含隐式意图的查询。仅利用7个领域中的85个验证环境,EnvFactory 生成了2,575条SFT和RL轨迹,相比传统方法环境减少五倍,却实现了更优的训练效率与下游性能,在BFCLv3、MCP-Atlas及τ²-Bench等基准上将Qwen3系列模型性能最高提升15%、8.6%和6%,为智能体强化学习提供了可扩展、可扩展且鲁棒的基础。
写了一个微信读书可视化报告skill:yao-weread-skill,已开源到GitHub 它可以把微信读书数据,生成一份本地可视化读书报告,包括: 1、近2年阅读时长与节律 2、书架书籍分析 3、阅读分类、作者、出版社偏好 4、笔记、划...
推文强烈建议用户将X平台蓝V订阅接入Hermes Agent,以最大化其价值。接入后,蓝V可支持文生图、图生视频、图生图及语音对话等功能。同时,通过整合引用推文的关键信息,接入Grok能赋予其强大的实时检索能力,在准确度和来源可靠性上超越GPT、Gemini、Claude等模型。用户可借此进行信息整理、自动化工作流管理和充当私人助理,从而显著提升使用体验。
http://x.com/i/article/2056013843718156289
研究表明,AI代理使用grep、文件读取等基础终端工具直接搜索原始数据,在多项基准测试中表现远超传统语义检索系统。例如,在BrowseComp-Plus基准上,终端搜索将准确率从69%提升至80%,同时降低成本。核心观点在于,检索不仅是模型问题,更是交互界面问题。直接语料交互允许代理进行精确字符串搜索、检查上下文并持续验证假设,从而从已定位文档中提取更多有效证据,其增益主要来自更充分地利用已发现文档,而非找到更多相关文档。局限性在于,随着语料库规模扩大,定位初始锚点的成本迅速增加,因此终端搜索无法完全替代大型索引。但对于强大AI代理,性能瓶颈可能在于工具允许其“触及”数据的深度。