前_buildspace创始人Farza发布了Mac端AI助手Clicky。它常驻光标旁,用户无需打开应用或打字,直接对屏幕说话即可触发。AI能理解指令并自动执行任务,例如整理桌面截图、创建提醒事项、搜索整理网红列表生成CSV文件,甚至能在几分钟内根据描述编译并运行一个功能完整的原生Mac App。其核心突破在于从“用户主动寻找并操作AI”转变为“AI常驻感知屏幕,听令即执行”,直接完成而非仅提供操作路径,类似于数字员工而非聊天机器人。目前该产品已可免费下载。
前_buildspace创始人Farza发布了Mac端AI助手Clicky。它常驻光标旁,用户无需打开应用或打字,直接对屏幕说话即可触发。AI能理解指令并自动执行任务,例如整理桌面截图、创建提醒事项、搜索整理网红列表生成CSV文件,甚至能在几分钟内根据描述编译并运行一个功能完整的原生Mac App。其核心突破在于从“用户主动寻找并操作AI”转变为“AI常驻感知屏幕,听令即执行”,直接完成而非仅提供操作路径,类似于数字员工而非聊天机器人。目前该产品已可免费下载。
在2026北京国际车展上,斑马智能与东风研发总院宣布,基于元神AI的淘宝闪购Agent将首次搭载于东风天元智舱。该功能允许用户仅通过自然语音完成全流程点餐,能精准识别模糊意图、自动匹配门店并推荐餐品,支持自由对话与订单中途修改。服务覆盖全品类美食,原生集成于座舱系统,可实现优惠自动叠加、配送时间智能联动导航。未来双方还计划在影音娱乐、出行游玩等场景推出更多原生Agent服务。
作者指出,每天刷X平台实质是在为其免费提供内容劳动。通过利用OpenClaw等工具连接X的API,可以逆转这一关系:让AI 24小时自动扫描平台,将指定领域(如AI创业)的潜在爆款内容及分析推送到Telegram,并过滤垃圾信息。其中,“Reply Guy”策略能捕捉爆款帖子发布初期的机会,通过抢先发布高质量评论获取巨大曝光。此外,工具提供的全局仪表盘有助于洞察各国信息差,发现机会。作者亲测该方法成本极低,能将每日信息获取时间从一小时压缩至五分钟,认为AI能将人从无意义的信息劳动中解放,专注于思考与创造。未来的竞争力在于精准过滤垃圾信息并抓住核心的1%。
PageGuide是一款浏览器扩展,通过视觉叠加将大语言模型的回答直接锚定在网页中,以解决用户在杂乱页面中定位信息、完成多步骤任务和对抗干扰内容三大需求。它提供三种模式:Find模式原位高亮答案来源以供验证;Guide模式分步显示操作指南引导用户执行;Hide模式帮助隐藏干扰内容。一项涉及94名用户的研究表明,该工具在所有模式下均显著优于无辅助浏览,例如Hide模式使任务准确率大幅提升、完成时间缩短70%,Guide模式提高任务完成率,Find模式则减少80%的Ctrl+F使用并缩短任务时间。代码与演示已开源。
文章指出,AI Agent正成为用户与软件交互的主要中间层,未来80%的人机交互将通过Agent完成。这要求产品设计范式从面向人类用户界面转向优先为AI Agent服务。核心转变包括:软件需通过API、MCP、CLI等方式向Agent开放能力,Salesforce的“Headless 360”计划是典型案例;产品需主动向Agent提供成功所需的关键规范与上下文,如Notion MCP的做法;需建立有效的反馈循环机制,利用Agent的调用理由和反馈工具来驱动产品迭代。设计者需明确系统与调用方Agent各自的上下文优势,并填补信息缺口。传统图形界面不会消失,但产品必须为Agent优先使用而构建。
用户通过Seedance 2.0和Rita平台制作AI视频,复刻了潘金莲与西门庆等经典场景,并分享提示词技巧。Rita平台直接接入原版Seedance 2.0,模型无降智,支持高并发分钟级出片,月费11.99美元可跑30条4秒视频。工具门槛降低后,创作瓶颈从工具操作转向创意打磨,更多时间用于优化prompt和画面分镜。推荐提示词已放在评论区供取用。
兄弟们,挖到一个好东西,必须分享出来,直接说结论: 目前能跑原版Seedance 2.0、不排队、不降智、 还能传真人照片生成真人视频的平台, 性价比最高的就是Rita, 总之强烈推荐,冲就完了! 有好多兄弟私信问我,怎么好久没发AIGC内...
该方案主张让AI自主使用文件系统等通用工具管理记忆,比专用架构更有效,且此能力随模型智能提升而自然涌现。技术上将记忆实现为工作区内持久化、可多智能体同步的明文文件存储,挂载于/mnt/memory/。上下文管理采用双轨模型:Session Log处理会话工作记忆,Memory Store负责跨会话长期记忆。设计理念从“为AI安装记忆”转变为“提供通用工具”,使记忆成为可审计、可迁移的开放文件资产,体现了智能扩展在工具使用中的重要性。
http://x.com/i/article/2047708413208219649
WUPHF 是一个为 AI 员工设计的协作办公平台,通过一个命令即可启动,在本地提供 Web 界面。它将不同角色的 AI 智能体置于一个共享的虚拟办公室中,使其可见、可争论并协作完成任务。平台为每个智能体提供私人笔记,团队共享一个基于 Markdown 和 Git 的本地维基,智能体可自主将可靠信息同步至团队知识库。项目目前处于 1.0 版本前的预发布阶段,默认使用 Claude Code,支持通过命令行参数灵活配置。
开源项目“Browser Harness”发布,旨在赋予大型语言模型(LLM)在浏览器中自主完成任意任务的能力。该工具通过提供一个可编程的浏览器控制框架,使LLM能够像人类一样操作网页,执行点击、输入、导航等复杂交互。此举有望突破当前AI代理在自动化网络操作方面的限制,扩展LLM的实际应用场景。该项目已在GitHub开源,并在Hacker News社区获得100点热度关注。
博主推荐Rita作为目前性价比最高的AI视频生成平台。该平台是GamsGo旗下产品,与字节官方合作,直接接入未经降配的原版Seedance 2.0模型,无需排队且生成速度快。其Mega套餐月费为11.99美元,可生成30条4秒视频,新用户注册赠送积分。博主通过生成“潘金莲与西门庆重逢”等视频测试,确认其画面细节与官方效果一致,认为该平台降低了工具门槛,使创作者能将更多精力集中于创意与提示词打磨。
开源工具Hyperbrowser能在约25秒内深度解析并克隆网站(如Anthropic官网)的完整设计系统,自动提取颜色、字体、间距等样式,并总结设计语言,生成结构化文档。这标志着设计正从依赖手艺的“像素级模仿”转变为可快速解析、复制的结构化数据,大幅降低了借鉴成熟设计系统的门槛,未来竞争焦点可能转向对设计DNA的快速吸收与再创造。
OpenRouter Agent SDK 提供 callModel 函数,能将聊天补全转换为支持工具调用、停止条件和成本追踪的多步智能体,覆盖 300 多个模型。
OpenRouter 发布 Agent SDK,其核心是 callModel 函数。该函数可将一次聊天完成转化为具备工具调用、停止条件与成本追踪功能的多步骤智能体工作流。这一工具兼容平台上的 300 多个模型,使开发者能够便捷地构建复杂的多轮交互智能体应用。
小米澎湃OS开发者平台正式推出支付服务Skill能力,支持主流AI开发工具。该服务通过标准化接口,帮助商户快速对接收银台及支付功能,内置完整流程与适配方案,大幅简化开发周期。开发者仅需下载安装Skill、通过自然语言交互接入支付能力、自动联调测试三步即可完成接入,一次性支持小米支付、微信支付、支付宝等多种支付方式,并覆盖App/H5/小程序支付、拆单、退款等多项功能。
VLAA-GUI 是一个模块化 GUI 智能体框架,围绕停止、恢复与搜索三个核心组件构建。其强制性完整性验证器要求每一步完成时都必须提供可观察的 UI 成功证据,并通过决策规则交叉审查完成声明。强制性循环中断器提供多层过滤机制,在重复失败时切换交互模式,在屏幕状态持续重现时强制改变策略。按需调用的搜索代理可直接向具备搜索能力的大语言模型查询陌生工作流程。框架还集成了按需调用的编码代理与接地代理。在包含 Linux 和 Windows 任务的 OSWorld 与 WindowsAgentArena 基准测试中,VLAA-GUI 在五个顶级骨干模型上均取得最佳性能,分别达到 77.5% 和 61.0% 的成功率。其中三个骨干模型在 OSWorld 上单次通过即超越人类表现。消融实验表明所有三个组件均能持续提升强骨干模型性能,而循环中断器几乎将易循环模型浪费的步骤减半。
在2026北京车展上,长安、东风、北汽、比亚迪、吉利、长城、理想、上汽大众、上汽智己等多家车企宣布接入阿里千问大模型。接入后,部分车型将能通过一句话指令完成复杂路径规划、闲聊、查新闻、订酒店、买门票、点外卖、查快递等全场景服务。阿里云提供了“端+云”协同架构:端侧部署Qwen-Omni模型负责感知与快速响应,云端千问则链接数字世界并调用阿里巴巴生态服务。此前,一汽红旗已于3月26日率先接入千问。
小米澎湃OS 3 Beta版已向小米17系列、Redmi K90 Pro Max等机型推送“龙虾”智能体Xiaomi miclaw。该智能体基于小米MiMo大模型,能让手机成为AI工具,理解用户意图后调用应用与系统工具完成任务。主要更新包括新增人格与技能体系、支持自然语言创建定时任务、可使用80多项系统工具,并预置了日程、沟通、办公等多场景一方助手。它还支持跨设备同步记忆和文件搜索传输,并可通过助手商店扩展能力。目前该产品仍属前沿探索,在稳定性与复杂场景处理方面持续优化。
支付宝AI付正式发布对OpenClaw(龙虾)类AI智能体的支持,用户可在JVS Claw、DTClaw、Claude Code等智能体中通过语音指令开通支付功能,完成缴费、购Token、购物等操作。服务采用7×24小时智能风控,需手动身份核验及本人授权确认,支付宝承诺"你敢付我敢赔"保障交易安全。
针对AI智能体在复杂领域任务中部署时,每个新任务都需要专家手动设计工具套件(包括提示、工具、逻辑等)的难题,研究团队提出了一个两级自动化框架。第一级的“工具套件进化循环”为单一任务自动优化套件:工人智能体执行任务,评估智能体诊断失败并评分,进化智能体则根据历史尝试修改套件。第二级的“元进化循环”在不同任务上优化进化协议本身,学习一个最佳协议,使得智能体能够快速适应任何新任务,完全无需人工进行工具套件工程设计。该框架将手动工程转变为自动化工程,并进一步实现了自动化设计本身的自动化。
Anthropic正升级其always-on Agent项目Conway。新系统将支持用户创建、分享和重用自定义UI标签页(如任务控制、工作流管理等),并由Anthropic顶级模型驱动。目前iOS应用已隐藏新增设置界面,网页端也引入Built-in与Installed分类组件。这一扩展功能标志着Agent交互向模块化、可共享方向演进,允许用户构建个性化工作流界面。
中国信息通信研究院4月21日启动可信技能(Skills)治理首批测试评估,针对智能体技能模块存在的执行偏差、调度失序、安全隐患等可信度问题,设置"执行可信""调度可控""合规可靠"三大类共15个指标70余个细分项,覆盖Skills治理、Skills库治理等方向。评估工作将于2026年5-6月开展材料审核与技术测试,最终结果在2026年7月相关产业大会发布。
针对用户请求常省略关键细节导致工具调用输入不完整的问题,研究者推出MPT基准测试与PRefine方法。MPT包含265个多会话对话,涵盖偏好回忆、归纳与迁移三大挑战。PRefine通过生成-验证-精炼循环将用户偏好建模为动态假设,从历史提取可复用约束,在仅消耗全历史提示1.24% token的情况下提升工具调用准确率。研究表明,有效的个性化需捕获用户选择背后的原因而非仅记录选择本身。
本源量子宣布,我国第三代自主超导量子计算机"本源悟空"首次系统性搭载人工智能运算能力,实现量子算力与AI应用生态融合。该计算机搭载72位自主超导量子芯片"悟空芯",于2024年1月上线运行。此次同步推出量子知识大模型Origin Brain及QPanda3 Runtime MCP服务,用户可通过自然语言交互提交量子计算任务,无需编程即可调用真实量子算力,显著降低使用门槛。
研究团队发布WebCompass基准,首次对代码语言模型进行全生命周期多模态网页开发能力评估。该基准涵盖文本、图像、视频三种输入模态,设置生成、编辑、修复三类共七项任务,覆盖15个生成领域、16种编辑操作及11种缺陷类型,难度分三级。评估采用LLM-as-a-Judge与Agent-as-a-Judge(基于MCP在真实浏览器中自动测试)相结合的方法。实测显示:闭源模型综合能力显著领先;美学表现是开源模型的最大瓶颈;Vue框架难度最高,React和Vanilla/HTML表现更稳定。
研究团队推出Agent-World,一个用于提升通用智能体能力的自演化训练平台。该系统包含两大核心:自主环境任务发现机制,从数千真实世界主题中探索数据库与工具生态并合成可验证任务;以及持续自演化训练框架,结合多环境强化学习与动态任务合成,自动识别能力缺口并驱动针对性学习。Agent-World-8B和14B模型在23项智能体基准测试中持续超越主流专有模型,研究还揭示了环境多样性与自演化轮次对智能体性能的提升规律。
Just tried the new infographic skill from @dotey in my Hermes Agent from @NousResearch. I gave it the URL of my new arti...
研究团队发布GTA-2基准测试,用于评估通用工具智能体从原子级操作到开放式工作流的综合能力。该基准包含GTA-Atomic(短期封闭任务)和GTA-Workflow(长期开放任务),采用递归检查点机制分解目标并评估端到端完成度。实验显示,前沿模型在原子任务上成功率不足50%,在工作流任务中仅达14.39%。分析表明,检查点反馈及Manus、OpenClaw等执行框架可显著提升性能,凸显执行架构设计比底层模型能力更为关键。
Anthropic 为 Claude Code 推出 /usage 更新,核心在于管理 100 万词元上下文窗口以避免性能衰减。文章介绍了关键策略:开启新会话适用于新任务;使用“回溯”功能从历史节点重启以高效纠错;“压缩”功能自动总结历史,“清空”则需手动提炼要点;当工作产生大量中间结果时,使用“子智能体”在独立上下文中执行并仅返回结论更佳。目前,掌握这些决策是引导 Claude 产出高质量结果的关键。
新增 /tui 命令实现全屏无闪烁渲染,Ctrl+O 改为切换详细转录模式,焦点视图由 /focus 独立控制。强化插件管理界面,新增 MCP 服务器配置冲突警告,扩展远程控制客户端对多条斜杠命令的支持。修复 30 余项问题,包括 MCP 工具调用挂起、全屏高 CPU 占用、非受信文件名命令注入漏洞等,并优化内存分配与会话管理。