Moxt的核心是为AI构建了一个原生工作空间,通过将Word、PDF等文档自动转换为Markdown等AI原生格式,并利用文件系统作为结构化“图书馆”,解决了信息“散”与“脏”的痛点。用户拥有由AGENTS.md定义的个人AI助手,并能创建高度个性化的“AI同事”。它强调信息质量,内置“熵减官”角色清理过时内容。AI不仅能组合Skills完成复杂任务流,还支持定时任务与Webhook实现自动化。其输出超越文字,可生成可交互的数据看板与完整PPT,使AI成为组织内的高效协作者。
Moxt的核心是为AI构建了一个原生工作空间,通过将Word、PDF等文档自动转换为Markdown等AI原生格式,并利用文件系统作为结构化“图书馆”,解决了信息“散”与“脏”的痛点。用户拥有由AGENTS.md定义的个人AI助手,并能创建高度个性化的“AI同事”。它强调信息质量,内置“熵减官”角色清理过时内容。AI不仅能组合Skills完成复杂任务流,还支持定时任务与Webhook实现自动化。其输出超越文字,可生成可交互的数据看板与完整PPT,使AI成为组织内的高效协作者。
蚂蚁数科在2026数字中国建设峰会上发布DataX智能体数据生态平台。该平台通过接入模型上下文协议(MCP)和专用智能体DTClaw,旨在降低数据使用门槛、缩短数据价值转化周期。DataX汇聚隐私计算、数据加工等Skills库,将传统数据服务转化为标准MCP协议以提升AI接入效率。DTClaw可将复杂的数据处理逻辑封装为即用型Skill与Agent,实现“开箱即用”。平台还构建了基于数据的图谱知识库,支持通过自然语言进行智能编排与高效检索,帮助企业快速构建专业智能体。
新一代WPS多维表格通过AI能力升级,实现了零代码搭建办公管理系统。用户可用一句话描述需求(如“搭建编辑部稿件管理系统”),AI即可自动生成包含字段、视图和仪表盘的完整表格,大幅提升效率。系统还支持AI字段总结内容、自动生成社交媒体脚本,并能设置自动化工作流,例如在稿件截止前自动发送催稿提醒,实现智能管理。该产品基于海量办公场景洞察,深度贴合实际工作流程。
科大讯飞正式发布星火 X2-Flash 模型并开放API。该模型采用MoE架构,总参数300亿,支持256K上下文,基于华为昇腾910B集群训练。其在智能体、代码等能力上大幅提升,在深度研究报告、Skill管理等多项任务上效果接近业界万亿参数模型,而整体token消耗不到主流大尺寸模型的三分之一。通过结合DSA与MTP技术,模型在国产芯片上的训练效率从同规模A800集群的20%提升至90%,并解决了长交互场景采样效率低的问题,为大规模强化学习训练扫清障碍。AstronClaw、Loomy等已率先接入。
一款出色的个人AI助手应具备七大核心能力:跨平台无缝执行邮件、日历及各类API/MCP服务;能主动可靠地处理定时任务与自动跟进;拥有优秀的长期记忆以更懂用户;提供无需复杂指令的开箱即用多端体验;支持在文字、语音、视频和实时通话间自由切换;可通过任何第三方通讯软件触达;并具备有趣的个性。然而,目前包括OpenClaw、Claude Code和Codex在内的产品,均未能完全满足所有这些标准。
A great personal agent should: 1. Get work done across email, calendar, Google Workspace, or any API/MCP it's hooked up ...
当前,遗留代码、AI工具与组织治理正加速融合。Anthropic将Claude Code作为“新员工”引入拥有70万行代码的17年老项目;Thoughtworks推动提示词成为可版本化、可审查的一等交付物;NVIDIA致力于构建统一的全模态主干模型。随着AI已具备代码生成能力,工程挑战的核心正从“生成”转向“治理”,关键在于让AI持续理解项目上下文、使其输出可复用,并推动多模态技术落地生产环境。
Anthropic于4月29日宣布升级Claude AI,新增专属连接器,全面接入Adobe、Blender等八大主流创意软件生态。此次更新将AI能力深度整合至专业工作流,用户可直接在Adobe系列软件中调用50多项工具,在Autodesk Fusion中通过对话创建修改3D工业模型,在Blender中生成脚本与调试场景。此外,音频软件Ableton和Splice用户也能快速查询文档与检索采样库。Claude旨在充当智能助手,自动化处理重复任务,让创作者更专注于核心创意。
Adobe 将 Photoshop、Lightroom、Illustrator 等八款核心创意工具集成至 Claude。用户现可通过 AI 助手直接调用这些工具,执行调色、抠图、扩图等图像处理,套用模板设计、剪辑视频、获取 Stock 授权素材,以及搜索、总结和整理创意文件。此举旨在简化创意工作流程。
SKILL.md文件将调用接口、执行流程和工具副作用混合在自然语言中,导致技能发现和风险评估脆弱。新研究提出SSL三层类型化JSON表示:调度层处理调用信号,结构层管理执行场景,逻辑层定义原子动作和资源使用,基于Schank和Abelson的脚本理论。通过LLM规范化器转换现有文件,技能发现MRR从0.573提升至0.707,风险评估宏观F1从0.744提升至0.787。研究发布了6,184技能语料库、403任务查询和500风险标记技能,强调随着技能注册表扩展,需结构化表示以提升管理效率。
本次更新主要新增了通过环境变量选择Bedrock服务层级的功能,并支持在/resume搜索框粘贴PR链接以定位创建该PR的原始会话。同时修复了多项关键问题:修正了源会话含时间线回退条目时,/branch命令可能创建失败分支的问题;解决了发送给新版模型的图像被错误调整为2576px(应为2000px上限)的问题;增强了OpenTelemetry日志记录,确保数字属性以数值类型输出;并修复了Vertex AI/Bedrock在生成会话标题等场景下可能返回无效请求错误的问题。此外,还包含对MCP工具显示、CLI命令退出行为等多项细节的优化与修正。
Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...
To enable: install the Claude mobile app → /remote-control to pair the mobile app → /config → enable "Push when Claude d...
Claude宣布接入Blender、Adobe、Autodesk等八个创意行业核心工具,标志着AI应用从聊天框生成转向深度嵌入专业工作流。用户可直接在软件内部调试场景、批量修改对象或编写脚本,处理重复性任务。这代表AI竞争焦点已从模型规模转向与普通人工作流的无缝融合,对创作者而言,掌握这类连接器比追逐新模型更具实际价值。
Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...
Persistent memory is the Achilles heel of AI. Engramme's Large Memory Models (LMMs) empower every app with persistent me...
以ChatGPT、Claude Web为代表的工具已超越传统聊天机器人,成为具备虚拟运行环境和工具调用能力的AI Agent。利用这一特性,用户可以让AI在执行任务时自行进行验证和迭代,而非仅进行对话。例如,在要求其生成或优化图像提示词时,可指令AI先自行验证并根据结果迭代改进,用户最终验收迭代后的成果,这种方法通常能获得更优的结果。
http://x.com/i/article/2047484171258634240
作者不再直接与多个AI Agent交互,而是通过核心AI搭档Finn来管理整个工作流。具体流程是:先在Codex中将单个Agent或技能调试稳定,然后交由OpenClaw平台运行,后续基本无需干预。用户只需向Finn提出需求,由其协调其他Agent执行,避免了与众多Agent直接对话导致的混乱。该系统已集成Obsidian、Google Workspace、飞书、GitHub等工具,并通过白名单、审计和能力边界限制确保安全。例如,处理年度烂账的流程被调试为固定技能后,Finn能自动填表、定时盘点并发送邮件,成为集私人助理、财务总监和技术总监于一身的角色。
作者试用Open Claude Design项目,肯定其作为开源项目的学习价值,项目宣称还原度超95%、代码量达18700+行。但当前产出仅为HTML雏形,在交互和完成度上与Claude Design原版的优美React组件相比仍有明显不足。
正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71...
华盛顿大学MacCoss实验室的Brendan MacLean将培训新开发者的方法论应用于Claude Code,以管理拥有70万行C#代码、持续开发17年的开源蛋白质分析软件Skyline。他通过创建独立的AI上下文仓库、编写CLAUDE.md引导文件以及设计“技能”模块(如调试技能),为Claude Code建立项目认知。该方法显著提升了开发效率:搁置一年的文件视图面板功能在两周内完成;CSS布局更新从依赖设计师变为不到一天实现。此外,Claude Code还自动化了2000多张教程图片的截图比对和每日测试报告生成,团队现在主要依靠它生成代码和脚本。
Anthropic为Claude推出了一系列针对创意软件的原生连接器,使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API,例如在Blender中调试场景、批量编辑对象,在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”,如寻找菜单、记忆语法、编写一次性脚本等,从而实现更少的上下文切换、更直接的操作和更高的自动化程度,提升工作效率。
Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...
Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...
Anthropic推出Claude for Creative Work,这是一套连接器工具,可实现Claude与Blender、Autodesk、Adobe等主流创意软件的直接集成。这些连接器允许Claude访问各平台功能,例如在Adobe系列中调用50多款应用,在Autodesk Fusion中通过对话创建3D模型,或在Blender中通过自然语言操作Python API。创意工作者可利用Claude加速软件学习、编写脚本插件、桥接多工具工作流以及自动化批量处理等重复任务。该系列工具基于MCP标准,并已与多所艺术设计院校合作,旨在推动创意计算教育。
Mistral AI正式为企业客户在Mistral Studio平台推出“工作流”功能。该功能具备持久化执行能力,可追踪每一步状态,并提供完整的可观测性,记录所有分支、重试和状态变更。其核心特性包括支持“人在回路”,仅需一行代码即可暂停工作流等待人工审批,且与Studio原生集成,使用相同的智能体和连接器。该方案注重企业就绪性,通过工作区实现团队与项目隔离,同时服务于开发者和业务团队。在部署上,其控制平面运行于Mistral自有基础设施,提供了灵活性。
Hear from our team:
本文综述多工具LLM智能体的进展,指出其核心失败原因在于长时间协调多个工具的可靠性不足,而非单次工具调用。论文将多工具编排视为独立问题,要求智能体处理工具的选择、排序、监控与重试。作者从运行时规划、训练数据与调优、安全性、效率、缺失工具处理及更复杂的交互任务基准六个领域回顾现状。关键发现是,进展更依赖于图式规划、记忆、验证、回滚以及更好的长周期工具使用评估方法,而非单次调用准确性。当前研究与基准正从简单的单次调用测试转向更贴近现实、要求智能体在长工具链中保持可靠性的硬任务测试。
阿里云QoderWorker推出专家套件功能,首批上线金融、法律、营销等六大领域10个套件。这些套件将专业知识、工作流程和数据连接器预先封装,用户无需编写代码即可一键调用,直接获取专业经验。例如,法律套件可全流程处理合同审查、文书起草,金融研究套件能快速基于公告生成分析报告。平台还支持企业自建专属套件,实现“配置”与“使用”分离,懂业务的员工封装一次后,其他员工可一键安装使用。
用户尝试了Slock平台,认为其界面和交互类似Slack,安装配置过程简单。主要流程包括:在网站注册登录并添加本地电脑,通过终端执行指令自动扫描本地的大模型命令行工具;随后可利用本地的Claude Code、Codex或Gemini CLI创建AI Agent。用户可以在不同对话线程中邀请这些Agent加入,实现随时对话并调用本地的Skill功能。该平台旨在便捷地集成和管理本地AI工具进行协作。
OpenAI开源了gpt-realtime-1.5的官方语音控制组件,允许用户直接用自然语音控制应用UI状态,而非仅进行语音转文本。该组件是一个完整的React参考实现,开发者可快速集成。其核心在于工具由应用预定义,模型只能调用这些受限动作,确保了安全可控。这标志着语音正从输入层升级为顶层控制层,为设计、驾驶等双手操作场景提供了新的交互可能,是交互范式的重要转折。
You can build interactive applications with gpt-realtime-1.5, so users can control app state more naturally with voice. ...
作者将BestBlogs的业务与接口监控能力接入PostHog,并将详细日志存储在阿里云SLS。通过对接两边的监控控制平面,定期分析检查业务与系统问题,随后利用Codex进行自动化优化与改进,从而形成一个完整的监控、分析与优化闭环。这一流程显著提升了运维效率,实现了省心管理。
Did you ever want to control your browser side-by-side with Claude Code? Now, with /open-gstack-browser skill and GStack...
GPT Image 2 Prompt工具发布了一项针对生成“Elon Musk”主题高级概念排版海报的详细设计规范。核心要求是海报必须以“Elon Musk”标题为绝对主导视觉结构,文字需巨大、可读、有力且拼写精确。设计需基于对标题含义、文化氛围及象征意义的解读,转化为一个强有力的视觉隐喻。若标题指代广为人知的人物,则需将具有可识别性的编辑肖像作为主要视觉元素,占据40-70%版面,并与标题文字产生互动。整体风格需为高端编辑海报,采用4-6色系,强调定制化字形、戏剧性尺度和精炼的视觉张力,避免通用化设计元素。
http://x.com/i/article/2048438511788007424
PixVerse发布AI视频生成CLI工具,用户可通过一行命令快速生成视频,无需打开浏览器。该工具集成于Claude Code等平台,支持调用Sora 2、Veo 3.1、Grok Imagine等多种模型,并具备图片生视频、AI配音、唇形同步等网页版全部功能。安装简便,支持通过Telegram或飞书进行手机遥控操作。
Chrome 开发者文档推出了 Prompt API,这是一个用于 AI 提示管理的应用程序编程接口,帮助开发者以编程方式处理提示词,提升开发效率。该 API 的发布信息在 Hacker News 上获得102点积分,反映出技术社区对此工具的关注和积极评价。开发者可通过官方文档进一步了解其功能和应用场景。
腾讯云QClaw发布v0.2.14版本,迎来最大规模更新。新版本率先支持Hermes框架,允许单一应用同时运行两种Agent内核。核心功能“灵感广场”升级为“专家广场”,内置超100个行业场景AI专家,用户通过自然语言交互即可直接生成文档、代码等结果。底层模型支持自由切换,新增接入腾讯混元Hy3 preview和DeepSeek-V4 Pro等大模型。微信小程序新增语音交互、文件共享及云端Agent远程管理功能。同时,平台新增百度网盘、携程等四个连接器,并上线了基于腾讯文档的Agent团队协作功能。
Telegram上线Managed Bots功能,极大简化了专属AI助手机器人的创建和管理流程。用户只需点击链接并确认名称,几秒内即可获得一个以自己名字命名的专属Bot,体验从使用公共客服转变为拥有私人助手。该功能支持机器人创建和管理其他机器人,并能互相通信。其核心潜力在于支持大规模个性化部署,应用场景包括:为每个用户创建隔离记忆与配置的个人AI助手;让商家一键开通品牌客服Bot的客服SaaS平台;用户点链接即开通的AI Agent平台;以及为每位订阅者提供定制化内容推送的专属Bot。
当前LLM智能体技能多以文本描述,导致机器难以解析利用。本研究基于经典知识表示理论,首次提出结构化技能表示法——调度-结构-逻辑表示法,将技能解耦为调度信号、执行结构和逻辑证据。通过基于LLM的标准化器实现该方法,并在技能发现与风险评估任务上评估。结果显示,该方法显著优于纯文本基线:技能发现的MRR从0.573提升至0.707,风险评估的宏观F1分数从0.744提升至0.787。这表明显式、基于来源的结构化表示能提升技能的可搜索性与可审查性,是迈向更可检查、可重用、可操作技能表示的重要实践步骤。
作者回应外界对其开发的“悟空skills”是否抄袭“女娲skills”的质疑,澄清其项目是在“女娲skills”启发下,根据自身需求进行独立迭代和完善的产物,并预告即将开源以供公众自行比较差异。背景信息显示,“女娲.skill”已取得显著关注,并被多家主流公司的Agent产品采用。
女娲.skill半个多月,14k+ stars了。并且已经分别被腾讯、Kimi、智谱的Agent产品直接植入作为默认skill使用。 如果你还不知道这是什么的话,这张图可以帮你建立起一个基本的认知。