AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 657 条
全部一手资讯X论文
标签「MCP/工具调用」清除
OpenAI@OpenAI · 5月1日70

It's never been easier to do everyday work with Codex. Choose your role, connect the apps you use every day, and try suggested prompts. Codex helps with everything from research and planning to docs, slides, spreadsheets, and more.

译使用Codex处理日常工作从未如此简单。 选择你的角色,连接你每天使用的应用,并尝试建议提示。 Codex能在研究规划、文档、幻灯片、电子表格等方方面面提供帮助。

阿绎 AYi@AYi_AInotes · 5月1日61

很多人还有些看不太懂,我再打个比方尽量跟大家说清楚, 就好比像你去一家标榜最开放的咖啡馆喝咖啡, 结果服务员偷偷扫描你手机里有没有竞品APP的通知, 只要扫到就多收你一杯的生态保护费, 表面上是欢迎所有人, 背地里却在设卡收租, 所以用户现在集体炸锅也正常

译Anthropic被曝通过其官方Claude Code工具检测用户Git提交历史,若发现包含“openclaw”字符串,便将该用户识别为第三方工具使用者,并触发“out of extra usage”错误,导致服务被拒或强制额外收费。开发者实验证实此为人为设置的字符串匹配规则。此举被视为Anthropic为将用户锁定在自家生态、打压更灵活的第三方竞品而采取的粗暴手段,与其此前塑造的开放、不监控形象相悖,引发了开发者社区的强烈不满和抗议。

meng shao@shao__meng · 4月30日57

Glean 发布 Waldo:自研"智能搜索专用模型",作为前置环节运行在前沿大模型之前,专门负责检索规划,把"找资料"和"做推理"这两件事拆开 @glean https://www.glean.com/blog/waldo-launch Waldo 基于 NVIDIA Nemotron 3 Nano(30B/3B MoE),采用 instruct 模式而非 reasoning 模式,以压低延迟。使用 Thinking Machines Tinker API 做 LoRA 微调 为什么做 Waldo · 观察:企业 AI 任务无论多复杂,几乎都从搜索开始(多轮迭代检索 → 综合作答) · 痛点:让前沿模型同时做"检索规划"和"深度推理",是用最贵的算力干最机械的活——慢且贵 · 思路:高频、定义清晰的子任务(如搜索)应该交给专门训练的小模型;前沿模型只做综合与生成 架构关键决策 · Waldo 作为 第一步 运行,而非作为前沿模型的 sub-agent 被调用。 · 子智能体方案需要 3 次串行推理;Waldo 前置最优情况下只需 1 次前沿模型调用 · Waldo 调用工具集(Glean Search、员工搜索、Web Search),完成后不生成自然语言,而是把检索好的上下文"原状"交给前沿模型,让前沿模型像自己搜过一样直接作答 · 不替代 Glean 现有的语义搜索与企业知识图谱,而是在其之上做"规划层" 衍生能力:自适应推理路由 Waldo 跑完后,其自身执行轨迹(调用次数、命中文档数、是否稀疏、是否需越界工具)天然成为路由信号,用来决定下游前沿模型应启用多深的推理档位。模型"读自己的活"来评估任务复杂度。 实际效果 · 单次 LLM 调用:Waldo 比默认推理模型(GPT-5.4 medium)快 10×+(~250ms vs ~3s) · 端到端集成后:延迟降低 ~50%,Token 消耗降低 ~25%,质量无回退 · 约一半查询走"快路径",根本不需要前沿模型的完整能力

译Glean推出自研的智能搜索专用模型Waldo,旨在将企业AI任务中的“检索规划”与“深度推理”分离。Waldo基于NVIDIA Nemotron 3 Nano构建,作为前置环节运行,专门负责调用Glean Search、员工搜索和Web搜索等工具进行检索规划,并将检索到的上下文直接交给前沿大模型进行综合作答。这种架构避免了让昂贵的前沿模型处理机械的搜索任务,使单次调用延迟降低至约250毫秒,比默认推理模型快10倍以上。集成后,系统端到端延迟降低约50%,Token消耗减少约25%,且约一半查询可走“快路径”无需调用完整前沿模型。该设计印证了专用小模型在处理重复性任务上的效率优势,是智能体AI架构的重要演进。

Berryxia.AI@berryxia · 4月30日67

🚀 Claude Code 内置神技上线! 直接调用 Claude Platform 官方技能,模型迁移、Prompt Caching、Managed Agents 上手全自动搞定! 1. 直接说 “Add prompt caching” 就能自动应用最佳实践 2. 完全开源,支持 7 种语言 SDK + CLI,还集成到 CodeRabbit、JetBrains 等工具

小互@xiaohu · 4月30日59

Stripe 发布 Link agent wallet 让 AI agent 可以代表你发起付款,但不会拿到你的真实银行卡信息。 AI agent 可以为你创建一次性支付凭证,用完就失效。 你会收到提醒,并在 Link 里批准或拒绝每一笔购买。 真实卡号不会交给 agent,也不会暴露给它正在操作的工具。 Link CLI 已经开源,开发者可以把它接进 Claude Code、MCP 客户端或自己的 agent 工作流。

译Stripe发布Link agent wallet,使AI agent能代表用户发起支付,同时保护银行卡信息安全。其核心机制是让AI agent生成一次性支付凭证,每笔交易需用户在Link中手动批准或拒绝。真实卡号既不会提供给AI agent,也不会泄露给其调用的外部工具。此外,Stripe已开源Link CLI,开发者可将其集成至Claude Code、MCP客户端或自定义的agent工作流中。

Berryxia.AI@berryxia · 4月30日49

http://x.com/i/article/2049497253421940736 # AI时代最大的笑话:我居然还在用邮箱疯狂搞钱!别卷Prompt了,会发邮件就能让AI帮你干活! > 我从去年 11 月就开始养龙虾,自己摸索了半年。今年国内龙虾火了之后,我反而冷静下来——开始琢磨怎么把它真正接入工作和团队。 最近这半年,「养龙虾」这事儿在朋友圈和 X 上挺火的。 我也是其中一员。从去年 11 月份开始养,那时候国内还没什么人玩,全靠自己摸索。摸了半年到现在,国内龙虾真正火起来之后,我反而开始注意到一个挺奇怪的现象—— 大家养着养着就停了。 新鲜劲过去之后,那只龙虾就在那里待命中,朋友圈晒过几张截图,公众号写过几篇 demo,然后呢?然后就没有然后了。它没真正进到任何人的日常工作或生活流程里。 我也走过这个坑。直到今年开春想清楚一件事—— 我不只自己用,我能不能让我同事也“吃上”我养的这只龙虾? 这篇是我的答案。 我尽量讲得朴素一点,最小的成本、最低的学习门槛——这样你看完,如果你身边也有不太会折腾的同事,能直接照着搭起来。 ## 我们这边的真实情况 我做 TOB 教育业务。平时业务节奏很常规:谈业务、找客户、出方案、谈合同、交付。 投标是中间一环,不是大头——学校采购、教育比赛、各种乱七八糟的项目挺多,加在一起占用的零碎时间不少,但属于那种「不做不行,做了又烦」的活。 这次养龙虾这件事,参与的就两个人——我和我们公司的商务助理 TIFA。我主要跟进设计,TIFA 帮我做后端的对接和测试。我们日常公司里其他同事都还在按老方式干活,没人逼着改。 我决定先挑一个网站做测试实验,跑通了再考虑接入更广的工作流。 我挑了港科大广州的招投标公告——https://puro.hkust-gz.edu.cn/bid/index上面有新公告、投标截止时间、中标公示,结构清晰,是个典型的「靠人刷」场景。 把它跑通,再说扩展。 教育行业的标的极其分散——高校竞价网、竞价星、云彩通、各地政府采购、几十所重点学校自己的采购处页面。做过这个业务的人应该是懂的都懂,一个城市跑下来要刷十几个网站。我们之前给 同事 TIFA 配过豆包,让她每天看到公告就丢进去做摘要,但最累那一步「先得把公告找到」,豆包 帮不上忙。 那段时间我手机里和她的飞书消息长这样👇🏻 > TIFA 08:42 老板,今天广州那边智慧教室的标有没有看到? > TIFA 09:15 竞价星又打不开了…… > TIFA 09:48 港科大今天发了 3 条新公告,我整理一下发你 > TIFA 10:33 那个深圳的标我刚发现已经截止了,赶不上了 > TIFA 14:20 南沙的我在客户路上没法刷,你能帮我看一眼吗? > 说明:该图为AI生成示例图(工作原因没办法直接截图) 讲真,AI 进来了,但人还是脱不开身——没真做到自动化。 直到 4 月初,我换了一个组合。 ClawEmail + XCrawl——前者给龙虾一个真实可收发的邮箱身份,后者让龙虾能看任何公开网页。两个东西加上龙虾这个载体,整个工作流就跑起来了。 跑了一个月之后我突然意识到一件事—— 邮件这个被宣告死了 10 年的东西,正在变成 AI 时代最稳定的工作流入口。 过去几年所有 AI 工具都在比谁的对话框更聪明、谁的模型更强、谁的 token 更便宜。但真正决定一个 AI 工具能不能用起来的,从来不是它有多聪明,是它能不能进入你已经在用的工具流。 而我们已经用了 50 多年的、最不可替代的工具流,叫邮件。 ## 第一步,去 ClawEmail 给龙虾注册一个 Agent 邮箱 ClawEmail 的官网注册地址是:https://claw.163.com/?channel=Berryxia.AI 舔着 B 脸要的邀请码,不然要排队很久,仅仅适用于前200名。手慢无。 记得输入邀请码:CLAWBECF889BE773 进去你会看到一行很大的 slogan——「邮件是调用 Agent 最简单的方式」。下面那句更直白:「给每个 Agent 一个专属邮箱,任何人发邮件就能用,不需要注册、不需要 VPN、不需要 API 对接」。 第一次看到这句话我没在意。跑了一个月之后我意识到这就是这个产品的全部。 这里需要先讲清楚网易的 ClawEmail 和传统邮箱最大的不同—— 普通邮箱(Gmail / Outlook)只能干一件事:把邮件存进收件箱,等你打开来读。 而网易的 ClawEmail 邮箱打破了传统邮箱的设计,直接专为 Agent 设计。它的官方文档里有句话写得特别准: > 「不是又一个 AI 工具。是一个可编程的邮件处理引擎。」 什么意思?官方把它的能力拆成 5 项技能 简单讲——传统邮箱是给人用的,ClawEmail 是给程序用的。一个负责把邮件「摆在你眼前」,一个负责把邮件「变成程序能调用的接口」。 这就是为什么需要给龙虾单独配一个 @claw.163.com 邮箱——它不是个普通邮箱,它是一个能让 AI 真正参与工作流的接口层。 但要注意——这些读写能力不是开箱即用的。每装一个 Skill,它就多一项本事。下面这套就是我装了 3 个 Skill 之后跑起来的。 目前 ClawEmail 还在内测期,先点首页那个橙色「立即报名参与内测」按钮,提交资料拿邀请码 CLAWBECF889BE773 (我等了 4 天)。激活之后,三步配置一个 Agent 邮箱: 1. 创建邮箱:在 Dashboard 点「+ 新增 Agent」,给它起个名字,系统自动生成 @claw.163.com 后缀的真实地址。 1. 绑定到龙虾:需要点击添加邮箱后,可以看到更多点击配置邮箱,选择为 OpenClaw 安装。 1. 复制官方那行命令,丢到龙虾对话窗里说「装一下这个 Skill」。 1. 测试收发:拿任何邮箱给它发一封,看它能不能读懂能不能回。 我的实操。在龙虾对话窗里直接说「帮我装一下 ClawEmail + 安装指令即可」,然后把命令丢给它,注意这里每个人的Key不同,不要复制我的这个key哈: 它接过去自己装。装好告诉我「装完了,准备给我配邮箱吗」。 我申请的这个邮箱后缀@claw.163.com 的真实可收发的邮箱。 我的私人主邮箱是 andyhu#m e.com,跟它物理隔离——任何邮件混乱、隐私泄露的风险都不会传到我的主邮箱上。 因为大家叫我 Berryxia,我这里给我的龙虾起了个名字就叫小 B(后文全部使用它),方便大家可以记住他。 ClawEmail 还给小 B 配了两种处理模式——Email Channel(邮件即指令,AI 读上下文回复)和 CLI 工具(邮件即数据,按规则批量处理)。日报巡检走 CLI,临时查询走 Channel,混着用。 我们没干别的事儿就是每天查看邮件就可以完成这个工作流中的一个工作。 ## 第二步,给小 B 装一双能看公开网页的眼睛 XCrawl 是个网页智能抓取的 MCP 服务,小 B 装上之后就能看任何公开网页。之前给朋友们已经推荐安利过,是一款爬取文章内容都是很不错的工具,强烈安利给大家。 注册地址:https://xcrawl.com/?keyword=h4csylkj 注册之后会给一个控制台,里面有 API Key 和算分(赠送 1000 积分初始额度,够跑一阵)。它有 5 个原子能力—— - Scrape:抓单页。一次请求拿到 Markdown / JSON / HTML / 截图 / 摘要 / 链接列表。支持动态 JS 渲染、国家代理、仅主要内容过滤。 - Crawl:批量抓整站。智能递归,支持翻页和无限滚动,可设置深度(最大 3 级)、页面上限(最多 100 页)。 - Map:站点 URL 发现。先扫域名给出全部可发现 URL(最多 10 万条),可以正则过滤——比如我做标书雷达就用了 /bid/.* 只抓招标频道。 - Search:跨引擎搜索。Google / Bing 等。 - SERP:深度抓搜索结果页。除了 10 条结果,还含 People Also Ask、知识图谱、相关搜索、富结果。 但真正让我觉得这玩意儿是「为大模型设计」的,是它两个底层能力—— 输出 Markdown 直接喂大模型。它的 Markdown 已经做了清洗——去广告、去导航、去 cookie 弹窗,只留正文和结构化元素。不用我再写正则过滤。 自定义结构化提取。我可以告诉它「抓这个页面,提取项目名、预算、截止时间、资质要求」,它会按 schema 自动整理成 JSON。这一步省下来的脏活,可能是它最大的价值——以前自己写爬虫光「把页面文本变成结构化字段」就能写半天。 至于稳定性——住宅 IP 轮换、浏览器指纹伪装、JS 渲染重试,这些防封策略默认开。我跑了一个多月没卡死过。 把官方命令丢给小 B 或者丢安装文档就行: 安装文档:https://docs.xcrawl.com/doc/introduction/#welcome-to-xcrawl ## 第三步,让小 B 学会玩转飞书 因为自打过完年后,公司从企业微信转飞书平台,恰逢小龙虾起飞,飞书也将作为第二个基建的工具,必须给我的让小 B 装一个能玩转飞书的 Skill: 这一步很关键,因为我和 TIFA 平时所有工作都在飞书里。如果让小 B 把数据沉淀到一个我们不打开的地方,那等于没沉淀。 让它直接写飞书,意味着 TIFA 随时打开飞书就能看到所有标书的最新状态,不需要打开龙虾,不需要装新工具。 我让小 B 建了一张「港科大广州投标追踪表」,方便查看中标情况和毛利等信息 这张表是小 B 知道「我们投过哪些标」的来源,也是它每天更新中标结果的目的地。 ## 第四步,下任务(也是最后一步) 打开龙虾对话窗,我直接说—— > 每天中午有新标的推送邮件到 andyhuo@me.com 中将 https://puro.hkust-gz.edu.cn/bid/index的关于苹果、Mac、imac 服务器、工作站相关的项目推送给我并发送邮件,以及对应的中标信息,以及截止投标日期等提供链接 https://puro.hkust-gz.edu.cn/bid/work-list?columnId=7&location=2 可以参考,使用 xcrawl 进行提取。 注意我没强调几点钟干什么——它会自己排定时任务。第二天中午第一封早报就到了。 我和 TIFA 都把 ClawEmail 在手机上接进了飞书工作台,所以不管在地铁里、客户路上、家里沙发上,邮件来了第一时间能看到。 邮件的主要信息包含了,正在进行标的以及报名截止时间。已经成交的标的等,都是直接在邮件中可以查看,当然你的约束条件越多,给到的结果就会越精准。 你可以根据自己的需求进行调整变量。 我在地铁上花了几分钟读完,转给 TIFA「截止那条今天对一下应标材料;中标那条记录到复盘文档」。 但真正改变我们工作方式的,是那天下午。 3 点多,TIFA 在外面见客户,飞书发我:「我们之前投的『Mac 电脑科研教学用电脑』那个项目中标公示出了吗?」 我没在电脑前。打开手机邮件新建一封——收件人 berryxia@claw.163.com,主题「麦克电脑那个项目中标公示出了吗」,正文空。 3 分钟后 TIFA 和我都收到一封回信: > 来自 berryxia@claw.163.com已通过 xcrawl_search 查询 puro.hkust-gz.edu.cn/bid/index 的中标公示频道。「麦克电脑科研教学用电脑」项目中标公示已于今日 11:30 发布。中标方:我方公司 ✅。已自动更新「港科大广州投标追踪表」中该项目状态为 我们中标。详细公示文件附 PDF。小 我盯着这封邮件看了一会儿。 > 我们都是用最熟悉的方式参与的——发邮件。TIFA 不需要装任何工具,我也不需要远程操作她的电脑。我们各自给一个邮箱发了消息,各自收到了答复,飞书表格在我们都没看的时候已经被自动更新了。 港科大这一个网站跑通之后,下一步我准备把高校竞价网、竞价星、云彩通这几个也按同样的模板加进来——同一套工作流,加个监控站点的成本几乎是零。 ## 邮件这件事正在被重新定义 ClawEmail 官网那句被埋得很深的话,我后来才反应过来。 > 「对于不会养龙虾的人来说,他想用 Agent 帮自己完成工作,可以通过邮件去调用别人的 Agent。」 世界上会有一群养虾人,养着各种擅长不同事情的龙虾——做财务的、做法律的、做调研的。它们都有 @claw.163.com 后缀的地址。 你想让法律龙虾帮你看个合同?发邮件给它。你想让财务龙虾帮你处理一批发票?发邮件给它。 你不需要装 App、不需要注册账号、不需要学 prompt——你只需要会发邮件。 不过我又琢磨了一下,邮箱只是开始。 小 B 现在有了邮箱身份,能收能发能被任何人调用。但邮箱只是它的第一张身份证。下一张应该是 ID——统一标识符,让别的 Agent 知道「这只虾来自哪个组织、可信级别多少」。 再下一个可能是 钱包——让它能付款、收款、在干活过程中自己结清第三方 API 的费用。再往后可能是 声音(拨打电话)、地址(收快递)。 一只 Agent 完整身份系统正在长出来。 > 但邮箱这一步意义最大——因为它是整套身份系统里唯一反向兼容人类的接口。我会发邮件,我老板会发邮件,我妈也会发邮件。我们不需要为了用 AI 学一套新协议——AI 反过来学了一套我们已经用了 50 多年的旧协议。 如果你也想试试,几件事得讲清楚。 > 而 XCrawl 严格只爬公开数据,不碰需要登录的、不碰个人隐私、不碰付费内容。也不要碰 robots.txt 明确写着「禁止抓取」的站点。工具中性,但用法有边界。 > ClawEmail 还在内测期,要去 我给你的专属邀请码,不然就排队等官方审批,之前我都等了好几天。不要去外面找乱七八糟的——网易这套真做了反诈和邮件域名信誉机制,只有官方版的 @claw.163.com 邮箱才能保证不进对方的垃圾箱。 我刚开始踩过一个浅坑,用了一个野路子方案发邮件,全进了客户的垃圾邮件,事后才搞明白是域名信誉的问题。这事儿就是 ClawEmail 这种官方方案存在的意义——它解决的不只是「能发邮件」,而是「发的邮件别人能收到」。 最后插一嘴,最近还有个朋友让我帮她查个医生,于是乎我想到的还是这种组合,龙虾帮忙调用的工具然后去解决对应的问题, 最终使用用户喜欢和满意的结果进行交付。因为设计神秘,就不放对应交付物。 直接给对方做了一套完整的PPT,直接可以邮件让龙虾发送就行了。 事情是这样的,她想选择一个适合的医生,想看主治医师的口碑,但是一直找不到客观且真实的评价,。 我想了下让小 B 去小红书进行抓取对应的评论和这个医生的相关信息,XCrawl 的 xcrawl_search + xcrawl_scrape 把医生散在 小红书各个帖子和评论中的信息都拉了下来。 最后按我给的「基本信息、擅长方向、患者评价数」这几个字段做了结构化提取,第二天她邮箱里一份报告+PPT,连「主任号挂号费 50 元」「累计帮助 125 位患者」「8 条公开评价」这种细节都拢成了一张表。 她看完跟我说:「这个医生靠谱,不错。」又便宜,口碑又好。 ## 最后,关于那个“笑话” 文章开头我说:AI 时代最大的笑话,是我居然还在用邮箱疯狂搞钱。 但跑了一个多月之后我发现,真正的笑话其实是。 所有人都在卷 Prompt、卷模型、卷工具,却没人意识到,最低门槛、最稳定、最容易接入团队的 AI 入口,是一个50年前就存在的东西:邮箱。 你不需要让你的同事学 Prompt。 你不需要让你的老板装新 App。 你甚至不需要让你妈理解什么是 AI。 你只需要告诉他们:给这个邮箱发消息,它会帮你干活。 这就是为什么我说邮箱正在复活——不是以“通信工具”的身份,而是以“AI 同事的身份证”的身份。 下次有人跟你说「再不学 AI 就要被淘汰了」,你可以淡定一点。 因为最值钱的 AI 工具,正在悄悄变成一种你早就会用的东西。 而你,已经会了20年。 如果你也养着一只龙虾,但还没让它进入到任何工作流—— 可以从注册一个 @claw.163.com 邮箱开始。 不是为了赶时髦,是为了让 AI 真正帮你搞钱。 邀请码:CLAWBECF889BE773(仅限前200名,手慢无) 注册地址:https://claw.163.com/?channel=Berryxia.AI P. S. 如果你看完这篇文章后成功跑通了自己的 AI 工作流,欢迎在评论区告诉我——你的“小 B”在帮你干什么活。 我很好奇,除了盯标书,邮箱+AI 还能解决哪些被忽视的重复劳动。

译作者分享了一个将AI代理(“龙虾”)融入实际工作流的案例。核心在于利用ClawEmail为AI代理提供一个可编程的邮箱接口,使其能通过邮件接收和处理指令。结合XCrawl(网页抓取工具)获取公开的招投标公告信息,并整合飞书进行结果同步。这一组合解决了教育行业投标信息分散、需人工频繁刷网站的问题,实现了从信息发现到整理分发的自动化。关键在于,AI工具的价值不在于其模型本身多强大,而在于能否无缝嵌入现有、稳定的工作流(如邮件),从而真正提升效率。

Berryxia.AI@berryxia · 4月30日56

兄弟们!AI时代最大的笑话:我居然还在用邮箱疯狂搞钱!有了它我直接退订了我的企查查的年度会员! 养龙虾半年后,我终于让它真正进到我们真实的工作流了! 我用 ClawEmail + XCrawl + 小龙虾 给公司商务助理搭了一个自动投标监控系统。 现在每天中午,小 B 会自动: 1️⃣ 抓取热门招标网站新公告 2️⃣ 筛选苹果/Mac/服务器相关项目 3️⃣ 结构化提取截止时间、中标信息 4️⃣ 直接发邮件给同事+ 自动更新飞书表格 全程零配置、会发邮件就行了,再也不用手动刷几十个网站了! 邮箱正在变成 AI 时代最稳的工作流入口——你不需要让同事学 Prompt,只需要让他们发邮件就行。

译作者结合ClawEmail、XCrawl等工具,为公司商务助理开发了一套自动投标监控系统。该系统能自动抓取招标公告,筛选出苹果、Mac或服务器相关项目,并结构化提取关键信息,随后自动通知同事并更新飞书表格。全程零配置,仅需会发邮件即可驱动,体现了邮箱作为AI时代低门槛、高效工作流入口的价值。

meng shao@shao__meng · 4月30日56

Anthropic 增长营销团队成员 @helloitsaustin 谈: 如何在增长营销工作中深度整合 Claude,五个实际使用场景经验和方法论可借鉴!(不局限于 Claude,可以把方法论平移到你最常用的 Agents) 你是不是也只是让 AI 来做文案润色?这也是大多数增长营销者的现状!而真正的高杠杆用法在于将 AI 嵌入整个工作流中,提升决策质量、自动化重复劳动,并降低跨团队协作成本。 # 五个实际使用场景 1. Chat as a thinking partner Austin 在开始撰写报告或简报前,先用 Claude “talk through the shape of it”(梳理框架)。例如,讨论“哪些指标对目标受众真正重要?如何分段?高管需要什么 vs. 我想展示什么?” 关键技巧:让 Claude 主动向你提出澄清问题,从而暴露隐藏假设,避免后期返工。 这体现了“先思考、再执行”的原则。传统工作中,人们常花1小时写出无用文档;这里,AI 帮助在概念阶段就对齐方向,显著提升效率和输出质量。比如作者举例的 SEO 报告直观展示了对话式引导过程。 2. Cowork for scheduled reporting 文件上传(GSC exports、dashboard data、content list等)和自动生成周报的流程。 Austin 过去每天早上手动拉数据、写总结;现在通过 Cowork 设置定时任务,AI 读取原始数据、起草报告、标记异常,只需几分钟收尾。 这直接解决了增长营销中耗时最多的“数据聚合与叙事”环节。MCP 允许连接常用数据源,实现从 “raw data → executive summary” 的自动化。配图中的周报样例(有机搜索流量增长、关键词表现等)展示了专业输出水平。 3. Claude Code to build the tools I need 提示 “Build a dashboard that tracks our App Store reviews...”(构建追踪 App Store 评论的仪表盘)。 Austin(非开发者)用几小时就开发出用户情绪分析工具,连产品和工程团队都在使用。 这部分最体现“赋能非技术人员”。传统上,营销人需依赖工程资源;现在,“can I try building this myself” 成为第一反应。Claude Code 降低了开发门槛,让增长团队快速迭代内部工具,加速从 idea 到 value 的周期。 4. Skills for encoding your playbook Skills 包括“campaign-brief-analyzer” “brand-voice” “email-subject-line-drafter” 等可重复使用的自定义指令。 Austin 强调:将机构知识(品牌声音、实验分析方法、简报标准等)打包成 Skills,让 Claude 在 Chat、Cowork、Code 中一致应用。 这是“知识管理”的 AI 化解决方案。Skills 让零散文档或个人经验转化为可执行、可复用的资产,避免知识孤岛,提升团队一致性。 5. Claude Design to translate my ideas into visuals 从简报直接生成品牌化落地页mockup的过程。作者过去用文字描述给设计师,现在先用Claude渲染迭代,直到视觉匹配脑海中的想法,再与设计团队对接。 这极大减少了沟通损耗,提升创意对齐效率。Claude Design 桥接了营销 idea 与视觉实现,适合快速测试和迭代。

译大多数营销人员仅用AI润色文案,而高价值用法在于将Claude深度嵌入工作流。Anthropic增长营销成员分享了五大应用场景:1)作为思考伙伴,在撰写报告前梳理框架、对齐方向;2)通过Claude Cowork自动化数据报告生成,节省重复劳动;3)利用Claude Code让非技术人员快速构建内部工具;4)通过Skills功能将机构知识编码为可复用的标准化资产;5)使用Claude Design将创意快速转化为视觉稿,减少沟通损耗。这些方法旨在提升决策质量、自动化流程并降低协作成本,其方法论可迁移至其他AI智能体。

ginobefun@hongming731 · 4月30日51

Codex 现在进化得也很快,不再只是编码助手了,OpenAI 内部将其定位为软件工程智能体,可在「读取-规划-执行循环」中运行测试并协调子智能体。 最新 AI Engineer 里有一个一小时左右的 Full Workshop,讲解子智能体并行执行、插件生态扩展、Guardian 安全门控与 MCP 集成,以及 Codex 获得 300 万周活跃用户背后的工程基础。值得一看。

译Codex已从编码助手快速进化为软件工程智能体,OpenAI内部将其定位为能在读取-规划-执行循环中运行测试并协调子智能体的系统。最新AI Engineer的Full Workshop讲解了子智能体并行执行、插件生态扩展、Guardian安全门控与MCP集成,以及Codex获得300万周活跃用户背后的工程基础,展示了其在软件工程领域的应用潜力和发展进展。

阿绎 AYi@AYi_AInotes · 4月30日68

这个太实用了,Gmail可以做成AI Agent 的入口,让 AI Agent 可以直接从邮件里接活干哈哈哈,It's so cool🤩🤩🤩 视频演示是一封付费用户结账后卡住的 bug 邮件 →点一下Share in chat"→ Google Chat 里 @Uma 自动接管。 背后链路: Gemini Flash Lite 路由 → Cursor SDK → Cursor Cloud Agents 自动读邮件线程、查代码仓库、分析 bug、写修复方案 结果直接流式返回到 Chat,还能一键跳 Cursor 看过程。 以前:复制邮件 → 粘贴给 AI → 等回答 现在:一键推送 → Agent 自己干完 Gmail = 入口 Google Chat = 协作面板 Cursor SDK = 大脑和手 这才是AI Agent 接活该有的样子啊

译推文演示了将Gmail作为AI Agent任务入口的实用场景:用户可将bug报告邮件一键分享至Google Chat并@AI助手Uma,由其自动接管。技术链路整合Gemini Flash Lite与新版Cursor SDK,驱动Cloud Agents自动读取邮件、查询代码、分析问题并生成修复方案,结果流式返回聊天界面。这实现了从手动复制粘贴到一键自动执行的转变。文中强调,Cursor SDK的发布里程碑式地将生产级编程能力转化为可任意嵌入的基础设施,使同一智能体能集成于CI流水线、自动化脚本等各处,其能力与编辑器内体验完全一致,正推动开发者角色向指挥AI转型。

向阳乔木@vista8 · 4月30日66

发现一个很实用的开源项目,叫 Beads,GitHub 上已经有 22.6k star 。 核心想解决 AI Agent 处理长任务的「失忆」问题。 现在 AI Agent一般靠 Markdown 做记忆,但Markdown是纯文本,没结构,没依赖关系,没状态追踪。 任务一多,上下文窗口一满,信息就丢了。 Beads 的思路:好好做「任务管理」。 底层用的是 Dolt,是一个「像 Git 一样」的 SQL 数据库,支持分支、合并、版本回溯,甚至有单元格级别的merge。 Beads 用Dolt的好处: ① 多个智能体并发写入时,用哈希 ID(比如 bd-a1b2)避免冲突 ② 任务历史可以回溯,不会凭空消失 ③ 持远程同步,团队协作或多机器使用都没问题 不依赖 Git,Beads 可完全脱离 Git 运行。 上下文压缩设计的也不错,有个「语义记忆衰减」,把关闭任务压缩摘要,节省上下文窗口空间。 适合什么场景 项目说主要给 AI编程Agent用。 实际上,任何要在多个 AI 会话之间保持任务连续性的场景都适用。 不用每次开新会话都要重新交代上下文。 安装方法:把Github的地址丢给你的Agent,告诉他安装这个库,并带我配置使用。 地址见评论区

译开源项目Beads旨在解决AI Agent处理长任务时的信息丢失问题。它摒弃了传统无结构的Markdown记忆方式,转而采用结构化任务管理。其底层使用支持分支、合并和版本回溯的Dolt数据库,允许多智能体并发写入且避免冲突,保持任务历史可追溯并支持远程协作。项目还设计了上下文压缩机制,通过“语义记忆衰减”将关闭任务压缩为摘要以节省上下文空间。它主要服务于AI编程Agent,也适用于任何需要在多次AI会话间维持任务连续性的场景。

ClaudeDevs@ClaudeDevs · 4月30日48

The Built with Opus 4.7 Claude Code hackathon is a wrap! Thank you to the 500 participants worldwide, and to @cerebral_valley for co-hosting. Here's how the winners combined multi-agent orchestration, persistent memory, MCP tools, sandboxed execution, and smart prompt design 🧵

译Built with Opus 4.7 Claude Code 黑客松圆满落幕! 感谢全球 500 名参与者,以及联合主办方 @cerebral_valley。 以下是获胜者如何结合多智能体编排、持久记忆、MCP 工具、沙箱执行和智能提示设计 🧵

OpenAI Developers@OpenAIDevs · 4月30日64

With the Figma plugin, Codex can now turn implementation plans into visual FigJam boards.

译通过Figma插件,Codex现在可以将实施计划转化为可视化的FigJam白板。

宝玉@dotey · 4月30日60

我就说你们咋逆向 Claude Design 的 System Prompt 的,原来都在请求的 Payload 里面,包括调用啥工具都有。 可惜额度太少了,用几次就没了

ClaudeDevs@ClaudeDevs · 4月30日62

Claude Code ships with a built-in skill for working with the Claude Platform. Useful for model migrations, using API features (e.g., prompt caching), or onboarding to newer APIs like Claude Managed Agents.

译Claude Code 内置一项用于操作 Claude Platform 的技能。 适用于模型迁移、使用 API 功能(例如提示缓存),或接入较新的 API 如 Claude Managed Agents。

宝玉@dotey · 4月30日67

Cursor 今天开放了官方 TypeScript SDK 公测,把驱动自家编辑器、CLI 和网页版的智能体(agent,可自主执行编码任务的 AI 助手)整套打包交给开发者。装上 npm install @cursor/sdk 就能用。 调用方式很灵活。Agent 可以跑在本机,也可以塞到 Cursor 云端的独立虚拟机里。云端模式下每个 agent 都有专属沙箱、克隆好的代码仓库和配置完整的开发环境,电脑休眠或断网都不影响任务继续,干完活还能直接开 PR、推分支、附上截图。模型层面不绑定,OpenAI、Anthropic、Google 的前沿模型可以一键切换,也能跑 Cursor 自家的 Composer 2(专为编码训练的模型,号称用更低成本接近前沿水平)。 SDK 把 Cursor 平时藏在编辑器里的那套 harness(智能体运行框架)整个开放了出来:代码库索引、语义搜索、即时 grep、MCP 工具接入、从仓库 .cursor/skills/ 目录自动加载的技能、可以观察和干预 agent 循环的 hooks,以及把任务拆给"子 agent"的能力。 官方点名了几种典型场景:CI/CD 流水线里自动总结改动、定位失败原因、自动提修复 PR;做内部工具让销售和市场团队不写代码就能查产品数据;甚至把 Cursor 直接嵌进自家面向客户的产品里,让最终用户在不离开宿主应用的情况下用上 agent 体验。Faire 的工程经理 George Jacob 的说法是,他们以前要自己管虚拟机、绕开内存限制,现在能直接复用 Cursor 的云端运行时来维护代码库。 计费按 token 用量算。GitHub 上的 cookbook 仓库放了几个示例项目,包括最简版的本地 agent、网页原型工具、能拖卡片自动开 PR 的看板,以及命令行工具。 放进上下文里看:Anthropic 早些时候推出了 Claude Agent SDK,OpenAI 也有 Codex 相关 SDK,agent 基础设施本身正在变成一门独立生意。Cursor 这次相当于把自己卖给开发者的核心能力打包出售。你既可以付费用它的编辑器,也可以付费让它替你跑 agent。 Cookbook: https://github.com/cursor/cookbook

译Cursor开放官方TypeScript SDK公测,允许开发者使用其智能体(agent)框架,该框架驱动Cursor编辑器、CLI和网页版。智能体可在本机或云端独立虚拟机中运行,云端提供沙箱、代码仓库和完整开发环境,支持任务持续执行并自动提交PR。模型层面不绑定,可一键切换OpenAI、Anthropic、Google等前沿模型,或使用Cursor专为编码训练的Composer 2。SDK开放了代码库索引、语义搜索、MCP工具接入、技能加载和任务拆分等核心能力。应用场景包括CI/CD流水线自动化、内部工具开发以及嵌入客户产品,使最终用户获得智能体体验。计费按token用量计算,SDK基于Cursor自身的运行时、harness和模型,让开发者能构建与Cursor相同能力的智能体。

宝玉@dotey · 4月30日54

转译:深度拆解 Hermes Agent 的记忆系统:它如何修正 OpenClaw 的误区 如果你读过我之前关于 ChatGPT、Claude 以及 Clawdbot 记忆系统的文章,你就会知道我一直在钻研同一个问题:这些 AI 智能体(AI Agent)到底是怎么记事的? Hermes Agent 对我来说格外有趣,因为这次我不需要只靠观察它的行为来搞“逆向工程”。Hermes 是开源的,它的代码库和文档都是公开的。所以,我没有通过提示词(Prompt)去盲测这个黑盒,而是直接翻看了它的代码路径——从它如何构建提示词状态、持久化会话,到如何清理记忆和查询历史对话。 简而言之:Hermes 拥有的不是一套记忆系统,而是四套。 1. 存储在 MEMORY.md 和 USER.md 中、经过高度浓缩的提示词记忆。 2. 通过 session_search 调用的 SQLite 历史会话存档(可搜索)。 3. 像程序记忆(Procedural Memory)一样运作的智能体技能管理。 4. 可选的 Honcho 层,用于更深层的用户建模(User Modeling)。 把这些设计联系在一起的核心逻辑非常简单:保持提示词稳定以便利用缓存(Caching),其他一切繁杂信息都交给工具。 让我们深入聊聊。 Hermes 的上下文结构 在理解记忆之前,我们先看看 Hermes 到底给模型发送了什么。 系统提示词(System Prompt)大致是按以下顺序组装的: ------- [0] 默认智能体身份 [1] 工具使用行为指南 [2] Honcho 集成模块(可选) [3] 可选系统消息 [4] 固化的 MEMORY.md 快照 [5] 固化的 USER.md 快照 [6] 技能索引 [7] 上下文文件(AGENTS.md, SOUL.md 等规则文件) [8] 日期/时间 + 平台信息 [9] 对话历史 [10] 当前用户消息 -------- 这非常关键,因为 Hermes 正在针对大模型供应商的提示词缓存(Prompt Caching)机制进行优化。代码显示,提示词构建器的目标非常明确:让稳定的前缀部分尽可能长时间地保持不变。 这一个决定就解释了 Hermes 大部分的记忆架构。 如果某条信息每一轮对话都要用到,Hermes 会尽量把它缩得很小并注入进去;如果信息量很大、属于历史旧账或者偶尔才有用,Hermes 就会把它踢出提示词,改用“按需检索”的方式。 第一层:固化的提示词记忆 其内置的记忆系统小得令人惊讶。 Hermes 将持久记忆存储在 ~/.hermes/memories/ 下的两个文件中: 1). MEMORY.md 智能体笔记:环境、规范、工具怪癖、教训 限制:2,200 字符 2). USER.md 用户画像:偏好、沟通风格、身份信息 限制:1,375 字符 这容量真不大。加起来大约只有 1,300 个 Token(模型理解文本的最小单位)。 而这正是刻意为之。 在会话开始时,Hermes 加载这两个文件,把它们渲染进提示词区块,然后在整个会话期间固化这个快照。会话中途写入的记忆会立即存入硬盘,但不会改变已经生成的系统提示词。这些改动只有在开启新会话,或者触发了“压缩(Compression)”导致的提示词重建时才会生效。 渲染后的格式如下: ------ ═══════════ MEMORY (你的个人笔记) [67% — 1,474/2,200 字符] ═══════════ 用户的项目是一个位于 ~/code/myapi 的 Rust Web 服务,使用 Axum + SQLx § 这台机器运行 Ubuntu 22.04,安装了 Docker 和 Podman § 用户喜欢简洁的回复,讨厌冗长的解释 ------ 这里有几个我非常欣赏的细节设计: 1. 使用字符限制而非 Token 限制:这让记忆逻辑与模型无关。Hermes 不需要调用特定模型的计算工具就能判断记忆是否存满。 2. 简单的分隔符文件格式:条目之间用 § 分隔。没有复杂的向量数据库(Vector DB),没有自定义二进制存储,就是纯文本。 3. 刻意保持极小的系统提示词空间:这是整个设计的重中之重。Hermes 不想把所有历史都塞进提示词,它只想要最有价值的事实。 4. 记忆是“精选状态”,而不是“日记”:这是 Hermes 与 OpenClaw 最大的区别。 OpenClaw 的日志更像是“流水账”。而 Hermes 则反其道而行。它的工具架构和测试逻辑强调: • 保存用户偏好。 • 保存环境事实。 • 保存反复出现的错误修正。 • 保存稳定的规范。 • 不保存任务进度。 • 不保存会话结果。 • 不保存临时的待办事项(TODO)。 真相是:Hermes 希望 MEMORY.md 和 USER.md 保持精简、高频且对缓存友好。 memory 工具 Hermes 通过一个拥有三种操作的 memory 工具来管理这些文件:add(添加)、replace(替换)、remove(移除)。 一个好用的细节是:replace 和 remove 使用子字符串匹配。你不需要记住条目的内部 ID,只需要传入现有条目中一段唯一的文字即可。 此外,系统会拒绝完全重复的内容,并拦截危险信息。源代码会扫描记忆条目,防止提示词注入(Prompt Injection,即通过输入恶意指令误导 AI)、凭证泄露或隐藏的 Unicode 字符。 第二层:用于情景回溯的 session_search 如果说 MEMORY.md 是 Hermes 的“短期热记忆”,那么 session_search 就是它的“长尾回溯系统”。 所有过去的会话都存储在 SQLite 数据库中,拥有完整的索引和搜索功能。当模型需要想起以前聊过的内容时,它不去翻 MEMORY.md,而是搜索这个会话数据库。 其工作流程是: 1. 在过去的消息中进行全文搜索。 2. 按会话分组结果。 3. 加载匹配度最高的会话。 4. 使用一个便宜的辅助模型对这些会话进行摘要总结。 5. 将精炼后的回顾内容返回给主模型。 这是一种非常务实的设计。它比盲目地把长篇累牍的历史塞进每一个提示词要便宜且高效得多。 第三层:压缩与记忆冲刷(Memory Flush) Hermes 另一个聪明之处在于它处理长对话“压缩”的方式。 当会话变得太长,Hermes 会压缩对话中间的部分以节省空间。但摘要是有损的,重要事实可能会丢失。 于是,Hermes 会先进行一次“记忆冲刷”。 在压缩之前,它会发送一条指令告诉模型: > “会话即将压缩,请保存任何值得记住的东西。优先保存用户偏好、修正建议和重复模式,而非具体的任务细节。” 然后它运行一次额外的模型调用,只开启 memory 工具。如果模型觉得有什么东西该留下来,就会在对话被“洗掉”之前把它写入 MEMORY.md。 第四层:作为程序记忆的技能(Skills) Hermes 不仅能记住事实,还能记住技能。 技能(Skills)存储在 ~/.hermes/skills/ 下。当 Hermes 发现了一个复杂的流程、修复了一个棘手的问题或学会了更好的方法时,它可以将其保存为“技能”。 大多数记忆系统只关注“语义回溯”(名字、偏好、事实),但智能体还需要记住如何做事。 为了效率,Hermes 不会把所有技能都塞进提示词,而是只放一个技能索引,只有在需要时才加载具体的技能内容。 第五层:用于深层建模的 Honcho 最后是可选的 Honcho 层。如果说本地记忆是 Hermes 的笔记本,Honcho 就是它尝试构建的复杂用户模型。它能实现跨设备、跨平台的记忆连续性。 最精妙的是它如何在不破坏提示词缓存的前提下实现集成: • 在会话的第一轮,Honcho 的上下文会被织入系统提示词。 • 在之后的对话中,为了保持提示词稳定,Honcho 的回溯内容会附加在当前用户的提问后面,而不是修改系统提示词。 这确保了缓存依然有效,同时 AI 依然能读到最新的背景信息。 Hermes 与 OpenClaw 的区别 • OpenClaw:记忆更接近“以 Markdown 为中心的存储”,日志和长效文件是主要事实来源。 • Hermes:提示词记忆被严格限制,历史记录存在 SQLite 里,只有需要时才搜索。 Hermes 更加关注缓存效率。 它认为:不是所有东西都配住在“系统提示词”这个黄金地段。 总结:Hermes 做对了什么? 1. 冷热分离:小规模提示词记忆负责常驻信息,搜索负责偶尔用到的信息。 2. 缓存优先:它意识到频繁改动提示词会导致延迟增加和成本上升。 3. 记忆的多样性:它承认记忆是分层的——包括个人画像、情景回溯、操作技能和深层建模。 Hermes 的核心设计原则最令我折服:记忆应该让智能体变得更好用,而不是通过摧毁提示词的稳定性来换取博闻强识。 真正的诀窍不是记住更多,而是在正确的层级、以正确的成本,记住正确的事情。

译Hermes Agent采用四层记忆架构,核心是保持提示词稳定以优化缓存。第一层是固化在提示词中的MEMORY.md和USER.md文件,容量小以确保缓存友好性;第二层是通过session_search调用的SQLite历史会话存档,实现按需检索;第三层是压缩对话时的记忆冲刷机制,优先保存关键信息;第四层是作为程序记忆的技能管理系统。可选的Honcho层用于深层用户建模。与OpenClaw的流水账存储不同,Hermes严格区分记忆层级,强调缓存效率,旨在以正确成本记住正确信息。

Rohan Paul@rohanpaul_ai · 4月30日46

Right now AI Agents have a serious missing layer - agents can act, but they still can’t really notice. Most agents still wait for a prompt. World2Agent (W2A) changes the setup: sensors watch real-world events, turn them into structured signals, and send them to agents so they can decide and act without someone manually feeding every update. So W2A has built an open protocol that gives AI agents a standard way to notice real-world events, not just respond after a human tells them something. Sensors provide real-world context. You define the action. Think GitHub trends, stock moves, Steam deals, meeting changes, research drops, X posts, error logs, or any source that can emit a signal. Today’s agents are mostly reactive because they lack a perception layer, and builders currently have to manually stitch together polling, webhooks, auth, schemas, deduplication, and delivery logic every time they want an agent to “notice” something. The important idea is this: tools give agents the ability to act, but sensors give them the ability to know when to act. W2A wants sensors to emit structured signals in one shared format, so an agent can subscribe to them the way software subscribes to events. So basically this is the missing infrastructure layer for proactive agents, similar in spirit to what MCP did for tool use. 🧵 1. In this example here, Andrej Karpathy posts → Sensor catches the signal → Agent auto-reviews your codebase using their insight.

译当前AI智能体缺乏感知层,只能被动响应提示。World2Agent (W2A) 通过构建开放协议解决了这一问题,它将现实世界事件(如GitHub动态、股价变动或社交媒体帖子)通过传感器转化为结构化信号。智能体可订阅这些信号,从而能自主决策和行动,无需人工持续输入。这消除了开发者需手动集成轮询、Webhook等复杂逻辑的负担。本质上,W2A为构建主动型智能体提供了缺失的基础设施层,类似于MCP协议为工具调用所做的标准化工作。例如,当特定人物发帖时,传感器捕捉信号后,智能体可自动触发代码库审查任务,实现了“知道何时行动”的关键能力。

Chubby♨️@kimmonismus · 4月30日52

Cursor is making a platform play. Right now they're an IDE. By releasing the SDK, they're turning their agent runtime into programmable infrastructure that runs headlessly in CI/CD pipelines, internal tools, and even third-party products. Every agent spun up through the SDK burns tokens on Cursor's billing. That means revenue scales with compute, not seats, and without a human in the loop, volume can go way higher. Smart move!

译Cursor正从集成开发环境转向平台化战略,通过发布SDK,将其智能体运行时转变为可编程基础设施。该基础设施可无头运行于CI/CD流水线、内部工具及第三方产品中。每次通过SDK启动的智能体都将消耗Cursor的计费代币,这意味着其收入模式将按计算量而非用户席位进行扩展。由于无需人工介入,使用量可大幅提升。此举旨在让开发者能利用驱动Cursor的相同运行时、工具链和模型来构建智能体。

向阳乔木@vista8 · 4月29日54

读到一篇不错的小白教程,如何用Notion和Obsidian搭建更好的Claude记忆系统。 让AI翻译了下。 https://blog.qiaomu.ai/how-to-give-claude-perfect-memory

elvis@omarsar0 · 4月29日55

// Agentic Harness Engineering // Pay attention to this one, AI devs. (bookmark it) Most coding-agent harnesses are still tuned by hand or brittle trial-and-error self-evolution. This new work introduces Agentic Harness Engineering, a framework that makes harness evolution observable. They do this through three layers: components as revertible files, experience as condensed evidence from millions of trajectory tokens, and decisions as falsifiable predictions checked against task outcomes. Each edit becomes a contract you can verify or revert. Results: pass@1 on Terminal-Bench 2 climbs from 69.7% to 77.0% in ten iterations, beating human-designed Codex-CLI (71.9%) and self-evolving baselines like ACE and TF-GRPO. The evolved harness also transfers across model families with +5.1 to +10.1 point gains, while using 12% fewer tokens than the seed on SWE-bench-verified. Harness work is the biggest hidden cost in most agent systems. This is the first credible recipe for letting the harness improve itself without drifting into noise. Paper: https://arxiv.org/abs/2604.25850 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译针对AI智能体开发中依赖人工调试、成本高昂且脆弱的“缰绳”设计问题,研究者提出了“智能体缰绳工程”框架。该框架通过三层设计实现可观测的进化:将组件视为可回滚的文件、从海量运行轨迹中提炼经验证据、将决策转化为可由任务结果验证的预测。每次修改都成为可验证或回滚的“合约”。实验表明,该框架在十次迭代内将Terminal-Bench 2的pass@1分数从69.7%提升至77.0%,超越人工设计与基线方法。进化后的缰绳能跨模型迁移并提升性能,同时在SWE-bench上减少12%的令牌消耗,为智能体系统的核心组件提供了首个自动化、可靠的优化方案。

歸藏(guizang.ai)@op7418 · 4月29日74

http://x.com/i/article/2049456244537409536 # Moxt 实测:把你的组织,折叠进一堆文件夹 上周四下午,我同时在做五件事。 周刊选题整理到一半、CodePilot 新冒了两个 Issue、Twitter 收藏夹里躺着三条想存的推、微信里有好几条待回的信息、一篇长文的草稿卡在开头。 一直以来我常工作见的问题就是:我的 Context 散在五个地方。 飞书、Notion、本地文件夹、微信聊天记录、我自己的脑子。 切任务的时候,一半时间花在搬运。 这只是散。更麻烦的是脏。 就算把东西汇到一起,AI 读起来也费劲: 飞书的 block、Notion 的 toggle、PDF 的视觉排版、Slack 截图,每种格式都要先剥一层壳。 散加脏,就是现在大多数 AI 产品在上下文上的主要问题。 Agent 能做到什么程度,不靠模型,靠你给它的工具和上下文。 正好前段时间 Moxt 发布了,我就试了一下,发现它在这两个问题的解决上做得非常好。 ## 一、给 AI 一个自己的家 Moxt 上来就回答了一件事:AI 需要一个自己的工作空间。 它的答案挺"笨"的。让 AI 在 md、csv、html 这些母语里工作,让它在文件系统里导航。听着不性感,但特别对。 Markdown 是 AI 的母语。 你给它一份 md,它秒懂;给它一份 Word,要先转一道。 Word 本质上就是 Markdown 的 GUI,那层 GUI 为人眼而设,对 AI 来说全是噪音。 Moxt 会把这些对于 AI 来说的脏信息,转成 AI 原生的格式: - 导入 Word/PDF/Notion,后台自动转 md - 导入 Excel,自动转 csv - 生成的可视化报告,一律是 html 文件系统是 AI 的图书馆。能 grep、能树状浏览的结构,正好是它训练时熟悉的那种,读起来天生就顺。 这种设计带来一个搬家爽点。 我在 Claude Code 里攒了十几个 Skill: humanizer-zh 去 AI 味、writing-rewriter 做小绿书和推特风格改写、wechat-formatter 做公众号排版、document-illustrator 做配图。每一个就是一个 md 文件加几个资源。 搬到 Moxt 的 Skills 目录,一个不用改,全都跑得通。 它们本来就是 md,Moxt 的 Skill 也是 md。说是集成,其实就是复制粘贴。 Workspace 还有一个好处:把 Context 从一次性输入变成可以累积的资产。 现在我写 AIGC Weekly,不用重新贴前几期选题、不用重新解释写作偏好、不用重新说我关注哪些方向。 背景默认已知。 别的 AI 产品,每次都是新一轮对话,Context 得一次性喂;Moxt 里的 Context 是往上攒的。 ## 二、把"你是谁"写进一份 md 每个 Moxt 用户都有一个专属个人 AI,叫 momo。 momo 的行为规则写在一份 AGENTS.md 里,放在你的个人空间。 用过 Claude Code 的朋友一看就懂。就是 CLAUDE.md 那套思路,产品化了。 而且除了 Momo 以外,你还能创建自己的 AI 同事。 我做的第一件事,创建了一个我自己的 AI 分身"AI 藏师傅"。 具体方式就是把我所有的历史语录和写的内容都传了上去,然后它帮我创建了一个总结文档和规则。 涵盖了从 agents.md 到时间线等各种资料,以及语气内容等各个方面。 给它写了完整的身份书: - 网名和平台矩阵 - 口头禅(「朋友们」「这太顶了」等) - 感叹号用法 - 对话模式和写稿模式的切换规则 - 还有其他的要求 甚至从我的内容里总结出了 6 个我的核心信条: 1. 没亲手用过就没有发言权 1. 松弛是生产力,不用数据审判自己 1. AI 是赋能工具,不是替代品 1. 开放生态 > 平台封闭 1. 只要敢花钱、敢放权,AI 就是许愿机 1. 朋友关系高于流量关系 比方说,我现在如果写稿子或者写内容,就完全可以直接让这个 AI 同事帮我写。 因为它已经几乎蒸馏了我所有的内容和信息,某种程度上,它就是我的分身。 AI 藏师傅在我的个人空间里有完整的工作文件: - drafts/:它帮我起草的内容 - MEMORY.md:它积累的关于我的偏好 - Skills/:它能调用的所有技能 我随时能打开看、能改、能删。 整个记忆库可以随时打开改,没有黑盒。 AI 的"记忆"不该是玄学,就是几个你能读懂的 md 文件而已。 这时候我才反应过来。Rules 也是 Context,而且是密度最高的那种。一份 AGENTS.md 里装着你的人格、价值观、写作品味,是你给 AI 最浓缩的 Context。 ## 三、做加法之前,先做减法 Moxt 有一个引导案例让我特别有感触。它的第一个 AI 同事模板叫"熵减官"。 这家公司专门造了这么一个角色,它手里没有写作、分析、生成这类产出任务。它只做三件事: - 扫 Workspace 里过时的文档 - 发现内容之间的矛盾 - 把死内容归档 他们那句 slogan 我很喜欢:做少是能力,做多是本能。 我手里有 300 多篇剪藏、几十份项目笔记、上百条 Twitter 收藏,真正能用上的远没这么多。 更糟的是,废墟会污染 AI。 你问它"我之前对某个问题怎么看",它能把三年前已经被我推翻的观点翻出来,一本正经地告诉你。 Context 的价值,不只在量,更在质。 Moxt 想做的是会自己精简的地方。无限塞东西的仓库,市面上已经够多了。 ## 四、读得懂,还得会动、会记、有人格 AI 读懂你的 Context 只是第一步。接下来它还得会自己动、会记住发生过的事、有一个承载这一切的人格。 将 Skill 组合完成复杂任务 必不可少的是现在 Agent 里的 Skills 能力。 大家知道我做了很多 Skills(比如最近很火的 PPT 生成)。 比如我的公众号写作流水线: humanizer-zh(去 AI 味) → writing-rewriter(风格重写) → wechat-formatter(公众号排版) 以前在 Claude Code 里手动走三步,每步复制粘贴; 现在丢一份初稿进去,十几分钟拿到可以直接贴公众号的终稿。 所有中间版本都在 Workspace 里,回看改动一目了然。 定时任务:让信息来找我 同样,Moxt 还支持定时任务。 我建了个"热点监控员",每天早上跑一个 Cron,扫过去 24 小时的 Twitter、Newsletter、Hacker News,按主题聚类,输出当天的"科技热点日报"。 这个对于我们的内容生产其实非常有帮助,我不建议大家全看 AI 总结的内容,但是 AI 能让我们不漏掉一些比较重要的信息。 Webhook:让事件来找它 比 Cron 更猛的是 Webhook。 我自己有一个 vibe coding 的项目,叫做 Codepilot 。 这种项目其实用户多了以后,管理和上下文的处理都非常麻烦。 因为你的本地环境和线上的 GitHub 是两个完全不同的环境。 CodePilot 的 GitHub 仓库一旦有新 Issue,Webhook 推给 AI 同事,它先归类: - 是 bug?归到待修复 - 是功能建议?排进路线图候选 - 是用户不会用?生成一条 FAQ 草稿 做完再决定要不要叫我。一个人没法 7×24 在线,AI 同事可以。 自主性是一把刻度尺 由于是给组织用,所以安全性很重要。 而且大家不同的文件夹也有不同的权限,所以 Moxt 也做了很多安全上的处理。 Moxt 自己讲得很到位:不同场景需要不同的放手程度。 连外部系统:用好 MCP 除了 Slack、GitHub 原生集成,Moxt 也支持 MCP: - Sentry MCP:直接问"最近线上有什么报错" - Figma MCP:问设计稿里某个按钮的颜色 - Linear MCP:「创建一个 bug ticket,优先级 high」 对于组织来说,这个功能还是更需要的。 因为我个人用的 MCP 很少有需要在不同地方流转的需求。 但对于组织而言,经常需要从原来的 Notion 里查东西,或者从 Slack 去同步一些信息,这些流转过程都很重要。 ## 五、AI 不只会写字,还会画图 Moxt 最惊艳我的一点,是它把 AI 的输出从文字拓展到了完整的视觉形态。 同样一份数据,momo 能输出三种东西: 可交互数据看板 基于 ECharts。下拉能筛选、悬浮有提示、多图联动。一个独立 html,打开就是完整的可视化。 比如我这里在连接了 GitHub 以后,我就让它基于我 GitHub 这个项目,做一个可交互的数据看板。 结构完整的 PPT Moxt 也能实时生成结构完整的 PPT。 你也可以安装其他的一些 PPT Skills 来生成,都能正常生成预览。 我这里使用的是我自己的 PPT Skills,也是支持的。 封面、目录、内容页、图表、结尾。风格可选。html 格式,键盘翻页。 产品也是可以的 由于它有很多的上下文,所以它生成的效果肯定是比一些没有上下文、或者上下文非 AI 原生的产品要强很多的。 表单、列表、后台 dashboard 常见页面结构。Tailwind CSS,一个文件,可以直接当 demo 演示。 三种产出都是 html,落在 Workspace 里双击就看。 对靠视觉内容吃饭的人来说,AI 的交付物从"一段文字"升级成了"一份可以直接发出去的成品"。 而且对于组织来说,这种可视化的内容更适合理解和交付,比看纯文字要清晰、直观非常多。 ## 六、Agent 公式 我其实以前提过一个公式。Agent 到底什么决定它有多强? > Agent 能力 = 工具 × 上下文 × (人格 + Memory + Skill) - 工具决定它能做什么。Moxt 给的是 sandbox、浏览器、Cron、Webhook、MCP、外部集成 - 上下文决定它知道什么。Moxt 给的是 Workspace 里一路累积的 md 文件加外部数据通道 - 人格 + Memory + Skill 决定它像不像你。Moxt 给的是 AGENTS.md、MEMORY.md、Skills/,三件都是你能直接读和改的纯文本 这是个乘法。任何一个因子为 0,输出就是 0。模型再强也救不回来。 Moxt 把这几个因素结合、实现的非常好,而且易于理解。 重要的是,回答了在组织层面应该怎么去使用这些元素。 ## 最后 Moxt 在 AI 藏师傅的身份书里写了六条信条,第三条是「AI 是赋能工具,不是替代品」。 Moxt 这个产品想做的事,说到底也是一句话:放大人的能力。 这个同频来得很自然。我认这个产品,是因为我本来就这么想。 "一人公司"里的"一人",重点落在"决策和品味不被稀释"这几个字上,跟"一个人硬扛"没什么关系。 真正稀缺的是判断、审美、执念。这些 AI 学不来,也不该由 AI 来做。 AI 该做的,是把你从搬运 Context、切换任务、重复性看一眼这些琐碎里解放出来,让那份稀缺的判断被放大。 一个人的品味 × AI 同事的执行带宽,才是 OPC 真正的意思。 如果你或者是你的组织跟我一样: - 每天在五件事之间切换 - Context 散在七八个地方 - 有一堆想沉淀的写作方法论找不到地方装 可以来试一下 Moxt(moxt.ai),今天的内容就到这里。 我觉得对你有帮助的话,可以帮我点个赞,或者转发给你需要的朋友。

译Moxt的核心是为AI构建了一个原生工作空间,通过将Word、PDF等文档自动转换为Markdown等AI原生格式,并利用文件系统作为结构化“图书馆”,解决了信息“散”与“脏”的痛点。用户拥有由AGENTS.md定义的个人AI助手,并能创建高度个性化的“AI同事”。它强调信息质量,内置“熵减官”角色清理过时内容。AI不仅能组合Skills完成复杂任务流,还支持定时任务与Webhook实现自动化。其输出超越文字,可生成可交互的数据看板与完整PPT,使AI成为组织内的高效协作者。

向阳乔木@vista8 · 4月29日29

将 DeepSeek Web 对话能力转换为 OpenAl、Claude 与 Gemini 兼容 API。 厉害!但现在API这么便宜,直接用API也行吧...

译将 DeepSeek Web 对话能力转换为 OpenAI、Claude 与 Gemini 兼容 API。 厉害!但现在API这么便宜,直接用API也行吧...

ginobefun@hongming731 · 4月29日38

一款出色的个人 AI 助手应该做到以下几点: 1. 跨平台执行力:能无缝处理邮件、日历、Google Workspace,以及任何已接入 API 或 MCP 的服务。 2. 主动且靠谱:不仅是被动响应,还能稳定执行定时任务、事件触发器和自动跟进事项。 3. 超强记忆力:具备极佳的长期记忆,随着时间的推移能变得越来越“懂你”。 4. 开箱即用的多端体验:横跨网页与移动端,彻底告别繁琐的斜杠指令和手动配置。 5. 多模态无缝切换:在交流过程中,允许你随时在文字、语音、视频和实时通话之间自由切换。 6. 全渠道触达:就像联系真人朋友一样,你可以通过任何第三方通讯软件随时找到它。 7. 有趣的灵魂:自带个性和人设,让聊天沟通变得生动有趣。 但说实话,无论是 OpenClaw、Claude Code 还是 Codex——目前市面上还没有任何一款产品能完美做到以上这一切。

译一款出色的个人AI助手应具备七大核心能力:跨平台无缝执行邮件、日历及各类API/MCP服务;能主动可靠地处理定时任务与自动跟进;拥有优秀的长期记忆以更懂用户;提供无需复杂指令的开箱即用多端体验;支持在文字、语音、视频和实时通话间自由切换;可通过任何第三方通讯软件触达;并具备有趣的个性。然而,目前包括OpenClaw、Claude Code和Codex在内的产品,均未能完全满足所有这些标准。

ginobefun@hongming731 · 4月29日50

#BestBlogs 早报 2026-04-29 今日主题:老代码、AI 工具与组织治理三件事正在合流。Anthropic 把 Claude Code 当新员工,带进 17 年 70 万行的 Skyline 老仓库;Thoughtworks 让提示词变成版本化、可审查的一等交付物;NVIDIA 把文本、图片、视频、音频压进同一个全模态主干。模型已经能写代码,工程的难题就从生成转向了治理:让它持续记住项目,让它的输出可以被复用,让多模态真正进入生产。

译当前,遗留代码、AI工具与组织治理正加速融合。Anthropic将Claude Code作为“新员工”引入拥有70万行代码的17年老项目;Thoughtworks推动提示词成为可版本化、可审查的一等交付物;NVIDIA致力于构建统一的全模态主干模型。随着AI已具备代码生成能力,工程挑战的核心正从“生成”转向“治理”,关键在于让AI持续理解项目上下文、使其输出可复用,并推动多模态技术落地生产环境。

小互@xiaohu · 4月29日53

Adobe 把8款创意工具的打包接进 Claude 涉及工具:Photoshop、Lightroom、Illustrator、Firefly、Premiere、Express、InDesign、Stock。 现在Claude 可以帮你: 改图调图:调色调光、抠背景或模糊背景、扩图裁剪 做素材:套模板做设计、剪视频、从 Stock 图库买授权 找东西管文件:搜之前存的素材、总结内容、整理资产

译Adobe 将 Photoshop、Lightroom、Illustrator 等八款核心创意工具集成至 Claude。用户现可通过 AI 助手直接调用这些工具,执行调色、抠图、扩图等图像处理,套用模板设计、剪辑视频、获取 Stock 授权素材,以及搜索、总结和整理创意文件。此举旨在简化创意工作流程。

elvis@omarsar0 · 4月29日57

// From Skill Text to Skill Structure // One of the more practical skill papers I've seen this month. SKILL.md files entangle invocation interface, execution flow, and tool/resource side effects in one blob of natural language. This makes downstream discovery and risk review brittle. New research proposes SSL, a three-layer typed JSON representation: a Scheduling layer for invocation signals, a Structural layer for execution scenes, and a Logical layer for atomic actions and resource use. It's drawn from Schank and Abelson's classical work on scripts, MOPs, and conceptual dependency. An LLM-based normalizer converts existing SKILL.md files into this structure. The numbers: Skill Discovery MRR jumps from 0.573 to 0.707, and Risk Assessment macro F1 from 0.744 to 0.787. They release a 6,184-skill corpus, 403 task queries, and 500 risk-labeled skills. As skill registries scale, you can't keep treating capability packages as unstructured prose. Paper: https://arxiv.org/abs/2604.24026 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译SKILL.md文件将调用接口、执行流程和工具副作用混合在自然语言中,导致技能发现和风险评估脆弱。新研究提出SSL三层类型化JSON表示:调度层处理调用信号,结构层管理执行场景,逻辑层定义原子动作和资源使用,基于Schank和Abelson的脚本理论。通过LLM规范化器转换现有文件,技能发现MRR从0.573提升至0.707,风险评估宏观F1从0.744提升至0.787。研究发布了6,184技能语料库、403任务查询和500风险标记技能,强调随着技能注册表扩展,需结构化表示以提升管理效率。

TestingCatalog News 🗞@testingcatalog · 4月29日55

Anthropic released new Connectors to Claude, focused on Creative Work. New Connectors: Adobe Creative Cloud, Ableton, Splice, Canva Affinity, SketchUp, Resolume, Autodesk Fusion, and Blender.

译Anthropic 发布了面向创意工作的 Claude 新连接器。 新连接器包括:Adobe Creative Cloud、Ableton、Splice、Canva Affinity、SketchUp、Resolume、Autodesk Fusion 以及 Blender。

TestingCatalog News 🗞@testingcatalog · 4月29日54

Claude Code can now notify you via a push notification when it has finished the task. Claude push 👀

译Claude Code 现在可以在完成任务时通过推送通知提醒您。 Claude 推送 👀

宝玉@dotey · 4月29日19

ByteByteGo 画的 MCP 和 Agent Skills 的对比图,比 AI 画的还是精致多了。 不过这种图的问题,就是你懂的话一看就很清晰,不懂的话看图还是看不懂。

译ByteByteGo绘制的MCP与Agent Skills对比图在视觉上比AI生成的更为精致。然而,此类技术架构图存在一个普遍问题:其理解门槛较高。对于已经具备相关领域知识(如模型上下文协议与智能体技能概念)的读者,图示能清晰呈现关键区别;但对于缺乏背景的观众,仅凭图表本身仍难以理解其核心内容与对比要点。这反映出技术可视化在追求信息密度与可读性之间需要平衡。

阿绎 AYi@AYi_AInotes · 4月29日57

说个暴论,这才是2026年到目前为止,AI行业最有价值的一次更新,没有之一🚀🚀🚀 Claude一口气接入了8个创意行业的顶级工具,Blender,Adobe,Autodesk,Ableton,Splice,Canva,SketchUp,Resolume。 它不再是让你在聊天框里生成东西,再导出到软件里修改, 而是直接钻进你每天打开8小时的软件内部,帮你调试场景,批量修改物体,写自定义脚本,处理所有你不想做的重复性劳动。 以前的AI是让你换个地方工作, 现在的AI是跑到你的工位上帮你干活。 这标志着AI正式进入工具原生时代,它的下一个战场再也不是谁的模型更大, 而是谁能无缝嵌入普通人的真实工作流。 我认为对所有创作者来说,学会用好这些连接器,比追任何新出的大模型都重要。

译Claude宣布接入Blender、Adobe、Autodesk等八个创意行业核心工具,标志着AI应用从聊天框生成转向深度嵌入专业工作流。用户可直接在软件内部调试场景、批量修改对象或编写脚本,处理重复性任务。这代表AI竞争焦点已从模型规模转向与普通人工作流的无缝融合,对创作者而言,掌握这类连接器比追逐新模型更具实际价值。

elvis@omarsar0 · 4月29日31

Advanced memory systems unlock agents unlike anything we've ever seen. This Large Memory Model (LMM) enables proactive memory and allows agents to automatically surface vital context, without explicit prompting. The LMM is purpose-built to give apps persistent human memory without any search or prompting from the user It works across many tools like Gmail & Slack. Worth checking out if you are building advanced AI agents: https://engramme.com

译Engramme公司推出专为AI智能体设计的大型记忆模型,旨在解决AI缺乏持久记忆的核心痛点。该LMM无需用户主动搜索或提示,即可在Gmail、Slack等各类工具中自动提取并呈现关键上下文信息,实现主动记忆功能。其核心观点认为,持久记忆是当前AI的阿喀琉斯之踵,而该技术旨在为所有应用赋予类似人类的持久记忆能力,与Google解决搜索、OpenAI解决语言问题并列。

宝玉@dotey · 4月29日66

一个 ChatGPT 使用技巧(可能适合于其他 AI 工具) 像 ChatGPT、Claude Web,已经不再单纯的只是一个 ChatBot,而是 AI Agent,也就是说每个会话都可以有一个虚拟运行环境,可以调用工具。 借助这个特点,在让 ChatGPT 执行任务的时候,就可以让它自行去做一些验证,而不是像以前那样只是对话。 比如说我在让 ChatGPT 写画图的提示词或者优化提示词的时候,我会让它自己先做一些验证,根据验证结果自己去迭代,然后我再基于它迭代后的结果去验收,通常结果会更好一些。

译以ChatGPT、Claude Web为代表的工具已超越传统聊天机器人,成为具备虚拟运行环境和工具调用能力的AI Agent。利用这一特性,用户可以让AI在执行任务时自行进行验证和迭代,而非仅进行对话。例如,在要求其生成或优化图像提示词时,可指令AI先自行验证并根据结果迭代改进,用户最终验收迭代后的成果,这种方法通常能获得更优的结果。

歸藏(guizang.ai)@op7418 · 4月29日60

近期第三条百万曝光内容了,这个 Skill 几天就干到了 3800 Star

译近期第三条百万曝光内容了,这个 Skill 几天就干到了 3800 Star [引用 @op7418]:http://x.com/i/article/2047484171258634240

凡人小北@frxiaobei · 4月29日59

我现在基本不太直接用 Agent了。 介绍下我的AI 搭档,Finn。 现在大部分情况是 Finn 让 Agent 去干活。 工作流其实挺简单的: 我现在会现在 Codex (之前是 Claude Code) 里把一个 Agent 或者 skill 调好,跑到稳定。 然后直接丢给 OpenClaw,后面基本就不太管了 这一步挺关键的。 不然你会发现一个很烦的事情: 你要跟一堆 Agent 来回对话,有时候都找不到有那个 MD 的文件夹在哪,很快就乱了。 换了这种模式后我现在基本只做一件事:提需求 剩下的 Finn 自己去搞,他会先跟我确认好需求,就安排其他 Agent 去干了。 而且我已经把一整套东西接进来了,Obsidian、Google Workspace、iCloud、飞书、github、Cloudflare 等,各种表格和自动化流程。 如果你还在一个个 Agent 聊天,其实有一个悖论,以为自己在用 AI,但本质上只是换了一套更聪明的工具。 安全我也跑了一段时间,我现在的做法挺克制的:白名单 + 审计 + 能力边界,不给乱权限,主要让它长期跑那些稳定的事情。 目前看,是稳的。 有一个很直观的变化,这套东西一旦跑顺了,真的很难再回去什么都自己聊自己盯。 比如最近我用 Codex 对好了将近一年的烂账,然后形成了一个固定的 skill 交给了 OpenClaw,现在跟他说一句,就能把所有的表填的明明白白,还能在固定时间盘点,发邮件。 所以 Finn 现在是我的私人助理,财务总监,技术总监等角色集大成者。

译作者不再直接与多个AI Agent交互,而是通过核心AI搭档Finn来管理整个工作流。具体流程是:先在Codex中将单个Agent或技能调试稳定,然后交由OpenClaw平台运行,后续基本无需干预。用户只需向Finn提出需求,由其协调其他Agent执行,避免了与众多Agent直接对话导致的混乱。该系统已集成Obsidian、Google Workspace、飞书、GitHub等工具,并通过白名单、审计和能力边界限制确保安全。例如,处理年度烂账的流程被调试为固定技能后,Finn能自动填表、定时盘点并发送邮件,成为集私人助理、财务总监和技术总监于一身的角色。

宝玉@dotey · 4月29日51

试了下,还不错,但是还是有差距,claude design 产出物是 react 组件,界面美观,内容完善度挺高,交互做的很流畅,当前这个产出还是 HTML,只有个基本雏形,交互上差不少。 不过作为开源项目,刚开始已经很不错了,还是有学习借鉴之处,可以看看👍

译作者试用Open Claude Design项目,肯定其作为开源项目的学习价值,项目宣称还原度超95%、代码量达18700+行。但当前产出仅为HTML雏形,在交互和完成度上与Claude Design原版的优美React组件相比仍有明显不足。

Rohan Paul@rohanpaul_ai · 4月29日71

Claude's new connectors will let it work inside Blender, Autodesk Fusion, Adobe Creative Cloud, Ableton, Splice, Canva Affinity, SketchUp, and Resolume. So now it has got direct access to real creative tools, so Claude can read docs, inspect project state, write scripts, and carry out repetitive actions where the work already lives. The Blender connector exposes Blender’s Python API through natural language, which means Claude can debug a scene, inspect object relationships, build small tools, and batch-edit many objects without the user manually clicking through the interface. The Fusion connector pushes the same idea into 3D CAD, where conversation can create or modify models, turning chat from a helper into a control layer for design software. Main benefits is we get fewer manual steps, faster learning, and easier automation for jobs like layer cleanup, export pipelines, scene-wide edits, and tool-building that used to demand deeper scripting skill. The interesting part is that Claude is moving from answering questions to operating inside production workflows. Creative work is full of small translation costs: finding the right menu, remembering syntax, renaming layers, moving assets between tools, writing one-off scripts, debugging scenes, and repeating the same fix across fifty objects. Those are not glamorous problems, but they quietly decide how much ambition survives contact with deadline and fatigue. The connectors Anthropic just announced target exactly that layer. Blender gets a natural-language bridge to its Python API, which means Claude can inspect scenes, explain what is broken, and generate tools inside the software rather than outside it. Fusion, Adobe, Ableton, SketchUp, Affinity, Resolume, and Splice push the same idea into design, audio, and 3D workflows: less context switching, more direct manipulation, and fewer manual handoffs.

译Anthropic为Claude推出了一系列针对创意软件的原生连接器,使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API,例如在Blender中调试场景、批量编辑对象,在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”,如寻找菜单、记忆语法、编写一次性脚本等,从而实现更少的上下文切换、更直接的操作和更高的自动化程度,提升工作效率。

Chubby♨️@kimmonismus · 4月28日34

To be honest, Anthropic is making the same mistake OpenAI recently made. Instead of focusing on their main product, they're trying to connect it to everything. However, Claude Opus 4.7 remains a failure. Clearly. Therefore, the question arises whether they should really be investing resources in all these additional aspects like Blender connectors.

译作者批评Anthropic正在重复OpenAI近期犯下的错误,即未聚焦核心产品,反而试图将Claude连接到各类外部工具。尽管官方宣称新推出的Blender连接器能让创意工作者直接在Claude中调试场景、构建工具或批量修改对象,但作者指出Claude Opus 4.7版本仍显失败,质疑公司是否应继续将资源投入此类附加功能开发。

Claude@claudeai · 4月28日62

Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a scene, build new tools, or batch-apply changes across every object, directly from Claude.

译Claude 现已连接创意专业人士已在使用的工具。 通过新的 Blender 连接器,您可以直接从 Claude 中调试场景、构建新工具,或对每个对象批量应用更改。

TestingCatalog News 🗞@testingcatalog · 4月28日60

Mistral AI launched Workflows on Mistral Studio for Enterprise customers! > Durable execution - Workflows track state at every step > Observability - Every branch, retry, and state change is recorded in Studio > Human-in-the-loop - A single line of code pauses a workflow for approval > Native to Studio - Workflows use the same agents and connectors as the rest of Studio > Enterprise readiness - Workspaces within Studio keep teams and projects separated > Built for developers and business teams > Deployment flexibility - The control plane runs on Mistral

译Mistral AI正式为企业客户在Mistral Studio平台推出“工作流”功能。该功能具备持久化执行能力,可追踪每一步状态,并提供完整的可观测性,记录所有分支、重试和状态变更。其核心特性包括支持“人在回路”,仅需一行代码即可暂停工作流等待人工审批,且与Studio原生集成,使用相同的智能体和连接器。该方案注重企业就绪性,通过工作区实现团队与项目隔离,同时服务于开发者和业务团队。在部署上,其控制平面运行于Mistral自有基础设施,提供了灵活性。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月1日
03:14
OpenAI@OpenAI
精选70
使用Codex处理日常工作从未如此简单。 选择你的角色,连接你每天使用的应用,并尝试建议提示。 Codex能在研究规划、文档、幻灯片、电子表格等方方面面提供帮助。
智能体MCP/工具OpenAI产品更新

推荐理由:OpenAI 的 Codex 把 AI 助理塞进了你的日常工作流,直接连通你每天用的应用,不用折腾配置,看一眼提示就能上手,做运营和产品的可以试试。
02:10
阿绎 AYi@AYi_AInotes
61
Anthropic被曝检测用户代码提交历史以打压第三方工具,引发社区强烈抗议

Anthropic被曝通过其官方Claude Code工具检测用户Git提交历史,若发现包含“openclaw”字符串,便将该用户识别为第三方工具使用者,并触发“out of extra usage”错误,导致服务被拒或强制额外收费。开发者实验证实此为人为设置的字符串匹配规则。此举被视为Anthropic为将用户锁定在自家生态、打压更灵活的第三方竞品而采取的粗暴手段,与其此前塑造的开放、不监控形象相悖,引发了开发者社区的强烈不满和抗议。

阿绎 AYi: 卧槽,Anthropic这次真把开发者当傻子。 知名开发者Theo做了个实验:建了个空Git仓库,只commit一行JSON {"schema": "openclaw.inbound_meta.v1"}, 调用官方Claude Code就直...

AnthropicMCP/工具大佬观点开源生态
4月30日
22:13
meng shao@shao__meng
57
Glean发布专用搜索规划模型Waldo,优化AI代理工作流

Glean推出自研的智能搜索专用模型Waldo,旨在将企业AI任务中的“检索规划”与“深度推理”分离。Waldo基于NVIDIA Nemotron 3 Nano构建,作为前置环节运行,专门负责调用Glean Search、员工搜索和Web搜索等工具进行检索规划,并将检索到的上下文直接交给前沿大模型进行综合作答。这种架构避免了让昂贵的前沿模型处理机械的搜索任务,使单次调用延迟降低至约250毫秒,比默认推理模型快10倍以上。集成后,系统端到端延迟降低约50%,Token消耗减少约25%,且约一半查询可走“快路径”无需调用完整前沿模型。该设计印证了专用小模型在处理重复性任务上的效率优势,是智能体AI架构的重要演进。

Sumanth: Small Language Models are the Future of Agentic AI! Glean just released Waldo - a 30B agentic search model that runs bef...

MCP/工具产品更新搜索
22:10
Berryxia.AI@berryxia
67
🚀 Claude Code 内置神技上线! 直接调用 Claude Platform 官方技能,模型迁移、Prompt Caching、Managed Agents 上手全自动搞定! 1. 直接说 "Add prompt caching" 就能自动应用最佳实践 2. 完全开源,支持 7 种语言 SDK + CLI,还集成到 CodeRabbit、JetBrains 等工具
AnthropicMCP/工具产品更新编码
11:44
小互@xiaohu
59
Stripe推出Link代理钱包,AI代付不泄露真实卡号

Stripe发布Link agent wallet,使AI agent能代表用户发起支付,同时保护银行卡信息安全。其核心机制是让AI agent生成一次性支付凭证,每笔交易需用户在Link中手动批准或拒绝。真实卡号既不会提供给AI agent,也不会泄露给其调用的外部工具。此外,Stripe已开源Link CLI,开发者可将其集成至Claude Code、MCP客户端或自定义的agent工作流中。

智能体MCP/工具产品更新
11:40
Berryxia.AI@berryxia
49
以邮件为入口,让AI代理自动化处理招投标信息

作者分享了一个将AI代理(“龙虾”)融入实际工作流的案例。核心在于利用ClawEmail为AI代理提供一个可编程的邮箱接口,使其能通过邮件接收和处理指令。结合XCrawl(网页抓取工具)获取公开的招投标公告信息,并整合飞书进行结果同步。这一组合解决了教育行业投标信息分散、需人工频繁刷网站的问题,实现了从信息发现到整理分发的自动化。关键在于,AI工具的价值不在于其模型本身多强大,而在于能否无缝嵌入现有、稳定的工作流(如邮件),从而真正提升效率。

智能体MCP/工具教程/实践
11:40
Berryxia.AI@berryxia
56
利用AI与邮箱构建自动投标监控系统,实现高效工作流

作者结合ClawEmail、XCrawl等工具,为公司商务助理开发了一套自动投标监控系统。该系统能自动抓取招标公告,筛选出苹果、Mac或服务器相关项目,并结构化提取关键信息,随后自动通知同事并更新飞书表格。全程零配置,仅需会发邮件即可驱动,体现了邮箱作为AI时代低门槛、高效工作流入口的价值。

Berryxia.AI: http://x.com/i/article/2049497253421940736

智能体MCP/工具教程/实践
09:44
meng shao@shao__meng
56
Anthropic增长营销专家分享:深度整合Claude提升工作效能的五个高阶场景

大多数营销人员仅用AI润色文案,而高价值用法在于将Claude深度嵌入工作流。Anthropic增长营销成员分享了五大应用场景:1)作为思考伙伴,在撰写报告前梳理框架、对齐方向;2)通过Claude Cowork自动化数据报告生成,节省重复劳动;3)利用Claude Code让非技术人员快速构建内部工具;4)通过Skills功能将机构知识编码为可复用的标准化资产;5)使用Claude Design将创意快速转化为视觉稿,减少沟通损耗。这些方法旨在提升决策质量、自动化流程并降低协作成本,其方法论可迁移至其他AI智能体。

austin lau: most growth marketers use AI to rewrite headlines and call it a day. here's how I actually use Claude on the growth mark...

AnthropicMCP/工具教程/实践
09:40
ginobefun@hongming731
51
Codex进化为软件工程智能体,AI Engineer Workshop解析关键技术

Codex已从编码助手快速进化为软件工程智能体,OpenAI内部将其定位为能在读取-规划-执行循环中运行测试并协调子智能体的系统。最新AI Engineer的Full Workshop讲解了子智能体并行执行、插件生态扩展、Guardian安全门控与MCP集成,以及Codex获得300万周活跃用户背后的工程基础,展示了其在软件工程领域的应用潜力和发展进展。

智能体MCP/工具OpenAI教程/实践
09:37
阿绎 AYi@AYi_AInotes
68
Gmail成为AI Agent入口,Cursor SDK释放自动化编程潜力

推文演示了将Gmail作为AI Agent任务入口的实用场景:用户可将bug报告邮件一键分享至Google Chat并@AI助手Uma,由其自动接管。技术链路整合Gemini Flash Lite与新版Cursor SDK,驱动Cloud Agents自动读取邮件、查询代码、分析问题并生成修复方案,结果流式返回聊天界面。这实现了从手动复制粘贴到一键自动执行的转变。文中强调,Cursor SDK的发布里程碑式地将生产级编程能力转化为可任意嵌入的基础设施,使同一智能体能集成于CI流水线、自动化脚本等各处,其能力与编辑器内体验完全一致,正推动开发者角色向指挥AI转型。

阿绎 AYi: 我等了整整一年的东西,终于来了, Cursor今天正式发布了它的SDK, 这回可远不只是又一个编程工具的小更新, 可以说是人类历史上第一次, 把生产级的编程能力,变成了可以随便嵌入的基础设施, 以前你只能在Cursor编辑器里用它的Agen...

智能体MCP/工具大佬观点
09:15
向阳乔木@vista8
66
开源项目Beads:用结构化任务管理解决AI Agent长任务"失忆"问题

开源项目Beads旨在解决AI Agent处理长任务时的信息丢失问题。它摒弃了传统无结构的Markdown记忆方式,转而采用结构化任务管理。其底层使用支持分支、合并和版本回溯的Dolt数据库,允许多智能体并发写入且避免冲突,保持任务历史可追溯并支持远程协作。项目还设计了上下文压缩机制,通过“语义记忆衰减”将关闭任务压缩为摘要以节省上下文空间。它主要服务于AI编程Agent,也适用于任何需要在多次AI会话间维持任务连续性的场景。

智能体MCP/工具开源/仓库
08:43
ClaudeDevs@ClaudeDevs
48
Built with Opus 4.7 Claude Code 黑客松圆满落幕! 感谢全球 500 名参与者,以及联合主办方 @cerebral_valley。 以下是获胜者如何结合多智能体编排、持久记忆、MCP 工具、沙箱执行和智能提示设计 🧵
AnthropicMCP/工具行业动态
06:09
OpenAI Developers@OpenAIDevs
精选64
通过Figma插件,Codex现在可以将实施计划转化为可视化的FigJam白板。

Figma: MCP updates in FigJam so you can visualize your systems (and not just read code) → generate_diagram to create architectu...

MCP/工具OpenAI产品更新编码

推荐理由:Codex 这次更新不是小功能补丁,它把 Figma 从设计师专属变成了开发者的白板,generate_diagram 直接画架构图,做系统设计的可以扔了 Lucidchart 了。
04:44
宝玉@dotey
60
我就说你们咋逆向 Claude Design 的 System Prompt 的,原来都在请求的 Payload 里面,包括调用啥工具都有。 可惜额度太少了,用几次就没了
AnthropicMCP/工具教程/实践
04:12
ClaudeDevs@ClaudeDevs
精选62
Claude Code 内置一项用于操作 Claude Platform 的技能。 适用于模型迁移、使用 API 功能(例如提示缓存),或接入较新的 API 如 Claude Managed Agents。
AnthropicMCP/工具产品更新

推荐理由:Claude Code 终于把平台操作集成进命令行,模型迁移和 prompt caching 现在一条命令搞定,做 agent 开发的省了大把配配置文件的时间。
01:44
宝玉@dotey
67
Cursor开放TypeScript SDK公测,提供智能体框架

Cursor开放官方TypeScript SDK公测,允许开发者使用其智能体(agent)框架,该框架驱动Cursor编辑器、CLI和网页版。智能体可在本机或云端独立虚拟机中运行,云端提供沙箱、代码仓库和完整开发环境,支持任务持续执行并自动提交PR。模型层面不绑定,可一键切换OpenAI、Anthropic、Google等前沿模型,或使用Cursor专为编码训练的Composer 2。SDK开放了代码库索引、语义搜索、MCP工具接入、技能加载和任务拆分等核心能力。应用场景包括CI/CD流水线自动化、内部工具开发以及嵌入客户产品,使最终用户获得智能体体验。计费按token用量计算,SDK基于Cursor自身的运行时、harness和模型,让开发者能构建与Cursor相同能力的智能体。

Cursor: We're introducing the Cursor SDK so you can build agents with the same runtime, harness, and models that power Cursor. R...

智能体MCP/工具大佬观点
01:14
宝玉@dotey
54
转译:深度拆解 Hermes Agent 的记忆系统:它如何修正 OpenClaw 的误区

Hermes Agent采用四层记忆架构,核心是保持提示词稳定以优化缓存。第一层是固化在提示词中的MEMORY.md和USER.md文件,容量小以确保缓存友好性;第二层是通过session_search调用的SQLite历史会话存档,实现按需检索;第三层是压缩对话时的记忆冲刷机制,优先保存关键信息;第四层是作为程序记忆的技能管理系统。可选的Honcho层用于深层用户建模。与OpenClaw的流水账存储不同,Hermes严格区分记忆层级,强调缓存效率,旨在以正确成本记住正确信息。

Manthan Gupta: http://x.com/i/article/2034841599101009921

智能体MCP/工具大佬观点
00:39
Rohan Paul@rohanpaul_ai
46
World2Agent:为AI智能体补上"感知"层,让它们能主动察觉现实世界事件

当前AI智能体缺乏感知层,只能被动响应提示。World2Agent (W2A) 通过构建开放协议解决了这一问题,它将现实世界事件(如GitHub动态、股价变动或社交媒体帖子)通过传感器转化为结构化信号。智能体可订阅这些信号,从而能自主决策和行动,无需人工持续输入。这消除了开发者需手动集成轮询、Webhook等复杂逻辑的负担。本质上,W2A为构建主动型智能体提供了缺失的基础设施层,类似于MCP协议为工具调用所做的标准化工作。例如,当特定人物发帖时,传感器捕捉信号后,智能体可自动触发代码库审查任务,实现了“知道何时行动”的关键能力。

智能体MCP/工具开源/仓库
00:09
Chubby♨️@kimmonismus
52
Cursor正从集成开发环境转向平台化战略,通过发布SDK,将其智能体运行时转变为可编程基础设施。该基础设施可无头运行于CI/CD流水线、内部工具及第三方产品中。每次通过SDK启动的智能体都将消耗Cursor的计费代币,这意味着其收入模式将按计算量而非用户席位进行扩展。由于无需人工介入,使用量可大幅提升。此举旨在让开发者能利用驱动Cursor的相同运行时、工具链和模型来构建智能体。

Cursor: We're introducing the Cursor SDK so you can build agents with the same runtime, harness, and models that power Cursor. R...

智能体MCP/工具产品更新部署/工程
4月29日
22:45
向阳乔木@vista8
54
读到一篇不错的小白教程,如何用Notion和Obsidian搭建更好的Claude记忆系统。 让AI翻译了下。 https://blog.qiaomu.ai/how-to-give-claude-perfect-memory
智能体MCP/工具教程/实践
22:43
elvis@omarsar0
55
智能体缰绳工程:实现AI智能体核心组件的可观测自动化进化

针对AI智能体开发中依赖人工调试、成本高昂且脆弱的“缰绳”设计问题,研究者提出了“智能体缰绳工程”框架。该框架通过三层设计实现可观测的进化:将组件视为可回滚的文件、从海量运行轨迹中提炼经验证据、将决策转化为可由任务结果验证的预测。每次修改都成为可验证或回滚的“合约”。实验表明,该框架在十次迭代内将Terminal-Bench 2的pass@1分数从69.7%提升至77.0%,超越人工设计与基线方法。进化后的缰绳能跨模型迁移并提升性能,同时在SWE-bench上减少12%的令牌消耗,为智能体系统的核心组件提供了首个自动化、可靠的优化方案。

智能体arXivMCP/工具编码
20:37
歸藏(guizang.ai)@op7418
精选74
Moxt 实测:为AI构建原生工作空间,打造高效组织协作者

Moxt的核心是为AI构建了一个原生工作空间,通过将Word、PDF等文档自动转换为Markdown等AI原生格式,并利用文件系统作为结构化“图书馆”,解决了信息“散”与“脏”的痛点。用户拥有由AGENTS.md定义的个人AI助手,并能创建高度个性化的“AI同事”。它强调信息质量,内置“熵减官”角色清理过时内容。AI不仅能组合Skills完成复杂任务流,还支持定时任务与Webhook实现自动化。其输出超越文字,可生成可交互的数据看板与完整PPT,使AI成为组织内的高效协作者。

智能体MCP/工具教程/实践

推荐理由:歸藏把 Moxt 用出了 Claude Code 的深度,从 AI 分身到 Skills 流水线,读完能直接上手搭建自己的 OPC 工作台,做一人公司的都该看看。
18:12
向阳乔木@vista8
29
将 DeepSeek Web 对话能力转换为 OpenAI、Claude 与 Gemini 兼容 API。 厉害!但现在API这么便宜,直接用API也行吧…
DeepSeekMCP/工具开源/仓库
12:38
ginobefun@hongming731
38
理想个人AI助手七大标准,尚无产品能全满足

一款出色的个人AI助手应具备七大核心能力:跨平台无缝执行邮件、日历及各类API/MCP服务;能主动可靠地处理定时任务与自动跟进;拥有优秀的长期记忆以更懂用户;提供无需复杂指令的开箱即用多端体验;支持在文字、语音、视频和实时通话间自由切换;可通过任何第三方通讯软件触达;并具备有趣的个性。然而,目前包括OpenClaw、Claude Code和Codex在内的产品,均未能完全满足所有这些标准。

Peter Yang: A great personal agent should: 1. Get work done across email, calendar, Google Workspace, or any API/MCP it's hooked up ...

智能体MCP/工具多模态大佬观点
07:38
ginobefun@hongming731
50
老代码、AI工具与组织治理的融合趋势

当前,遗留代码、AI工具与组织治理正加速融合。Anthropic将Claude Code作为“新员工”引入拥有70万行代码的17年老项目;Thoughtworks推动提示词成为可版本化、可审查的一等交付物;NVIDIA致力于构建统一的全模态主干模型。随着AI已具备代码生成能力,工程挑战的核心正从“生成”转向“治理”,关键在于让AI持续理解项目上下文、使其输出可复用,并推动多模态技术落地生产环境。

AnthropicMCP/工具多模态现象/趋势
07:11
小互@xiaohu
53
Adobe 把8款创意工具的打包接进 Claude

Adobe 将 Photoshop、Lightroom、Illustrator 等八款核心创意工具集成至 Claude。用户现可通过 AI 助手直接调用这些工具,执行调色、抠图、扩图等图像处理,套用模板设计、剪辑视频、获取 Stock 授权素材,以及搜索、总结和整理创意文件。此举旨在简化创意工作流程。

AnthropicMCP/工具产品更新多模态
06:41
elvis@omarsar0
57
从技能文本到技能结构

SKILL.md文件将调用接口、执行流程和工具副作用混合在自然语言中,导致技能发现和风险评估脆弱。新研究提出SSL三层类型化JSON表示:调度层处理调用信号,结构层管理执行场景,逻辑层定义原子动作和资源使用,基于Schank和Abelson的脚本理论。通过LLM规范化器转换现有文件,技能发现MRR从0.573提升至0.707,风险评估宏观F1从0.744提升至0.787。研究发布了6,184技能语料库、403任务查询和500风险标记技能,强调随着技能注册表扩展,需结构化表示以提升管理效率。

智能体MCP/工具开源/仓库论文/研究
05:39
TestingCatalog News 🗞@testingcatalog
55
Anthropic 发布了面向创意工作的 Claude 新连接器。 新连接器包括:Adobe Creative Cloud、Ableton、Splice、Canva Affinity、SketchUp、Resolume、Autodesk Fusion 以及 Blender。

Claude: Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...

AnthropicMCP/工具产品更新
05:39
TestingCatalog News 🗞@testingcatalog
54
Claude Code 现在可以在完成任务时通过推送通知提醒您。 Claude 推送 👀

ClaudeDevs: To enable: install the Claude mobile app → /remote-control to pair the mobile app → /config → enable "Push when Claude d...

AnthropicMCP/工具产品更新
03:10
宝玉@dotey
19
ByteByteGo绘制的MCP与Agent Skills对比图在视觉上比AI生成的更为精致。然而,此类技术架构图存在一个普遍问题:其理解门槛较高。对于已经具备相关领域知识(如模型上下文协议与智能体技能概念)的读者,图示能清晰呈现关键区别;但对于缺乏背景的观众,仅凭图表本身仍难以理解其核心内容与对比要点。这反映出技术可视化在追求信息密度与可读性之间需要平衡。

Alex Xu: MCP vs Skills

智能体MCP/工具教程/实践
02:35
阿绎 AYi@AYi_AInotes
57
Claude接入八大创意工具,AI进入原生协作时代

Claude宣布接入Blender、Adobe、Autodesk等八个创意行业核心工具,标志着AI应用从聊天框生成转向深度嵌入专业工作流。用户可直接在软件内部调试场景、批量修改对象或编写脚本,处理重复性任务。这代表AI竞争焦点已从模型规模转向与普通人工作流的无缝融合,对创作者而言,掌握这类连接器比追逐新模型更具实际价值。

Claude: Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...

AnthropicMCP/工具产品更新
02:11
elvis@omarsar0
31
Engramme公司推出专为AI智能体设计的大型记忆模型,旨在解决AI缺乏持久记忆的核心痛点。该LMM无需用户主动搜索或提示,即可在Gmail、Slack等各类工具中自动提取并呈现关键上下文信息,实现主动记忆功能。其核心观点认为,持久记忆是当前AI的阿喀琉斯之踵,而该技术旨在为所有应用赋予类似人类的持久记忆能力,与Google解决搜索、OpenAI解决语言问题并列。

Engramme: Persistent memory is the Achilles heel of AI. Engramme's Large Memory Models (LMMs) empower every app with persistent me...

智能体MCP/工具产品更新
01:40
宝玉@dotey
66
活用AI Agent特性,让ChatGPT自行验证迭代任务

以ChatGPT、Claude Web为代表的工具已超越传统聊天机器人,成为具备虚拟运行环境和工具调用能力的AI Agent。利用这一特性,用户可以让AI在执行任务时自行进行验证和迭代,而非仅进行对话。例如,在要求其生成或优化图像提示词时,可指令AI先自行验证并根据结果迭代改进,用户最终验收迭代后的成果,这种方法通常能获得更优的结果。

智能体MCP/工具教程/实践
01:36
歸藏(guizang.ai)@op7418
60
近期第三条百万曝光内容了,这个 Skill 几天就干到了 3800 Star 【引用 @op7418】:http://x.com/i/article/2047484171258634240

歸藏(guizang.ai): http://x.com/i/article/2047484171258634240

智能体MCP/工具教程/实践
01:11
凡人小北@frxiaobei
59
我的AI搭档Finn:从直接使用Agent到智能工作流管理的转变

作者不再直接与多个AI Agent交互,而是通过核心AI搭档Finn来管理整个工作流。具体流程是:先在Codex中将单个Agent或技能调试稳定,然后交由OpenClaw平台运行,后续基本无需干预。用户只需向Finn提出需求,由其协调其他Agent执行,避免了与众多Agent直接对话导致的混乱。该系统已集成Obsidian、Google Workspace、飞书、GitHub等工具,并通过白名单、审计和能力边界限制确保安全。例如,处理年度烂账的流程被调试为固定技能后,Finn能自动填表、定时盘点并发送邮件,成为集私人助理、财务总监和技术总监于一身的角色。

智能体MCP/工具教程/实践
00:39
宝玉@dotey
51
试用Open Claude Design:开源有潜力但交互存差距

作者试用Open Claude Design项目,肯定其作为开源项目的学习价值,项目宣称还原度超95%、代码量达18700+行。但当前产出仅为HTML雏形,在交互和完成度上与Claude Design原版的优美React组件相比仍有明显不足。

Tom Huang: 正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71...

MCP/工具开源/仓库教程/实践编码
00:07
Rohan Paul@rohanpaul_ai
精选71
Claude推出原生连接器,可直接操作Blender、Fusion等创意软件

Anthropic为Claude推出了一系列针对创意软件的原生连接器,使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API,例如在Blender中调试场景、批量编辑对象,在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”,如寻找菜单、记忆语法、编写一次性脚本等,从而实现更少的上下文切换、更直接的操作和更高的自动化程度,提升工作效率。

Claude: Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...

AnthropicMCP/工具产品更新

推荐理由:Claude 终于从聊天框走进了 Blender 和 Fusion 的生产现场,这对创意工作者来说是真正省时间的更新,做 3D 和设计的值得立刻试试 Blender connector。
4月28日
23:37
Chubby♨️@kimmonismus
34
作者批评Anthropic正在重复OpenAI近期犯下的错误,即未聚焦核心产品,反而试图将Claude连接到各类外部工具。尽管官方宣称新推出的Blender连接器能让创意工作者直接在Claude中调试场景、构建工具或批量修改对象,但作者指出Claude Opus 4.7版本仍显失败,质疑公司是否应继续将资源投入此类附加功能开发。

Claude: Claude now connects to the tools creative professionals already use. With the new Blender connector, you can debug a sce...

MCP/工具产品更新大佬观点
23:36
Claude@claudeai
精选62
Claude 现已连接创意专业人士已在使用的工具。 通过新的 Blender 连接器,您可以直接从 Claude 中调试场景、构建新工具,或对每个对象批量应用更改。
AnthropicMCP/工具产品更新

推荐理由:Blender 连接器意味着 Claude 开始认真渗透创意工作流,做 3D 的人终于不用在终端和 GUI 之间反复横跳了,虽然目前场景还窄,但方向对。
22:38
TestingCatalog News 🗞@testingcatalog
60
Mistral AI面向企业客户在Mistral Studio平台推出"工作流"功能

Mistral AI正式为企业客户在Mistral Studio平台推出“工作流”功能。该功能具备持久化执行能力,可追踪每一步状态,并提供完整的可观测性,记录所有分支、重试和状态变更。其核心特性包括支持“人在回路”,仅需一行代码即可暂停工作流等待人工审批,且与Studio原生集成,使用相同的智能体和连接器。该方案注重企业就绪性,通过工作区实现团队与项目隔离,同时服务于开发者和业务团队。在部署上,其控制平面运行于Mistral自有基础设施,提供了灵活性。

Mistral AI: Hear from our team:

智能体MCP/工具产品更新
‹ 上一页
1…1314151617
下一页 ›