Today, we launched agent-to-agent conversations in Slack to give you real AI coworkers. Vellum assistants now talk to ea...
Today, we launched agent-to-agent conversations in Slack to give you real AI coworkers. Vellum assistants now talk to ea...
*Cracks knuckles*
Introducing Claude x Arcads in Slack: Get viral ads in your Slack DMs Available today for all Arcads users
该论文指出,MCP服务器设计不同于普通API,因为LLM通过纯语言描述选择工具,过多或模糊的工具会导致混淆。作者归纳了5种实际模式(如暴露数据、运行工作流、保持会话状态、组合服务器、翻译混乱领域API),并警告4个常见错误(大而全工具、模糊描述、不安全外部内容、慢工具应返回job ID)。在54个额外服务器上测试发现,弱模型在可见工具超过10-15个时准确率降至90%以下。良好MCP设计的核心是使工具列表小巧、清晰、安全且稳定。
推文推荐飞书 Aily,称其对普通人已足够好用。Aily 理解飞书全套数据,通过 MCP 连接外部系统,能自主调用工具,覆盖生态内各类任务。相比需要精细控制的 CLI,Aily 对话交互即可满足多数需求。引用推文则强调,用好飞书文档(类比20年前的 Office)和 AI 调用飞书 CLI,是学渣保住空调房工作的机会。两者共同指向飞书生态内 AI 工具的实用价值。
如果你是一个学渣,马上大学毕业,大学也差/专业也差,大概率找不到送外卖以外的工作的话,强烈建议你好好学习用好飞书文档,这大概就是 20 年的的 office,是你留在空调房最好的机会 顺便要是会用 AI 来调用飞书 cli 就基本不怕没工作...
Introducing Voice Agent Builder: a no-code platform to create human-like voice agents with Grok Voice. Available today a...
MCP、API、CLI 本质都是让 Agent 调用工具的方式。MCP 是唯一在协议层考虑“人在回路”的方案,支持回传会话、UI 嵌入、等待人操作等。API 凭借接口描述、可读状态等元信息,适合 90% 场景。CLI 目前因 bash 可组合性强、本地调试方便而最好用,但长期是死路:需 Unix shell 环境,有依赖问题,易因等待人类输入卡死。
http://x.com/i/article/2070358283723141120
WordPress 推出 WPVibe 插件,连接网站后即可让已付费的 Claude 等 AI 通过自然语言直接管理整个系统,包括文章、媒体、SEO、主题及主题文件。无需二次 AI 订阅或本地安装,自带 40+ WP-CLI 命令的 MCP 工具箱,支持写文章、改页面、传图片、管理插件和主题、网站健康检查(如插件冲突、PHP 版本、性能问题),甚至可搭建新主题。
Elvis Saravia(DAIR.AI)推荐一篇关于MCP服务器架构模式的论文。该论文基于15个独立开发的MCP服务器,归纳出5种常见模式:暴露资源、编排工具、管理会话、聚合代理及适配领域工作流。这一分类有助于开发者明确服务器设计方向,避免重复造轮。论文地址:https://arxiv.org/abs/2606.30317。
Until today, agents could buy about 2,000 tools through x402. We just 10x'd that to 20,000+ 🚀 In partnership with @coin...
Acti 把 AI 智能体直接放在手机键盘的文本输入区。用户输入意图后长按 Acti 空格键,AI 读取需求并调用相应应用或服务,在同一输入框内返回地图链接、餐厅推荐、体育对比、回复草稿、提醒或 Notion 页面等结果。该方案无需单独的聊天机器人应用,键盘成为 AI 与真实工作流交汇的界面。此外还有 Skill Key 系统,可绑定按键(如按住 N 打开 Notion,按住 L 查看 LinkedIn 资料)。最实用的演示是地图:输入“时代广场星巴克位置”,长按空格即可获得地图链接和可发送的消息,无需打开地图 App。
Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...
关联讨论 12 条X:OpenRouter (@OpenRouter)X:Kim (@kimmonismus)TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)Hacker News 热门(buzzing.cc 中文翻译)Claude Code:GitHub Releases(RSS)The Decoder:AI News(RSS)MarkTechPost(RSS)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)Anthropic:Newsroom(网页)Until today, agents could buy about 2,000 tools through x402. We just 10x'd that to 20,000+ 🚀 In partnership with @coin...
Until today, agents could buy about 2,000 tools through x402. We just 10x'd that to 20,000+ 🚀 In partnership with @coin...
Until today, agents could buy about 2,000 tools through x402. We just 10x'd that to 20,000+ 🚀 In partnership with @coin...
Flowith 团队发布「Matrix」,定位为自演化、多层级的 multi-agent runtime。用户设定使命后,Matrix 通过 CEO Office → OKR 分解任务,驱动多个 Agent 部门(Research/Engineering/Growth/Product)并行执行,并以 proof(文件、上线页面、收入等)闭环。架构包含 Runtime 层(独立 browser/工具/记忆,支持 Neo/Claude Code/Codex,超长时运行)和公司原语(网站部署、Stripe 收款、Agent Wallet、Agent Email)。macOS 客户端已上线,Web 版 coming soon。在 44 个职业真实知识工作的 GDPval-Bench 上,Matrix(GPT 5.5 + harness)得分 95.45%。此前有限 beta 中用户已创建数万个零人公司。
what if you can run an entire 0-person company - without the grind of running a team? matrix is the runtime that makes i...
X 官方推出托管 MCP,使 Grok、Cursor、Claude 等 MCP 兼容 AI 工具无需部署即可直接调用 X API,获取搜索、时间线、书签、发文等实时数据,全程走用户权限。该服务并非免费,采用 X Developer App 按量计费模式,读帖和发帖各有单价,重度 Agent 使用容易导致账单失控;写操作限流比读操作更严格,易触发 429 错误。建议开发者先在后台设定消费上限,从小流量测试后再放量。
Announcing the hosted X MCP. Agents now have access to the best real-time information source in the world. Connect Grok,...
X(Twitter)官方推出 hosted X MCP,AI 智能体可通过 MCP 协议直接调用 X API 获取实时信息,支持 Grok、Cursor 等工具。用户需注册 X API 并按量付费,个人优惠价每次调用 0.01 美元(1 美元 1000 次)。有用户实测拉取近三天书签仅花 0.1 美元。配置步骤:创建 APP 并充值、获取配置 ID、辅助配置(可交给 Codex/Claude)、授权启动。
Announcing the hosted X MCP. Agents now have access to the best real-time information source in the world. Connect Grok,...
Introducing Cursor for iOS. Build from anywhere by launching always-on cloud agents. Or remotely control agents running ...
关联讨论 1 条Cursor Blog智能体进入大型工程组织面临验证回路与组织成熟度两大瓶颈。Spotify 架构师分享在2000万行monorepo中运行Claude Code的经验,强调标准化代码库与可靠的CI、测试、自动合并等验证基建是前提,内部平台Honk整合这些工具。Block 工程负责人指出九成工程师在用Goose和Claude Code但功能交付未加速,提出六阶段成熟度模型与AI champions项目(约50名champion各投入30%时间),通过AGENTS.md沉淀知识,三个月内AI生成代码占比提升69%。Spring I/O 2026则梳理Spring AI从LLM调用到生产级智能体生态的演进。三篇从技术基建、组织流程、框架产品化给出解法。
Today we're introducing the CrowdReply MCP. The first ever MCP that analyzes and ranks your website in AI search. Simply...
RepoPrompt 已开源,社区版上线GitHub。作者Provencher被OpenAI招安,条件是为付费用户做好安排:先免费再开源,付费用户获赠Codex Credits。该工具从仓库挑选文件生成prompt,解决超32K token使模型变笨的问题,称为“上下文工程”。开源版反转架构:内置MCP server为主控,底层CLI工具可替换,支持推理模型规划并并行分发子任务。目前仅支持macOS,可通过Homebrew安装。
RepoPrompt 作者被 OpenAI 招安了,然后这软件现在免费了,即将开源。 如果你是 RepoPrompt 付费用户会给你送 Codex 的 Credits。
ViDA 团队开源的 BrowserBC 项目,探索更高效的 web agent 运行方式:先用强模型录制一次人类浏览器操作流程,将其蒸馏为可复用技能,再交给更小更便宜的模型执行。一次录制即可泛化技能。在 WebArena-Hard 上,tool calls 降低 27%,成功率从 60% 升至 81%。
We open-sourced BrowserBC: A system that turns human browser trajectories into reusable agent skills. Just one recording...
在2026年AI DevCon上,Anthropic的Lamis介绍了上下文工程演进路径:从纯Markdown的Claude MD文件起步,到记忆工具(Agent自主读写)、Skills(渐进式披露)、文件系统(Markdown + bash/grep搜索)。生产环境中遇到并发写入、权限、注入等问题,通过版本控制、哈希校验、组织级只读/个人可写权限、可移植API解决。最后提出"做梦"——带外异步处理,由专门Agent分析跨会话模式并调整记忆。该机制已投产,可提升任务效率、降低延迟,额外token消耗被效率提升抵消。
Vercel 开源了框架 Eve,将智能体视为一个目录:agent/instructions.md 定义系统提示,agent/agent.ts 配置模型等运行时参数;工具(agent/tools/ 下的类型化文件)、技能(agent/skills/ 下的 Markdown 文件,按需加载)、子智能体(内置 agent 工具实现委托)和人工审批(needsApproval 标记)均以文件形式存放,无需注册步骤。Eve 内置持久会话、沙箱、追踪和评估等生产级基础设施。
diff models are good at diff things, but how many of us actually compare them? you sign up for each provider separately,...
@jjacky @OpenRouter 🫡 can confirm: it rocks.
ZCode通过Cua插件接入开源Computer Use,agent可操作macOS:截图、读无障碍树、点击、打字,绕过Apple Events权限,改用CGEvent+Accessibility API。它自行计算7×6=42,并打开Chrome导航到微博和X。GUI正变成agent也能直接操作的界面。
Hook 是 Claude Code 的触发器,可设置规则让 AI 自动执行操作,不消耗 Token。当前支持近 30 个 Hook 事件。文章整理了 6 种玩法:权限弹窗提醒、开机日程播报、上下文预压缩时生成摘要卡片、文件自动整理、久坐提醒,以及通过 Bark 工具向手机发送完成推送。
微软为 Copilot in Excel 新增 FactSet、Morningstar、PitchBook 等数据连接器,支持团队通过 SKILL.md 定义 DCF 模型、三表模型等可重复任务。Copilot 可遵循团队设定的格式、命名和公式规则。Plan with Copilot 强制模型在编辑前声明操作范围与假设,Show Changes 则标记 AI 与人工编辑。CEO Satya Nadella 称此举可通过 skills 扩展团队专业知识。
Today we're bringing skills to Copilot for Excel, giving teams a new way to scale their expertise across every workbook.