AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「MCP/工具调用」清除
5月17日周日
19:02Hacker News 热门(buzzing.cc 中文翻译)67MCP 欢迎页面
12:54Berryxia.AI71微信读书Skill安装与使用指南
10:00向阳乔木66微信读书Cli安装与配置指南
09:16宝玉71创始人手册:打造 AI 原生初创公司
07:54ginobefun55企业AI竞争焦点转向智能体控制平面
06:54Berryxia.AI42OpenAI将Codex升级为个人AI设备网络
05:54Berryxia.AI74MagicPath与Codex深度整合,设计开发流程合二为一
05:08elvis71工具使用代理认知与行动脱节机制研究
04:33Chubby♨️45OpenAI将Codex打造为个人计算集群控制平面
02:43AYi63AI工具将十年开发经验压缩成一行命令
5月16日周六
22:05Greg Brockman45Codex技能:分析代码库计算复杂性并优化热点
20:42AYi60飞书 CLI 工具开源45天破万星,AI 透明操作获开发者认可
12:46宝玉60帮转 DeepSeek 招 Agent Harness 产品经理
11:28向阳乔木37用卡比的 wx-cli 写了一个自用的群聊总结,做每天、每周总结索引。 看一眼就能知道当下热点。 还能获取群聊提到的有用 URL 和文件。
08:57Simon Willison 博客58datasette-llm-limits 0.1a0 发布
08:00HuggingFace Daily Papers(社区热门论文)57多模态工具使用智能体基准
01:54The Decoder:AI News(RSS)66ChatGPT 现在想访问你的银行账户,以便告诉你别再点外卖了
00:54歸藏(guizang.ai)64飞书CLI工具获市场认可,展现AI时代SaaS软件竞争新方向
5月15日周五
23:05Microsoft Research51微软研究院发布AI新工具与模型
22:57小互74开源项目OpenSquilla:智能路由降低AI成本近十倍,兼容多平台与模型
22:04Greg Brockman69Codex技能:一键发掘本地潜在建站客户
21:54Berryxia.AI55Google Gemini Spark泄露截图:工具能力进阶,但功能开放谨慎
20:42AYi76精选飞书开源CLI工具45天获万星,AI操作可见可控引关注
17:54Berryxia.AI66视频翻译工具Violin安装与配置指南
17:42公众号:月之暗面(Kimi)54Kimi WebBridge:让 AI 帮你操作浏览器
17:41🚨 AI News | TestingCatalog66谷歌Gemini Spark新增高级工具使用与技能创建流程
15:54歸藏(guizang.ai)71GPT Codex新增移动端远程控制与多设备同步
12:54歸藏(guizang.ai)69Codex支持手机ChatGPT远程控制桌面设备
10:48HuggingFace Daily Papers(社区热门论文)67ATLAS:一个功能词元,兼作智能体操作与潜在视觉推理单元
09:27向阳乔木66飞书CLI工具:连接AI与工作流的高效利器
08:51ginobefun52早报聚焦AI前沿:Claude代码实践、GPT-Realtime-2与效率思考
08:46meng shao67Figma发布2026年Q1财报,营收增长加速至46%
08:00HuggingFace Daily Papers(社区热门论文)56χ-Bench基准测试:AI智能体在医疗自动化中的能力评估
07:51Berryxia.AI63xAI推出Grok Build早期Beta版,专注Agentic CLI
07:34Artificial Analysis62中国移动发布专有模型JT-35B-Flash,智能指数显著提升
05:18Sam Altman74OpenAI推出Codex Hooks和编程访问令牌,增强自动化与定制能力
05:06OpenAI Developers76精选Codex推出自动化钩子与程序化令牌
04:40Replit ⠕63Mixpanel集成Replit MCP,开发流程内嵌数据分析
02:06Peter Steinberger 🦞43mcporter 0.11.0 版本发布,提升浏览器自动化稳定性
02:00Claude:Blog(网页)73精选在大型代码库中高效运用Claude Code:最佳实践与入门指南
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月17日
19:02
Hacker News 热门(buzzing.cc 中文翻译)
67
MCP 欢迎页面

MCP(模型上下文协议)推出了全新的欢迎页面,旨在为用户提供更直观的入门体验。该页面整合了关键文档、工具和社区资源,帮助开发者快速理解并集成MCP。页面设计简洁,重点突出了协议的核心概念与最新动态。此举是MCP提升开发者体验、推动协议更广泛采用的重要一步。该页面发布后在Hacker News上获得了101点关注度。

MCP/工具教程/实践
12:54
Berryxia.AI@berryxia
71
❤️ 【引用 @vista8】:微信读书Cli安装和配置教程。 1. 官方指令,复制发给Codex或Claude Code 下载 https://cdn.weread.qq.com/skills/weread-skills.zip 安装 skill 2. 或者用 X 上网友 @eviljer 做的优化版Skill npx skills add jerlinn/jerlin-weread 3. 如果需要API key,访问微信官方这个页面获取 https://weread.qq.com/r/weread-skills 4. 使用案例 直接跟AI说:"调用微信读书skill 查看被讨厌勇气的高亮划线"

向阳乔木: 微信读书Cli安装和配置教程。 1. 官方指令,复制发给Codex或Claude Code 下载 https://cdn.weread.qq.com/skills/weread-skills.zip 安装 skill 2. 或者用 X 上网...

MCP/工具教程/实践
10:00
向阳乔木@vista8
66
微信读书Cli安装和配置教程。 1. 官方指令,复制发给Codex或Claude Code 下载 https://cdn.weread.qq.com/skills/weread-skills.zip 安装 skill 2. 或者用 X 上网友 @eviljer 做的优化版Skill npx skills add jerlinn/jerlin-weread 3. 如果需要API key,访问微信官方这个页面获取 https://weread.qq.com/r/weread-skills 4. 使用案例 直接跟AI说:"调用微信读书skill 查看被讨厌勇气的高亮划线"
MCP/工具教程/实践
09:16
宝玉@dotey
71
创始人手册:打造 AI 原生初创公司

AI正重塑创业格局,大幅降低技术门槛,催生“AI原生”初创公司。创始人角色从执行者转变为AI智能体的指挥者,无需传统技术背景即可开发软件或制定商业策略。初创生命周期被重新定义为构思、MVP、发布和扩展四个阶段,核心是利用AI工具(如研究、智能体编程和流程自动化)来压缩时间。成功关键在于创始人需掌握使用AI的时机与方法,尤其在构思阶段应通过深入研究验证痛点与方案的匹配度,而非盲目开发。

智能体AnthropicMCP/工具教程/实践
07:54
ginobefun@hongming731
55
企业AI竞争焦点转向智能体控制平面

企业AI的竞争维度正从模型性能转向智能体控制平面,即管理AI任务规划、工具调用、数据访问与安全权限的基础设施层。VentureBeat调查显示,微软以38.6%份额领先,OpenAI占25.7%,Anthropic首次以5.7%进入榜单,标志其Claude从被调用模型转变为编排基础设施。企业选择编排平台时,安全与权限管理已超越模型性能成为首要考量,反映企业更重视部署AI时的合规、审计与责任归属。

智能体AnthropicMCP/工具Microsoft
06:54
Berryxia.AI@berryxia
42
OpenAI将Codex升级为个人AI设备网络

OpenAI计划将Codex升级为个人AI设备网络。用户可在多台设备上安装Codex,将Mac Mini、工作站甚至闲置旧电脑连接成“Codex network”。通过主设备即可远程调用这些设备的Computer Use能力,执行任务、处理文件和自动化操作。配合即将推出的“Locked Use”设置,该功能在提升控制权的同时保障了安全性。此举使用户能从单一设备运行单个Agent,转变为随时调度分布式Agent集群,从而将闲置硬件转化为生产力,标志着个人算力时代的到来。

🚨 AI News | TestingCatalog: OPENAI 🔥: In the future, Codex will be able to control other desktop devices with the Codex installation. All your Mac ...

智能体MCP/工具OpenAI产品更新
05:54
Berryxia.AI@berryxia
74
MagicPath与Codex深度整合,设计开发流程合二为一

MagicPath AI CEO @skirano 演示了其产品与Codex的深度整合。用户现可将MagicPath作为原生画布直接在Codex中运行,通过拖拽设计UI,Codex能实时感知项目并自动生成、编辑代码,实现设计与开发的无缝衔接,无需在Figma和IDE间切换。安装简便,只需在Codex中粘贴一条命令即可完成配置。此举将“设计-开发-迭代”流程整合于单一窗口,显著缩短了从创意到可运行应用的距离。

Pietro Schirano: You can now run MagicPath as a native canvas inside Codex to design and build functional apps. It's pretty incredible. H...

MCP/工具教程/实践编码
05:08
elvis@omarsar0
71
工具使用代理认知与行动脱节机制研究

该可解释性论文聚焦工具使用代理,通过探测隐藏状态发现模型常能识别应调用工具,但实际调用失败,不匹配率达26%-54%。问题完全集中于认知到行动的过渡阶段,而非认知本身。内部探测方向可解码,但后期层的最后令牌机制使信号旋转,几乎与产生的行动正交。研究旨在预测干预措施效果,指出常见归因如提示或训练不足可能忽略后期层几何结构,这为工具使用提示A/B测试中的性能上限提供了合理解释。

智能体MCP/工具大佬观点
04:33
Chubby♨️@kimmonismus
45
OpenAI正将Codex从一个代码生成模型转变为个人计算设备的统一控制平面。未来,任何安装了Codex的设备,包括Mac Mini、工作站、开发机乃至浏览器会话,都能成为其智能体网络的端点。通过即将推出的"锁定使用"设置,用户可以从主设备安全地授权Codex,跨网络调用其他机器的"计算机使用"能力。这意味着Codex将能协调并操作你所有的计算设备,形成一个由AI驱动的分布式个人计算集群。

🚨 AI News | TestingCatalog: OPENAI 🔥: In the future, Codex will be able to control other desktop devices with the Codex installation. All your Mac ...

智能体MCP/工具OpenAI产品更新
02:43
AYi@AYi_AInotes
63
AI工具将十年开发经验压缩成一行命令

Greg Brockman转发的Codex Skill "Complexity Optimizer"通过一行npx命令安装,能在几秒内扫描代码库,精准定位O(n²)、N+1查询等性能问题,并提供文件、行号、优化建议和风险等级。其核心设计是仅报告问题而不自动修改,将决策权留给开发者。这标志着AI的关注点正从“更快地写代码”转向“发现人类难以察觉的复杂问题”,将十年项目经验才能积累的诊断能力封装成可一键调用的技能。未来,类似的安全审计、架构检测等工具将大量涌现。资深开发者的护城河因此被重新定义:从依靠个人眼力发现问题,转向依靠业务判断力来评估和落地AI提供的解决方案。

Greg Brockman: codex for improving computational complexity

MCP/工具大佬观点编码
5月16日
22:05
Greg Brockman@gdb
45
Codex技能能够分析代码库,识别计算复杂性高的区域,如O(n2)、O(n*m)模式和重复扫描检测。它提供前后复杂性估计和安全优化建议,包括风险级别和所需测试,默认以报告模式运行,支持一键安装。该工具专注于检测循环、重复查找和N+1模式等,旨在在不破坏行为的前提下减少复杂性,且完全开源。

Kappaemme: CODEX SKILL THAT FINDS COMPLEXITY HOTSPOTS IN YOUR CODEBASE! I made a Codex skill that analyzes your codebase and report...

GitHubMCP/工具OpenAI开源/仓库
20:42
AYi@AYi_AInotes
60
飞书官方 CLI 工具 lark-cli 开源45天后 GitHub star 数突破1万,成为国内首个破万星的办公套件开源项目。其核心在于允许 AI 通过命令行直接操作飞书,执行建群、建文档等任务,且每一步操作都可见、可预览、可审查,与 MCP 等云端不可见模式形成对比。更关键的生态指标是,飞书主干已合并了10位外部开发者的代码,而同类产品钉钉和企业微信则为零,体现了真实的开发者参与。这种透明可控的特性是开发者放心将任务交给 AI Agent 的重要前提。

AYi: 刚刚花三分钟装了飞书官方那个 CLI 工具, 跑了一句话,建群、建文档、发通知,一次性全做完了, 我盯着终端看了几秒钟, 才反应过来这玩意儿真的能让 AI 直接操作飞书。 装的过程没啥可说的, 一行 npx @larksuite/cli@l...

智能体MCP/工具OpenAI开源/仓库
12:46
宝玉@dotey
60
帮转 DeepSeek 招 Agent Harness 产品经理

DeepSeek招聘Agent Harness产品经理,旨在将其前沿模型能力转化为领先的Agent产品。该职位需规划产品路线图,连接研究员、工程师与社区,定义并衡量Agent帮助用户的核心指标,推动模型与Harness共同进化。候选人需是Agent产品高强度用户,熟悉Claude Code、GitHub Copilot等工具,理解LLM与Agent技术原理,并具备数据分析和产品设计能力。

智能体DeepSeekMCP/工具行业动态
11:28
向阳乔木@vista8
37
用卡比的 wx-cli 写了一个自用的群聊总结,做每天、每周总结索引。 看一眼就能知道当下热点。 还能获取群聊提到的有用 URL 和文件。
MCP/工具教程/实践
08:57
Simon Willison 博客
58
datasette-llm-limits 0.1a0 发布

新插件 datasette-llm-limits 0.1a0 发布,需与 datasette-llm 及 datasette-llm-accountant 配合使用。该插件允许在 Datasette 内为每位用户或全局配置大语言模型(LLM)使用的支出限额。配置示例显示,可为用户设置滚动24小时窗口内的使用额度,金额上限为1.00美元。这为团队管理LLM调用成本提供了细粒度的控制工具。

MCP/工具产品更新部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
57
多模态工具使用智能体基准

针对智能体在真实工作流中需处理多模态输入、调用工具并自我修正的需求,研究团队推出了MM-ToolBench基准。该基准包含来自客户服务与智能创作两大类共100个可执行任务,覆盖20个细分领域,由27个MCP服务器提供324个工具支持。其核心设计理念是“闭环多模态验证”,即智能体必须执行工具、检查输出制品并在不符合要求时进行自我修正。实验表明,该基准极具挑战性,例如Claude Opus 4.6的成功率仅为32.0%,远低于94.0%的人类基准。它旨在为评估和推进下一代全模态工具使用智能体奠定基础。

智能体MCP/工具论文/研究评测/基准
01:54
The Decoder:AI News(RSS)
66
ChatGPT 现在想访问你的银行账户,以便告诉你别再点外卖了

OpenAI 正在将 ChatGPT 转变为个人财务助手。美国地区的 Pro 用户现已能通过 Plaid 连接银行账户,基于真实交易数据获得个性化财务分析。该功能运行于 GPT-5.5 Thinking 模型,未来将向所有用户开放。OpenAI 同时提醒,ChatGPT 并非持牌财务顾问,其分析仅供参考。

MCP/工具OpenAI产品更新推理
00:54
歸藏(guizang.ai)@op7418
64
飞书CLI工具开源一个多月便在GitHub获得万星,显示市场高度认可。该工具几乎能控制飞书所有能力,让用户无需与传统UI交互即可完成工作。作者指出,AI时代SaaS软件的竞争焦点正从UI转向对Agent的适配程度和覆盖率。飞书CLI通过分层架构、Skills说明书及Dry Run等对Agent友好的设计,有效降低了复杂软件的使用门槛,并为其快速迭代投入巨大。这为开发者提供了新路径:结合飞书CLI与Agent框架,可直接利用飞书的聊天界面、多维表格和群组构建Agent产品,无需从头开发前端界面。

歸藏(guizang.ai): 飞书 CLI 牛皮啊,发布一个月多点就达到 10000 Star 了! 说明用户和市场相当认可这个动作 最近我们可以发现,越来越多的传统办公产品开始发布 CLI 和 Agent。 AI 时代的 SaaS 软件可能得换个做法了:UI 只是最基...

智能体GitHubMCP/工具大佬观点
5月15日
23:05
Microsoft Research@MSFTResearch
51
微软研究院的新工具、模型、代码库和论文现已发布。 使用AI和智能体?值得关注: • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先型智能体 • 意义匹配微调 • AI转型与经济发展
智能体MCP/工具Microsoft产品更新
22:57
小互@xiaohu
74
开源项目OpenSquilla:智能路由降低AI成本近十倍,兼容多平台与模型

开源项目OpenSquilla通过智能路由架构,在保持与OpenClaw相近性能(0.9251分)的同时,将复杂AI任务处理成本从6美元大幅降至0.68美元。其核心是将简单任务分配给廉价模型,仅复杂任务调用Opus等顶级模型。系统具备四层记忆结构模拟人脑认知,支持按需加载16种工具,并设有三档代码沙箱安全防护。项目提供统一后端,支持网页、命令行及Slack、飞书等平台接入,兼容OpenAI、Claude、Gemini、DeepSeek等20余家主流模型。

智能体MCP/工具开源/仓库
22:04
Greg Brockman@gdb
69
开发者发布了一款开源的Codex技能,旨在将本地搜索转化为潜在客户线索。该工具能自动搜索附近的各类本地商户,并分析其是否拥有独立网站或仅依赖社交媒体页面,以此判断其建站需求。核心功能包括潜在客户挖掘、网站与纯社交媒体状态检查、线索评分、提取联系方式,并支持聊天或CSV格式输出。用户可通过一条命令快速安装使用。

Kappaemme: CODEX SKILL THAT TURNS LOCAL SEARCH INTO CLIENT LEADS! I made a Codex skill that helps find local businesses that may ne...

智能体MCP/工具开源/仓库
21:54
Berryxia.AI@berryxia
55
Google Gemini Spark泄露截图:工具能力进阶,但功能开放谨慎

泄露的Gemini Spark内部截图显示,新模型整合了Agent与Chat模式,重点提升高级工具使用和Skills创建流程。然而,当前Skills仅支持复制粘贴MD文件创建,缺乏直接导入选项,且未见Browser或Computer Use功能。这表明Google在推进AI工具能力时采取了渐进策略,优先打磨核心流程,而非一步到位开放激进功能。

🚨 AI News | TestingCatalog: GOOGLE 🔥: New Gemini Spark screenshots featuring advanced tool use and Skills creation flow. It seems like there won't ...

智能体GoogleMCP/工具产品更新
20:42
AYi@AYi_AInotes
精选76
飞书开源CLI工具45天获万星,AI操作可见可控引关注

飞书开源命令行工具lark-cli在45天内获得超过1万GitHub star,成为国内首个破万星的办公套件开源项目。该工具允许AI通过命令行直接操作飞书,执行建群、建文档等任务,且每一步操作都可预览、可审查,与云端不可见的MCP模式形成对比。其主干代码已合并10位外部开发者的贡献,而同类产品钉钉和企业微信则为零。这种可见、可控的特性被视为开发者放心将任务交给AI Agent的前提,预示着一句话指令驱动完整项目流程成为可能。

智能体MCP/工具开源生态教程/实践

推荐理由:飞书CLI把AI操作办公套件的每一步都摊在终端里,这种透明感是MCP黑箱给不了的,加上1万星和10个外部PR,这组数字比任何PR稿都诚实。
17:54
Berryxia.AI@berryxia
66
哈哈 你们要的林志玲版。。。 【引用 @berryxia】:这个项目也可以直接 # 安装成 Claude Code skill 命令:violin --install-skill 以后就可以直接这样:violin input.mp4 output_zh.mp4 --language Chinese 大家需要注意: 去 http://api.together.ai 注册获取 Key(也支持 OpenAI、ElevenLabs,只需其中一个)。 Violin 默认使用 Together AI(免费注册可得额度),需要设置环境变量: # 永久生效,加到 ~/.zshrc echo 'export TOGETHER_API_KEY=你的key' >> ~/.zshrc source ~/.zshrc

Berryxia.AI: 这个项目也可以直接 # 安装成 Claude Code skill 命令:violin --install-skill 以后就可以直接这样:violin input.mp4 output_zh.mp4 --language Chinese ...

MCP/工具教程/实践语音
17:42
公众号:月之暗面(Kimi)
54
Kimi WebBridge:让 AI 帮你操作浏览器

Kimi WebBridge 是一款面向本地 AI Agent 的浏览器插件,使智能体能够直接操控浏览器,执行网页导航、数据提取等任务。

智能体MCP/工具产品更新
17:41
🚨 AI News | TestingCatalog@testingcatalog
66
GOOGLE 🔥:Gemini Spark新截图展示高级工具使用和技能创建流程。 目前看来除了复制粘贴外,似乎没有导入SKILL MD文件的选项。目前也没有浏览器或计算机使用功能的迹象。

Just a dragon: The new Gemini Spark model will have Agent mode / Chat mode. New advanced use of tools.

智能体GoogleMCP/工具模型发布
15:54
歸藏(guizang.ai)@op7418
71
GPT的Codex功能现已支持通过手机ChatGPT进行远程控制。用户可将移动设备与桌面端Codex绑定,实现对话自动同步,并可直接从手机发送指令、审批权限及监控进度。设置需在Mac版Codex客户端启用"设置Codex移动版",过程中建议使用Google Authenticator完成多重因素验证,而非短信。目前该功能仅支持Mac,Windows版本仍在开发中。

歸藏(guizang.ai): Codex 终于支持手机上的 ChatGPT 远程控制了! 可以自动同步你绑定的 Codex 设备上的所有对话,而且可以直接发送指令、审批权限、监控进度。 我写一下设置的教程: 1. 点击桌面端 Codex 客户端左侧的"设置 Codex ...

智能体MCP/工具OpenAI教程/实践
12:54
歸藏(guizang.ai)@op7418
69
Codex支持手机ChatGPT远程控制桌面设备

Codex现已支持通过手机上的ChatGPT应用远程控制绑定的桌面设备。该功能可实现对话自动同步,并允许用户直接发送指令、审批权限及监控进度。设置需在桌面端Codex客户端内启动,并建议使用Google Authenticator完成多重因素验证。绑定后,手机ChatGPT应用将出现Codex侧边栏,用于访问和控制桌面端对话。目前该功能仅支持Mac版Codex,Windows版本仍在开发中。

歸藏(guizang.ai): Codex 终于支持手机上的 ChatGPT 远程控制了! 可以自动同步你绑定的 Codex 设备上的所有对话,而且可以直接发送指令、审批权限、监控进度。 我写一下设置的教程: 1. 点击桌面端 Codex 客户端左侧的"设置 Codex ...

智能体MCP/工具OpenAI产品更新
10:48
HuggingFace Daily Papers(社区热门论文)
67
ATLAS:一个功能词元,兼作智能体操作与潜在视觉推理单元

针对视觉推理中直接生成图像计算成本高、代理方法存在切换延迟、潜在方法泛化性差等问题,本研究提出ATLAS框架。其核心是引入“功能词元”这一离散单元,它同时作为智能体操作和潜在视觉推理单元。每个词元对应一个内化的视觉操作,无需视觉监督,仍作为标准词元存在于词表中,可通过下一词元预测生成。这避免了生成冗余的中间视觉内容,且与标准的可扩展SFT和RL训练兼容。为应对RL中功能词元的稀疏性问题,研究引入了潜在锚定GRPO(LA-GRPO)以稳定训练。实验表明,ATLAS在多项挑战性基准测试中取得了优异性能,并保持了良好的可解释性。

arXivMCP/工具多模态推理
09:27
向阳乔木@vista8
66
飞书CLI工具:连接AI与工作流的高效利器

飞书CLI工具在GitHub上已获超1万Star,成为连接AI工作流的关键工具。它允许用户将AI助手(如Codex和Claude Code)的产出直接整合到飞书生态中,实现自动化操作。典型应用包括:让AI搜索整理资料并自动写入飞书文档、通过对话安排出差日程、以及读取飞书妙记自动生成会议纪要和待办事项。该工具通过指令npx @larksuite/cli@latest install即可安装,官方文档提供了更多进阶使用案例。

MCP/工具教程/实践
08:51
ginobefun@hongming731
52
早报聚焦AI前沿:Claude代码实践、GPT-Realtime-2与效率思考

本期早报重点推荐了三项内容。Anthropic发布了Claude Code在大型代码库中的官方实践指南。OpenAI则公开了GPT-Realtime-2的实现细节并提供了开发演示视频。此外,少楠探讨了在大模型时代,当效率大幅提升(效率溢出)之后所带来的深层思考。

AnthropicMCP/工具OpenAI教程/实践
08:46
meng shao@shao__meng
67
Figma发布2026年Q1财报,营收增长加速至46%

Figma创始人发布2026年第一季度财报,回应了市场对其在AI设计工具冲击下生存状况的质疑。财报显示营收达3.33亿美元,同比增长46%,且连续两个季度加速增长。净美元留存率升至139%,为两年多来最高。增长主要来自席位扩张、AI Credit货币化及AI产品矩阵的渗透。AI Credit自3月启动货币化后,75%的超额用户选择付费续用,显示真实需求。公司同时上调了2026年全年营收指引。

Dylan Field: Quick update: not dead. $FIG Q1 results: → 46% YoY revenue growth, accelerating for the 2nd straight quarter → Net Dolla...

MCP/工具行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
56
χ-Bench基准测试:AI智能体在医疗自动化中的能力评估

χ-Bench是一个针对医疗运营自动化的基准测试,评估AI智能体在策略密度、多角色协作和多边交互三项关键能力上的表现。测试涵盖授权、用率管理和护理管理三大领域,要求智能体在模拟20个医疗应用、提供87个工具接口的高保真环境中,依据超过1290份文档的操作手册完成任务。结果显示,在30种配置中,最佳智能体仅解决28%的任务,严格标准下成功率不足20%,且全量任务性能骤降至3.8%。这表明AI在处理复杂、不可逆的企业级应用时仍面临显著挑战。

智能体MCP/工具论文/研究
07:51
Berryxia.AI@berryxia
63
xAI推出Grok Build早期Beta版,专注Agentic CLI

xAI正式发布Grok Build的早期Beta版本,这是一个专为编码、构建应用和自动化工作流设计的agentic命令行界面。它支持并行子代理、计划视图及团队共享市场,并能集成MCP skills等扩展功能。目前仅面向SuperGrok Heavy订阅者开放。xAI选择深耕CLI,旨在让开发者直接在终端驱动agent团队,推动agent技术从演示融入实际工作流。

智能体MCP/工具xAI产品更新
07:34
Artificial Analysis@ArtificialAnlys
62
中国移动发布专有模型JT-35B-Flash,智能指数显著提升

中国移动近日发布了专有的350亿参数非推理模型JT-35B-Flash,其Artificial Analysis智能指数达到36,较前代JT-MINI大幅提升11分。该模型在面向电信客服场景的工具使用评测τ²-Bench中以99%的得分领先,并展现出较高的令牌效率,运行智能指数仅消耗约1700万输出令牌。JT-35B-Flash拥有256K上下文窗口,目前主要面向企业客户提供。作为全球主要电信运营商,此举标志着中国移动在开发更强大专有模型方面的持续投入。

MCP/工具模型发布
05:18
Sam Altman@sama
74
OpenAI宣布Codex推出两项新功能,旨在提升围绕代码的自动化与定制体验。一是"Hooks",允许用户通过脚本在任务关键节点自定义Codex的工作流程,例如运行验证器、扫描提示中的敏感信息、记录对话至内部系统,或根据代码库和目录创建记忆与定制行为。二是"编程访问令牌",为Business和Enterprise团队提供范围限定的凭证,可从ChatGPT工作区设置生成,适用于CI/CD管道、发布工作流和内部自动化任务。该令牌支持设置过期时间或即时撤销,并能将使用情况关联回对应工作区。

OpenAI Developers: Codex is getting easier to automate and customize around your code. 🪝 Hooks customize the Codex loop with scripts that ...

MCP/工具OpenAI产品更新编码
05:06
OpenAI Developers@OpenAIDevs
精选76
Codex推出自动化钩子与程序化令牌

Codex正变得更易于围绕用户代码实现自动化与定制。其核心更新包括“钩子”功能,允许在任务关键节点运行脚本,以进行工作验证、扫描密钥、记录对话或按仓库定制行为。同时,面向商业和企业团队推出“程序化访问令牌”,提供范围化凭证,可从ChatGPT工作区设置创建,用于CI/CD、发布流程和内部自动化,支持设置过期或撤销,并将使用情况关联回工作区。

MCP/工具OpenAI产品更新编码

推荐理由:Codex 引入 hooks 和程序化访问令牌,CI/CD 集成和定制化开发变成标准化操作,做内部工具链的可以立刻用上,这是它从个人工具走向团队基础设施的关键一步。
04:40
Replit ⠕@Replit
63
发布产品。衡量效果。全在一个流程中完成。 @Mixpanel 现已登陆 Replit MCP。下周伦敦黑客松现场演示👇

Mixpanel: Mixpanel is live in the Replit MCP marketplace! Devs building on @Replit can pull product analytics into their agent wor...

智能体MCP/工具产品更新
02:06
Peter Steinberger 🦞@steipete
43
mcporter 0.11.0 已上线 如今我主要将 mcporter 用作更稳定的浏览器自动化命令行工具,并供代理测试 MCP 而无需重启。 我很高兴代码模式正逐渐被测试框架采用,因此对此的需求将减少。 https://github.com/openclaw/mcporter/releases/tag/v0.11.0
智能体MCP/工具产品更新
02:00
Claude:Blog(网页)
精选73
在大型代码库中高效运用Claude Code:最佳实践与入门指南

Claude Code已成功部署于数百万行的单体仓库、遗留系统及分布式架构中。其核心在于围绕模型构建的“工具套件”,而非仅依赖模型本身。该套件包含五个关键扩展点:提供代码库概览的CLAUDE.md文件、实现持续改进的钩子、按需加载专业知识的技能、插件以及MCP服务器。它采用智能体搜索模式,直接在开发者本地实时代码库上操作,无需构建和维护集中式索引,从而避免了传统RAG系统在活跃大型代码库中索引过时的问题。团队对代码库设置的投入程度直接决定了其导航效果。

智能体AnthropicMCP/工具教程/实践

推荐理由:这是 Anthropic 官方出的 Claude Code 大型代码库配置指南,把 CLAUDE.md、hooks、skills 的层级和分工讲得比社区经验更系统,做工程落地的团队可以当作部署手册。
‹ 上一页
1…1415161718…26
下一页 ›