AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 658 条
全部一手资讯X论文
标签「MCP/工具调用」清除
AYi@AYi_AInotes · 6月6日53

分享一个 GitHub 5 万星的开源AI剪辑神器, 本地处理、永久免费、不要水印、没有会员墙。 它叫 OpenCut,想干掉剪映最让人不爽的那件事—— 你做的视频,再也不用先传到别人的服务器上了。 现在就能用,但作为一个免费开源产品,想完全媲美年费700多块的剪映肯定不太可能, 先说说OpenCut 现在的状态,属于 Early Beta: 打开网页就能剪,导入视频、拉时间线、切一刀、修个头尾, 完全免费、没水印、不要会员。 但导出、特效、转场这些功能还在路上, 只追求今天就能高效出片?现阶段剪映还是更强,这话我得说在前面。 那么他的优势是什么? 剪映是云端处理,你的素材要先上传, OpenCut 是本地优先,视频压根不离开你的机器。 一个把你的内容当数据,一个把你的内容当你的, 这一条差别,剪辑的时候你感觉不到, 等哪天平台改规则、加水印、涨会员价的时候,你就全懂了。 OpenCut没把自己当成又一个剪映, 它的路线图里写着: Rust 重写核心、Web + 桌面 + 移动统一、 插件系统、Editor API,还有 MCP Server—— MCP Server 是让 AI Agent 直接调工具的协议, 也就是说,以后你的 AI 能直接调 OpenCut 来替你剪,它想做的也不是一个剪辑软件, 而是一个能被你自己的工作流调用的、可编程的视频底座。 所以把视频编辑四个字去掉,这其实是所有工具正在发生的同一件事—— 过去的工具是一个封闭的盒子,你只能按它给你的按钮, 未来的工具是一个开放的接口,你能把它焊进自己的系统,让 AI 替你按。 剪映卖的是一次出片的效率, OpenCut 赌的是你愿不愿意为"这东西永远是我的、还能被我编程"多等几年。

译OpenCut 是一个 GitHub 5 万星的开源 AI 剪辑工具,主打本地优先,视频无需上传服务器,永久免费、无水印、无会员墙。目前处于 Early Beta 阶段,网页版支持基础剪辑(导入视频、时间线、切割),但导出、特效、转场等功能仍在开发。路线图包括 Rust 重写核心、Web+桌面+移动统一、插件系统、Editor API 及 MCP Server(让 AI Agent 直接调用工具),目标是成为可编程的视频底座,而非对标剪映的封闭工具。

凡人小北@frxiaobei · 6月6日43

Codex+Obsidian 是个非常好的 agent 组合, 现在唯一的缺陷是文档太多了,每次打开 Obsidian 都卡几秒, 大家有啥解决方案吗👀

译用户认为 Codex 与 Obsidian 搭配是非常优秀的 AI Agent 组合,但存在 Obsidian 文档过多导致每次打开卡顿几秒的问题,寻求解决方案。引用推文指出,Obsidian 加上 Codex,配合合适的 API、MCP 和 Skills,基本能替代目前 90% 以上的 AI Agent 产品,这是从 Notion 迁移到 Obsidian 一个月后的感受。

Rohan Paul@rohanpaul_ai · 6月5日62

Tencent WorkBuddy is now becoming China’s #1 PC-based productivity AI agent. Tell it what you need, then it reads files, calls tools, writes reports, builds decks, analyzes data, uses 100+ expert roles. Connects to GitHub, Jira, Notion, Gmail, Google Drive, Slack and more through MCP, runs tasks in a sandbox, and can even be controlled from Slack, Telegram, Discord, or WeChat when you are away from your desk. WorkBuddy breaks a big task into smaller jobs, picks the right skills or connected apps for each job, and for complex work it can use Expert Teams where multiple specialized sub-agents work in parallel while 1 lead agent coordinates the final output. So if you ask for a report, it is not just generating text. It can read the file, send the data-analysis part to an analyst-style expert, send the writing part to another expert, use connectors like Google Drive or Gmail if needed, and then combine everything into a finished file. 👋 Here are a few practical use cases you can do immediately with it. - Read PDFs, images, and documents, then organizes the extracted content. - Create reports, proposals, manuals, and presentations from raw material. - Analyze spreadsheets, finds trends, and turns data into charts. - Create platform-ready posts, scripts, articles, and content ideas. - Automatically research news and sends scheduled summaries to your channels. - Run desktop tasks from Slack on your phone. Manage Calendar and Drive tasks directly through conversation. - Build working apps without needing you to code. - Turn repeated workflows into reusable WorkBuddy skills. For my own workflow, I installed Tavily AI Search because I post a lot about research papers on X. And paper content needs outside context: project pages, GitHub repos, author links, related papers, previous methods, and the reason a paper is worth posting about. @TencentAI_News

译腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体。它可读取文件、调用工具、撰写报告、制作演示文稿、分析数据,支持100+专家角色。通过MCP连接GitHub、Jira、Notion、Gmail、Google Drive、Slack等,在沙箱中运行任务,并可通过Slack、Telegram、Discord、微信远程控制。WorkBuddy将大任务分解为小任务,为复杂工作启用专家团队:多个专业子智能体并行工作,一个主导智能体协调最终输出。用例包括阅读PDF/图片、创建报告、分析电子表格、生成内容、自动研究新闻并发送定时摘要、从手机运行桌面任务、无需编码构建应用等。

fofr@fofrAI · 6月5日62

Today I'm experimenting with Gemini 3.5 Flash and the Antigravity CLI to see how fast and how autonomously the agents can do things. - It took 20 minutes to install and run the original CompVis Stable Diffusion 1.5 repo, get the weights, debug, run inference and generate an image on a Linux CPU. It fixed every crash and managed dependencies while making changes to run on a CPU - I gave it the original Lora and SD papers and asked it to make a lora fine tuner from first principles, with a set of 10 images. That took about 1h30, most of the time being slow training runs on the CPU, but it did optimize for multiple CPUs. It worked, it made a lora that showed a likeness and then it wanted to hill climb. I told it to think of the poor CPUs - I wanted to experiment with the new Ideogram v4 weights. It used modal to find the right class of GPU, get the code, set up the env, get the weights, run inference, that took about 20 mins in total

译fofrAI 使用 Gemini 3.5 Flash 和 Antigravity CLI 实验 AI 智能体的自主性和速度。结果:20 分钟内在 Linux CPU 上安装并运行原版 Stable Diffusion 1.5,完成推理生成图像;基于 Lora 和 SD 论文,用 10 张图片从零实现 Lora 微调器(约 1 小时 30 分,主要为 CPU 训练);通过 modal 约 20 分钟找到 GPU、获取 Ideogram v4 权重并运行推理。该推文展示了当前长周期智能体任务的基线案例。

meng shao@shao__meng · 6月5日62

终于等来了 @gregisenberg 对 Codex Sites 的解读 Greg 通过六轮 Prompt,把 Codex Sites 做成一个会自己更新的「创业想法看板」! 1. 建壳 + 样本数据 @ sites 调用插件。关键一句:「save for review, do not deploy」 —— 拦住自动部署,留在产品评审模式。 2. 加记忆 Sites 默认每次访问都是新的。先让 Agent 展示数据模型,再写代码(Greg 选了 Cloudflare D1,实体 ideas,动作:list / add / update / move / score / archive)。有持久化,Demo 才变成软件。 3. 安全动作 预置、命名的操作入口(如 add idea)。Agent 只能走这些路径改数据,不能随意改库。你在任意 Codex 对话里随口说个想法,也能通过唯一合法通道落到线上看板 —— 人机协作的 API 边界。 4. Skills 让 Codex 写 Startup Ideas Admin 技能:教未来对话如何读板、加卡、移动、打分,并附示例命令。技能 = 可复用的操作手册,让 Safe Actions 在陌生会话里也能被正确触发。 5. 存档检查点 Codex 没有游戏式自动存档。明确说「save as V1 review, do not deploy」,并核对构建状态、存储、访问权限、版本 —— 可回滚的已知好点。 6. 闭环验证 开新对话,只说:用 Startup Ideas Admin 加一条想法。新线程加载技能 → 读板 → 经批准路径写入。再发布 → 上线带注册页的 live board。证明 跨会话、跨线程的可重复运营。

译Greg Eisenberg 通过六轮 Prompt,用 Codex Sites 做出自动更新的创业想法看板。关键步骤:1)调用 sites 插件,指令“save for review, do not deploy”阻止自动部署;2)选 Cloudflare D1 实现持久化;3)设安全动作,限定 Agent 只能通过预设路径改数据;4)编写 Startup Ideas Admin 技能,使操作手册化;5)存档为 V1 并验证版本回滚;6)新对话加载技能,跨线程写入并成功上线,证明跨会话可重复运营。

🚨 AI News | TestingCatalog@testingcatalog · 6月5日66

OpenSquilla released MetaSkill, a self-organizing skill protocol that teaches an open-source AI agent how to discover, filter, and compose its own atomic skills rather than relying on hand-written workflows. The framework relies on intelligent model routing, sending simpler tasks to lower-cost models while reserving stronger models for heavier workloads, aimed at reducing costs without sacrificing performance. #sayitbuildit @OpenSquilla

译OpenSquilla 发布了 MetaSkill,一个自组织技能协议,它教会开源 AI 智能体如何自行发现、过滤和组合原子技能,而非依赖手工编写的工作流。 该框架依赖智能模型路由,将更简单的任务发送给低成本模型,同时将更强模型留给更重的工作负载,旨在不牺牲性能的情况下降低成本。 #sayitbuildit @OpenSquilla

小互@xiaohu · 6月5日64

最近 AI 工具似乎已开始从 Coding 开发 转向 Working 办公了😁 Kimi 刚刚发了一个新东西: Kimi Work 继承了Kimi Code的核心功能和 Kimi Agent 的建站、PPT 等专业 Skills 能力 同时还打通了金融、科研、法律等专业数据库 为打工人士量身打造... 最多可同时调度 300 个Agent互相配合完成任务... 下面是我的测试结果... 不再需要打开终端、写命令、配置环境,安装客户端即可 只需要通过文字描述你的需求,Kimi Work 就能在电脑上拆解任务、并行执行、调用工具、使用浏览器、创建整理文件夹,并交付文档、表格、PPT 等

译Kimi 推出新工具 Kimi Work,继承 Kimi Code 核心功能和 Kimi Agent 的建站、PPT 等专业 Skills,并打通金融、科研、法律等专业数据库。用户无需终端或命令行,安装客户端后通过文字描述需求即可让系统拆解任务、并行执行、调用工具、使用浏览器、整理文件夹,最终交付文档、表格、PPT 等成果。最多可同时调度 300 个 Agent 互相配合完成任务。

Elon Musk@elonmusk · 6月5日64

Grok Build updates

译xAI 发布 Grok Build 0.2.20 更新,修复多项 Bug 并新增工具。修复包括:消除 Markdown 表格渲染中的鬼影单元格、使监控对模型可见且可终止、保留计划预览中的软换行、修复 image_edit 中的附件引用、优化 MCP 生命周期通知路由和鼠标滚轮滚动、改进压缩提示与去重子代理提醒、允许回滚时自动降级、修复 Windows 上本地 stdio MCP 服务器问题。新增 image_to_video 和 reference_to_video 工具,捆绑 imagine 技能,支持 ICO 转 PNG,以及 Search 和 ListDir 块按 Enter 打开全屏查看器。

Alibaba Cloud@alibaba_cloud · 6月5日76

PolarDB-X Zero is live! No signup. No config. Just one API call. Get a full distributed database in 30 seconds. Native HNSW vector indexing — inside MySQL compatible engine. Relational + semantic search — one SQL statement. AI Agent ready — MCP protocol, AI IDE compatibility (Cursor, Claude, Qoder, Qodex, etc.) Try it now: https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB

译PolarDB-X Zero 上线了! 无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。 原生 HNSW 向量索引——内置兼容 MySQL 的引擎。 关系型 + 语义搜索——一条 SQL 语句。 AI 智能体就绪——MCP 协议、AI IDE 兼容(Cursor、Claude、Qoder、Qodex 等) 立即尝试:https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB

meng shao@shao__meng · 6月5日69

OpenAI Codex 新增了面向 iOS / SwiftUI 开发的“Build iOS Apps”官方插件,把 iOS 应用开发闭环进一步引入 Codex 工作流 主要能力:在 Codex 内直接查看和测试 iOS 应用,打开 SwiftUI previews,并对代码编辑进行热重载,从而减少在 Codex 与 Xcode/模拟器之间来回切换。 底层机制:围绕 XcodeBuildMCP 构建自动化工作流,支持构建、测试、模拟器运行、UI 检查、日志和调试器状态采集。 实践意义:让 Codex 能自主完成“发现项目与模拟器 -> 构建运行 -> 观察 UI 和日志 -> 调试验证”的完整开发闭环。 这两个底层的开源项目需要关注 1. serve-sim(作者 @Baconbrix / Evan Bacon) 为 Codex 提供了 streaming simulator 能力,支持更顺畅的模拟器交互体验。 https://github.com/EvanBacon/serve-sim 2. SnapshotPreviews(作者 @sentry) 用于从项目中提取 SwiftUI previews,让预览能力可以更方便地被工具链集成。 https://github.com/getsentry/SnapshotPreviews

译OpenAI Codex 推出“Build iOS Apps”官方插件,将 iOS 应用开发闭环引入 Codex 工作流。用户可在 Codex 内直接查看和测试 iOS 应用、打开 SwiftUI previews 并进行代码热重载,无需切换到 Xcode 或模拟器。底层基于 XcodeBuildMCP 构建自动化工作流,支持构建、测试、模拟器运行、UI 检查、日志与调试状态采集。值得关注的两个开源项目:serve-sim(提供 streaming simulator 能力)和 SnapshotPreviews(用于提取 SwiftUI previews 集成工具链)。

elvis@omarsar0 · 6月4日48

I am hooked on Dynamic Workflows! The idea of generating harnesses on the fly is so compelling that I reverse-engineered it for my agent orchestrator. And then I built a monitoring dashboard (as an HTML artifact) to track tasks, metrics, and reports. I can now use and monitor dynamic workflows in my agent orchestrator with coding agents like Claude Code, Codex, Pi, and even my own custom-built @dair_ai agent. This is clearly the future of working with agents to accomplish complex, long-running tasks. Some use cases I'm having success with: - Branching deep research tasks (with verification) - Parallel deep research tasks - Session mining of all my agent sessions - Bug hunting - Triaging - Fact-checking - LLM councils - AI simulations - Data synthesis - Evals generation ... and many others Dynamic workflows, like agent skills, feel like an important primitive to not only get the most out of agents but also incorporate dynamic behaviors and important components like cooperation and verification. There is so much exploration ground here. The exciting part is that this is not limited to coding tasks; it extends to business use cases and many other technical domains like science and research.

译Elvis Saravia 逆向工程了动态工作流(Dynamic Workflows)并集成到自研智能体编排器中,同时构建 HTML 监控仪表盘跟踪任务、指标和报告。该工作流可在 Claude Code、Codex、Pi 等编码智能体及自研 @dair_ai agent 上运行。成功用例包括分支深度研究、并行深度研究、会话挖掘、Bug 定位、分类、事实核查、LLM 委员会、AI 模拟、数据合成和评测生成等。他认为动态工作流与 agent 技能一样,是实现复杂长期任务的关键原语,不仅限于编码,还可扩展至商业、科学等领域。

Rohan Paul@rohanpaul_ai · 6月4日65

Most AI workflows break because the user has to carry the context manually, and Anuma is trying to make that context portable, private, and usable across models. Anuma is a private AI workspace built around 1 memory across every model, so your context, preferences, goals, and past work can follow you across ChatGPT, Claude, Gemini, Grok, DeepSeek, Kimi, and others. It also adds on-device encrypted memory, Private Mode by default, no logs, no training, full memory export, Council Mode, model switching inside 1 chat, and AI texting through iMessage or SMS. I integrated Anuma into my AI workflow and for me, the strongest use case research paper analysis: I’m uploading 3 different papers on the same topic, then using Anuma’s multimodal and parallel multi-model workflow to compare how different models read, summarize, question, and connect the papers. That is where Council Mode becomes useful, because you can see multiple model responses side by side instead of trusting 1 answer blindly. No more opening 5 separate AI tabs and re-explaining the same research context again and again, I can keep the same memory, switch models, compare answers, and continue the analysis in 1 place.

译Rohan Paul 介绍 Anuma,一个私人 AI 工作空间,核心功能是跨模型统一记忆——用户在 ChatGPT、Claude、Gemini、Grok、DeepSeek、Kimi 等模型间切换时,上下文、偏好、目标和历史工作自动跟随。额外功能包括设备端加密记忆、默认隐私模式、无日志无训练、支持完整记忆导出、Council Mode(多模型并列回复对比)、单聊内模型切换,以及通过 iMessage 或 SMS 的 AI 文本能力。Paul 分享研究论文分析用例:上传多篇论文,利用多模态和多模型并行工作流,对比不同模型对同一主题的阅读、总结和关联能力,避免重复解释上下文。

Orange AI@oran_ge · 6月4日68

今天 ListenHub 的AI 视频功能正式上线啦,人类用户和 Agent 现在都可以调用 ListenHub 的服务生成视频。 目前已支持 HappyHorse、Seedance 2.0 等视频模型。 输入一个想法,或使用参考图、参考视频,即可一键生成视频。 人类使用: ListenHub 官网: https://listenhub.ai/zh/app/ai-video Agent 使用: listenhub-cli:https://github.com/marswaveai/listenhub-cli skills: https://github.com/marswaveai/skills openapi: https://listenhub.ai/docs/zh/openapi/api-reference/ai-video

X.PIN@thexpin · 6月4日52

You'll be able to use Qwen (Alibaba's AI assistant) to order KFC in China! Simply say, "order me a meal deal from the nearest KFC," and Qwen will match your coupons and place the order.

译你将能够使用 Qwen(阿里巴巴的 AI 助手)在中国点肯德基!只需说“从最近的肯德基帮我点一份套餐”,Qwen 就会匹配你的优惠券并下单。

AYi@AYi_AInotes · 6月4日64

关于Codex的使用,分享下我的一些思考,如果从前几天我分享的使用AI的底层心法是以道御术的角度看,省额度是术,看清生产力归谁管是道。 如果你也在用 Codex,并且习惯把额度省着点用—— 我劝你看完这条再决定要不要继续省, 昨天那次 reset,可能正好把你攒的 buffer 覆盖掉了。 OpenAI Codex 负责人 Tibo(@thsottiaux)发帖, 说过去 24 小时出了 3 次小可靠性事故, 给所有付费计划统一重置了额度,配了一句 May the tokens flow again。 评论区一片感谢,刷屏 Saint Tibo、he did it again,我翻了一圈,想说一句可能没人爱听的话, 你这几天精打细算省下来的额度,大概率是白省了。 先讲讲 Codex 这套额度怎么算的,没按 token,而是按推理时间(reasoning time)算的。 一个 5 小时窗口,本地和云任务共用。 据社区实测,Plus 计划下 GPT-5.4 大概跑 40 分钟推理就把这 5 小时额度烧到 100%,GPT-5.3 大概 60 分钟。 也就是说你开个 /goal 让它自己 plan→act→test→iterate 连轴转, 额度掉得比你想象快得多,你只看到一个百分比,看不见它每分钟在烧多少。 现在把 reset 叠进来看, 据社区讨论,这个 reset 很多时候不是凭空补额度, 是把你下一个计费周期的起点往前提了。 所以那些 reset 后立刻开跑的人,有人一口气跑了 11 小时+推理; 而你为了周末大项目辛辛苦苦攒的 buffer,一次 reset 直接被覆盖归零。 省的人亏,冲的人赚。 4、5 月到这次,Tibo 已经 reset 好几轮了,这不是偶发,属于常态了。 所以在现在这套规则下,精打细算反而是次优解。 不是让你瞎浪费,是这系统在奖励立刻消耗的人,你得顺着它的规则走。 但真正让我在意的,不是怎么省额度,是这件事意味着什么。 把 Codex、把额度、把 reset 这几个词去掉, 这是所有用云端 AI 干活的人的同一个故事, 你的生产力,不在你手里,在一套你看不透、也补偿得不透明的系统手里。 今天 Tibo 心情好给你 reset,明天他换岗了呢。 靠一个好心负责人的 goodwill 续命的信任, 他在的时候特别暖,他一走,账要一次性集中还。 所以这事真正的解法,不是蹲着等下一次 reset, 是别把生产力全押在一个你控制不了的池子里。 本地模型兜底 + 云端冲峰值,自己记一份 burn rate(40 分钟≈100%,倒推 4 分钟≈10%), 把节律攥回自己手里。 我觉得AI 工具的下一道分水岭,已经不在模型多强了, 关键看是我们的生产力到底归谁管。

译OpenAI Codex 负责人 Tibo 因 24 小时内 3 次可靠性事故,重置所有付费计划额度。Codex 按推理时间计费:Plus 下 GPT-5.4 约 40 分钟耗尽 5 小时窗口,GPT-5.3 约 60 分钟。重置常将下个计费周期提前,导致精打细算攒的额度被覆盖,立即消耗者反而获得更多推理时间。作者认为系统奖励即刻消耗,建议本地模型兜底、云端冲峰值,夺回生产力控制权。

meng shao@shao__meng · 6月4日36

一时间没看懂是腾讯云的广告,还是 Skillhub 的推广。。 国内面向开发者的平台,文档一个比一个难找,经常是绕来绕去找不到,搜索基本没用,助手基本废话,最后还得跑去找售前要链接 😂 如果能趁着这波全民龙虾化之后的 Skills 化,能把文档稍微规整一下,也是功德无量了。

译主推文批评国内面向开发者的平台文档结构混乱、搜索功能几近无效、智能助手输出空洞,用户常常只能找售前要链接。作者将这一现状与“全民龙虾化之后的Skills化”趋势关联,期待平台能借此机会规范文档体验。

宝玉@dotey · 6月4日61

AI Agent 对比 PC 和移动端不是完全取代的关系。 手机出来没有完全取代PC,但很多事情你可以随时随地处理了;AI Agent 也不会完全取代手机和PC,但很多时候你不需要打开很多App了,直接给 Agent下指令就够了。

译AI Agent 不会完全取代手机和 PC,但用户无需打开多个 App,直接给 Agent 下指令即可。通用 Agent 将成未来操作系统,App 有三种结局:消亡、转为 CLI/MCP、保留为 GUI 插件。SaaS 应尽快推出 CLI 与 Skill 以适配 Agent。

meng shao@shao__meng · 6月4日59

OpenClaw Skill Workshop @shakker OpenClaw 把 Skill 定位为可复用的 Agent 工作流,而不只是说明文档。Skill 一旦生效,会改变之后每一次 Agent 的行为;因此写错 Skill 比写错单次回答更严重——错误会被固化进系统。 Skill Workshop 的定位就是要在「临时对话」和「持久能力」之间加一道人工审核闸门。 https://docs.openclaw.ai/tools/skill-workshop 机制:先提案,再生效 · 提案期:生成 PROPOSAL.md,不写入 SKILL.md,Agent 不会执行 · 审核期:用户可改措辞、补步骤、加规则、调支持文件 · 应用期:用户确认后才变成正式 Skill 典型协作链:你描述要复用的流程 → Agent 起草提案 → 你迭代修订 → 你决定「采用 / 跳过」。 产品形态:两种审核节奏 · Board 视图 — 工作坊全貌 按 pending / applied / rejected / stale 分栏;可搜索、预览、看 diff、检查附属文件。适合批量治理技能库。 · Today 视图 — 快速过审 一次只呈现下一个提案,问题很具体:「要不要纳入 Skills 集合?」适合日常轻量决策。 · Tweak(微调) — 价值最集中的环节 生成物往往「八九分对」:措辞、缺步、安全兜底、脚本 vs 模板等。Workshop 把修补变成围绕同一提案对象的修订对话,而不是改完就丢上下文。 Skill 不只是 Markdown Skill 可捆绑标准子目录下的支持文件: · assets / examples / references / scripts / templates 这些文件随提案一起展示、扫描,应用时与主指令一并写入。路径规则刻意收紧:禁止绝对路径、目录穿越、隐藏段、写到 Skill 目录外——在「够用」和「可写任意文件」之间取保守平衡。

译OpenClaw 推出 Skill Workshop,将 Agent 的 Skill 定位为可复用工作流。机制为先提案后生效:Agent 生成提案,用户可修改措辞、补充步骤、调整支持文件,确认后才写入正式 Skill,避免错误固化。提供 Board 视图(按 pending/applied/rejected/stale 分栏管理)和 Today 视图(快速过审)。Tweak 微调功能允许围绕同一提案反复修订。Skill 可捆绑 assets、scripts 等支持文件,路径规则严格禁止绝对路径和目录穿越。引用 OpenClaw:Agent 应学习重复工作,但非静默改写未来运行;Skill Workshop 将可复用经验变成可审查提案。

MiniMax (official)@MiniMax_AI · 6月4日78

Mem0 is an official launch partner for MiniMax M3! M3's 1M token context window + @mem0ai 's memory layer = AI apps that truly remember. Build personalized AI agents with persistent memory, now with 50% off M3 during launch week. Get started with Minimax → https://platform.minimax.io/docs/guides/models-intro Sign up with mem0 → http://app.mem0.ai/?utm_source=minimax_x_post

译Mem0 是 MiniMax M3 的官方启动合作伙伴! M3 的 1M token 上下文窗口 + @mem0ai 的记忆层 = 真正记住的 AI 应用。 构建具有持久记忆的个性化 AI 智能体,现在启动周内 M3 享五折优惠。 开始使用 Minimax → https://platform.minimax.io/docs/guides/models-intro 注册 mem0 → http://app.mem0.ai/?utm_source=minimax_x_post

MiniMax (official)@MiniMax_AI · 6月4日65

@mem0ai is an official launch partner for MiniMax M3! M3's 1M token context window + @mem0ai 's memory layer = AI apps that truly remember. Build personalized AI agents with persistent memory, now with 50% off M3 during launch week. Get started with Minimax → https://platform.minimax.io/docs/guides/models-intro Sign up with mem0 → http://app.mem0.ai/?utm_source=minimax_x_post

译@mem0ai 是 MiniMax M3 的官方发布合作伙伴! M3 的百万 token 上下文窗口 + @mem0ai 的记忆层 = 真正能记住的 AI 应用。 构建带有持久记忆的个性化 AI 智能体,发布周期间 M3 可享 5 折优惠。 开始使用 Minimax → https://platform.minimax.io/docs/guides/models-intro 注册 mem0 → http://app.mem0.ai/?utm_source=minimax_x_post

Perplexity@perplexity_ai · 6月4日56

Perplexity Computer is for growing businesses. Computer connects to 400+ tools for every type of company, including Intuit QuickBooks, Vercel, Shopify, Canva, and more. Learn more about how people are using Computer for their business: https://www.perplexity.ai/enterprise/use-cases/growing-businesses

译Perplexity Computer 适用于成长型企业。 它可连接超过400种工具,涵盖各类公司需求,包括Intuit QuickBooks、Vercel、Shopify、Canva等。 了解更多关于企业如何使用Computer进行业务操作: https://www.perplexity.ai/enterprise/use-cases/growing-businesses

Rohan Paul@rohanpaul_ai · 6月4日59

This feels like the natural next step for AI agents. One prompt for the whole email workflow with MCP-backed Claude controlling it. Nitrosend just launched an AI-native email platform that lets Claude build, design, segment, and send complete email campaigns from a single prompt. It connects through MCP, so Claude can act on the email system directly instead of only writing copy that a human must paste into Mailchimp, Klaviyo, or another builder. The key point is agency: Claude is not producing a draft, it is controlling the workflow across design, logic, contact targeting, and delivery. Some example - a user can ask for a newsletter, onboarding flow, or transactional email set, and Nitrosend generates responsive, dark-mode-ready, editable email markup with the sending stack already attached.

译Nitrosend 推出 AI 原生邮件平台,通过 MCP 协议与 Claude 连接。用户只需一条提示词,Claude 即可完成构建、设计、受众分组和发送完整邮件活动,而非仅生成草稿。该平台无传统仪表盘,Claude 直接控制系统工作流,包括设计、逻辑、目标定位和投递。引用推文显示,已有用户通过一条提示词成功向 10,000 人发送发布公告。

Google Gemini@GeminiApp · 6月3日67

Join @GoogleDeepMind Principal Engineer @__apf__ to walk through how Gemini Spark helps simplify your daily workflows. Powered by Gemini 3.5 Flash, Spark builds upon Gemini's ability to connect with @GoogleWorkspace apps like Docs and Gmail to execute complex tasks.

译参加 @GoogleDeepMind 首席工程师 @__apf__ 的演示,了解 Gemini Spark 如何帮助简化您的日常工作流程。由 Gemini 3.5 Flash 驱动,Spark 建立在 Gemini 与 @GoogleWorkspace 应用(如 Docs 和 Gmail)连接的能力之上,以执行复杂任务。

Rohan Paul@rohanpaul_ai · 6月3日59

AI agents are getting powerful, but they still have a very basic problem: they keep relearning the same things. Every time you open a new Cursor session, run a coding agent, or ask an agent to triage security findings, a lot of the work is repeated context-building. @EvoMapAI is trying to solve that by turning agent experience into reusable infrastructure. The bigger idea: GitHub made code reusable. EvoMap is trying to make AI agent experience reusable. The core mechanism is so simple: a Gene is a reusable strategy for solving a class of problems. A Capsule is a verified execution record showing that the strategy actually worked in a real task. When an agent faces a similar task later, it does not start cold. It queries the EvoMap network, retrieves the closest Gene/Capsule, applies the proven strategy, and then feeds the result back into the system if it improves the pattern. That changes the economics of AI workflows. Instead of every agent run being a one-off inference, each successful run becomes a reusable asset. The docs show this across coding migrations, security remediation, and SIEM-style triage: fewer retries, lower token usage, more consistent execution, and better auditability through cited Capsule provenance. For teams already using Cursor, Claude Code, Codex, or custom agents, this is worth watching. To connect an AI agent to EvoMap, go to evomap[.]ai/onboarding/agent, register your node, run the setup command, open the claim_url, and bind the agent to your account. Then publish a successful workflow as a Gene/Capsule, so other agents can reuse it and you can earn credits when they do. #EvoMap #VibeCoding

译EvoMap AI致力于解决AI智能体每个新会话都要重复学习上下文的问题。其核心概念是Gene(可复用的问题解决策略)和Capsule(验证过的执行记录)。智能体遇到相似任务时,查询EvoMap网络获取匹配的Gene/Capsule,应用已有策略,再将结果反馈改进模式。这使每次成功运行成为可复用资产,而非一次性推理。适用于编码迁移、安全修复、SIEM分类等场景,可减少重试、降低token消耗、提升执行一致性,并提供审计溯源。用户可访问evomap.ai/onboarding/agent连接智能体(如Cursor、Claude Code、Codex),发布工作流并赚取积分。

🚨 AI News | TestingCatalog@testingcatalog · 6月3日53

ICYMI 👀: Claude Code CLI can now operate Claude Platform, including the Messages API and Claude Managed Agents. One CLI to rule them all 🤖

译错过必看 👀:Claude Code CLI 现在可以操作 Claude 平台,包括 Messages API 和 Claude Managed Agents。 一个 CLI 统管一切 🤖

🚨 AI News | TestingCatalog@testingcatalog · 6月3日57

Airtap launched a cloud phone built around recurring mobile routines that run on a daily schedule and are handled automatically by an AI agent. > Morning briefings, midnight bookings, coupon sweeps, flight rebooking on price drops. > Aggregated summary across your chats, notifications, news, and emails. > Coupon sweeps across Amazon, pharmacy, and grocery apps and more! A SKILLS.md drop-in connects Claude Code, Codex, or OpenClaw to a dedicated cloud Android instance where the agent taps, scrolls, types, and navigates real apps on a set schedule.

译Airtap 发布了一款云手机,围绕重复性移动日常任务构建,按每日计划由 AI 智能体自动执行。支持用例包括:早间简报、午夜预订、优惠券扫描、降价机票改签,以及跨聊天、通知、新闻和邮件的聚合摘要。通过一个 SKILLS.md 文件即可将 Claude Code、Codex 或 OpenClaw 连接到专属云端 Android 实例,让智能体在真实应用上按计划自动点击、滑动、输入和导航。

小互@xiaohu · 6月3日71

被 AI 不听话折磨了大半年,终于找到解法了 发现一个开源项目 OpenSquilla,国内团队做的 他们用 Python 把"小龙虾"重写了一遍 解决了它太费token、不按照规则执行以及安全的问题 100 次对话就能省下 100万 Token 先说省钱: 它集成了一个本地的小模型,你发的每一个请求,在真正发给大模型之前,会被这个小模型极速向量化,分析这个请求到底是简单任务还是复杂任务。简单的发给便宜模型,复杂的才派顶级模型上场。 就跟医院分诊台一个道理,感冒发烧不用挂专家号。 关键是这个分类在本地跑,不花 token,速度极快,基本感知不到。 官方跑了个测试,25 个任务,纯用 Claude Opus 4.7 总成本 6.2 美金,用 OpenSquilla 路由 Opus4.7、GLM5.1、DS4 Flash 混着跑,分数几乎一样,成本只要 0.68 美金。同样的效果,成本砍到九分之一! 这下我终于敢把 Opus 和 GPT 接进去了!每轮对话还会显示本轮省了多少 token。 而且省 token 不只省在模型调用上。 我装了九十多个 Skill,每轮对话都把所有 Skill 的 description 全塞进上下文里,算了一下每轮要消耗 9000 左右 Tokens。 OpenSquilla 会根据当前对话语义只注入匹配度最高的几个 Skill,按我的规模大概 100 次对话就能省 100万 Token

译国内团队开源项目OpenSquilla用Python重写“小龙虾”,解决费token、不按规则执行及安全问题。它集成小模型对请求实时分类:简单任务走便宜模型,复杂任务走顶级模型。测试25个任务,纯Claude Opus 4.7成本6.2美金,OpenSquilla混跑Opus 4.7、GLM5.1、DS4 Flash成本仅0.68美金,分数几乎一样。同时,它根据对话语义只注入匹配度最高的Skill(原90+个),每轮省约9000 Token,100次对话累计省100万Token。

AYi@AYi_AInotes · 6月3日68

哇偶,Claude 官方这个 ant CLI 有点意思啊, 把 Claude Platform 全套 API 塞进终端,每个端点都能通过命令行直接跑。 ant 是 Claude Platform 的原生命令行工具,Messages API、hosted agents,结果直接 pipe 进 shell,不用翻文档拼 curl。 Ant能解决什么问题? 以前调 Claude API 要:翻文档 → 拼 HTTP → 处理 JSON → 写脚本封装, 现在:终端里直接调,输出直接进你的 pipeline,agent 也能从命令行启动。 怎么用Ant? ant CLI 被设计成 coding agent 友好型,Claude Code 用 claude-api skill 就能读懂它,你的 agent 不光能写代码,还能直接调用 Claude 官方 API 干活。 一些实用场景: 1. 批量处理本地文件,直接 pipe 给 Claude 分析 2. shell 脚本里自动化调用,省掉 Python 胶水代码 3. CI/CD 流水线里集成 Claude 能力 4. Claude Code 里让 agent 自己调 API,闭环更深 说白了,Claude 正在从网页聊天工具往终端基础设施切。 对于写代码的人,终端就是主场,那么它这次直接切进了你的主场。 视频 30 秒,建议先扫一眼 👇

译Claude 推出了名为 ant 的 CLI 原生工具,它将 Claude Platform 的 Messages API、托管 Agent 等全部 API 端点集成到了命令行中。用户现在可以直接在终端调用这些功能,并将结果通过管道(pipe)输出到 shell,省去了以往翻阅文档、拼接请求和处理 JSON 的步骤。该工具对 coding agent 友好,Claude Code 能通过 claude-api skill 理解并使用 ant,从而更直接地调用官方 API。这标志着 Claude 正从网页工具延伸向终端基础设施。

凡人小北@frxiaobei · 6月3日56

Codex 新发布的这几个插件宣传大于实际,插件底层把能团结的友商全拉进来了。 如果你是相关 saas 或者工具的用户,那可以满足不少日常工作。 但更严谨一些,每个公司每个人都有自己的业务逻辑和规范,最终要起飞还得沉淀自己的 marketplace 和 plugin / skill。 回到这个逻辑,Pete 最近采访 YC,关于YC 如何进行 AI-Native 组织改造,值得一看。

译OpenAI Codex推出一系列新插件,覆盖数据分析、创意生产、销售、产品设计、股票投资和投行等场景,标志着其定位从程序员专用工具向更通用的AI智能体(Agent)转型。然而,有观点认为这些插件目前“宣传大于实际”。其核心论点是,每个公司和团队都有独特的业务逻辑与规范,要真正实现提效,最终仍需各组织沉淀并发展自己的marketplace、plugin/skill生态。

凡人小北@frxiaobei · 6月3日58

Codex 新发布的这几个插件很有参考意义,也包装的很全面,插件底层把能团结的友商全拉进来了。 如果你是相关 saas 或者工具的用户,那可以满足不少日常工作。 但更严谨一些,每个公司每个人都有自己的业务逻辑和规范,最终要起飞还得沉淀自己公司的 marketplace 和 plugin skill。 回到这个逻辑,Pete 最近采访 YC,关于YC 如何进行 AI-Native 组织改造,值得一看。

译OpenAI 为 Codex 发布了数据分析、创意生产、销售、产品设计等多个新插件,将其从程序员专属工具扩展为面向更多工种的通用智能体。推文指出,这些插件整合了多家友商能力,对日常工作效率有帮助,但每个企业最终仍需建立自己的插件生态。未来将上线更多行业插件,以推动智能体为更广泛人群提效。

向阳乔木@vista8 · 6月3日62

这个朋友写的Skill有意思,帮你监控Codex的重置消息,哈哈哈。 第一时间切fast模型,消耗用量。 安装指令有点长,见评论区,复制发给codex用就行。

AYi@AYi_AInotes · 6月3日63

Damn,AI 终于学会「安排自己干活」了! Claude 刚更新的 Dynamic Workflows, 这回他们没有选择给模型加新技能, 而是搭了一套「自我组织架构」—— 让模型在动手之前,先拆任务、再选模式、自己给自己定流程。 Anthropic 内部早就意识到, 你给一个再聪明的模型派活,它也会出现三类系统性毛病: 1️⃣ Agentic Laziness(agent 式偷懒) 2️⃣Self-bias(自我偏见) 3️⃣Goal Drift(目标漂移) @trq212 从这套新机制里拆出了 6 种可复用的编排模式, 说白了,这个不只是在修模型本身, 还在用架构设计,去对冲模型层面的性格缺陷。 这跟我带团队踩过的坑一模一样, 你招到一个天才工程师,如果不管流程,他要么只挑轻松的做(laziness), 要么沉迷自己那套技术审美(self-bias), 要么做到一半被旁支带跑(goal drift)。 那么最有效的解法从来不是换更贵的人(堆模型), 而是给他一套清晰的协作接口和自检流程(搭架构)。 所以说,下一代 AI 的护城河,可能真的不在模型参数里, 而在你能设计出多强的「认知架构」上。 更强的模型,不如更强的自我组织架构, 这可能才是 Agent 真正的成人礼。

译Claude更新了Dynamic Workflows功能,核心是让模型具备“自我组织”能力,能在执行任务前自主拆解目标、选择工作模式并制定流程。此举旨在系统性解决AI智能体存在的智能体式偷懒、自我偏见和目标漂移等三类问题。该设计理念认为,通过架构设计对冲模型缺陷,比单纯堆叠模型能力更有效,并从中提炼出了6种可复用的编排模式。

meng shao@shao__meng · 6月3日61

Windsurf is DEAD, long live Devin Desktop ? 😠 标题党了:Windsurf → Devin Desktop https://devin.ai/blog/windsurf-is-now-devin-desktop @cognition 收购 Windsurf 一年后,终于把「IDE + 自主 Agent」两条产品线彻底合并为一! One Devin, every surface · Devin Desktop → 桌面 IDE + Agent 管理 · Devin Cloud → 云端长时自主 Agent · Devin CLI → 终端 · Devin Review → 每次 diff 的代码审查 新 Devin Desktop 三项新功能 1. Agent Command Center(指挥中心) 2. ACP 开放协议 3. Devin Local(Cascade 继任者)

译Cognition 在收购 Windsurf 一年后,将 Windsurf 与 Devin 两条产品线整合为统一的 Devin 平台。新推出的 Devin Desktop 被定位为下一代产品,集成了桌面 IDE 与智能体管理功能,使用户能从单一界面管理本地与云端的智能体舰队。完整的平台还包括 Devin Cloud(云端长期自主智能体)、Devin CLI(终端)和 Devin Review(代码审查)三个组件。此次更新引入了三项新功能:Agent Command Center(智能体指挥中心)、ACP 开放协议以及 Devin Local(作为 Cascade 的继任者)。

meng shao@shao__meng · 6月3日63

OpenAI Codex 真的越来越「通用智能体」了 最新「Codex for every role, tool, and workflow」中,又有三个核心能力发布: · 角色插件 - Role-specific Plugins · 预览 - Sites · 标注精修 - Annotations https://openai.com/index/codex-for-every-role-tool-workflow/ 1. 角色插件(Role-specific Plugins) 预配置的「角色 × 工具 × 工作流」包,降低非技术用户的上手成本。 每个插件捆绑:App 连接 + Skills + 指令 + 工作流。首批 6 个插件覆盖 62 个应用、110 个 skills: 插件 - 目标角色 - 典型产出: 1. Data Analytics:分析师、业务团队;指标归因、报告、Dashboard(Snowflake、Databricks Genie、Hex、Tableau) 2. Creative Production:市场、创意;活动板、广告变体、产品图(Figma、Canva、Shutterstock、Picsart、Fal) 3. Sales:销售;账户优先级、会议准备、跟进、关单计划(Salesforce、HubSpot、Slack、Outreach、Clay 等) 4. Product Design:产品设计;方向探索、流程审计、URL 原型、截图交互化(Figma、Canva) 5. Public Equity Investing:公募/股票投资者;财报解读、同业对比、投资论点跟踪(Moody's、FactSet、PitchBook、Hebbia 等) 6. Investment Banking:投行;Pitch 材料、可比分析、尽调结论(Moody's、Datasite、S&P 等) 设计逻辑: · Out of the box:开箱即用,强调「no coding required」 可定制:团队可改工作流,或自建/共享插件 · 生态路线:Corporate Finance、PE、Marketing Strategy、Strategy Consulting、Legal 等即将推出;长期· 目标是 开放插件生态(伙伴可在 Codex / ChatGPT 内直接发布) 这和 Salesforce AppExchange、Slack Marketplace 的路径类似:用垂直场景插件锁定企业工作流,而不是只卖通用模型能力。 2. Sites(预览)—— 从「文档/文件」到「可共享的交互界面」 面向 Business / Enterprise 客户预览。 Sites 是 Codex 生成并托管的 交互式网页/轻量应用,通过 URL 在工作区内共享。 典型场景: · 客户评审页(产品更新、开放问题、使用趋势、下一步) · 财务模型的 scenario planner(改假设、即时对比,而非读 Excel 多 tab) · 发布材料的 living hub(消息、里程碑、负责人、决策持续更新) · 项目进度追踪、客服指引、创意 brief 库 关键转变: 不再把产出硬塞进 doc/slide/spreadsheet,而是 按任务形态生成专属界面;且 Sites 可随信息变化持续更新,不是一次性静态页。 早期生态伙伴:Vercel、Wix、Base44、Replit、Lovable、Figma、Webflow、Emergent——说明 OpenAI 在 生成 + 托管 + 设计/建站工具链 上找互补,而非全栈自建。 3. Annotations(标注精修)—— 从「一次生成」到「局部迭代」 原先开发者已在代码、Markdown、网站上用 annotations;现在扩展到 文档、表格、幻灯片。 工作方式:选中具体区域 → 给出修改指令 → Codex 只改选中部分。 例子: · 选中导航栏 → 改字体 · 高亮投资论点 → 追问来源 · 标记图表 → 优化标签 这解决的是 enterprise AI 产品的经典痛点:首稿可用 ≠ 终稿可用。Annotations 把交互从「重写整篇」降到「 surgical edit」,更贴近真实协作中的 review 循环。

译OpenAI Codex 发布三项核心能力:角色插件提供预配置的“角色×工具×工作流”包,首批6个插件覆盖62个应用、110个技能,旨在让非技术用户“开箱即用”;Sites(预览)可将工作转化为交互式网站或应用并托管分享,初期面向Business/Enterprise客户;Annotations(标注精修)功能将局部迭代修改从代码扩展至文档、表格、幻灯片,用户可选中特定区域进行精确调整。

Thariq@trq212 · 6月3日69

Workflows are the biggest upgrade to Claude Code’s capabilities since skills and subagents. I dove deep into it with @sidbid to figure out best practices, examples and more.  I’m particularly excited about the non-technical tasks it enables for Claude Code.

译工作流是 Claude Code 自技能和子智能体以来最大的能力升级。 我和 @sidbid 深入探讨了最佳实践、示例等内容。我特别兴奋于它为 Claude Code 启用的非技术任务。

OpenAI@OpenAI · 6月3日77

We’re making Codex more useful for your work by expanding plugins beyond individual tools. These plugins turn Codex into a specialist for a specific role with a single install, no coding required. Codex can access 62 popular apps and 110 skills for work across sales, data analytics, creative production, product design, and public equity investing. https://openai.com/index/codex-for-every-role-tool-workflow/

译我们正在通过将插件扩展到单个工具之外,使 Codex 更适用于您的工作。 这些插件通过一次安装即可将 Codex 转变为特定角色的专家,无需编码。 Codex 可访问 62 个流行应用和 110 项技能,覆盖销售、数据分析、创意制作、产品设计和公开股票投资等工作领域。 https://openai.com/index/codex-for-every-role-tool-workflow/

ClaudeDevs@ClaudeDevs · 6月3日77

We’ve added a CLI for Claude Platform to make every API endpoint runnable from your terminal. Call the Messages API, stand up Claude Managed Agents, pipe results straight into your shell. The ant CLI is well understood by coding agents (Claude Code) using the claude-api skill.

译我们为 Claude Platform 添加了一个 CLI,使每个 API 端点都可以从你的终端运行。 调用 Messages API,启动 Claude 托管智能体,并将结果直接管道传输到你的 shell。 ant CLI 被使用 claude-api 技能的编码智能体(Claude Code)很好地理解。

Rohan Paul@rohanpaul_ai · 6月3日72

Factory just introduced Factory Router, a coding-agent model selector. Claude Opus-class results while cutting AI session spend by 20-25%. Reports 99% of Claude Opus 4.7’s Terminal-Bench 2. Basically it works by treating each coding-agent run as a routing decision: it first sends the task to the cheapest model class that should be strong enough for that kind of work, then escalates to a stronger frontier model if the session starts failing or needs deeper reasoning. Frontier AI should be reserved for frontier work.

译Factory推出Factory Router,一个编码智能体模型选择器。它通过将每次编码任务视为路由决策,首先使用最具性价比的模型处理,仅在遇到失败或需要深度推理时升级至更强前沿模型。该方案旨在保持与Claude Opus 4.7相近的性能(报告称达到其Terminal-Bench 2分数的99%),同时将AI会话成本降低20-25%。其核心理念是“前沿AI应保留给前沿工作”。

🚨 AI News | TestingCatalog@testingcatalog · 6月3日68

OPENAI 🔥: New Sites, role-specific Plugins, and Annotations features are rolling out in preview for Business and Enterprise plans. > Today, we’re introducing new ways to do more of your work with Codex: plugins that adapt Codex to your role and tools, annotations that help you refine the result in place, and a preview of the ability to create interactive websites and apps you can share with your workspace using a URL.

译OPENAI 🔥:新站点、角色专属插件和注释功能正面向商业和企业计划用户推出预览版。 > 今日,我们推出使用 Codex 的新方式:可适配您角色和工具的插件、帮助您就地优化结果的注释,以及通过 URL 创建可与工作区共享的交互式网站和应用的预览功能。

向阳乔木@vista8 · 6月3日73

英伟达竟然有 Skill 安全扫描工具,还开源了。 地址见评论区,Skill 安全是个问题,但好像身边很少有人做Skill安全扫描。 可能目前还没听到特别严重的 Skill 造成破坏的案例,但警惕性不能没有。 最好写个 Meta Skill,生成各种自用 Skill。 他人Skill只做 AI 的学习参考。

译英伟达开源了一款针对AI智能体Skill(技能)的安全扫描工具。推文指出,Skill安全虽是一个实际问题,但目前专门做此方向扫描的工具和人员似乎较少。尽管尚未出现由Skill引发的严重破坏性案例,但仍需保持警惕。推文建议,用户可以考虑编写一个Meta Skill(元技能)来自动生成各种所需的Skill,并强调他人的Skill应主要用作学习和参考,而非直接使用。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月6日
18:24
AYi@AYi_AInotes
53
OpenCut:GitHub 5万星开源AI剪辑工具,本地优先、永久免费、无水印无会员

OpenCut 是一个 GitHub 5 万星的开源 AI 剪辑工具,主打本地优先,视频无需上传服务器,永久免费、无水印、无会员墙。目前处于 Early Beta 阶段,网页版支持基础剪辑(导入视频、时间线、切割),但导出、特效、转场等功能仍在开发。路线图包括 Rust 重写核心、Web+桌面+移动统一、插件系统、Editor API 及 MCP Server(让 AI Agent 直接调用工具),目标是成为可编程的视频底座,而非对标剪映的封闭工具。

AYi: http://x.com/i/article/2060717603987791878

GitHubMCP/工具开源/仓库开源生态
16:40
凡人小北@frxiaobei
43
用户认为 Codex 与 Obsidian 搭配是非常优秀的 AI Agent 组合,但存在 Obsidian 文档过多导致每次打开卡顿几秒的问题,寻求解决方案。引用推文指出,Obsidian 加上 Codex,配合合适的 API、MCP 和 Skills,基本能替代目前 90% 以上的 AI Agent 产品,这是从 Notion 迁移到 Obsidian 一个月后的感受。

Yihui: Obsidian 加上 Codex,再配合合适的 API、MCP 和 Skills,基本上能替代目前 90% 以上的 AI Agent 产品。 这是我将笔记从 Notion 迁移到 Obsidian 一个月之后的感受。

智能体MCP/工具教程/实践
6月5日
21:58
Rohan Paul@rohanpaul_ai
62
腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体

腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体。它可读取文件、调用工具、撰写报告、制作演示文稿、分析数据,支持100+专家角色。通过MCP连接GitHub、Jira、Notion、Gmail、Google Drive、Slack等,在沙箱中运行任务,并可通过Slack、Telegram、Discord、微信远程控制。WorkBuddy将大任务分解为小任务,为复杂工作启用专家团队:多个专业子智能体并行工作,一个主导智能体协调最终输出。用例包括阅读PDF/图片、创建报告、分析电子表格、生成内容、自动研究新闻并发送定时摘要、从手机运行桌面任务、无需编码构建应用等。

智能体MCP/工具产品更新
21:40
fofr@fofrAI
62
fofrAI 测试 Gemini 3.5 Flash 与 Antigravity CLI 智能体自主性与速度

fofrAI 使用 Gemini 3.5 Flash 和 Antigravity CLI 实验 AI 智能体的自主性和速度。结果:20 分钟内在 Linux CPU 上安装并运行原版 Stable Diffusion 1.5,完成推理生成图像;基于 Lora 和 SD 论文,用 10 张图片从零实现 Lora 微调器(约 1 小时 30 分,主要为 CPU 训练);通过 modal 约 20 分钟找到 GPU、获取 Ideogram v4 权重并运行推理。该推文展示了当前长周期智能体任务的基线案例。

fofr: Where's the baseline for impressive long horizon agent tasks today? What are you seeing this week that makes you go "woa...

智能体GoogleMCP/工具大佬观点
21:28
meng shao@shao__meng
62
Greg Eisenberg 六轮 Prompt 打造自动更新创业想法看板

Greg Eisenberg 通过六轮 Prompt,用 Codex Sites 做出自动更新的创业想法看板。关键步骤:1)调用 sites 插件,指令“save for review, do not deploy”阻止自动部署;2)选 Cloudflare D1 实现持久化;3)设安全动作,限定 Agent 只能通过预设路径改数据;4)编写 Startup Ideas Admin 技能,使操作手册化;5)存档为 V1 并验证版本回滚;6)新对话加载技能,跨线程写入并成功上线,证明跨会话可重复运营。

The Startup Ideas Podcast (SIP) 🧃: http://x.com/i/article/2062661069458620416

智能体MCP/工具教程/实践
19:36
🚨 AI News | TestingCatalog@testingcatalog
66
OpenSquilla 发布了 MetaSkill,一个自组织技能协议,它教会开源 AI 智能体如何自行发现、过滤和组合原子技能,而非依赖手工编写的工作流。 该框架依赖智能模型路由,将更简单的任务发送给低成本模型,同时将更强模型留给更重的工作负载,旨在不牺牲性能的情况下降低成本。 #sayitbuildit @OpenSquilla
智能体MCP/工具产品更新
17:22
小互@xiaohu
64
Kimi Work 发布:300 Agent 协作,面向办公场景

Kimi 推出新工具 Kimi Work,继承 Kimi Code 核心功能和 Kimi Agent 的建站、PPT 等专业 Skills,并打通金融、科研、法律等专业数据库。用户无需终端或命令行,安装客户端后通过文字描述需求即可让系统拆解任务、并行执行、调用工具、使用浏览器、整理文件夹,最终交付文档、表格、PPT 等成果。最多可同时调度 300 个 Agent 互相配合完成任务。

智能体MCP/工具产品更新
15:40
Elon Musk@elonmusk
64
xAI 发布 Grok Build 0.2.20 更新,修复多项 Bug 并新增工具。修复包括:消除 Markdown 表格渲染中的鬼影单元格、使监控对模型可见且可终止、保留计划预览中的软换行、修复 image_edit 中的附件引用、优化 MCP 生命周期通知路由和鼠标滚轮滚动、改进压缩提示与去重子代理提醒、允许回滚时自动降级、修复 Windows 上本地 stdio MCP 服务器问题。新增 image_to_video 和 reference_to_video 工具,捆绑 imagine 技能,支持 ICO 转 PNG,以及 Search 和 ListDir 块按 Enter 打开全屏查看器。

skcd: Bug fixes shipping to Grok Build 0.2.20 (release notes will be available in the TUI and on change-log website) • Elimina...

MCP/工具xAI产品更新编码
14:22
Alibaba Cloud@alibaba_cloud
精选76
PolarDB-X Zero 上线了! 无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。 原生 HNSW 向量索引--内置兼容 MySQL 的引擎。 关系型 + 语义搜索--一条 SQL 语句。 AI 智能体就绪--MCP 协议、AI IDE 兼容(Cursor、Claude、Qoder、Qodex 等) 立即尝试:https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB
MCP/工具产品更新部署/工程

推荐理由:PolarDB-X Zero 把分布式数据库、向量索引和 MCP 协议打包成一行 API,30 秒就能跑一个 AI Agent 可用的混合搜索后端,做 agent 开发的可以试一下。
08:54
meng shao@shao__meng
69
OpenAI Codex 新增"Build iOS Apps"插件

OpenAI Codex 推出“Build iOS Apps”官方插件,将 iOS 应用开发闭环引入 Codex 工作流。用户可在 Codex 内直接查看和测试 iOS 应用、打开 SwiftUI previews 并进行代码热重载,无需切换到 Xcode 或模拟器。底层基于 XcodeBuildMCP 构建自动化工作流,支持构建、测试、模拟器运行、UI 检查、日志与调试状态采集。值得关注的两个开源项目:serve-sim(提供 streaming simulator 能力)和 SnapshotPreviews(用于提取 SwiftUI previews 集成工具链)。

OpenAI Developers: More of the iOS app loop, now inside Codex. The Build iOS Apps plugin lets Codex view and test your iOS app in the in-ap...

MCP/工具OpenAI产品更新编码
6月4日
23:22
elvis@omarsar0
48
DAIR.AI 创始人 Elvis Saravia 分享动态工作流实践

Elvis Saravia 逆向工程了动态工作流(Dynamic Workflows)并集成到自研智能体编排器中,同时构建 HTML 监控仪表盘跟踪任务、指标和报告。该工作流可在 Claude Code、Codex、Pi 等编码智能体及自研 @dair_ai agent 上运行。成功用例包括分支深度研究、并行深度研究、会话挖掘、Bug 定位、分类、事实核查、LLM 委员会、AI 模拟、数据合成和评测生成等。他认为动态工作流与 agent 技能一样,是实现复杂长期任务的关键原语,不仅限于编码,还可扩展至商业、科学等领域。

智能体MCP/工具大佬观点
20:52
Rohan Paul@rohanpaul_ai
65
Anuma:跨模型统一记忆的私人AI工作空间

Rohan Paul 介绍 Anuma,一个私人 AI 工作空间,核心功能是跨模型统一记忆——用户在 ChatGPT、Claude、Gemini、Grok、DeepSeek、Kimi 等模型间切换时,上下文、偏好、目标和历史工作自动跟随。额外功能包括设备端加密记忆、默认隐私模式、无日志无训练、支持完整记忆导出、Council Mode(多模型并列回复对比)、单聊内模型切换,以及通过 iMessage 或 SMS 的 AI 文本能力。Paul 分享研究论文分析用例:上传多篇论文,利用多模态和多模型并行工作流,对比不同模型对同一主题的阅读、总结和关联能力,避免重复解释上下文。

MCP/工具多模态教程/实践
20:32
Orange AI@oran_ge
68
今天 ListenHub 的AI 视频功能正式上线啦,人类用户和 Agent 现在都可以调用 ListenHub 的服务生成视频。 目前已支持 HappyHorse、Seedance 2.0 等视频模型。 输入一个想法,或使用参考图、参考视频,即可一键生成视频。 人类使用: ListenHub 官网: https://listenhub.ai/zh/app/ai-video Agent 使用: listenhub-cli:https://github.com/marswaveai/listenhub-cli skills: https://github.com/marswaveai/skills openapi: https://listenhub.ai/docs/zh/openapi/api-reference/ai-video
智能体MCP/工具产品更新视频
17:42
X.PIN@thexpin
52
你将能够使用 Qwen(阿里巴巴的 AI 助手)在中国点肯德基!只需说"从最近的肯德基帮我点一份套餐",Qwen 就会匹配你的优惠券并下单。
智能体MCP/工具产品更新
16:17
AYi@AYi_AInotes
64
Codex 额度重置:省着用反亏,建议本地兜底

OpenAI Codex 负责人 Tibo 因 24 小时内 3 次可靠性事故,重置所有付费计划额度。Codex 按推理时间计费:Plus 下 GPT-5.4 约 40 分钟耗尽 5 小时窗口,GPT-5.3 约 60 分钟。重置常将下个计费周期提前,导致精打细算攒的额度被覆盖,立即消耗者反而获得更多推理时间。作者认为系统奖励即刻消耗,建议本地模型兜底、云端冲峰值,夺回生产力控制权。

Tibo: Hi. Over the last 24 hours we had three separate small incidents that affected Codex reliability. Those are three too ma...

MCP/工具OpenAI大佬观点编码
15:18
meng shao@shao__meng
36
吐槽国内开发者平台:文档难搜,Skills化或改善

主推文批评国内面向开发者的平台文档结构混乱、搜索功能几近无效、智能助手输出空洞,用户常常只能找售前要链接。作者将这一现状与“全民龙虾化之后的Skills化”趋势关联,期待平台能借此机会规范文档体验。

MCP/工具其他
11:09
宝玉@dotey
61
AI Agent 与 PC、手机的关系:不是完全取代

AI Agent 不会完全取代手机和 PC,但用户无需打开多个 App,直接给 Agent 下指令即可。通用 Agent 将成未来操作系统,App 有三种结局:消亡、转为 CLI/MCP、保留为 GUI 插件。SaaS 应尽快推出 CLI 与 Skill 以适配 Agent。

宝玉: 通用 Agent 就是未来的操作系统了,就像现在我们操作电脑需要借助操作系统,以后我们跟 AI 通信会通过 Agent OS。 App 会有几种结局: - 消亡:Agent 自己就有能力,不需要独立的 App - 变成 CLI 或者 MCP...

智能体MCP/工具大佬观点
08:48
meng shao@shao__meng
59
OpenClaw Skill Workshop

OpenClaw 推出 Skill Workshop,将 Agent 的 Skill 定位为可复用工作流。机制为先提案后生效:Agent 生成提案,用户可修改措辞、补充步骤、调整支持文件,确认后才写入正式 Skill,避免错误固化。提供 Board 视图(按 pending/applied/rejected/stale 分栏管理)和 Today 视图(快速过审)。Tweak 微调功能允许围绕同一提案反复修订。Skill 可捆绑 assets、scripts 等支持文件,路径规则严格禁止绝对路径和目录穿越。引用 OpenClaw:Agent 应学习重复工作,但非静默改写未来运行;Skill Workshop 将可复用经验变成可审查提案。

OpenClaw🦞: Agents should learn repeated work, but not by silently rewriting future runs. Skill Workshop turns reusable agent lesson...

智能体MCP/工具产品更新
05:58
MiniMax (official)@MiniMax_AI
同事件精选78
Mem0 是 MiniMax M3 的官方启动合作伙伴! M3 的 1M token 上下文窗口 + @mem0ai 的记忆层 = 真正记住的 AI 应用。 构建具有持久记忆的个性化 AI 智能体,现在启动周内 M3 享五折优惠。 开始使用 Minimax → https://platform.minimax.io/docs/guides/models-intro 注册 mem0 → http://app.mem0.ai/?utm_source=minimax_x_post
智能体MCP/工具模型发布
同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》
推荐理由:MiniMax 把 1M 上下文和 Mem0 记忆层绑在一起,不是单纯秀参数,是给 Agent 装了个硬盘,做长期记忆产品的该关注一下。
04:28
MiniMax (official)@MiniMax_AI
65
@mem0ai 是 MiniMax M3 的官方发布合作伙伴! M3 的百万 token 上下文窗口 + @mem0ai 的记忆层 = 真正能记住的 AI 应用。 构建带有持久记忆的个性化 AI 智能体,发布周期间 M3 可享 5 折优惠。 开始使用 Minimax → https://platform.minimax.io/docs/guides/models-intro 注册 mem0 → http://app.mem0.ai/?utm_source=minimax_x_post
智能体MCP/工具模型发布
01:36
Perplexity@perplexity_ai
56
Perplexity Computer 适用于成长型企业。 它可连接超过400种工具,涵盖各类公司需求,包括Intuit QuickBooks、Vercel、Shopify、Canva等。 了解更多关于企业如何使用Computer进行业务操作: https://www.perplexity.ai/enterprise/use-cases/growing-businesses
智能体MCP/工具产品更新
01:18
Rohan Paul@rohanpaul_ai
59
Nitrosend 发布 AI 邮件平台,Claude 单提示词控制全流程

Nitrosend 推出 AI 原生邮件平台,通过 MCP 协议与 Claude 连接。用户只需一条提示词,Claude 即可完成构建、设计、受众分组和发送完整邮件活动,而非仅生成草稿。该平台无传统仪表盘,Claude 直接控制系统工作流,包括设计、逻辑、目标定位和投递。引用推文显示,已有用户通过一条提示词成功向 10,000 人发送发布公告。

George Hartley ☄️: I just sent our launch announcement to 10,000 people. It took one prompt in Claude. Today we're launching @nitrosendx - ...

智能体AnthropicMCP/工具产品更新
6月3日
23:32
Google Gemini@GeminiApp
同事件精选67
参加 @GoogleDeepMind 首席工程师 @__apf__ 的演示,了解 Gemini Spark 如何帮助简化您的日常工作流程。由 Gemini 3.5 Flash 驱动,Spark 建立在 Gemini 与 @GoogleWorkspace 应用(如 Docs 和 Gmail)连接的能力之上,以执行复杂任务。
智能体GoogleMCP/工具产品更新
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:这是 Gemini 把 Agent 能力真正嵌入日常工作流的一步,跟 Workspace 的深度集成会让很多不会编程的人也能用上自动化,值得关注。
20:48
Rohan Paul@rohanpaul_ai
59
EvoMap AI:将AI智能体经验转化为可复用基础设施

EvoMap AI致力于解决AI智能体每个新会话都要重复学习上下文的问题。其核心概念是Gene(可复用的问题解决策略)和Capsule(验证过的执行记录)。智能体遇到相似任务时,查询EvoMap网络获取匹配的Gene/Capsule,应用已有策略,再将结果反馈改进模式。这使每次成功运行成为可复用资产,而非一次性推理。适用于编码迁移、安全修复、SIEM分类等场景,可减少重试、降低token消耗、提升执行一致性,并提供审计溯源。用户可访问evomap.ai/onboarding/agent连接智能体(如Cursor、Claude Code、Codex),发布工作流并赚取积分。

智能体MCP/工具产品更新
20:24
🚨 AI News | TestingCatalog@testingcatalog
53
错过必看 👀:Claude Code CLI 现在可以操作 Claude 平台,包括 Messages API 和 Claude Managed Agents。 一个 CLI 统管一切 🤖

ClaudeDevs: For interactive login, the CLI supports "ant auth login". This runs a browser OAuth flow, scopes the token to a workspac...

智能体AnthropicMCP/工具产品更新
19:54
🚨 AI News | TestingCatalog@testingcatalog
57
Airtap 推出 AI 智能体云手机,自动执行日常移动任务

Airtap 发布了一款云手机,围绕重复性移动日常任务构建,按每日计划由 AI 智能体自动执行。支持用例包括:早间简报、午夜预订、优惠券扫描、降价机票改签,以及跨聊天、通知、新闻和邮件的聚合摘要。通过一个 SKILLS.md 文件即可将 Claude Code、Codex 或 OpenClaw 连接到专属云端 Android 实例,让智能体在真实应用上按计划自动点击、滑动、输入和导航。

智能体MCP/工具产品更新
18:08
小互@xiaohu
71
开源项目OpenSquilla用Python重写"小龙虾",大幅节省Token与成本

国内团队开源项目OpenSquilla用Python重写“小龙虾”,解决费token、不按规则执行及安全问题。它集成小模型对请求实时分类:简单任务走便宜模型,复杂任务走顶级模型。测试25个任务,纯Claude Opus 4.7成本6.2美金,OpenSquilla混跑Opus 4.7、GLM5.1、DS4 Flash成本仅0.68美金,分数几乎一样。同时,它根据对话语义只注入匹配度最高的Skill(原90+个),每轮省约9000 Token,100次对话累计省100万Token。

智能体MCP/工具开源/仓库端侧
14:13
AYi@AYi_AInotes
68
Claude 官方推出 ant CLI,将全套 API 集成到命令行

Claude 推出了名为 ant 的 CLI 原生工具,它将 Claude Platform 的 Messages API、托管 Agent 等全部 API 端点集成到了命令行中。用户现在可以直接在终端调用这些功能,并将结果通过管道(pipe)输出到 shell,省去了以往翻阅文档、拼接请求和处理 JSON 的步骤。该工具对 coding agent 友好,Claude Code 能通过 claude-api skill 理解并使用 ant,从而更直接地调用官方 API。这标志着 Claude 正从网页工具延伸向终端基础设施。

ClaudeDevs: We've added a CLI for Claude Platform to make every API endpoint runnable from your terminal. Call the Messages API, sta...

智能体AnthropicMCP/工具产品更新
12:56
凡人小北@frxiaobei
56
Codex发布插件但实际落地待验证

OpenAI Codex推出一系列新插件,覆盖数据分析、创意生产、销售、产品设计、股票投资和投行等场景,标志着其定位从程序员专用工具向更通用的AI智能体(Agent)转型。然而,有观点认为这些插件目前“宣传大于实际”。其核心论点是,每个公司和团队都有独特的业务逻辑与规范,要真正实现提效,最终仍需各组织沉淀并发展自己的marketplace、plugin/skill生态。

Andy Stewart: OpenAI 的野心和獠牙展现得比想象中更快。 CodeX 在其规划中已不再是程序员专属,而是走向更通用的 Agent。 为了让大家认识到这一点,以及具体帮哪些人做哪些事,OpenAI 主动晒出了数据分析、创意生产、销售、产品设计、股票投资...

智能体MCP/工具OpenAI大佬观点
12:26
凡人小北@frxiaobei
58
OpenAI Codex 推出多领域插件,迈向通用智能体

OpenAI 为 Codex 发布了数据分析、创意生产、销售、产品设计等多个新插件,将其从程序员专属工具扩展为面向更多工种的通用智能体。推文指出,这些插件整合了多家友商能力,对日常工作效率有帮助,但每个企业最终仍需建立自己的插件生态。未来将上线更多行业插件,以推动智能体为更广泛人群提效。

Andy Stewart: OpenAI 的野心和獠牙展现得比想象中更快。 CodeX 在其规划中已不再是程序员专属,而是走向更通用的 Agent。 为了让大家认识到这一点,以及具体帮哪些人做哪些事,OpenAI 主动晒出了数据分析、创意生产、销售、产品设计、股票投资...

智能体MCP/工具OpenAI产品更新
12:07
向阳乔木@vista8
62
这个朋友写的Skill有意思,帮你监控Codex的重置消息,哈哈哈。 第一时间切fast模型,消耗用量。 安装指令有点长,见评论区,复制发给codex用就行。
MCP/工具OpenAI教程/实践
11:12
AYi@AYi_AInotes
63
Damn,AI 终于学会「安排自己干活」了!

Claude更新了Dynamic Workflows功能,核心是让模型具备“自我组织”能力,能在执行任务前自主拆解目标、选择工作模式并制定流程。此举旨在系统性解决AI智能体存在的智能体式偷懒、自我偏见和目标漂移等三类问题。该设计理念认为,通过架构设计对冲模型缺陷,比单纯堆叠模型能力更有效,并从中提炼出了6种可复用的编排模式。

Thariq: http://x.com/i/article/2061850535708483585

智能体AnthropicMCP/工具产品更新
09:43
meng shao@shao__meng
61
Cognition 在收购 Windsurf 一年后,将 Windsurf 与 Devin 两条产品线整合为统一的 Devin 平台。新推出的 Devin Desktop 被定位为下一代产品,集成了桌面 IDE 与智能体管理功能,使用户能从单一界面管理本地与云端的智能体舰队。完整的平台还包括 Devin Cloud(云端长期自主智能体)、Devin CLI(终端)和 Devin Review(代码审查)三个组件。此次更新引入了三项新功能:Agent Command Center(智能体指挥中心)、ACP 开放协议以及 Devin Local(作为 Cascade 的继任者)。

Windsurf is now Devin Desktop: Introducing Devin Desktop: the next generation of Windsurf Manage fleets of local and cloud agents from one surface Supp...

智能体MCP/工具产品更新编码
08:43
meng shao@shao__meng
63
OpenAI Codex 真的越来越「通用智能体」了

OpenAI Codex 发布三项核心能力:角色插件提供预配置的“角色×工具×工作流”包,首批6个插件覆盖62个应用、110个技能,旨在让非技术用户“开箱即用”;Sites(预览)可将工作转化为交互式网站或应用并托管分享,初期面向Business/Enterprise客户;Annotations(标注精修)功能将局部迭代修改从代码扩展至文档、表格、幻灯片,用户可选中特定区域进行精确调整。

OpenAI: Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...

智能体MCP/工具OpenAI产品更新
04:31
Thariq@trq212
69
工作流是 Claude Code 自技能和子智能体以来最大的能力升级。 我和 @sidbid 深入探讨了最佳实践、示例等内容。我特别兴奋于它为 Claude Code 启用的非技术任务。

Thariq: http://x.com/i/article/2061850535708483585

智能体AnthropicMCP/工具产品更新
03:34
OpenAI@OpenAI
77
我们正在通过将插件扩展到单个工具之外,使 Codex 更适用于您的工作。 这些插件通过一次安装即可将 Codex 转变为特定角色的专家,无需编码。 Codex 可访问 62 个流行应用和 110 项技能,覆盖销售、数据分析、创意制作、产品设计和公开股票投资等工作领域。 https://openai.com/index/codex-for-every-role-tool-workflow/
MCP/工具OpenAI产品更新
关联讨论 6 条OpenAI:官网动态(RSS · 排除企业/客户案例)X:Rohan Paul (@rohanpaul_ai)X:OpenAI (@OpenAI)X:Sam Altman (@sama)IT之家(RSS)X:OpenAI Developers (@OpenAIDevs)
02:54
ClaudeDevs@ClaudeDevs
精选77
我们为 Claude Platform 添加了一个 CLI,使每个 API 端点都可以从你的终端运行。 调用 Messages API,启动 Claude 托管智能体,并将结果直接管道传输到你的 shell。 ant CLI 被使用 claude-api 技能的编码智能体(Claude Code)很好地理解。
AnthropicMCP/工具产品更新部署/工程

推荐理由:Ant CLI 把 Claude Platform 的所有 API 端点都弄进了终端,配合 Claude Code 用很顺手,做 Agent 或脚本开发的可以直接上手玩。
02:15
Rohan Paul@rohanpaul_ai
72
Factory Router发布:智能路由优化编码智能体成本与性能

Factory推出Factory Router,一个编码智能体模型选择器。它通过将每次编码任务视为路由决策,首先使用最具性价比的模型处理,仅在遇到失败或需要深度推理时升级至更强前沿模型。该方案旨在保持与Claude Opus 4.7相近的性能(报告称达到其Terminal-Bench 2分数的99%),同时将AI会话成本降低20-25%。其核心理念是“前沿AI应保留给前沿工作”。

Factory: Introducing model routing to Factory. Factory Router picks the right model for every task, automatically. Maintain front...

MCP/工具产品更新编码
00:53
🚨 AI News | TestingCatalog@testingcatalog
68
OPENAI 🔥:新站点、角色专属插件和注释功能正面向商业和企业计划用户推出预览版。 > 今日,我们推出使用 Codex 的新方式:可适配您角色和工具的插件、帮助您就地优化结果的注释,以及通过 URL 创建可与工作区共享的交互式网站和应用的预览功能。

OpenAI: https://openai.com/index/codex-for-every-role-tool-workflow/

MCP/工具OpenAI产品更新编码
00:36
向阳乔木@vista8
73
英伟达开源Skill安全扫描工具

英伟达开源了一款针对AI智能体Skill(技能)的安全扫描工具。推文指出,Skill安全虽是一个实际问题,但目前专门做此方向扫描的工具和人员似乎较少。尽管尚未出现由Skill引发的严重破坏性案例,但仍需保持警惕。推文建议,用户可以考虑编写一个Meta Skill(元技能)来自动生成各种所需的Skill,并强调他人的Skill应主要用作学习和参考,而非直接使用。

MCP/工具安全/对齐开源/仓库
‹ 上一页
1…45678…17
下一页 ›