The open-weight labs did not come to play this week. StepFun dropped Step 3.7 Flash. MiniMax dropped M3. Both with open ...
The open-weight labs did not come to play this week. StepFun dropped Step 3.7 Flash. MiniMax dropped M3. Both with open ...
据X.PIN独家消息,微信的AI智能体采用agent-to-agent架构运行。其中,“管家”智能体负责理解用户意图,并将任务(如外卖、打车等)路由至各小程序自带的“技能”中执行,实现一站式服务闭环。该智能体基于腾讯混元及智谱等模型构建,目前正于数个高流量小程序内进行有限测试。用户可在授权后允许智能体读取聊天历史以实现个性化服务。微信庞大的用户基础、支付、身份体系与百万级小程序生态,使其具备显著的落地优势。
Tencent moves closer to launching AI agent for WeChat's 1.4bn Chinese users https://ft.trib.al/bto5t0c
作者受一条推文启发,使用Codex对自己的MacBook进行了只读存储分析,发现了B站缓存视频等大量可清理空间(激进方案超140G)。为替代收费软件CleanMyMac,作者制作并开源了一个跨平台(支持Mac/Windows)的AI清理skill。该skill会扫描文件并生成可交互的HTML报告,通过三色分级(绿灯可放心清理、黄灯需人工判断、红灯禁止动)直观展示,并提供安全执行按钮。实测清理后释放了近120G空间,相比CleanMyMac仅扫描出的15.8G,其信息更透明、建议更详细。
同一事件,精选展示《基于 Codex 的开源 AI 技能"清理垃圾.skill":自动扫描电脑生成 HTML 报告,一键清理垃圾》该推文拆解了Claude Code的工作流。它是一个能后台运行、可监控的任务系统,包含三个核心角色:Claude负责拆解任务与规划,Runtime负责调度管理状态,每个AI智能体(agent)仅处理一个子任务,并通过并发池与队列推进。系统关键设计是“状态外置”,即中间结果由执行系统保存,主上下文只读取摘要,从而使其能扩展至大量智能体。推文认为这种智能规划、Runtime执行、状态独立、模型按需调度的模式,代表了一种新的工程编排方式,并可将其工作流转换为自有系统的可执行格式。
肝了几天,来回打磨了快 30 遍, 一次性把最新的 Claude Code 的 Workflow 给你完全拆解清楚 有人说它的伟大程度,不亚于 MCP 和 Skill。 第一眼我是不信的,直到拆开看它内部怎么跑: 这不是"问一句答一句"的对...
宝玉(@dotey)宣布将于北京时间当晚20:00在图灵社区直播间举办公开课,主题为 Agent Skills。他将分享自己制作 Skill 的实操经验和心得体会,并介绍新书《图解Skill: AI提效实战指南》。
We just shipped the ability to build apps that connect to Gmail, Drive, Sheets, and more directly inside of @GoogleAIStu...
推文建议,Codex、Cursor等AI智能体应提供API接口,允许右侧面板的网页视图直接向智能体发送包含文本和附件的提示词。例如,用户可构建类似Claude Design的网页,通过调用"window.codex.sendPrompt(text, attachments)"等API,将输入内容直接推送到左侧聊天界面。此举旨在实现智能体与网页间更深层的交互,从而解锁更多可能性。
文章分享了四条让AI智能体有效理解代码库的实用建议。1. 确保源代码是唯一真实来源,或通过MCP、CLI等方式让外部内容对智能体可读。2. 智能体需具备自我验证能力,这依赖于使用类型语言、高质量测试和配置良好的linter。3. 编写简洁有效的AGENTS.md文件,并融入符合模型预期的直观命名,可借助Cursor等工具自定义智能体。4. 配置自动化流程,用于代码重构建议、安全问题检查和持续文档生成,以实现一个能自我改进的“自动驾驶”代码库。
高通CEO Cristiano Amon预测,全球token需求到2026年每10秒将达317亿,到2030年将增至1.27万亿,实现40倍增长。他指出,这一增长主要源于AI正从人类节奏的交互转向智能体驱动的活动。智能体AI将消耗远超聊天机器人的token,因其执行自主任务时需调用工具、读取输出、协调系统并更新记忆,形成隐藏的微决策链。因此,软件使用模式可能从按点击或席位计量,转变为按其消耗的机器推理token量计量。
New video of Qualcomm CEO Cristiano Amon: AI will require "gazillions" of tokens. Because, Agentic AI will consume drama...
We've reset 5-hour and weekly rate limits for all users on Pro and Max plans. We fixed an issue that caused some Claude ...
Today @MiniMax_AI ships M3 - the first frontier model purpose-built for computer-use agents. Natively multimodal. One mo...
关联讨论 12 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)高通CEO Cristiano Amon指出,AI智能体(Agentic AI)因其执行规划、工具调用、验证等自主任务,单次请求的token消耗可能达普通回答的10至50倍以上,因此AI将需要“海量”token。高盛预测,到2030年AI智能体的token使用量将增长24倍,每月可能达120千万亿。同时,推理成本预计年降60%-70%。这标志着软件计量方式可能从按席位/点击转向主要按机器推理/token消耗量计算,Uber和Microsoft等公司已在重新评估高昂的智能体使用成本。
Goldman Sachs: "Token use by AI agents is expected to multiply 24 times by 2030" AI agents are now creating the first se...
Update: We didn't get the blog out yet. It's been a busy weekend. But @StepFun_ai Step 3.7 Flash is currently FREE in Ki...
当前多Agent工作流(如OpenClaw、Codex、Claude Code并行使用)普遍存在“知识孤岛”问题,每个智能体拥有独立的记忆和上下文,导致工作虽能完成但缺乏“为何如此”的整体背景。将知识写入Repo的常见做法只保留了决策结论,却丢失了推理路径和争议过程。作者主张构建一个由用户拥有的共享记忆层(Hive Mind),使一个智能体的发现能即时同步给其他智能体,从而将“一群助手”转变为“一个分布式心智”。GBrain(共享知识图+MCP)和CASS(跨工具本地session检索)被视为解决该问题的方向项目。
http://x.com/i/article/2060957702340395008
🧵 1/8 前几天给大家分享的我用AI邮箱来搞钱的帖子(见前贴),有很多朋友私信我问,你使用的那个像素风的小龙虾是什么? 怎么那么可爱有趣,我今天给大家介绍一下! 熟悉我的朋友知道,我是一个像素爱好者,看看我头像哈哈! 我一直自己想做个属...
腾讯混元正式发布专为OpenClaw等长期协作智能体(Agent)设计的记忆插件 Hy-Memory。它基于6层记忆框架、System1/System2双系统与三层进化链构建,旨在成为智能体的“第二大脑”。该插件解决了记忆碎片化问题,实现了显著性能提升:记忆数量减少70%以上,单条记忆信息密度提升45%以上,在超长上下文场景中token消耗降低35%,记忆更新速度提升20%。
作者解决了其Codex推理速度异常缓慢且频繁断联的问题。在同一网络环境下,其他设备运行正常,这排除了网络原因。最终发现根源是配置文件中错误地写死了两个参数,并强制加载了两个MCP,导致了性能问题。建议遇到类似情况的用户,可尝试利用Codex自身能力来检查其配置文件。
推文分享了使用/goal的两种核心方法:一是将逆向代码等复杂任务拆解为清单,例如先通过脚本解析生成JSON文件,再让AI分批处理并实时更新状态;二是与AI共同编写设计文档,划分成具体阶段,设定验收条件后逐步执行,每个阶段完成后自动提交。这两类场景强调将AI作为结构化任务执行助手,通过明确的检查点与流程控制提升工作效率。引用部分提及该功能正在被用户尝试,并征集最佳实践案例。
大家真的开始用 /goal 解决问题了吗 能否在评论区留下你用 /goal 的最佳实践?
推文介绍了一种结合飞书与AI的交互式阅读方法。核心流程为:1. 使用 Codex 或 CC 将 EPUB 电子书按章节导入飞书文档;2. 人工阅读时在文档中对有感触的内容进行划线、加粗或评论;3. 再次调用 Codex 读取这些标记与评论,由AI进行解释和回复。作者认为此方法有趣,并计划将其封装为可复用的 Skill。
该推文介绍了以OpenAI Codex为核心的个人生活自动化智能体工具栈。它集成了Google全家桶、WhatsApp、电报及浏览器自动化等工具,并以Google Drive作为“真相源”数据层。核心是跨应用编排与判断,关键决策需经人工批准。技能(如inbox-zero)是可迭代的操作手册,用于固化偏好。典型的“介绍邮件”编排展示了Agent在处理多工具、高上下文切换任务时的效率。工具优先级为API/CLI > 本地文件 > 浏览器自动化。
http://x.com/i/article/2060579190920110081
本文介绍两种让 Codex/Claude Code 自动获取网页网络请求数据进行调试的方法,无需手动复制粘贴。方法一:使用 Chrome 的“Export HAR”功能导出 .har 文件,并将文件路径发给 Codex 分析。方法二:安装 Codex 的 Chrome 浏览器扩展,在对话中使用 @chrome 指令,让 Codex 直接操作浏览器进行调试与抓包。
Sandcastle是由@mattpocockuk开源的一个TypeScript工具,允许用户通过脚本编排Workflow,在虚拟机中协同调用Codex、Claude Code、Cursor、GitHub Copilot等多个AI智能体来完成复杂任务。它定位为面向追求极致效率场景的极客工具,适用于需要多智能体协作或“赛博养蛊”式的任务,例如让各智能体分别生成技术方案再相互评审完善。
I built my own software factory, and I open-sourced it. It's called Sandcastle. Here's how to use it:
在MacBook Pro M5 Max 64GB上的本地测试中,Liquid的LFM2.5-8B-A1B模型在需要完成7个工具调用的旅行规划任务上,显著优于OpenAI的gpt-oss-20b。LFM2.5-8B-A1B仅使用4.8GB内存,以266tok/s的速度成功完成了全部7/7工具调用,耗时6.9秒。相比之下,gpt-oss-20b消耗了11GB内存,仅完成3/7工具调用,速度为146tok/s,耗时15秒。这表明,一个活跃参数规模更小(1B)的MoE模型,通过更精准的训练,在工具调用这一智能体任务上可以战胜活跃参数规模约其2.5倍的更大模型。
Liquid's LFM2.5-8B-A1B smashed OpenAI's gpt-oss-20b on tool calling We ran both locally on a MacBook Pro M5 Max, 64GB, a...
OpenAI发布了Codex的Windows版Computer Use功能。根据演示视频,Codex已能处理像素级的Windows原生GUI操作,例如在收到“测试我正在做的WinUI应用”指令后,能直接打开Paint(画图)应用,流畅地选择工具、调色并一笔一笔绘制图案,这展示了其vision-action loop的成熟度。官方通过WinUI测试等场景,暗示该功能面向真实的生产环境。同时,通过ChatGPT移动应用,用户可以从手机端启动、审核和引导Codex在Windows机器上执行任务,形成“手机指挥+桌面执行”的跨设备协作流程。
Windows users, this one's for you. Computer use now works on Windows, so Codex can take action on your Windows computer....
作者认为MCP(模型上下文协议)对AI智能体的未来至关重要,其核心价值不仅在于工具连接,更在于它所启用的抽象能力。作者以自身构建的自我改进系统为例,该系统完全通过MCP驱动,展示了MCP如何赋能智能体间交互、实现复杂协调、版本控制、评估工作流及工具集成等关键功能。作者强调,尽管新事物可能不断涌现,但MCP协议本身对于未来所有进展将是必要且关键的基础。
安装了这个之后,Claude Code 的体验会立马不一样 Anthropic 悄悄发布了一个官方插件 claude-code-setup,把 Claude Code 从「还不错」升级成了专业的 AI 开发环境 它会自动扫描你的项目,一键推...
Gemini 3.5 flash + Gemini managed agents api just audited a real megatron-lm ci failure inside Eigent. root cause in min...
🚀 The team at @Google just released the Agents API, a service for building and running custom agents inside a sandboxed...
OpenAI宣布其Codex的“计算机使用”功能正式支持Windows系统。该功能使AI能像人类一样操作桌面应用,此前于4月中旬上线时仅支持macOS。同时更新了手机远程控制能力,现可通过ChatGPT手机App在移动设备上启动、监控和审批运行于Windows电脑的Codex任务。这是继5月支持Mac主机后的扩展,目前仍属于早期体验。
Windows users, this one's for you. Computer use now works on Windows, so Codex can take action on your Windows computer....
Anthropic为Claude Opus 4.8新增mid-conversation system messages API功能。该功能允许在对话进行中动态修改系统提示词(System Prompt),且不会影响Prompt Caching。此前,系统提示词只能在对话开头固定设置,开发者有时通过user消息中的特殊标签尝试覆盖。新功能支持插入更高优先级的系统指令以调整Agent行为。此功能目前仅限Claude Opus 4.8及其官方API与AWS上的Claude Platform。
a number of useful tips + tricks for Opus 4.8: 1/ you can now update the system prompt mid-conversation w/o breaking the...