我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。 几个月下来,托管服务的 MRR ...
我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。 几个月下来,托管服务的 MRR ...
该研究指出,在自我改进的AI智能体中,“更强模型总能写出更好进化器提示词”的直觉是错误的。工作区分了两种能力:产生更新的能力在不同模型间趋于平坦,而从更新中受益的能力呈倒U形曲线,在中等模型处达到顶峰。弱模型无法有效激活更新,强模型则因已处性能高位而获益甚微。因此,成本效益最佳的配置是:使用廉价的中等模型担任“进化器”,而将昂贵的强模型用作“求解器”。
该推文分享了一种借助AI创建高质量Skill的方法论。其核心是五步流程:1.定义结果及标准;2.与AI交流对齐标准;3.利用GPT 5.5 Pro、Grok或Gemini DeepResearch等工具进行深度研究,梳理理论与案例;4.将调研成果消化为个人方法论;5.利用meta-skill将其固化,并交由codex或cc生成具体Skill。此过程强调“以教促学”,通过深度理解和持续迭代,最终提升对目标领域的认知。
结合最近写skill的一些心得,总结了一个Skill设计五步法: 1、定义结果 创建skill之前,想清楚到底想要啥,包括结果的标准是什么? 2、对齐标准 为了想清楚这个标准,会和AI做不少交流和探讨 3、深度研究 知道对于结果的标准后,会...
推文建议像“渣男”一样组合使用多个AI模型,发掘各自优势。具体指出 Opus 4.8 在UI设计与实现上优于 GPT-5.5,推荐用 Claude Design 后交由不同模型实现;其在系统设计和计划方面质量也高,但在写作上较弱。在 Claude Code、Cursor 等智能体中使用时,除写作外效果良好。引用内容提及 Opus 4.8 近期负面评价与退订增多,并有人预测 Anthropic 未来可能面临困境。
全网都在骂 Opus 4.8,退订的人越来越多。实在想不明白,一家所有产品都是二流甚至三流水平的公司,是怎么火起来的???????? 我赌三年内 Anthropic 就会消失或被收购。
该推文指出AI领域过度关注上下文窗口大小,而真正的核心问题——AI智能体跨会话记忆缺失——却被忽视。HydraDB 获得 $6.5M 融资,旨在构建一个图原生的上下文基础设施,专为智能体提供持久化会话、可累积知识与行为可观测性。其核心是将内存、NVMe 和对象存储组合为单一的图层,目标实现比现有方案快、成本降低 1000 倍、且高精确度的上下文交付,为智能体赋予“大脑”。
Introducing HydraDB. The graph native context infrastructure for agents. Purpose built to deliver precise context & obse...
当前AI智能体的扩展方法常错误地将计算资源消耗等同于学习证据。新研究指出,两次运行消耗相同预算,但反馈的有效性可能天差地别。为此,研究提出了“有效反馈计算”(EFC)指标,仅统计那些正确、新颖、相关且被记住、并能改变后续决策的反馈。研究还结合任务需求对EFC进行归一化。实验表明,任务归一化的EFC比原始计算指标更能预测失败。在一项匹配预算测试中,采用更好反馈的方法将任务成功率从0.27提升至0.90,而成本和工具调用次数保持不变。 链接:arxiv.org/abs/2605.29682 标题:"Scaling Laws for Agent Harnesses via Effective Feedback Compute"
Guardrails on OpenRouter are the most powerful in the market: centralized security & governance for your AI traffic Budg...
同一事件,精选展示《Guardrails:保护你的智能体、数据与成本》当前多Agent工作流(如OpenClaw、Codex、Claude Code并行使用)普遍存在“知识孤岛”问题,每个智能体拥有独立的记忆和上下文,导致工作虽能完成但缺乏“为何如此”的整体背景。将知识写入Repo的常见做法只保留了决策结论,却丢失了推理路径和争议过程。作者主张构建一个由用户拥有的共享记忆层(Hive Mind),使一个智能体的发现能即时同步给其他智能体,从而将“一群助手”转变为“一个分布式心智”。GBrain(共享知识图+MCP)和CASS(跨工具本地session检索)被视为解决该问题的方向项目。
http://x.com/i/article/2060957702340395008
http://x.com/i/article/2060155258350014464
推文介绍了如何通过安装Computer Use插件让Codex操控浏览器及其他应用。用户需在Codex的Settings中安装该插件,然后在对话中以“@Computer”或具体应用名(如@Chrome、@Figma)开头输入任务指令。Codex会请求应用访问权限,允许后即可在屏幕上真实操作(拥有自己的光标),并可随时中止。文中列举了发帖、修改Figma界面、整理消息并笔记等示例。引用@GDB的评论“codex computer use is viscerally compelling”,强调了其直观震撼体验。
codex computer use is viscerally compelling
LobeHub发布了名为“Chief Agent Operator”的平台。用户无需自行构建或提示代理,只需提出需求,平台便从一个拥有273,000个技能的市场中自动匹配、部署合适的AI智能体。这些智能体可在云端24/7运行,并通过Slack、Discord等IM工具汇报进展。该平台旨在解决当前工作流中需手动管理多个代理、重复提供上下文等问题,据称可节省超50%成本。其定位是作为统一调度层,管理如Claude Code、Cursor等各类AI代理工具的运作与结果回传。
Qwen3.7-Max实测显示其前端测试能力较3.6版本有显著进步。后端能力测试在34个参与模型中表现突出,以6947分登顶,远超此前GPT-5.5-Pro(xhigh)的4000分,且是唯一实现IVF-PQ + ADC索引方案的模型。测试也指出其输出分布稳定性有待提升,建议使用中多加review代码。此外,其Agent能力已达到第一梯队水平,并可实际用于构建AI磁盘恢复系统等工程任务。
CodePilot发布了0.55.0-preview.5版本。本次更新包含大量内容优化和UI整体重构,并支持将Codex作为其Agent引擎。用户可选用Codex内置模型或自定义模型。该版本目前为测试版,未公开推送,可能存在重大Bug,开发者欢迎用户带日志反馈问题。
跟祖传的 20K context 说 bye bye 了。 MiniMax M3 发布了,三个亮点: 1M context、原生多模态、Agentic。 我这次做了一次完整评测,使用CC workflow 、 @ZenMuxAI和MiniM...
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
关联讨论 11 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)OpenAI Voice Hack Night现场演示了为手机设计的“AI智能体操作系统”。其核心思路是“UI即系统”——手机没有传统App,界面由端侧本地模型实时生成,复杂推理任务由云端GPT处理。演示中开发者全程语音指挥完成订机票、删日历、查AI新闻、发邮件等操作,但中途因“登录未配置”导致发邮件失败。该演示展示了无需调用App界面的交互形式,可能颠覆传统移动应用生态和商业模式。
🧵 1/8 前几天给大家分享的我用AI邮箱来搞钱的帖子(见前贴),有很多朋友私信我问,你使用的那个像素风的小龙虾是什么? 怎么那么可爱有趣,我今天给大家介绍一下! 熟悉我的朋友知道,我是一个像素爱好者,看看我头像哈哈! 我一直自己想做个属...
http://B.AI 🤝 @MiniMax_AI Powerful agents require both advanced intelligence and robust economic infrastructure. We are...
腾讯混元正式发布专为OpenClaw等长期协作智能体(Agent)设计的记忆插件 Hy-Memory。它基于6层记忆框架、System1/System2双系统与三层进化链构建,旨在成为智能体的“第二大脑”。该插件解决了记忆碎片化问题,实现了显著性能提升:记忆数量减少70%以上,单条记忆信息密度提升45%以上,在超长上下文场景中token消耗降低35%,记忆更新速度提升20%。
商汤科技宣布联合举办Agent Forge AI黑客松(Super AI Edition),活动将于2026年6月13日在新加坡SMU经济学院举行。参与者将使用SenseNova U1、Bright Data、Daytona、Kimi AI、Nosana和Terminal 3等工具,在一天内构建一个可运行的AI应用,并进行现场演示与竞赛,奖品为赞助商积分。该活动已满员,但可加入等待列表。
英伟达在GTC Taipei 2026发布消费级芯片RTX Spark。该芯片基于GB10,提供最高1 PFLOP的FP4 AI性能、20个CPU核心、6144个GPU核心及128GB LPDDR5X统一内存,支持在本地运行120B参数的大模型。其核心突破在于首次将统一内存架构与CUDA生态结合于消费级PC,解决了以往统一内存在AI开发生态上的短板。微软将重构Windows以原生支持本地AI智能体运行。这被称为个人电脑诞生40年来“重新定义”的时刻。
关联讨论 9 条X:Kim (@kimmonismus)HuggingFace Daily Papers(社区热门论文)IT之家(RSS)Hugging Face:Blog(RSS)X:Satya Nadella (@satyanadella)X:Perplexity (@perplexity_ai)X:Artificial Analysis (@ArtificialAnlys)Hacker News 热门(buzzing.cc 中文翻译)LMSYS:Blog(Chatbot Arena 团队)活动名为“Agent Forge AI Hackathon: Super AI Edition”,将于2026年6月13日在新加坡SMU经济学院举办。参与者需在一天内构建可运行的AI应用,可使用的工具包括Bright Data、Daytona、Kimi AI、Nosana、Terminal 3以及主办方SenseNova的U1模型。活动现场将进行项目演示并角逐赞助商提供的奖金,同时提供与开发者、工程师及创始人交流的机会。该活动名额已满,但仍可加入候补名单。
黄仁勋在NVIDIA GTC台北2026上表示,我们正处在构建软件的最伟大时代。他断言,AI智能体不会消灭软件,反而会创造巨大的新软件需求浪潮。核心在于,未来计算机的交互将从“点击和输入”转变为向AI解释意图,由AI生成代码或使用工具完成输出,这就是智能体AI。随着智能体数量激增,它们对工具的使用将前所未有。这对软件公司是非凡机遇,但关键突破在于,软件必须以智能体能使用的方式呈现。
🚀 @MiniMax_AI M3 is now available on OrcaRouter. One of the most anticipated open model releases, bringing next-gen spa...
开发者使用Three.js,耗时两周构建了可在线体验的盛唐长安3D互动项目。核心功能包括通过WASD模式在城市场景中自由漫游,并接入Agora ConvoAI实时语音Agent,使用户能与李白、杜甫等NPC进行真实语音对话。项目还融合了飞花令等诗词小游戏及AI展馆,将历史文化与AI能力场景化结合。该开源项目(GitHub Pages)代码结构清晰,旨在为创作者提供一个可复用的数字文旅样板。
http://x.com/i/article/2060375125825036288
Claude Design 现与 Claude AI 网站、Claude Code 共享额度,用起来更便捷。其产品设计和UI设计能力不错。一个提升设计一致性的技巧是先导入成熟的Design System再进行设计,例如推荐Adobe的Spectrum 2 design system。此外,GitHub上有更多设计系统资源可参考。
Claude Design 现在和 Claude AI 网站以及 Claude Code 共享额度了,之前是独立的额度,一不小心就没了。 这个产品推荐多用用,产品设计能力和 UI 设计能力挺不错的。 一个经验就是你先让它帮你定义一套设计系统...
Minimax M3 is now live in Hermes Agent on Nous Portal, OpenRouter, and Minimax Direct Providers! No need to hermes updat...
MiniMax M3 is now live on CREAO. Sparse-attention reasoning with up to 15.6× faster decoding at long context, built for ...
本教程介绍了如何构建一个名为《大唐长安》的Web 3D互动项目。项目基于Three.js搭建低多边形风格的长安城沙盘,玩家可通过WASD模式在其中漫游探索。核心玩法包括与多种NPC进行语音对话、参与飞花令等诗词小游戏。项目集成了Agora实时语音能力,通过Agora Skills(技能)和Agora CLI工具完成Agent集成与环境配置,使玩家能通过麦克风与李白等角色实时语音交流。此外,项目还设计了将现代AI品牌融入游戏的唐风AI展馆。
MiniMax-M3 is live on OpenRouter! A frontier-class open-weight model that combines a 1M-token context window, frontier c...
关联讨论 11 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)MiniMax-M3 by @MiniMax_AI is now live on Venice. The first open-weight model to deliver frontier coding and agentic perf...
推文分享了使用/goal的两种核心方法:一是将逆向代码等复杂任务拆解为清单,例如先通过脚本解析生成JSON文件,再让AI分批处理并实时更新状态;二是与AI共同编写设计文档,划分成具体阶段,设定验收条件后逐步执行,每个阶段完成后自动提交。这两类场景强调将AI作为结构化任务执行助手,通过明确的检查点与流程控制提升工作效率。引用部分提及该功能正在被用户尝试,并征集最佳实践案例。
大家真的开始用 /goal 解决问题了吗 能否在评论区留下你用 /goal 的最佳实践?