现在都是 AI Agent做开发,人喜欢的 PRD 和 AI 喜欢的是不一样的。 为了精准高效开发,写了个专门服务于 AI 的PRD文档生成Prompt。 先有这个文档,再给AI开发,功能完整度和丰富性会远远比自己想的全面、好用。 Skil...
推文提出AI Agent开发中人类与AI对PRD的需求不同,为此发布了一个专门服务于AI的PRD文档生成Prompt(命名为qiaomu-ai-prd)。开发者先使用该Prompt生成文档,再交给AI开发,可显著提升功能完整度和丰富性。安装指令为:npx skills add joeseesun/qiaomu-ai-prd,开源地址及Prompt见评论区。
@op7418 万字长文复盘爆款 Skills 经验,核心观点:Agent 不是聊天框,会放大能力差距;Skill 是普通用户用好 Agent 的关键中间层。好 Skill 需设计、维护与分发;生态不能只做仓库列表,需要内容、产品、案例、反馈形成迭代飞轮。基于真实案例。
http://x.com/i/article/2065096982310567936
Berry Xia 赞同观点:Agent 不会缩小用户能力差距,反而会放大差距。头部用户已搭建文档、规则、memory、MCP、CLI、工具调用、权限、安全沙箱等系统,普通用户仍停留在聊天框。目标清晰、品味强的人被 Agent 放大优势;目标混乱、缺乏文档的人被放大混乱。作者认为 AI 时代并非完全平权,善于使用 AI 工具的能力可被放大数万倍,原本几倍的差距现在可能扩大到数百倍。
http://x.com/i/article/2065096982310567936
Re-Ink 是 @LandingAI 金融 AI Hackathon 冠军项目,针对再保险承保中约 40% 时间消耗的行政文档录入痛点,构建端到端自动化方案。核心使用 LandingAI 的 Agentic Document Extraction (ADE) 实现 PDF/DOCX 条约的结构解析与上下文感知字段提取(合同标识、日期、金融条款、参与方等),无需正则或模板。关键设计为人机协同闭环:提取数据经人工审核后以单事务持久化,校验失败即回滚。Agent 层用两个 LangGraph Agent 封装入库前引导与审批后分析逻辑。Academy 调查显示手动提取错误率超 6%,运营预算约 14% 用于修复此类错误。
http://x.com/i/article/2065098287758348288
作者认为Agent并非抹平能力差距,而是放大K型分化,Skill可弥合鸿沟。Skill是把专家经验、工作流、品味、工具调用封装成可分发复用的Agent能力单元,如PPT Skill、社交媒体卡片等。好Skill的信息架构应为“中心短,辐射厚”:SKILL.md只放高信号流程,其余依赖文件系统分层管理,以高效利用上下文窗口。
本期精讲聚焦智能体工程化:Anthropic推出Claude Managed Agents,将推理与执行解耦,独立Vault管理凭证,事件日志支持运行恢复,首字延迟p50降约六成、p95降超九成。阿里工程师分享三层加载架构(常驻入口层压至8K上下文)、dispatcher状态机及G1-G8门禁,用结构约束替代堆prompt。Sequoia访谈指出模型正逐步吸收路由、执行环境等外层脚手架,独立创业公司窗口收窄。
Anthropic推出Claude Managed Agents,将推理循环与代码执行沙箱解耦,凭证存入独立Vault,自托管沙箱支持内网,首字延迟中位数降低六成、长尾降低九成。阿里工程师复盘Harness工程化,提出三层加载架构与G1-G8门禁。Google DeepMind的Logan Kilpatrick称模型正“吞掉”脚手架,Gemini 3.5 Flash编程能力完全来自后训练。另,Qwen3-VL-4B在支持SME2的旗舰手机上Prefill提速超80%;Fable AI实现1770%性能提升并发现关键Bug;此外涉及AI取代工程师、多智能体数字人、CFO用GPU替代加薪等讨论。
http://x.com/i/article/2065232915970371585
We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...
关联讨论 1 条OpenAI:官网动态(RSS · 排除企业/客户案例)社区基于865条讨论与实测总结:Claude Fable 5高自主、高成本、偏规划编排。核心共识:给更难目标、少给步骤;用Fable规划→Sonnet实现→Haiku验证;免费窗口(截至6月22日)内将经验固化为Skill。Effort旋钮Medium最省token且效果接近High;付费计划下输出价约$50/M token。安全回退静默切至Opus 4.8;视觉输入(截图→应用)比文字更有效。最佳策略:跑一次业务prompt诊断,把解法蒸馏成Skill留存。
http://x.com/i/article/2064864205749280768
邵猛分享 Spec 驱动开发(SDD)方法,用三个 Skills(/write-product-spec、/write-tech-spec、/validate-changes-match-specs)覆盖 Spec→Implement→Verify 闭环。规格分两层:PRODUCT.md(用户故事、不变量)和 TECH.md(架构、实现策略),均放在 specs/<issue>/ 目录,随 PR 提交。五步流程:写产品规格、写技术规格、Agent 按规格实现、一致性校验、计算机操作端到端验证。Skills 可移植,不绑定 Warp。开源仓库 warpdotdev/common-skills,安装:npx skills add warpdotdev/common-skills。
http://x.com/i/article/2065151123128721408
We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...
该论文提出SIA框架,让AI自动循环改进:一个观察者AI监控任务代理的表现,然后修改其外部设置(提示词、工具、重试规则、输出解析)或通过LoRA权重更新训练模型本身,模型主体不变,仅适配器从任务反馈中学习。在三个任务上测试:中文法律罪名分类(LawBench达70.1%)、GPU内核速度调优(生成代码优于此前最佳)、单细胞RNA降噪(得分0.289)。综合版本在所有任务上超越仅修改设置的方案,表明权重更新能帮助模型学到提示和工具无法发现的模式。
Jeff Bezos 在 CNBC 披露其新公司 Prometheus 的愿景:构建人工通用工程师,设计制造喷气发动机、芯片、医疗设备等硬物理产品,将传统数年设计周期缩短 10 倍以上。公司宣布完成 120 亿美元融资,估值 410 亿美元。初始启动资金 62 亿美元,新一轮融资表明公司需要更多算力、人才和工业数据才能验证产品。410 亿美元估值表明,前沿 AI 已从软件竞赛变为计算采购竞赛——投资者实质在为可能实现模型所需的机器预付费。
同一事件,精选展示《Prometheus 融资120亿美元,估值410亿美元,定位"人工通用工程师"》Three layers you need to run agent swarms at scale: - Runtime: solved. - Orchestration and triggers: solved. - Coordinat...
OpenAI 宣布收购 Ona,其安全云端执行技术可为 Codex 智能体创建持久云端工作空间——用户离开后,智能体仍可持续运行命令、检查系统、保留上下文并跨设备恢复任务。目前 Codex 周活用户达 500 万(增长 400%)。收购旨在强化企业级部署:智能体可在企业云边界内运行,具备作用域凭证、审核追踪、访问限制和可审计活动,适用于测试、漏洞修复、重构、迁移等多步骤任务。收购完成后,Ona 团队将加入 OpenAI Codex 团队。
We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...
一个非常个人视野的观察:很多用AI时间不怎么久的人,似乎并不知道: > 当AI预期之外地停止工作的时候,通常只要给它再发一句"继续"就好了。
The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools pl...
关联讨论 2 条xAI:News(网页)X:xAI (@xai)We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...
Deep Research in Computer is built on our Search as Code architecture. The model writes code that assembles search itsel...
Grok 推出“记忆”层,能记录用户之前的对话细节(项目、偏好、目标等),避免每次聊天从头开始。用户完全掌控:可查看 Grok 记住了什么、随时编辑或删除不需要的记忆。启用方式:打开 Grok 设置 → 记忆 → 开启。该功能旨在让 AI 越来越了解用户,提供更个性化的辅助体验。
Grok now lets you view and manage your Memory This is a powerful feature Grok can remember useful details from your prev...
We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...
苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...
针对如何给Codex写Goal指令的问题,作者发布了一个Skill,可将一句话需求自动转化为目标,实现“睡前写指令、模型自动开发、第二天收菜”。安装命令:npx skills add joeseesun/qiaomu-goal-meta-skill。源码免费开源(见评论区),旨在简化4w字文档的阅读负担。
Introducing Parloa's Agent Skills: a better way for CX leaders to connect AI agents to the enterprise systems they need ...
Cursor 正用当前版 Composer 训练下一代 Composer,形成递归自我改进循环。训练大型模型需要大量 RL 数据(模型通过“游戏”提升能力),新模型能自动配置开发环境(如自动安装依赖、修复故障)。Composer 2 在环境配置能力上显著优于版本 1,模型越强,越擅长创造训练其继任者的条件。Cursor 的 autoinstall 系统让前代 Composer 设置 RL 训练环境,使下一代专注于解决更难题,每一代都解锁先前版本不具备的能力。
We use previous generations of Composer to train future ones. Our autoinstall system has earlier Composer models set up ...
该论文认为,AI智能体可能使软件从固定代码转变为按需规划和构建的系统,代码不再是核心产物。传统软件预先固化规则,而智能体在运行时将意图转化为行动,把代码视为一次性工具。真正转变是从“预设计行为”到“协商式行为”,系统随条件变化不断解读目标。但这也带来新风险:静态程序在可检查边界内失效,智能体可能因漂移、过度自信、记忆错误或逐步放大早期错误而失败。未来工程师的关键能力是定义意图、约束自主性、设计评估、检查推理痕迹,并辨别流利回复与可靠系统的区别。
最近把小米的MiMo 2.5 的模型接到Bloome 中当Agent 来使用! 发现把技能配置好,自主执行任务也是不错的!关键是真的便宜啊! 这不又来整活儿了? 他们把MiMo-Code直接开源,这终端原生AI coding助手带跨会话永久...
关联讨论 3 条公众号:小米 MiMoHacker News 热门(buzzing.cc 中文翻译)X:小米 MiMo (@XiaomiMiMo)阿里云宣布推出ApsaraDB Enterprise Agents,即内置于数据库中的AI原生智能体,可自主执行分析、治理、数据准备等运维任务,无需人工干预;具备企业级安全能力(细粒度访问控制、数据脱敏、token管控),并能自我学习适应。相关活动将于2026年6月24日10:00(UTC+8)线上举办,时长30分钟。