A gift to the Chinese developer community for anyone building agents on @LangChain: After 2 books on the ecosystem, I op...
A gift to the Chinese developer community for anyone building agents on @LangChain: After 2 books on the ecosystem, I op...
Tom Osman用Codex的/goal功能,一条指令让AI自动将App所有功能拆解为用户故事,覆盖105个页面路由和67个API,生成183个用户故事。AI循环执行扫描、写测试、运行、自动修复、回归测试、补漏,持续4.5小时完成质量闭环。@gdb称这是“用Codex测试App中的每一个功能”。该流程从AI辅助写代码升级为AI自主负责质量,但局限是仅基于现有代码测试,可能固化错误或产生幻觉,大项目成本高,最终需人类把关。
codex for testing every single feature in your app:
Hermes Bible 将 Hermes Agent 169 页官方文档整合一体,提炼出 24 个可直接抄的真实工作流(如 Jira 到 PR 自动过渡),支持 ⌘K 即时搜索定位章节,社区可分享工作流并展示个人资料页。解决官方文档分散、优质工作流沉没在 X 和 Discord 的问题。
http://x.com/i/article/2042547855865585664
kunchenguid发布45分钟视频,讲解每天交付40-50个生产级PR的工作流。四层:1)终端中心(WezTerm+tmux+Neovim);2)船员入职:全局memory精简27行,项目级memory由agent自写;3)协作:语音输入OpenSuperWhisper,AXI标准(MCP比CLI多耗3倍token+2倍延迟),Lavish交互式HTML工件;4)验证:no-mistakes流水线在隔离worktree中对抗式review+E2E测试。并行用treehouse管理worktree,First Mate元agent调度。
many people asked me to make a video about my complete agentic engineering workflow excited to share it's finally here!!...
本书是构建自主AI系统的全栈实践参考。前半部分涵盖LLM基础(Transformer、GPU系统、SFT/LoRA/MoE训练、模型压缩、推理优化)及对齐与推理层(RLHF、PPO/DPO/GRPO、奖励建模、链式推理与测试时扩展)。后半部分专注智能体AI:智能体训练与轨迹RL、RAG与Agentic RAG、记忆系统、设计模式、MCP与A2A协议、多智能体架构,以及开发框架、UI设计、评估与生产部署。每章配理论基础、实现指南、代码示例和原始文献。
大语言模型默认无状态,构建智能体需借助记忆机制。七种记忆类型包括:工作记忆(上下文窗口内临时存储提示词、消息、工具输出)、语义记忆(长期存储用户偏好、事实)、情节记忆(记录过去事件与任务结果用于经验学习)、程序记忆(存储技能、工作流与行为规则)、外部/检索记忆(通过向量数据库在推理时拉取信息,即RAG)、参数记忆(嵌入模型权重中的世界知识与推理模式)、前瞻记忆(记忆未来意图与计划目标)。每种记忆对应不同时间尺度与实现方式,组合使用可构建更强的自主智能体系统。
This "loop" automation is nuts inside of Codex. "/goal go over every single feature in this app create a user story with...
推荐10个免费开源GitHub仓库:Recordly(免费屏幕录制,AGPL-3.0)、Stirling-PDF(PDF工具集,50+功能,MIT)、PhotoGIMP(GIMP转Photoshop界面)、Open Notebook(自托管NotebookLM,支持PDF/URL/YouTube,18+数据源,MIT)、Odysseus(PewDiePie开发的AI工作空间,本地优先,MIT)、FreeDomain(免费域名指向Cloudflare,AGPL-3.0)、Hyperframes(HeyGen的HTML/CSS转MP4引擎,Apache-2.0)、Web-to-App(网站转Android应用,支持Node/PHP/Python运行时)、ReClip(基于yt-dlp的多平台视频/音频下载)、Excalidraw(无限画布手绘图表,端到端加密,12万+好评)。
10 GITHUB REPOS THAT SHOULD BE ILLEGAL TO HAVE. all free. all open-source. bookmark this for later. 1️⃣ recordly - the f...
Nah kalau lo pakai Devin, bisa akses GLM 5.2 gratis dan unlimited🤯 cuma konteksnya maksimal 200 ribu, kalau pakai yg ve...
开发者整理出一套Agentic Engineering Workflow,覆盖任务拆解、工具调用、记忆管理到错误恢复全流程,让AI像工程师一样自主规划、写代码、调试和交付,而非仅聊天写文案。该工作流包含tmux、agent记忆、skills、语音输入、长任务执行、并行worktree管理、多agent调度,以及可视化HTML编辑器Lavish和代码变更校验流水线no-mistakes。所有步骤均已在真实项目中跑通,强调工程方法比模型能力更重要。
目前看到关于 "Agentic Engineering Workflow"的最完整的介绍👇 花了一个小时完整看完了,完全可以做成一个付费教程。 内容涵盖了tmux,agent记忆,skills,语音输入,长任务执行,并行worktree管...
Claude Code 设置/effort 为ultracode,然后翻译英文文章,你就会收获一个自动的多智能体流水线翻译流程: 先让 3 位风格各异的译者各出一稿 → 双语编辑对照原文评审挑出最佳译法 → 综合成定稿 → 最后逐句校对纠错...
OpenAI Codex 新增 Record & Replay 功能,用户可通过“演示一次工作流”创建可复用的 AI Skill。底层将 Skill 作为结构化上下文,回放时具备适应性,能调用当前环境中的工具完成任务。流程分两阶段:录制时 Codex 分析操作并自动起草 Skill(含使用时机、输入、步骤、验证);回放时用户提供新参数,Codex 自动执行。官方总结了五条高质量录制原则:短而完整、提前声明变量、真实但脱敏、补录隐性规则、及时停止。该功能与 Plugin 形成互补:适合个人快速 Skill 化,而非团队级分发。
拜耳与Thoughtworks合作开发了云端平台PRINCE,利用Agentic RAG和Text-to-SQL整合数十年临床前安全研究报告。该系统从关键词搜索演进为能回答复杂问题并起草监管文档的智能研究助手。架构通过上下文工程控制信息路由,通过驾驭工程实现编排、错误恢复与可观测性。系统以透明度、可解释性和人工参与为核心信任机制,显著提升数据可访问性与研究效率,同时确保治理与合规。
腾讯元宝推出父亲节主题活动,用户可选择爸爸年轻时照片与自己的照片,输入提示词(如“帮我生成一张和爸爸的合影,将图2的我融合到图1爸爸的照片中,我想穿越回__年前,和他一起_____;保留爸爸照片的背景、动作及五官;人物姿态自然协调,整体光线与色调保持一致”),元宝即可生成合影。活动旨在让用户“回到过去”看到爸爸的青春模样。
卧槽, 这真的有点东西哈哈~ Codex + Excalidraw = 无线画布,并且原生,无需额外插件👇👇
Codex + 画布工具,以及尝试一种更直觉、更留痕的图片标注修改方式。 直接用 Codex 的好处是 GPT Image 2 也基本可以自由干。
@aijoey 用 MiniCPM-V 4.6 搭建了视觉智能体安全监控 demo:四个 CCTV 实时画面,模型观察近期帧窗口,判断活动是否正常,仅在识别到真实事件时调用 raise_alert(reason, severity)。模型持续将场景分类为“常规/无紧急”,只在高速公路出现警车蓝灯时触发警报,推理为“警车蓝灯亮起,可能表示紧急情况”。该演示展示了小 VLM 超越图像描述、实现实际智能体行为的潜力。
Built a vision-agent security monitoring demo with MiniCPM-V 4.6. @OpenBMB Four CCTV style feeds run on a live clock. Mi...
面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群。128个并发智能体在DGX Spark上运行,通过vLLM连续批处理提供服务,每个智能体独立处理发票审核、退款路由、合规检查等8种业务队列。系统在1.48秒内跨智能体流式传输6604个chunks。该案例表明,1B模型的价值在于同时做出大量有用业务决策——用一群小型廉价worker并行清理队列。
Built a back-office agent swarm demo with MiniCPM5-1B. 128 concurrent agents on DGX Spark, served through vLLM continuou...
LangChain 官方认证大使 @zhanghaili0610 推出开源教程《Deep Agents 实战》,基于 LangChain / LangGraph 生态,讲解如何用 Deep Agents Harness 框架构建真实 Agent 应用。核心是“三层架构”:Runtime(LangGraph)、Framework(LangChain)、Harness(Deep Agents)。技术内核为上下文工程,通过虚拟文件系统实现按需读取、中间结果落盘、大文件局部读取。教程共 8 章 + 2 准备篇,覆盖虚拟文件系统(六大工具)、任务规划、子 Agent 委派(异步并行)及 Skills 复用(可在 Claude Code、Cursor 等 30+ 工具中通用)。
A gift to the Chinese developer community for anyone building agents on @LangChain: After 2 books on the ecosystem, I op...
本教程使用TimeCopilot构建端到端预测工作流。安装TimeCopilot等库后,加载AirPassengers数据集及合成季节序列(注入三处异常)。配置统计模型(AutoARIMA、AutoETS、SeasonalNaive、Theta)、Prophet和基础模型(Chronos,根据GPU选用amazon/chronos-bolt-small或tiny,可选TimesFM)。通过滚动交叉验证和RMSE等指标评选最优模型,生成概率预测与预测区间,可视化未来趋势并检测异常值。可选LLM智能体自动选择模型并输出分析响应。
分享了一个治愈风提示词,用于生成手工钩织玩偶形象(如 @elonmusk 等)。提示词描述:一只手工钩织的[主体]玩偶,柔软毛线材质,编织纹理细腻,身穿鲜艳主色调搭配精致辅色服饰,手中握着小道具,置于温馨场景中,氛围温暖柔和,充满手工质感与怀旧阿米古鲁米风格。@dotey 评论称该提示词挺酷,针织玩偶效果佳。
这个提示词挺酷,针织玩偶
GPT-Image-2.0生成的图片常出现毛躁、破碎纹路等观感问题,容易被识别为AI生成。使用Nano Banana超分放大工具可去除杂乱无意义的细节,增加有意义的细节,同时让文字和边缘更锐利清晰。对比图显示左边为GPT原图,右边为Nano Banana处理后效果。推荐提示词:"帮我将这张图片重绘和清晰化,让他细节更丰富,同时去掉原图中杂乱不必要的细节"。
Prompt share: Cozy Crochet Characters 💬Prompt: A handcrafted crochet doll of a [subject], made with soft yarn textures ...
http://x.com/i/article/2067506549107691520
用 Codex 写代码时,把 Review 从写完检查挪到动手之前,返工率可大幅减少。三种方法:1)零成本版:在需求前加指令要求先复述任务、澄清歧义、给出执行计划再写代码;2)官方内置版:输入 /plan 或 Shift+Tab,让 Codex 自动收拢上下文、输出完整计划;3)一劳永逸版:在 AGENTS.md 中写入强制前置规则,要求每次任务先深度思考、复述需求、识别风险再执行。好的 Agent 先方向正确再追求速度。
http://x.com/i/article/2063237792746831872
博客详解 Claude Code 的七种指令配置(CLAUDE.md、Rules、Skills、Subagents、Hooks、Output Styles、追加系统提示),从加载时机、压缩后保留性、token消耗与权威性三个维度对比。CLAUDE.md 分根目录(全程驻留)和子目录(按需加载);Rules 支持路径作用域节省 token;Skills 仅加载名称和描述,调用时载入完整内容;Subagents 独立上下文运行,只返回结果;Hooks 绕过压缩实现确定性控制;Output Styles 直接注入系统提示且永不被压缩;追加系统提示仅单次生效。文章给出实用决策原则,如用 Hook 跑 lint、用 Skills 封装部署流程等。
Google Docs 中出现的 Gemini 弹窗可通过两种方式关闭。一是点击文档顶部菜单栏的 Gemini,在下拉菜单中选择 “bottom bar preferences” 并关闭底部栏。二是通过 Gmail 设置:点击齿轮图标进入 “See all settings”,找到 “Google Workspace smart features” 并管理开关,关闭 Workspace 智能功能(包括 Docs 中的 Gemini 弹窗)。该方法可统一禁用多个 AI 功能,避免逐一关闭。
OpenRouter是托管路由网络,买credits后通过一个API路由至70+供应商,自动故障转移,无需自有密钥;覆盖300+模型(含20+免费),按用量收费(零加成+5.5%平台费,首100万免费),支持零数据保留和欧盟路由。Portkey是AI控制平面(2026年被Palo Alto收购),置于用户密钥之上,增加治理、提示管理、护栏和可观测性;提供1600+ LLM统一API,按日志计费(Developer免费,Production $49/月),支持HIPAA、SSO、私有部署。两者均可组合使用。
宝玉分享 baoyu-design Skill 的迭代过程:用户测试发现导出问题(样式表未铺满整页、渐变色丢失),他在本地复现后让 Agent 分析原因、给出解决方案并添加测试覆盖,修复后效果改善。该 Skill 可在制作 PPT、动画视频或网站时调用 AI 生图配图,支持 Codex 内置画图或配合 baoyu-image-gen Skill 调用 Codex CLI 画图,并能连同图片一起导出为 PPTX,在 PowerPoint/Keynote 中二次编辑。迭代循环:自己用 → 发现问题 → 让 Agent 分析 → 出方案 → 确认 → 更新 Skill。
baoyu-design skill 更新:可以在制作 PPT、动画视频或者网站时调用 AI 生图技能配图了,当然需要你本地 Agent 有配置画图 Skill。 如果是 Codex 可以直接调用内置画图工具,如果你用 Claude Cod...
OpenAI 正式推出 Codex for Open Source 计划,为开源项目维护者免费提供 6 个月 ChatGPT Pro(含完整 Codex 权限)及专项 API 额度,总价值 1200 美元。无硬性 Star 门槛,个位数 Star 的小项目也可申请。申请需说明具体维护工作、项目真实影响力及资源使用计划。审核采用 AI 加人工滚动处理,通过率较高,整个过程零成本,约十分钟即可完成。
人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...
开发者 Theo 让 Codex 通宵处理 GitHub 仓库中过时的 PR:自动分诊判断价值,关闭无用的,复活过时的。每个被复活的 PR 同时运行两个线程——Build 线程负责修复冲突和更新代码,Review 线程负责审查代码,形成写手+审稿人的双保险,降低单点幻觉风险。人类只需在关键节点做决策。工作流将仓库维护从个人拖延症转变为 agent 排班制度,实现“睡觉时自动干活,醒来只看决策”。主推文作者拆解出三步:Triage 分诊、关闭无用、复活并行推进,可直接复制使用。
I underestimated how cool this workflow is. Had Codex go through a bunch of stale PRs last night. Closed all the useless...
GitHub 内部开发了 Qubot,一个由 Copilot 驱动的数据分析智能体。员工可以用自然语言直接提问公司数据,无需编写 SQL 或使用 BI 工具。团队在构建过程中积累了关于设计、集成和用户体验的经验。
AI编程圈出现新主张:不应再手动提示编码智能体,而应设计循环自动完成提示、读取输出、判断完成,并在出错时重新提示。Boris Cherny(Claude Code创建者)和Peter Steinberger均持此观点。文章梳理了循环的五种演进形态(ReAct、AutoGPT、ralph loop、/loop与/goal、编排),并拆解六大组装部件:触发机制、隔离工作区、项目上下文记录、工具连接、独立验证智能体等。核心转变是从编写代码升级到编写驱动代码的系统。