该推文介绍了以OpenAI Codex为核心的个人生活自动化智能体工具栈。它集成了Google全家桶、WhatsApp、电报及浏览器自动化等工具,并以Google Drive作为“真相源”数据层。核心是跨应用编排与判断,关键决策需经人工批准。技能(如inbox-zero)是可迭代的操作手册,用于固化偏好。典型的“介绍邮件”编排展示了Agent在处理多工具、高上下文切换任务时的效率。工具优先级为API/CLI > 本地文件 > 浏览器自动化。
Agent: OpenAI Codex + Tools: Google 全家桶、WhatsApp、电报、浏览器自动化等 + Data: Google Drive、Notion、AGENTS.md 等 + Skills: inbox-zero、contacts 等 == 个人生活自动化 Agent 工具栈
@nicbstme 提出的两个典型工作流 1. 介绍邮件(跨 5 个工具的「胶水活」) 朋友 WhatsApp 求助 → 搜 WhatsApp/Gmail 找邮箱 → 网页查公司融资 → 起草介绍信 → 等批准 → 发邮件 → WhatsApp 告知完成。
人工约 20 分钟、大量上下文切换;用户侧约 10 秒提需求。Agent 做的是跨 App 的编排,不是回答问题。
2. 车牌更新(行政连续性) 发照片给 Agent → 更新 Drive 里的 Markdown 车辆档案 → 保留 VIN、保险等字段 → 上传回 Drive → 必要时用浏览器自动化同步到 FasTrak、停车 App、保险门户等无 API 的系统。
体现的是行政连续性:同一份信息在多处保持一致,而非一次性问答。
最重要的架构决策:Drive 作为 Source of Truth Nicolas 刻意把知识从 Notion 迁到 Google Drive,原因很务实: · Notion 对人友好,对 Agent 不友好(嵌套页面、数据库属性、权限、UI 原生结构) · Drive + Markdown/CSV:可搜索、可 diff、可编辑、可上传、可引用 file ID · gogcli 提供统一的 CLI 面(Gmail、Drive、Calendar、Docs、Sheets 等)