Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...
Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...
Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。
关联讨论 1 条X:Claude Devs (@ClaudeDevs)微信发布《开发者接入微信 AI 生态的指引》,引导小程序开发者接入微信 AI,让 AI 控制小程序。宝玉对此评论称,微信试图通过让 AI 操作小程序来维持自身超级入口地位,但未来年轻人不会主动打开微信,而是直接向自己的 Agent(如"帮我总结群聊"或"给妈妈发消息")发出指令。承担超级入口职责的很可能不是微信 AI。
微信终于要加 AI Agent 能力了? 微信发布了《开发者接入微信 AI 生态的指引》这篇文章,引导小程序开发者接入微信 AI 生态,让微信的 AI 控制小程序。 感觉这个可能是未来微信 AI 上一个非常重要的功能
Kimi发布Kimi Work,一款本地运行的桌面AI智能体。支持最多300个AI智能体同时在本地机器并行运行;配合WebBridge浏览器扩展,智能体可在浏览器中导航、搜索、点击、填写并完成任务;内置全球市场数据工具,可直接调用Yahoo Finance和世界银行数据,无需复杂API设置;记忆系统会记录用户偏好、过往决策和上下文。支持macOS(Apple Silicon)和Windows。
同一事件,精选展示《Kimi Work Beta版发布:面向知识工作者的本地Agent》今日,Hugging Face 宣布 OpenEnv 项目进一步开放,由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调,并获得 PyTorch Foundation、vLLM、SkyRL(UCB)等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具,定位为训练器与环境间的互操作层,标准化环境的发布、部署和消费,但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API(reset()、step()、state()),支持 HTTP、WebSocket、Docker 打包,并将 MCP 作为一等公民,使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证,以推动开源智能体 RL 基础建设。
Kocoro 是一个引擎级的开源 Mac AI agent 框架。它通过本地 agent 读取用户的过往会话、文件、应用、浏览器、屏幕和终端,将有用事实压缩为记忆,使 agent 无需重复上下文即可继续工作。安全模型以本地优先:工具操作需授权,危险命令被拦截或二次确认,行为可审计,秘密自动脱敏,记忆/同步默认不上传。其“情景记忆”将历史会话转化为项目事实、决策、协作者、截止日期和习惯。每晚自动将工作日蒸馏成本地知识图谱,次日直接恢复进度。
The models keep getting smarter. The users keep turning into assistants. You paste the file. Re-explain the project. Nar...
京东作为首批内测团队率先接入微信AI,将围绕电商、外卖、物流等业务接入微信AI Agent。微信开放平台提供自动模式和开发模式两种接入方式:自动模式由平台读取小程序源码并分析页面,无需额外开发;开发模式允许开发者基于业务特性自主开发,通过审核后可被微信AI调用。
腾讯正测试嵌入微信的AI Agent,用户右滑唤出对话窗口,通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力,可通过手机语音助理发起微信音视频通话或发送消息。6月8日,微信官方发布《关于开发者接入微信AI生态的指引》,提供自动接入模式,利用微信沙箱全自动改造小程序,使其可被AI直接调用。这一布局被视为Agentic Commerce(代理式交易)的雏形。
同一事件,精选展示《微信AI官宣内测:两种接入模式供开发者选择》微信开发者官方今日发布指引,确认微信AI正在内测阶段。开放平台提供两种接入模式:自动模式可授权平台读取小程序源码,无需额外开发即可让微信AI直接操作页面;开发模式下开发者可自主开发技能,审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手,用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信AI”可能非最终名称。接入与否不影响现有小程序服务。
关联讨论 2 条公众号:数字生命卡兹克IT之家(RSS)Boris Cherny 给出五条让 Claude Opus 自主运行数小时/天的建议:1. 开启 Auto Mode 减少审批;2. 用 Dynamic Workflows 编排数百至数千子 Agent;3. 使用 /goal 或 /loop 指令持续推进;4. 优先用云端 Claude Code,可关闭笔记本;5. 确保端到端自验证能力。邵猛补充:自动权限是前提;/goal、/loop 适合高难度任务但 token 消耗高;需解决本地关机/休眠;端到端验证最重要,否则 token 可能白费。
Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...
Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...
多项基准显示 Claude Opus 是长时间运行工作的最佳模型。SWE-Marathon 基准评估编码智能体在 10 亿 token 预算下自主完成长期软件任务(如重写 JAX 代码为 PyTorch、用 Rust 构建 C 编译器)。Opus 在此类任务上领先。Boris Cherny 给出 5 个技巧:使用自动权限模式避免审批;用动态工作流协调数百/数千个智能体;用 /goal 或 /loop 推动持续执行;在云端使用 Claude Code(桌面/移动端)以便关闭笔记本;确保 Claude 能端到端自验证——Chrome 扩展验证网页、iOS/Android 模拟 MCP、启动完整后端服务。
Can coding agents stay coherent over a 1 billion token budget? Can they build Slack from scratch? Rewrite a JAX codebase...
CJ Zafir团队发布Mac-1模型(6.6B参数),可在任何Mac本地运行,仅需7GB内存(12GB更佳)。它支持487个MacOS原生工具,能执行多工具链式调用,推理开启,输出速度约65 tok/s。应用层基于Mac原生UI/UX设计。作者认为这种本地小模型+原生工具的组合直接挑战云端SaaS agent,甚至可能抢了苹果Siri的活儿。
Here's a teaser of our Mac-1 model. > 6.6B model > runs locally (on any Mac) > requires 7GB RAM (12GB ideal) > can use 4...
datasette-agent-edit 0.1a0 插件发布,为 Datasette Agent 提供智能体编辑文本的核心工具。其设计借鉴 Claude text editor,实现三个工具:view(按行号查看文件片段)、str_replace(精确替换唯一字符串)、insert(在指定行号后插入文本)。该插件作为基础组件,可供其他协作 Markdown 编辑、SQL 查询更新、SVG 编辑等插件复用。
宝玉分享开发模式:先用 Claude Design 设计 App UI/UX,生成 HTML+CSS+React+data.js(优于 Figma,利于 AI 理解和 Git 版本管理);再用 Claude Opus 4.8 实现 MVP(GPT 5.5 在 UI 实现上差距明显)。因反复在本地与网页间导出替换设计稿繁琐,他编写工具解析 HAR 文件、解密 Claude Design 二进制内容,分析其 Prompt 和内置组件,将核心逻辑本地化集成到 Cursor(利用网页标记功能),配合 Opus 4.8 即可本地运行。最终开源 GitHub 项目“baoyu-design”。
最近为了研究 Claude Design,专门写了一个工具,可以解析 HAR 文件,解密 Claude Design 传输的二进制内容,这样可以方便的看到请求的 Prompt
Perplexity 的 "Search as Code" 架构放弃固定搜索 API,改为让 AI 模型在 Python 沙箱中自主编写搜索例程,自行完成过滤和去重。该方案在关键基准测试中超越 OpenAI 和 Anthropic 的模型,并将 token 成本削减高达 85%。
OPENAI 🔥: ChatGPT now can send emails directly from the conversation! AI will wrap whole Internet 👀
Cursor's new browser + element annotation turns it into a design studio. Meet Cursor Design 🎨 - Claude Design, running ...
宝玉对比了GPT-5.5与Opus 4.8的设计能力,认为Opus 4.8效果远优于GPT-5.5。他使用了基于Cursor浏览器和元素标注的baoyu-design Skill,该Skill通过npx skills add JimLiu/baoyu-design安装,可在本地运行:描述屏幕需求即可生成精良HTML,点击预览中任意元素即可发出修改指令。官方推荐搭配Opus 4.8以获得最佳效果。工具GitHub仓库:https://github.com/JimLiu/baoyu-design。
Cursor's new browser + element annotation turns it into a design studio. Meet Cursor Design 🎨 - Claude Design, running ...
With Design Mode, you can now point, draw, or talk to update your UI.
微软研究人员发现Anthropic旗下Claude Code的GitHub自动化流程存在漏洞,攻击者可通过提示词注入攻击,劫持CI/CD工作流窃取敏感凭证。漏洞源于Claude Code的读取工具未像Bash工具那样设置沙箱防护,恶意提示词可绕过两层防护读取系统文件中的API密钥等凭证。Anthropic于4月29日收到报告后,在5月5日发布Claude Code 2.1.128修复,通过限制对/proc/目录下敏感文件的访问防止信息窃取。
本期聚焦三大Agent工程议题:1)Emergent通过多智能体编排+定制容器,6个月实现1亿美元ARR,覆盖190国850万无编程背景用户;2)Chrome DevTools团队为MCP设计Agent接口,提出Token燃油效率、错误自愈、工具Schema设计和三层信任边界;3)OpenClacky创始人指出每个Agent功能都是一个缓存失效面,第一代RAG架构因90%召回率不足和嵌入成本高而失效。
GitHub 发布开源工具包 Spec Kit,旨在解决 "vibe coding" 的最大弱点——AI 常在规则未明确时就开始编码。它把流程从 "让 AI 直接构建" 改为 "先写产品规范,再让 AI 根据规范实现"。当前 AI 编码模式常因松散提示直接跳入代码,导致需求薄弱、边界遗漏和反复返工。Spec Kit 推动反向流程:先定义产品功能,再澄清差距、制订技术计划、分解任务,最后让 agent 执行。规范成为可执行的开发合约,支持 Copilot、Claude Code、Codex、Gemini、Cursor、Qwen 等 30+ agent 集成。项目已获 109K+ 星标。
OpenCut 是一个 GitHub 5 万星的开源 AI 剪辑工具,主打本地优先,视频无需上传服务器,永久免费、无水印、无会员墙。目前处于 Early Beta 阶段,网页版支持基础剪辑(导入视频、时间线、切割),但导出、特效、转场等功能仍在开发。路线图包括 Rust 重写核心、Web+桌面+移动统一、插件系统、Editor API 及 MCP Server(让 AI Agent 直接调用工具),目标是成为可编程的视频底座,而非对标剪映的封闭工具。
http://x.com/i/article/2060717603987791878
Obsidian 加上 Codex,再配合合适的 API、MCP 和 Skills,基本上能替代目前 90% 以上的 AI Agent 产品。 这是我将笔记从 Notion 迁移到 Obsidian 一个月之后的感受。
Anthropic 发布 Claude Cowork,一款运行在 Claude 桌面应用中的知识工作智能体。它可读写本地文件、跨 Slack 和 Google Drive 等应用协作,执行多步骤任务并生成带引用的实际交付物。核心能力包括本地文件访问、子智能体、长时间运行和定时任务。Claude Cowork 区别于对话式 AI 工具,支持用户描述目标与期望结果后自动规划执行。指南还介绍了产品矩阵(对话聊天、Claude Code 编程、Claude Cowork 跨应用知识工作)、设置要求、权限模型、七种常见工作流(如研究简报、会议准备、定期报告)以及营销和产品管理等插件。
同一事件,精选展示《Claude Cowork 入门最佳实践》加入Anthropic前从未写过代码的销售成员Jared Sires,利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS(Claude Drafts),通过Claude API根据客户邮件草拟回复,每天节省2-3小时。该系统基于约4,300行代码(几乎全由Claude Code编写),从Google Drive和Anthropic公开文档提取上下文,并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能,通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。
关联讨论 1 条Claude:Blog(网页)Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。
关联讨论 1 条MarkTechPost(RSS)谷歌于 6 月 2 日推送 Chrome 149 稳定版,覆盖 Windows、Mac 和 Linux 平台,含 429 项安全修复。新增端侧 AI 模型管理选项,用户可拒绝下载或移除已下载模型。测试中的“AI 模式”绕过搜索首页,尚未正式上线。DevTools 的 MCP 服务器及 AI 智能体命令行接口稳定,新增自定义 HTTP 头模拟和改版 AI 助手面板;CSS 面板加入 Gemini 驱动的样式自动补全。Chrome 149 正式推出 ARM64 Linux 官方 deb/rpm 构建包。
腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体。它可读取文件、调用工具、撰写报告、制作演示文稿、分析数据,支持100+专家角色。通过MCP连接GitHub、Jira、Notion、Gmail、Google Drive、Slack等,在沙箱中运行任务,并可通过Slack、Telegram、Discord、微信远程控制。WorkBuddy将大任务分解为小任务,为复杂工作启用专家团队:多个专业子智能体并行工作,一个主导智能体协调最终输出。用例包括阅读PDF/图片、创建报告、分析电子表格、生成内容、自动研究新闻并发送定时摘要、从手机运行桌面任务、无需编码构建应用等。
fofrAI 使用 Gemini 3.5 Flash 和 Antigravity CLI 实验 AI 智能体的自主性和速度。结果:20 分钟内在 Linux CPU 上安装并运行原版 Stable Diffusion 1.5,完成推理生成图像;基于 Lora 和 SD 论文,用 10 张图片从零实现 Lora 微调器(约 1 小时 30 分,主要为 CPU 训练);通过 modal 约 20 分钟找到 GPU、获取 Ideogram v4 权重并运行推理。该推文展示了当前长周期智能体任务的基线案例。
Where's the baseline for impressive long horizon agent tasks today? What are you seeing this week that makes you go "woa...
Greg Eisenberg 通过六轮 Prompt,用 Codex Sites 做出自动更新的创业想法看板。关键步骤:1)调用 sites 插件,指令“save for review, do not deploy”阻止自动部署;2)选 Cloudflare D1 实现持久化;3)设安全动作,限定 Agent 只能通过预设路径改数据;4)编写 Startup Ideas Admin 技能,使操作手册化;5)存档为 V1 并验证版本回滚;6)新对话加载技能,跨线程写入并成功上线,证明跨会话可重复运营。
http://x.com/i/article/2062661069458620416
OpenSquilla通过Meta Skill将多个Skill按YAML定义步骤、顺序和依赖,在Runtime层预先校验,防止无效调用。在PinchBench 1.2.1上,三模型混用的OpenSquilla与Claude Opus 4.7版OpenClaw得分几乎相同,但Token少一半,成本不到1/9。将Superpowers下14个Skill组合为Meta Skill后,输入Token压缩至67%。支持多模型,用本地小模型分类任务,模型切换仅在新Session生效;子Agent压缩上下文,400K窗口内可保持记忆。同一会话执行8个框架调研报告,仅花费7美分,Token和成本精确到小数点后四位。
百度智能云与FluxA建立战略合作,共同为Agent经济搭建基础设施。百度智能云提供可交易商品体系、自雇佣交易机制、能力工具箱及出海分销通道;FluxA作为支付底座,提供低费率高频微交易、Financial Harness安全授权、全球收款与Token Paywall。目前超9万个Agent使用FluxA钱包,超1万个AI Agent资源完成商业化。今年一季度中国两地区OPC新增超6000户,日均Token消耗140万亿。DAA被视为AI时代衡量生态价值的核心指标。
通义实验室推出全新评测基准PawBench v1.0,面向个人助理与通用智能体场景,将底座模型与运行框架Harness纳入同一体系进行交叉评测。评测矩阵包含9个模型与3个Harness(Hermes、OpenClaw、QwenPaw),覆盖150道真实任务共4050个测试单元。结果显示,QwenPaw(76.4分)、OpenClaw(75.4分)、Hermes(70.4分)之间存在显著分差,Harness环境对表现的影响甚至大于模型本身。PawBench还通过切片分析揭示了Harness在产物校验、Skill主动发现和Web搜索默认可用性等方面的关键差距。项目已开源。
Kimi 推出新工具 Kimi Work,继承 Kimi Code 核心功能和 Kimi Agent 的建站、PPT 等专业 Skills,并打通金融、科研、法律等专业数据库。用户无需终端或命令行,安装客户端后通过文字描述需求即可让系统拆解任务、并行执行、调用工具、使用浏览器、整理文件夹,最终交付文档、表格、PPT 等成果。最多可同时调度 300 个 Agent 互相配合完成任务。