Petdex是一个专为Codex设计的宠物商店项目,允许用户更换终端小宠物。用户可预览、下载和提交各种动态宠物,通过命令行工具如'npx petdex install <宠物名>'快速安装。在Codex中,可通过Settings → Appearance → Pets界面选择宠物,或使用/pet命令唤出或收起宠物,实现个性化终端体验。
Petdex是一个专为Codex设计的宠物商店项目,允许用户更换终端小宠物。用户可预览、下载和提交各种动态宠物,通过命令行工具如'npx petdex install <宠物名>'快速安装。在Codex中,可通过Settings → Appearance → Pets界面选择宠物,或使用/pet命令唤出或收起宠物,实现个性化终端体验。
写了一篇 OpenAI Codex App 入门指南 本来想把 Markdown 编辑为 X Article 格式分享,不过 X Article 的编辑体验还是太费时间了,明天先发公众号,再整理 X Article 格式(朋友们如果有好的 ...
This Chinese guy created agents in Claude Code for landing pages and single-handedly serves 47 small businesses a month,...
Warp团队在开源终端和文档工具后,进一步开源了内部使用的15个“Oz Skills”工作流加速工具集。这些工具覆盖五大领域:Git/GitHub协作(如自动创建PR、修复CI问题)、数据分析与标准化、Web质量审计(性能、无障碍访问、SEO/AEO)、基础设施规范(如Terraform风格检查)以及通用生产力(如文档更新、本地定时提醒)。团队强调其设计哲学是构建“工作流工具”而非简单API覆盖,并提供了便捷安装命令,旨在将提升内部效率的实践分享给开源社区。
The Warp team uses a lot of Skills to speed up our workflow, so we open-sourced them. > npx skills add warpdotdev/oz-ski...
OpenAI发布“Migrate to Codex”功能,允许用户将其他编程工具(如Claude Code、Cursor)的配置一键导入到Codex。该功能会扫描用户级和项目级配置,自动映射并迁移编程Agent的配置、规则、技能、MCP、hooks、子代理以及最近30天的所有会话等内容。对于无法自动迁移的部分,Codex会启动一个新线程,让Agent继续协助处理剩余迁移任务。
OpenAI 为 Codex 发布官方迁移方案,支持从其他 AI Coding Agents 一键导入指令、配置、技能、近30天会话等资产。迁移采用“自动迁移+残留兜底”设计:通过用户级和项目级双层扫描,执行检测、迁移、回检的四步循环;自动处理可识别配置后,对剩余部分使用 migrate-to-codex skill 手动处理。需注意 Slash commands 被归入 Skills 体系,且会话历史仅限30天。迁移完成后,必须人工复核工具权限、MCP服务器认证、Hooks行为差异等五类内容,因平台间语义或实现差异可能影响功能。
https://developers.openai.com/codex/migrate
Philipp Schmid 将主代理管理子代理的模式按控制力分为四档。模式一为内联工具调用,子代理如同函数,适用于独立任务。模式二为派发后收集,主代理可并行处理其他工作。模式三为代理池,子代理持久化并通过消息通信,支持多步协作。模式四为团队模式,代理间直接对话,主代理仅负责初始组建。核心建议是从简单模式开始,逐级升级需谨慎,因为每升一级对模型能力要求陡增,且许多任务用模式一即可解决。
http://x.com/i/article/2051654332727037955
AI工作正从聊天交互转向能直接操作计算机的智能体。Sai推出的新产品提供了一个由AI代理控制的远程计算机(通常是虚拟机),用户可通过手机或电脑与之交互。AI在私有远程桌面中自主操作真实应用程序,执行完整工作流。其核心突破在于手机成为真实软件工作的“遥控器”,繁重任务由后台持续运行的计算机完成。实际用例中,团队成员通过iMessage报告问题,Sai能在其虚拟机中复现问题、截图并交由Claude Code修改代码和提交PR,全程无需打开笔记本电脑,实现了在移动端发起并完成复杂工作。
Been dogfooding Sai with Claude Code lately and the part that's actually stuck for us isn't just the responsiveness. It'...
Gemini API 文件搜索工具近日扩展三项功能更新,旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括:多模态支持,通过Gemini Embedding 2模型实现对图像和文本的同步推理;自定义元数据过滤,允许为文件添加键值标签以结构化非结构化数据,从而提升搜索速度;精确引用功能,能够捕获并返回每条索引信息的精确来源,如页码。开发者可通过Google AI Studio的示例应用体验这些功能,与图像和文档库交互,提问并追溯答案来源。
Each agent ships with the connectors, skills, and subagents the task needs, ready to use as-is or adapt to your firm's o...
Unsloth发布指南,演示如何利用Gemma 4和Qwen3.6的GGUF模型,在仅需24GB RAM的本地机器上运行完整的agentic coding工作流。该方案通过Unsloth API端点和llama.cpp驱动,支持自愈式tool calls、代码执行和网页搜索。此举打破了以往必须在Claude Code等高端界面的性能与本地部署的隐私/成本之间二选一的困境,使得开发者能以近乎零成本在本地享受顶级交互体验,标志着开源模型开始无缝接管复杂的AI智能体工作流。
We made a guide on how to run open LLMs in Claude Code, Codex and OpenClaw. Use Gemma 4 and Qwen3.6 GGUFs for local agen...
Ollama通过命令ollama launch claude-desktop,将Ollama Cloud中的开源模型(如Kimi、DeepSeek、Qwen)无缝接入Claude Desktop应用。用户可在Claude Cowork和Claude Code中直接使用这些模型,享受完整的本地文件读写、应用交互及代码智能体等桌面级功能,打破了以往在本地开源模型与Claude高端界面间必须二选一的限制。通过--restore参数可轻松切换回Anthropic原生模型。此举消除了AI工具链的关键壁垒,标志着AI竞争重点正转向工作流的无缝融合。
🤯 Ollama now supports Claude Desktop via Claude's built-in third party inference. ollama launch claude-desktop This all...
开发者 Tom 开源了 open claude design 项目,宣称对 Claude Design 的还原度超过 95%。该项目历时 72 小时开发,包含超过 18700 行代码和 30 多种设计技能,支持 71 套以上设计系统,并能兼容多种主流代码代理工具。项目旨在成为 Claude Design 的开源替代品,后续将持续更新,代码已托管于 GitHub。
正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71...
Cursor团队认为,模型能力决定上限,而Harness(模型控制框架)决定其实际表现。他们采用愿景驱动与实验闭环的方法,通过线上A/B测试和离线评估持续优化。随着模型能力提升,Harness设计正从“守卫式”转向“动态获取式”,即减少静态信息注入,赋予模型更多动态获取上下文的权力。衡量体系结合离线基准、在线A/B测试及留存率、LLM判读等质量指标。Harness需为不同模型重度定制,贴合其工具格式与Prompt风格。团队判断AI编程的未来是多Agent协作,其成功关键取决于能协调任务分配与工作流缝合的Harness工程。
Claude Code创始人Boris Cherny通过30分钟视频,系统讲解了该工具的高级工程化用法。核心观点是:为Claude提供越多上下文,它就越智能。视频详细演示了如何通过CLAUDE.md文件在企业、项目、本地层级注入上下文规则,如何将内部工具集成到Agent工作流,并优化了数十个终端设置与权限管理等细节。他指出,多数用户仅发挥其10%潜力,仅用于简单对话,而未能将其作为驱动整个工程团队的生产力基础设施。
Anthropic计划为其Claude Cowork平台推出名为“Orbit”的主动式AI助手。该助手能够主动分析用户来自Gmail、Slack、GitHub、日历、Drive、Figma等多个应用的数据,并生成个性化洞察。用户还可以部署“Orbit apps”并置顶常用功能以便快速访问。这一动向标志着AI助手正从被动响应转向主动服务模式,OpenAI的ChatGPT Pulse、Google及Perplexity也都在开发类似功能。据悉,Orbit很可能作为一项高级功能,仅向Claude Max订阅用户开放。
Your AI chatbot can't ship. It answers. It suggests. It generates code you still have to wire up yourself. Close the tab...
Anthropic联合Google Cloud正式发布《Agent Stack》指南,提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标,由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议,支持串行、并行等工作流,并具备记忆功能。实际应用表明,AI能在几秒到几分钟内完成以往需数小时的任务,将“AI建公司”从概念转化为可复制的工程模板,推动工作模式向人类指挥AI团队转型。
一个名为CLAUDE.md的百行文件在GitHub上迅速走红,一周内获得超4.4万星。它没有依赖和配置,仅将Andrej Karpathy总结的LLM编码坏习惯浓缩为四条核心规则:先思考再编码、简约至上、手术式修改、目标驱动执行。开发者只需将其置于项目根目录,Claude Code等工具便能自动读取并遵循,从而显著提升代码质量,减少返工和token浪费。此举被视为对当前需要反复纠正AI模型的开发体验的集体反叛,以零成本方案为AI编码设定明确规范。
Sakana AI在ICLR 2026上发表研究,提出一个仅70亿参数的“指挥者”模型。该模型不直接解决问题,而是通过强化学习训练,专注于为混合开源与闭源模型的工作者智能体设计通信拓扑结构,并为每个工作者生成精准指令以发挥其特长。经随机化智能体池训练后,它能在推理时适应任意智能体组合。其关键创新在于,当允许指挥模型将自己也选为工作者时,系统会形成递归拓扑,实现动态测试时扩展。该模型在GPQA-Diamond和LiveCodeBench上达到SOTA水平,在AIME25和GPQA-D上的性能比最佳单体工作者提升约3%,这相当于前沿模型一个代际的改进幅度,且增益完全来源于协同优化。
一款名为“xbox-mac-ctrl”的开源工具,可将Xbox手柄转变为Mac电脑的通用遥控器。用户能通过手柄控制YouTube、B站等视频播放(全屏、快进、音量调节),并操作微信读书、浏览器及任意Mac软件(如Tab切换、滚动翻页)。该项目由开发者借助DeepSeek v4 Pro通过几轮对话编程实现,旨在满足躺卧时遥控刷小说、看视频的需求,并鼓励开发者fork以适配Switch手柄等其他硬件。
DeepSeek v4 Pro还是可以的。 几轮对话,实现一个工具,用xbox手柄控制电脑应用和浏览器。 当遥控器,躺床上刷小说和看视频。
借助Algrow的MCP平台,Claude现已能直接分析YouTube等平台的视频内容,自动生成包含数据表格、爆款拆解与留存曲线的深度报告。这标志着大模型竞争重点转向生态建设,第三方开发者通过工具链迅速弥补了Claude的原生视频短板。该功能为内容创作者提供了高效分析竞品、提炼爆款公式的生产力工具,并预示视频研究Agent时代的开启。目前处于免费试用阶段,未来订阅定价亲民。
open-slide是一款专为AI agent设计的幻灯片框架,能将自然语言提示直接转化为精美的完整演示文稿。其核心在于将每页幻灯片构建为React组件,并在固定画布上工作,而非简单生成Markdown。框架内置多项agent技能:通过/create-slide指令一句话生成整套幻灯片;支持在浏览器中对元素添加评论,并由agent通过/apply-comments一键应用所有修改;同时集成演示模式、演讲者笔记和定时器,并可一键导出HTML或PDF。它兼容Claude Code、Cursor等多种编码agent,其意义在于将AI agent的能力从“生成文字”升级为“输出可直接呈现的最终成品”,填补了AI代理与真实生产应用之间的关键空白。
Introducing open-slide - The slide framework built for agents. Prompt your agent, get a polished deck. $ npx @open-slide...
OpenAI Codex推出Auto-review新模式,解决传统人工审批与完全放权两种治理范式的缺陷。该模式在智能体越界时,由独立AI代理审批,评估用户意图、运行环境、安全策略和动作影响。拒绝时提供理由,超一半情况主智能体能自行找到更安全替代方案。效果上,自动批准率达99.1%,将打扰人类频率降低约200倍,有效拦截多数攻击。但团队坦承局限:非确定性安全保证,不能防御策略性欺骗,是安全与速度的折中。
Clicking the "Approve permission" button is difficult. We show that agents can do that for you. Check out our alignment ...
World2Agent开源了W2A协议,旨在为AI代理建立标准化的世界感知层。该协议采用“世界→传感器→代理”架构,传感器从GitHub、X帖子、日志等多种数据源中提取信息,并生成包含事件内容、来源及背景的结构化实时信号。这使得AI代理能主动感知外部变化并自主响应,无需等待人类提示。传感器可重复使用,避免了为每个新数据源重复开发轮询、去重等逻辑。与侧重代理能力的MCP不同,W2A主要解决代理“何时应被唤醒”的问题。目前该协议已支持多种主流代理,并邀请开发者共同构建传感器生态。
The future belongs to proactive agents. But without real-time perception, they're stuck reacting. "World2Agent" isn't a ...
Ora发布的《The State of Agent Readiness》报告指出,当前99%的互联网网站对AI代理基本不可用,中位数得分仅36分。代理在登录、交易等关键功能上失败率高,因互联网基础设施仍为人类设计,导致其操作成本高昂、效率低下。目前仅约1%的公司真正为AI代理优化,包括部分原生公司与基础设施巨头。报告预测,“Agent Readiness”得分将成为产品能否被AI代理推荐的关键指标,低分企业可能丧失竞争力。尽管许多公司声称支持相关标准,但实际符合规范者极少。
Stripe Treasury 的新方向致力于将公司财务转化为AI可调用的基础设施,超越多币种账户和稳定币等传统功能。通过Stripe MCP,AI应用可直接集成Treasury,使智能代理能执行查询余额、支付发票、创建卡片、管理现金流等操作,并借助人工介入循环机制控制风险,推动AI原生财务运营的发展。关键功能包括:支持多币种与稳定币持有、免费向美国企业转账、通过电子邮件向160个国家支付、赚取积分抵扣Stripe费用、使用Stripe卡消费并获得2%现金返还、在移动应用查看余额,以及从任何AI应用使用Treasury。
Introducing the new Stripe Treasury: • Hold funds in multiple currencies and stablecoins. • Instantly transfer money to ...
OpenRouter 又上了匿名新模型Owl Alpha! 1M 上下文,强大的工具调用能力! 猜猜他是谁家的哈哈😂
针对AI Agent领域框架频出、基准动荡的现状,一篇实战指南指出“跟上所有东西”是最差策略。核心建议是过滤99%的噪声,专注于变化缓慢、具有长期复利价值的基础概念,如上下文工程、工具设计、Orchestrator-Subagent模式、评估体系和MCP协议。应避免追逐短期热点框架。行动上,应从可量化的业务目标出发,优先建立可观测性与评估体系,用真实失败驱动迭代。在AI加速发展的背景下,胜出者将是能专注复利原语并产出实际作品的人。
http://x.com/i/article/2048881094637080576
I've never used an agent for the cliches of ordering food, grocery shopping, or booking travel. But I repeatedly use Com...
针对通用语言模型懂交互却不懂数据、专用模型精通数据却缺乏交互能力的科学AI困境,UIUC团队受《阿凡达》“Tsaheylu”神经连接启发,提出了Eywa接口框架。该框架让语言模型负责理解指令与调度,调用如Chronos、TabPFN等专用模型处理数据,从而协同发挥两者优势。初步实验效果良好,长期挑战在于语言模型能否达到专用模型的领域性能。
New stealth model: Owl Alpha! Owl is a high-performance foundation model designed for agentic workloads. Powerful tool u...