开源项目OpenSquilla通过智能路由架构,在保持与OpenClaw相近性能(0.9251分)的同时,将复杂AI任务处理成本从6美元大幅降至0.68美元。其核心是将简单任务分配给廉价模型,仅复杂任务调用Opus等顶级模型。系统具备四层记忆结构模拟人脑认知,支持按需加载16种工具,并设有三档代码沙箱安全防护。项目提供统一后端,支持网页、命令行及Slack、飞书等平台接入,兼容OpenAI、Claude、Gemini、DeepSeek等20余家主流模型。
CODEX SKILL THAT TURNS LOCAL SEARCH INTO CLIENT LEADS! I made a Codex skill that helps find local businesses that may ne...
在Baidu Create 2026上,李彦宏阐述了智能体时代的关键议题。他提出了“日活跃智能体”(DAA)作为衡量价值的新核心指标,并探讨了“AI进化理论”,该理论涵盖智能体、个人与组织三个层面的协同演进。同时,百度展示了为大规模支持智能体而构建的全栈基础设施。这些观点共同勾勒出智能体时代发展初期的基本框架与方向。
泄露的Gemini Spark内部截图显示,新模型整合了Agent与Chat模式,重点提升高级工具使用和Skills创建流程。然而,当前Skills仅支持复制粘贴MD文件创建,缺乏直接导入选项,且未见Browser或Computer Use功能。这表明Google在推进AI工具能力时采取了渐进策略,优先打磨核心流程,而非一步到位开放激进功能。
GOOGLE 🔥: New Gemini Spark screenshots featuring advanced tool use and Skills creation flow. It seems like there won't ...
飞书开源命令行工具lark-cli在45天内获得超过1万GitHub star,成为国内首个破万星的办公套件开源项目。该工具允许AI通过命令行直接操作飞书,执行建群、建文档等任务,且每一步操作都可预览、可审查,与云端不可见的MCP模式形成对比。其主干代码已合并10位外部开发者的贡献,而同类产品钉钉和企业微信则为零。这种可见、可控的特性被视为开发者放心将任务交给AI Agent的前提,预示着一句话指令驱动完整项目流程成为可能。
OpenAI is working on a dedicated setting for Codex to allow users to enable "Locked use." > Let Codex use your Mac while...
Kill your SaaS with Zo Computer - Live from Singapore 🇸🇬 https://x.com/i/broadcasts/1qKVmQBbkOZxB
The new Gemini Spark model will have Agent mode / Chat mode. New advanced use of tools.
Vercel基于十万亿token消耗的分析显示,Anthropic在费用上占61%居首,而Google以38%的token量领先。Claude Opus用于关键任务,Gemini Flash则以低成本大用量见长。B2B业务贡献40.7%的费用却仅产生29.7%的token。Agent请求占比激增至58.9%,其token消耗是普通聊天的2.6倍。
近期AI领域焦点从模型能力转向Agent工程化落地。Anthropic发布Claude Code实践,强调放弃RAG索引,采用Agentic Search导航大型代码库,并推出管理并行会话的Agent View及Computer Use最佳实践。OpenAI的Codex推出独立光标的Computer Use功能,解决了Windows平台沙箱安全问题,其负责人指出Codex正演变为可执行长期自主任务的本地Agent。国内厂商如阿里、腾讯等也在同步推进Multi-Agent实战,标志着AI Agent进入全面工程化应用阶段。
本周科技领域聚焦Agent工程化落地。Anthropic与OpenAI分别将Claude Code和Codex集成至IDE,并详细披露了Computer Use、Windows沙箱等关键实施细节。行业同时推出了包含12项指标的Agent评估体系及开放的Agent Skill标准。国内TiDB、腾讯云Harness、AgentScope Java也相继发布相关产品,共同推动Agent技术进入实际生产环境。
http://x.com/i/article/2055195078931709952
Dario在其最新文章中重申,强大的AI(或称AGI)将在2028年到来。他定义的“强大AI”并非仅在单一任务上超越人类,而是在大多数重要领域比顶尖专家更聪明,具备自主推理、创造、编码、研究和通过数字界面行动的能力。他进一步用“数据中心里的天才国度”来比喻,即数百万个这样的高能力AI代理可以并行运行,其工作速度远超人类,并能像压缩在计算基础设施中的整个诺贝尔奖专家群体一样协作。其最新博文预测,到2028年,美国前沿实验室将发布能力实现阶跃式提升的新模型。
Codex 终于支持手机上的 ChatGPT 远程控制了! 可以自动同步你绑定的 Codex 设备上的所有对话,而且可以直接发送指令、审批权限、监控进度。 我写一下设置的教程: 1. 点击桌面端 Codex 客户端左侧的"设置 Codex ...
Multi-agent's quiet problem: token cost scales with agents × turns × tool calls. It compounds fast , and that's the bill...
Wrote a skill that runs codex /review in a loop until there's no booboos anymore. Caveat: It won't fix system architectu...
飞书CLI工具发布一个多月即获10000 Star,显示市场对其方向的认可。在AI时代,SaaS软件的竞争正从传统UI转向对Agent的适配。飞书通过开放全部能力的CLI,允许用户和Agent完全绕过复杂UI进行操作,大幅降低了使用门槛。其CLI设计采用分层结构,并配套大量Skills作为“说明书”,便于Agent调用。同时,CLI在命令包装上注重对Agent友好,内置Dry Run、结构化输出等功能,方便AI调试。这为创业或构建Agent提供了新路径,可依托飞书CLI和Agent框架,直接利用其聊天界面、多维表格及组织成员作为基础设施。
Google即将发布的Gemini Spark标志着AI Agent时代的实质性进展。它并非单纯的聊天机器人或模型升级,而是演变为一个能24/7持续运行、拥有持久化记忆的个人操作系统级代理。其核心在于能主动处理邮件、预约会议、跟进任务,并持续从用户操作中学习。Google的独特优势在于整合了用户的搜索历史、位置、日历、邮件等全生态数据,构成了强大的护城河。尽管存在数据与隐私风险,但该产品有望彻底重构重度Google用户的工作与生活流程,使5月的Google I/O成为Agentic AI发展的关键节点。
Codex现已支持通过手机上的ChatGPT应用远程控制绑定的桌面设备。该功能可实现对话自动同步,并允许用户直接发送指令、审批权限及监控进度。设置需在桌面端Codex客户端内启动,并建议使用Google Authenticator完成多重因素验证。绑定后,手机ChatGPT应用将出现Codex侧边栏,用于访问和控制桌面端对话。目前该功能仅支持Mac版Codex,Windows版本仍在开发中。
Codex 终于支持手机上的 ChatGPT 远程控制了! 可以自动同步你绑定的 Codex 设备上的所有对话,而且可以直接发送指令、审批权限、监控进度。 我写一下设置的教程: 1. 点击桌面端 Codex 客户端左侧的"设置 Codex ...
蚂蚁集团AGI团队开源了万亿参数旗舰思考模型Ring-2.6-1T。该模型专为处理Agent工作流、代码工程、长时序执行等复杂任务设计,具备上下文理解、规划与工具调用能力,并提供高效与极致两种推理模式。其采用IcePop算法稳定训练,并借助MoE架构降低部署门槛。完全开源允许企业将模型部署于本地或端侧,确保数据不出域,有效解决了金融、政务等敏感领域对数据安全与合规的迫切需求。模型已在Hugging Face和ModelScope平台发布。
飞书CLI在GitHub上的star数已过万,作者认为这印证了飞书是国内对Agent最友好的平台。作者提出评估开源项目是否靠谱的四项关键标准:star数量反映项目热度;活跃的commit历史表明项目持续维护;issues的数量与关闭速度体现用户活跃度和问题处理效率;社区PR被合并的记录则显示项目对社区参与的重视。飞书CLI在这些方面均表现良好。
我靠!刚看到GitHub上,飞书CLI的star数过万了hhh 牛啊。。。 感觉那个周末一起床,发现飞书开源CLI才过去没几天==。
该提示词要求Claude基于普通版总结骨架,以毒舌、尖锐但不恶毒的风格重写微信群聊总结。具体包括扮演专业评论员,为发言排行添加毒舌备注、将群友画像改为“不留情面版”,并用戏谑口吻撰写概览。同时设定了创作红线,如不涉及人身攻击、私人信息或医学诊断,仅针对群内公开行为进行调侃。技术实现依赖于wx-cli,推荐使用Claude Code和Claude Opus 4.6模型以达到最佳效果。
baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 ...
Grok Build is amazing. The early beta just dropped for SuperGrok Heavy users and the first real feedback from developers...
http://x.com/i/article/2053655813877870592
@op7418 @jimail0218 支持,修改~/.codex/config.toml,添加[features]remote-control = true,然后终端运行codex remote-control,然后手机端就能看到了,好用...
Codex现已支持通过手机上的ChatGPT应用进行远程控制,实现了跨设备对话同步与指令操作。用户需在桌面端Codex客户端内启动设置,并完成多重因素验证(推荐使用Google Authenticator)。绑定后,手机ChatGPT App将出现Codex侧边栏,可查看并控制已绑定桌面设备的所有对话,直接发送命令。目前该功能仅支持Mac版Codex,Windows版本仍在开发中。
xAI推出Grok Build早期beta版,这是一个面向SuperGrok Heavy订阅者的代理CLI工具。其核心突破在于并行子代理机制,主代理可指挥多个子代理协同执行编码、研究等任务,实现结构化效率革命。战略上选择CLI界面,以支持脚本化、版本控制及与开发现有工具链集成。高价订阅旨在筛选重度开发者,获取真实项目中的高质量训练数据,加速产品迭代。此举标志着AI代理时代正式开启,未来开发者角色将向指挥AI代理军团协作转变。
An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...
OpenAI 在 ChatGPT 移动应用中推出 Codex 预览功能,用户可远程连接运行 Codex 的本地机器(如笔记本或 Mac mini)。通过安全中继层架构,系统能实时同步工作线程、审批请求与项目上下文,并回传截图、终端输出等结果,而所有文件与凭证均保留在本地,不上传云端。用户可在移动中启动任务、审阅输出或决策分叉,实现“云端中继+本地执行”的混合办公模式。目前该功能暂未支持 Windows 端。
You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...
由于这篇文章太伟大了,所以我把它变成了一个 Agent Skill。 大家可以使用自己的 Coding Agent 安装一下这个 Skill,这样就可以用「最佳实践」来轻松地重构或者开发一个既容易跨平台、又极其接近 Native 性能的桌面...
Prime Intellect 近期在AI研究自动化领域取得重要进展。他们让Claude Code与Codex智能体完全自主运行于nanoGPT速度挑战的优化器赛道,利用闲置算力完成了近万次实验,消耗约1.4万H200小时。最终,Claude Code将记录提升至2930步,超越了2990步的人类基准。实验显示,智能体在系统整合社区主流优化方法、进行超参数扫描和策略组合方面效率极高,但在要求真正创新的“新颖性检查”环节未能突破基线。该项目将所有实验记录、日志和代码开源,使得AI自主研究从概念转化为可复现的现实。
Automating AI research is the next major step in AI We let Claude Code (Opus 4.7) and Codex (GPT 5.5) run autonomously o...
xAI 面向 SuperGrok Heavy 订阅用户推出了 Grok Build CLI 测试版,这是一个用于编码、应用构建与工作流自动化的智能体命令行工具。其发布旨在通过用户反馈迭代产品。该工具核心特性包括优化的终端渲染性能、用于审阅复杂任务的可视化计划视图、支持并行执行最多8个角色的子智能体系统、可装载团队规范与知识的技能模块,以及支持团队共享的插件市场。其底层模型 grok-code-fast-1 在 SWE-Bench Verified 基准测试中成绩为70.8%,上下文窗口为256K。
An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...
2/ Go deeper with more metrics and analyze: • Keyword demand, difficulty, CPC, and intent • Branded vs. unbranded search...
Anthropic发布Claude Code大型代码库实践指南,强调Harness配置(如CLAUDE.md、Hooks)与模型能力同等重要,是决定实际体验的关键,并指出RAG在高速迭代代码库中存在时效性局限。同时,OpenAI通过Build Hour解析GPT-Realtime-2,展示语音Agent正从聊天机器人演进为“语音→行动”的自主工作流。此外,当AI将开发周期从月压缩到小时,效率提升正引发协作方式与组织结构的重构难题。