Raycast发布V2 Beta版本,核心转变是从一个单纯的启动器升级为“启动器+AI Agent”的集成工具。新版对整体UI和基础架构进行了全面重构,包括重做启动器底层、重新设计搜索与扩展功能。搜索功能得到升级,文件搜索被整合进主搜索框以提升速度。AI能力显著增强,新增了独立的AI Chat输入框和聊天窗口,并支持Skills、Agent和Memory功能,同时内置了语音输入。
Raycast发布V2 Beta版本,核心转变是从一个单纯的启动器升级为“启动器+AI Agent”的集成工具。新版对整体UI和基础架构进行了全面重构,包括重做启动器底层、重新设计搜索与扩展功能。搜索功能得到升级,文件搜索被整合进主搜索框以提升速度。AI能力显著增强,新增了独立的AI Chat输入框和聊天窗口,并支持Skills、Agent和Memory功能,同时内置了语音输入。
dAI <> @MiniMax_AI one of the leading teams in open source AI hosted us in Shanghai we discussed the infra we're buildin...
Will be giving a talk titled "You should do RL for long-running agents (and use RLMs)" at 4pm on Sat at AI Engineer Sing...
Notion发布开发者平台,其战略并非简单追逐AI Agent风口,而是让Agent成为平台的核心用户。其CLI工具设计精简、自描述且token占用低,专为Agent优化。平台提供包括数据同步、工具调用和托管沙盒在内的完整基础设施,并允许第三方Agent(如Claude)通过API无缝接入,统一工作空间以解决上下文碎片化和工具调用不稳定等痛点。Notion整合了CLI、Workers、数据库同步等组件,旨在成为Agent时代的操作系统,未来可能由Agent替代人类进行构建。早期采用者与观望者之间的差距或将迅速拉大。
BIG one for devs today. Introducing the Notion Developer Platform: - Notion CLI, ntn (Notion in your terminal) - Workers...
Long-running agents shouldn't pay frontier-model prices for every turn. We've been quietly building our agent with conte...
Gemini Spark 👀
谷歌将在I/O大会上发布新的Gemini Spark智能体。它将作为全天候AI助手,通过连接应用、技能、聊天记录、位置等个人信息来学习用户行为,从而协助处理收件箱和在线任务等日常事务。用户使用越多,其理解能力越强。为提升效率,Gemini会保存远程浏览器数据(如登录信息),但用户可在设置中清除数据或关闭相关智能功能。
Gemini Spark 👀
Can AI do the job of a financial analyst? We just released V2 of our Finance Agent Benchmark and tested the frontier mod...
OpenAI 为在 Windows 上实现 Codex 的“默认安全”体验,从免提权沙箱演进到提权沙箱。Windows 缺乏原生进程级约束,初期方案通过合成 SID 和 Write-Restricted Token 限制文件写入,但网络封锁只能依赖环境变量软拦截,无法强制生效。团队最终放弃免提权约束,转向创建独立本地用户(在线与离线沙箱用户),需一次性管理员权限安装并配置防火墙规则。通过引入 codex-command-runner.exe 作为中介,解决跨用户创建受限令牌进程的权限难题,形成四层架构,在保障安全的同时最小化对主流程的侵入。
We are continuing to invest in making agents work better on Windows. Highly recommend reading David's engineering post o...
上下文是AI Agent执行任务时动态拥有的全部信息总和,包括系统提示、对话历史、检索文档等,其管理属于“Context Engineering”。上下文窗口则是模型单次推理能处理的最大token数量的硬性技术限制。两者关系如同厨房操作台面积与台上实际摆放的食材工具。开发中的核心挑战在于所需上下文常远超窗口容量,因此需通过摘要、选择性检索等策略,在有限窗口内高效管理最有价值的内容。
开源项目OpenSquilla针对大语言模型应用Token消耗过高的问题,提出了智能模型路由与本地向量检索相结合的解决方案。系统能自动判断任务复杂度,将简单问题路由至廉价模型,复杂任务则分配给更强模型,且路由决策在本地完成,不消耗Token。通过增量发送与缓存命中机制,实际传输Token减少了90%以上。其记忆系统能在上下文将满时自动筛选并压缩关键信息,支持混合检索。项目还具备成本统计、安全沙箱、支持OpenClaw一键迁移及定时任务等功能,显著提升了使用效率与经济性。
杨植麟在视频中拆解Kimi K2模型的训练,仅花费460万美元便在编程大战中击败GPT-5.5等对手。其通过极致优化、线性注意力等架构创新,抹平资源差距,标志AI竞赛规则改变,小团队以聪明设计颠覆大厂传统玩法。
Anthropic发布了Claude计算机操作官方指南,核心解决了截图发送至API时因静默压缩导致的点击坐标偏移问题。关键在于客户端预先将截图缩放至1280x720等标准分辨率,并将指令置于截图前发送以提高精度。模型方面,Sonnet 4.6机械点击精度更高,Opus 4.7则支持更高分辨率。安全上必须在隔离环境中运行并设置高风险操作人工确认。Browser Use适合结构化Web任务,Computer Use则适用于桌面应用等非结构化场景。
OpenAI团队为Codex在Windows上构建沙箱时,因系统缺乏原生内核级工具,评估并否决了AppContainer、Windows Sandbox和强制完整性控制(MIC)三个现成方案。最终自研方案结合专属Windows SID与写受限令牌,在内核层实现无需管理员权限的文件系统隔离;网络隔离则通过创建特定本地用户账户绑定防火墙规则来强制执行。该架构虽复杂,但为所有需在Windows上实现文件系统隔离的AI Agent系统提供了关键设计范式。
Shopify工程师Paulo Arruda分享构建多Agent系统的实战经验。最初为应对AI生成代码导致的PR质量问题,尝试用AI补充测试,但依赖图等方案成本过高。Claude Code预览版的推出带来转机,其基于Grep的代码搜索无需维护索引,使Agent能直接操作任意代码库。核心教训是:专才Agent(任务拆分)效果远优于通才Agent;为领域专家适配现有工作流的AI工具,比组建全能AI小队更高效、更易获得信任。
Anthropic宣布,自2026年6月15日起,所有付费版Claude计划将在现有对话额度外,新增月度专用额度用于程序化调用。该额度覆盖通过Agent SDK、claude-p命令行工具、Claude Code在GitHub Actions中的任务及基于SDK的第三方应用的调用。此举将程序化访问能力正式纳入订阅,用户无需单独申请API Key和建立计费账户即可在订阅费内运行自动化工作流,降低了个人开发者和小团队构建Agent工作流的门槛。同时,Claude Code的每周使用限额将从6月起临时提升50%,持续至2026年7月13日。
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage...
Anthropic 宣布 Claude Code 每周限额临时增加 50%,持续至 7 月 13 日。但从 6 月 15 日起,配额系统改为双轨制:在 Claude Code 官方界面内,Max 和 Pro 账户可享受原有订阅额度;若通过 Agent SDK 构建的第三方应用(如 OpenClaw、Codepilot)使用服务,额度将按 API 费率折算成等值金额,导致实际可用额度骤降。例如,Max 账户的 200 美元 API 额度在密集使用时可能半天耗尽。官方澄清月费不变,但额度分为“交互使用”和“程序化使用”两个独立池,后者按 API 速率计费。
To add some clarity: you don't pay extra. It's the same subscription, same price per month. What's new our sub now cover...
BestBlogs早报聚焦AI智能体的工程化落地。Anthropic官方指南详解Claude Computer Use最佳实践,包括解决点击偏移的根本原因、推荐分辨率策略及必须采用虚拟机隔离与人工确认门控的安全原则。OpenAI工程师分享了为Codex构建Windows安全沙箱的历程,其最终方案通过专属安全标识符和写受限令牌,实现了操作系统层面的强制文件系统隔离。早报同时指出,基准测试优异的RAG Agent在生产环境中可能出现高达30%的幻觉率。
Anthropic揭示其AI模型Computer Use点击不准是因界面截图被静默压缩导致坐标偏移。OpenAI分享了在Windows系统上为Codex构建安全沙箱的方法。一份基于超百次生产部署的Agent评估框架提出12项指标,并给出关键警示:基准测试准确率可达95%,但生产环境中幻觉率可能高达30%。此外,推文还提及李想对AI转型的看法及Shopify在多Agent应用中的实践经验。
Cola与AgenTank联合举办首届AI Agent坦克对战挑战赛。参赛者需通过Cola接入游戏,训练自己的Agent坦克进行代码优化与策略升级,并参与排位赛。比赛获得了小米MiMo 2.5 Pro模型的赞助,提供免费Token用于坦克升级。赛事限100人参与,排名最高者可获得100美金奖励,于2026年5月14日13:00开始。开发者表示,若参与踊跃,可能将名额扩展至1000人并采用新算法,旨在推动AI Agent从效率工具向娱乐对战场景拓展。
http://x.com/i/article/2054702609756508160
一位开发者对Claude即将实施的程序化使用月度积分制度表示担忧。他主要依赖Claude Agent SDK进行程序化应用和自动化,并偏好自定义开发环境,认为新规虽旨在明确使用方式,但可能限制订阅服务的充分利用,并带来不确定性。为此,他已将部分工作迁移至Codex平台,以寻求更高自由度。新规覆盖Agent SDK、claude -p命令行工具、GitHub Actions及第三方应用的使用,自6月15日起生效。
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage...
Anthropic宣布自6月15日起,对Claude付费订阅计划的程序化调用实施新的专用月度信用额度,覆盖Agent SDK、claude-p命令行、GitHub Actions及基于SDK的第三方工具。但额度普遍被认为严重不足,如Pro计划仅20美元。此举旨在将高频自动化使用引导至按量付费的API,实质上收回了用户此前以订阅价获取超额API用量的价值。依赖第三方工具进行高频自动化的用户受影响最大,而交互式聊天和Claude Code等使用方式则不受影响。
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage...
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage...
Anthropic宣布为付费Claude计划提供月度API信用额度,表面是福利,实则是取消对程序化使用的大幅补贴。此前,重度用户通过订阅能以极低成本(如$200消耗价值$1000-$2000的token)运行Claude Agent SDK和claude -p等自动化任务。新政策下,同等预算的信用额度可能半天耗尽,导致重度用户实际成本飙升5-6倍。这是Anthropic继将第三方Agent框架移出订阅后,第三次“去补贴化”行动,旨在明确区分消费订阅(供人使用)与API(供机器使用),终结“用订阅价格跑生产级Agent”的灰色地带。此举标志着AI基础设施无限补贴时代临近尾声,开发者需将预算思路从“订阅”转向“API”计价。
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage...
作者介绍了将智能体与可交互的HTML组件(Artifacts)结合的工作流。这些组件超越了静态文件,能主动执行或辅助完成任务。其核心优势在于数据完全自主(存储于Markdown中,无需数据库)、维护简单且回报率高,并能实现高度个性化的功能扩展。作者已将其应用于写作、研究、设计等多个领域,并指出简化工具栈是提升效能的关键。他将于下周进行直播,详细讲解具体实现方法。
so we built psql_bm25s. exact BM25 retrieval. native Postgres access method. ~23x faster than pg_search on the standard ...
@gilpinskyy @deepfates Sure! Here's my .env: OPENAI_API_KEY=sk-proj-bmljZSB0cnkgaHVtYW4gYnV0IG15IGNyZWRzIGFyZSBib2d1cyA=...
作者分享Cursor公司超预期的服务:在延迟回复赠送1万美元额度的私信近一周后,另一名同事主动跟进并兑现了额度与Ultra全权限,令作者盛赞其“追着用户跑”的服务精神,并决定将所有代码工作迁移至Cursor。同时,推文强调了Cursor SDK的正式发布,该SDK将生产级编程Agent转化为可任意嵌入的基础设施,允许开发者将其集成到CI流水线、自动化脚本或自有产品中,且运行环境与能力与桌面编辑器完全一致。这标志着编程Agent从辅助工具转变为可在任何地方执行任务的“操作系统”,开发者角色也向指挥Agent演进。
我等了整整一年的东西,终于来了, Cursor今天正式发布了它的SDK, 这回可远不只是又一个编程工具的小更新, 可以说是人类历史上第一次, 把生产级的编程能力,变成了可以随便嵌入的基础设施, 以前你只能在Cursor编辑器里用它的Agen...