Browserbase推出的/browser-trace工具,解决了Agent网页自动化调试的核心痛点。它能无感地完整记录Agent(如Claude)操作网页的全过程,涵盖数千个CDP事件、DOM快照、网络请求及JS异常,并自动生成交互式HTML报告。这相当于为浏览器Agent创建了“黑匣子”和可观测性系统,将浏览器从黑箱执行器转变为透明、可查询、可复现的系统,为Agent的工程化可靠性奠定了坚实基础。
Browserbase推出的/browser-trace工具,解决了Agent网页自动化调试的核心痛点。它能无感地完整记录Agent(如Claude)操作网页的全过程,涵盖数千个CDP事件、DOM快照、网络请求及JS异常,并自动生成交互式HTML报告。这相当于为浏览器Agent创建了“黑匣子”和可观测性系统,将浏览器从黑箱执行器转变为透明、可查询、可复现的系统,为Agent的工程化可靠性奠定了坚实基础。
杨斌教授在演讲中指出,企业在推进AI转型时,真正的阻力并非技术壁垒,而是“中年组织心智”与“青春期技术”之间的剧烈冲突。中年组织心智表现为追求即期绩效、线性稳进和厌恶不确定性,而青春期技术则快速迭代、充满未知。这种组织心智与技术要求的不匹配,使得企业在适应AI等新兴技术时面临根本性挑战。
I was not expecting the Codex App to be even better than using the terminal. Highly recommend everyone to try. If you ar...
Browserbase推出/browser-trace工具,通过完整记录CDP事件、DOM快照、网络请求与日志,为浏览器Agent提供了类似“黑匣子”的可观测性,解决了Agent执行过程不透明、难以调试复现的核心痛点。与此同时,蚂蚁发布的Ling-2.6-1T模型将token效率作为首要目标,以约四分之一成本达到接近GPT-5.4非推理水平的综合智能。这两项进展共同指向Agent工程化的关键:可靠的可观测性与可负担的生产成本,标志着行业竞赛正从参数规模转向真实生产落地能力。
说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...
AI 编程热潮推动 GitHub 用户规模爆发式增长,平台频发故障后启动底层基础设施重构。2025年10月,GitHub 计划扩容至原有承载能力的10倍,但预计未来业务规模将达当前30倍。增长压力导致稳定性问题,如4月23日故障影响658个代码仓库和2092个合并请求。GitHub 正优先保障服务可用性,迁移算力至微软 Azure,物理隔离 Git 等核心服务,并推进多云架构以提升抗故障能力。
微软与 OpenAI 解除了独家合作协议。次日,亚马逊云科技(AWS)便在其 Bedrock 平台上推出了三项新的 OpenAI 服务,其中包括一项双方共同构建的智能体服务。此举标志着 OpenAI 模型正式结束了在微软 Azure 云上的独家托管状态,开始通过 AWS 向更广泛的客户提供。
腾讯Harness Engineering提出,构建AI工作流仅是管道,沉淀团队的私域与领域知识才是可持续的“复利资产”与技术护城河。团队设计了一套三维知识分层架构,并通过独立Git仓库实现跨项目共享与协作。工作流与知识库紧密集成,在启动、执行、归档阶段形成闭环。同时,引入异步审批机制突破人机交互瓶颈,实现24小时无缝流转。系统坚持“文件系统即状态机”原则,将所有知识转化为可版本控制的文件资产,确保每次交付都能积累经验。
运行 stripe projects add openrouter/api 即可从命令行获取 OpenRouter 账户、API 密钥和 Stripe 计费,AI 智能体同样可以执行此操作。
运行 stripe projects add openrouter/api 即可从命令行创建 OpenRouter 账户、获取 API 密钥并配置 Stripe 计费。AI 智能体同样可自动化完成该操作,无需手动注册。
运行 stripe projects add openrouter/api 命令,即可直接从命令行创建 OpenRouter 账户、获取 API 密钥并开通 Stripe 计费功能。该操作支持自动化代理执行,实现了账户开通与支付配置的一站式集成。
通用汽车宣布在美国为约400万辆2022款及更新的凯迪拉克、雪佛兰、别克和GMC车型推送谷歌Gemini AI助手,这是Gemini在汽车行业内规模最大的部署之一。该助手将与车辆信息娱乐系统中的谷歌服务及OnStar连接能力深度集成,提供增强的AI体验。此外,Gemini更新未来将逐步扩展到其他市场并支持更多语言。
艺电(EA)首席执行官安德鲁・威尔逊透露,公司85%的质检工作已由AI和机器学习算法完成,主要用于检测游戏闪退等基础问题。尽管自动化比例高,但质检部门的招聘人数却创下新高,因为AI的检测结果仍需大量人工进行分析,反而增加了就业需求。威尔逊强调,目前AI只起辅助增效作用,但鉴于EA已将AI定为发展方向,未来不排除其更深度替代人力的可能。同时,行业普遍应用AI已成趋势,九成游戏工作室已在开发中使用AI技术。
开源项目Auto-Architecture实现了针对CPU优化的Karpathy's Loop算法,该算法原由AI研究员安德烈·卡帕西提出,常用于神经网络训练与推理的优化循环。项目将这一循环方法专门适配于CPU架构,旨在提升计算效率与资源利用率。该项目已在GitHub开源,并在Hacker News上获得103个点赞,展示了社区对其技术思路的关注。
OpenAI与微软调整独家合作协议后,迅速与亚马逊AWS达成合作。AWS宣布将OpenAI最新大模型(如GPT-5.5)接入其Amazon Bedrock平台,并提供Codex代码Agent及由OpenAI赋能的托管Agent(均为有限预览版)。企业可通过现有Bedrock接口直接调用这些模型,无需额外部署基础设施或适配新安全体系。服务用量可抵扣企业AWS合约额度,并支持命令行工具、桌面客户端及VS Code插件。
开源项目jcode通过替换Claude的默认调用框架,实现内存占用减少20倍、启动速度加快245倍的惊人提升,并支持AI代理自我迭代的“Self-Dev”模式。同时,蚂蚁发布的Ling-2.6-1T模型以“token效率”为核心,能将成本降至可比模型的四分之一,综合智能接近GPT-5.4非推理水平。这两者共同揭示AI行业竞争重点正从参数规模转向真实生产环境下的成本与效率。
说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...
国产E级超算“灵晟”在深圳全面点亮并完成测试,正式开放应用。该系统由卢宇彤担任总设计师,完全依托国产通用CPU实现软硬件全栈自主可控,未使用任何GPU加速卡。其持续双精度浮点运算性能超过2EFlops,理论上超越当前全球公开超算榜首。系统采用分阶段建设与大规模液冷技术,存储容量达650PB,并已在遥感、气象、药物研发等九大领域取得重要应用成果。
Ghostty 负责人宣布将主要开发工作从 GitHub 迁移至自建服务,仅将其保留为代码库。作为拥有超 5 万粉丝的每日重度用户,他指出 GitHub 频繁的故障已严重影响开发,特别是 Actions、PR 和 Issues 等服务的不稳定阻碍了代码评审和 CI 流程。他认为,在 AI 时代 GitHub 已成为 Vibe Coding 的关键基础设施,但微软难以维持其可靠性。这揭示了一个市场机会:若能提供更稳定、且更适合 AI 及 AI Agent 的 Git 服务,将可能占据巨大优势。其推文引用也印证了长期用户因服务问题被迫离开的无奈与趋势。
Ghostty is leaving GitHub. I'm GitHub user 1299, joined Feb 2008. I've visited GitHub almost every single day for over 1...
Builders are voting with their tokens 🔥 SiliconFlow is now the #1 third-party model provider by daily token usage On @O...
🔥DeepSeek-V4-Pro API is 75% OFF until May 5th, 2026, 15:59 (UTC Time)! Don't miss out on this massive discount. 🛠️Inte...
Browser-Trace是Browserbase团队开发的浏览器可观测性工具,可在不干扰主自动化流程(如Playwright)的前提下,通过附加只读CDP客户端,将DevTools事件、网络请求、控制台日志、DOM快照和截图系统记录到文件系统。其核心机制包括实时记录CDP事件流、定时采样截图与HTML,以及事后按页面导航和事件类型对日志分桶切片,便于检索分析。该工具适用于自动化故障诊断、实时会话监控,以及需要将网络、DOM和截图按时间戳对齐进行因果推断的场景。使用中需注意采样间隔、进程管理等实践约束。
Introducing the /browser-trace skill, Give your agent 100% observability into its browser: dump network requests, DOM co...
OpenAI宣布与AWS深化合作,将GPT-5.5等模型、Codex编程工具及Bedrock托管智能体引入Amazon Bedrock平台,以限量预览形式上线。企业客户现可直接在AWS环境中调用OpenAI模型,复用现有安全、合规与账单体系,加速AI应用落地。Codex配置简便,支持多端使用,周活用户超400万。此次合作使Bedrock集齐Claude、LLaMA等主流模型,增强了AWS在云端AI竞争中的优势。
Earlier this year, OpenAI and @amazon partnered to bring OpenAI's frontier capabilities to enterprises, startups, and cu...
本次更新主要新增了通过环境变量选择Bedrock服务层级的功能,并支持在/resume搜索框粘贴PR链接以定位创建该PR的原始会话。同时修复了多项关键问题:修正了源会话含时间线回退条目时,/branch命令可能创建失败分支的问题;解决了发送给新版模型的图像被错误调整为2576px(应为2000px上限)的问题;增强了OpenTelemetry日志记录,确保数字属性以数值类型输出;并修复了Vertex AI/Bedrock在生成会话标题等场景下可能返回无效请求错误的问题。此外,还包含对MCP工具显示、CLI命令退出行为等多项细节的优化与修正。
OpenAI 与亚马逊 AWS 宣布合作,将其 AI 模型集成到 Bedrock 托管服务平台。用户可通过 AWS 直接访问 OpenAI 的先进模型,如 GPT 系列,从而简化企业部署 AI 应用的过程。此次集成提升了模型的可访问性和管理效率。在专访中,OpenAI 首席执行官 Sam Altman 和 AWS 首席执行官 Matt Garman 强调了双方在推动 AI 普及方面的合作细节,包括对 Bedrock Managed Agents 的优化,旨在为企业提供更高效的 AI 解决方案。
基于Transformer的表格检索系统将结构化表格扁平化为序列,导致即使语义不变,不同序列化格式(如CSV、HTML)也会产生显著差异的检索结果。研究将不同格式的嵌入视为共享语义的噪声视图,以其质心作为规范表示。质心平均法能有效抑制格式特异性变异,在多个检索模型的比较中优于单一格式。此外,研究引入轻量级残差瓶颈适配器,将单格式嵌入映射向质心目标,并施加协方差正则化。该适配器提升了多个稠密检索器的鲁棒性,但改进效果因模型而异,对稀疏检索提升较弱。相关代码与模型已开源。
OpenAI is moving away from its exclusive Microsoft arrangement, making room for possible partnerships with Amazon and Go...
一项人工智能安全研究在目前规模最大的开源电子病历软件OpenEMR中发现了38个安全漏洞。这些漏洞涵盖多个类别,包括跨站脚本、SQL注入和身份验证绕过等高风险问题。该软件被全球超过10万家医疗服务提供商所使用,影响范围广泛。研究团队利用AI驱动的代码分析工具完成了此次漏洞挖掘,凸显了AI在提升软件安全审计效率方面的潜力。所有已发现的漏洞细节均已报告给开发团队进行修复。
现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。
Warp is now open-source.
根据Menlo Ventures数据,51%的企业AI生产部署采用RAG技术,而仅9%主要依赖微调。Actian推出的VectorAI DB是一款专为云访问受限、延迟高或风险大的边缘环境设计的向量数据库。它支持在本地、边缘或物理隔离网络中运行RAG流水线、语义搜索和实时AI智能体,核心优势包括数据保留在内部网络、原生集成LangChain/LlamaIndex、实时索引更新以及混合搜索功能。该产品已通过黑客马拉松验证,应用于海事AI、设备端治疗师等场景,现正式向公众开放。
We're excited to announce VectorAI DB, the first vector database purpose-built for high-performance, reliable AI at the ...
蚂蚁集团AGI团队发布Ling-2.6-1T模型,其核心创新在于聚焦token效率而非参数规模。该模型采用MoE架构,每次推理仅激活7.4B参数,结合Linear Attention与Multi-Token Prediction技术,在保持接近GPT-5.4非推理水平的高智能同时,将token成本降至可比模型的四分之一。在Artificial Analysis评测中以极低消耗获得高分,并在SWE-bench等硬核Agent场景领先。该模型专为处理海量真实生产请求设计,旨在为高频Agent应用提供高效、低成本的解决方案,并通过免费API策略加速生态布局,预示AI竞赛重心正向真实生产成本效率转移。
后续来了兄弟们,卧槽真的太炸了,同样的任务,同样的配置,速度比Claude Sonnet 4.6还快 6 倍,成本低约 50 倍, openrouter 和 官方 API 均限时免费 1 周使用时间,白嫖的机会,冲啊兄弟们! 我上周那条讲E...
OpenAI的GPT系列模型、代码生成模型Codex以及托管智能体现已正式上线亚马逊云科技。企业用户可直接在AWS环境中集成并调用这些AI服务,基于自身云基础设施构建安全、可控的定制化人工智能应用。此次合作将OpenAI的前沿模型能力与企业级云环境的安全性和可扩展性相结合,为企业部署生成式AI与自动化智能体提供了新的平台选择。
GitHub宣布自2026年6月1日起,GitHub Copilot的代码审查功能将开始消耗用户的GitHub Actions配额分钟数。这一变化意味着开发者使用该AI辅助审查代码时,将计入其月度Actions使用量,可能影响免费额度用户或用量较大的团队。此前该功能可能未计入配额或采用独立计费方式,新政策将统一至Actions计费体系。
🎉 Meet Ling-2.6-flash from @AntLingAGI, an instant instruct model with 104B total params (7.4B active). Day-0 support i...
Mistral AI 正式推出 Workflows 公开预览版,该产品定位为企业AI的编排层,旨在通过提供持久性、可观察性和容错性,帮助AI驱动的工作流从概念验证可靠过渡到生产环境。它集成于Studio平台,允许开发者用Python编写工作流,并可发布至Le Chat供组织成员触发。其核心功能包括持久化执行(支持从断点恢复)、完整的步骤跟踪与审计,以及通过 wait_for_input() 等方法实现人工介入审批。目前已有ASML、ABANCA等企业客户使用其自动化货物放行、文档合规检查等关键业务流程,将原本耗时数小时的人工操作缩短至几分钟。
Big day for us, finally sharing what we've been cooking for a while. Over the past year, we kept seeing the same pattern...