AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
4月29日周三
22:36阿绎 AYi58Browserbase发布浏览器Agent"黑匣子"工具,开启工程化可靠性的关键一步
21:39ginobefun46AI转型阻力:组织中年心智与技术青春期的冲突
21:38Greg Brockman38终端老用户转投Codex应用
21:36阿绎 AYi60Agent工程化关键进展:可观测性与成本效率成核心
21:34IT之家(RSS)62AI 编程热潮推动 GitHub 爆发增长,平台频发故障后启动底层基础设施重构
21:12The Decoder:AI News(RSS)72精选OpenAI 在与微软重组协议次日登陆 AWS
20:39ginobefun53腾讯Harness Engineering:以领域知识为护城河的AI工程实践
20:00OpenRouter:Announcements(RSS)50OpenRouter 集成 Stripe Projects,支持通过 CLI 一行命令创建账户并获取 API 密钥与计费
20:00OpenRouter:Announcements(RSS)60精选OpenRouter 推出 CLI 创建账户功能,集成 Stripe 计费
20:00OpenRouter:Announcements(RSS)65精选通过 Stripe Projects 命令行创建 OpenRouter 账户
19:07公众号:通义实验室(千问)53FlashQLA:让 Qwen 的注意力层跑得更快
18:34IT之家(RSS)52通用汽车将在美为 400 万辆 2022 款及更新汽车推送谷歌 Gemini AI 助手
16:33IT之家(RSS)51EA CEO 威尔逊:公司 85% 质检工作已由 AI 完成
16:10Hacker News 热门(buzzing.cc 中文翻译)50Show HN: 汽车架构:卡帕西循环,聚焦于CPU
14:33IT之家(RSS)64结束与微软独家合作,OpenAI 模型接入亚马逊 AWS
13:35阿绎 AYi59Damn,这可能是2026年最被低估的开发者生产力工具💻🤖!
12:33IT之家(RSS)58没用一颗 GPU 加速卡:纯国产 CPU 架构 E 级超算"灵晟"在深圳点亮,持续性能超 2EFlops 剑指世界第一
11:37歸藏(guizang.ai)46重度用户因服务不稳定而离开 GitHub,揭示 AI 时代 Git 服务新机遇
10:46SiliconFlow63精选SiliconFlow成第三方模型日用量榜首
10:37DeepSeek47DeepSeek-V4-Pro优惠延期至2026年5月
10:11meng shao67Browser-Trace:浏览器可观测性工具技能
07:40宝玉60OpenAI与AWS扩大合作,模型与工具登陆Amazon Bedrock平台
07:07Rohan Paul56FDA拟用AI实时监测数据加速药物试验
06:35Claude Code:GitHub Releases(RSS)52版本v2.1.122更新摘要
06:09Hacker News 热门(buzzing.cc 中文翻译)53OpenAI 模型即将登陆亚马逊 Bedrock:专访 OpenAI 和 AWS 首席执行官
05:38HuggingFace Daily Papers(社区热门论文)49通过表示稳定性提升表格检索的鲁棒性
05:10SemiAnalysis43AI浪潮中CPU需求复苏,市场风向转变
03:07Rohan Paul60OpenAI在AWS部署模型,结束与微软独家合作
02:09Hacker News 热门(buzzing.cc 中文翻译)56人工智能在最大规模的开源病历软件中发现了38处漏洞
01:40宝玉53AI终端工具Warp客户端正式开源,推行"人管方向,AI干活"新模式
01:37Rohan Paul51Actian发布VectorAI DB:专为边缘环境设计的向量数据库,助力企业RAG部署
01:35阿绎 AYi66蚂蚁发布Ling-2.6-1T模型,以token效率革新生产级AI
01:11OpenAI:官网动态(RSS · 排除企业/客户案例)71精选OpenAI模型、Codex与托管智能体登陆AWS平台
01:09SemiAnalysis66全球AI芯片依赖单一薄膜材料
00:38AK58Apple 推出随机键值路由 实现自适应深度缓存共享 论文: https://huggingface.co/papers/2604.22782
00:09Hacker News 热门(buzzing.cc 中文翻译)62GitHub Copilot 代码审查功能将开始消耗 GitHub Actions 配额
4月28日周二
23:53OpenRouter61精选Opus 4.7模型成本普遍上涨12-27%
23:51Ant Ling62精选AntLingAGI与SGLang团队合作推出Ling-2.6-flash即时指令模型
23:39Mistral AI:News(网页)68Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
23:38TestingCatalog News 🗞58Plurai发布vibe-training方法:快速构建高性价比AI代理实时评估与防护
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月29日
22:36
阿绎 AYi@AYi_AInotes
58
Browserbase发布浏览器Agent"黑匣子"工具,开启工程化可靠性的关键一步

Browserbase推出的/browser-trace工具,解决了Agent网页自动化调试的核心痛点。它能无感地完整记录Agent(如Claude)操作网页的全过程,涵盖数千个CDP事件、DOM快照、网络请求及JS异常,并自动生成交互式HTML报告。这相当于为浏览器Agent创建了“黑匣子”和可观测性系统,将浏览器从黑箱执行器转变为透明、可查询、可复现的系统,为Agent的工程化可靠性奠定了坚实基础。

智能体产品更新部署/工程
21:39
ginobefun@hongming731
46
AI转型阻力:组织中年心智与技术青春期的冲突

杨斌教授在演讲中指出,企业在推进AI转型时,真正的阻力并非技术壁垒,而是“中年组织心智”与“青春期技术”之间的剧烈冲突。中年组织心智表现为追求即期绩效、线性稳进和厌恶不确定性,而青春期技术则快速迭代、充满未知。这种组织心智与技术要求的不匹配,使得企业在适应AI等新兴技术时面临根本性挑战。

现象/趋势部署/工程
21:38
Greg Brockman@gdb
38
terminal 近二十年来一直是我操作电脑的主要界面。 现在换成了 Codex 应用。

Yam Peleg: I was not expecting the Codex App to be even better than using the terminal. Highly recommend everyone to try. If you ar...

OpenAI大佬观点部署/工程
21:36
阿绎 AYi@AYi_AInotes
60
Agent工程化关键进展:可观测性与成本效率成核心

Browserbase推出/browser-trace工具,通过完整记录CDP事件、DOM快照、网络请求与日志,为浏览器Agent提供了类似“黑匣子”的可观测性,解决了Agent执行过程不透明、难以调试复现的核心痛点。与此同时,蚂蚁发布的Ling-2.6-1T模型将token效率作为首要目标,以约四分之一成本达到接近GPT-5.4非推理水平的综合智能。这两项进展共同指向Agent工程化的关键:可靠的可观测性与可负担的生产成本,标志着行业竞赛正从参数规模转向真实生产落地能力。

阿绎 AYi: 说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...

智能体产品更新部署/工程
21:34
IT之家(RSS)
62
AI 编程热潮推动 GitHub 爆发增长,平台频发故障后启动底层基础设施重构

AI 编程热潮推动 GitHub 用户规模爆发式增长,平台频发故障后启动底层基础设施重构。2025年10月,GitHub 计划扩容至原有承载能力的10倍,但预计未来业务规模将达当前30倍。增长压力导致稳定性问题,如4月23日故障影响658个代码仓库和2092个合并请求。GitHub 正优先保障服务可用性,迁移算力至微软 Azure,物理隔离 Git 等核心服务,并推进多云架构以提升抗故障能力。

GitHub开源生态行业动态部署/工程
21:12
The Decoder:AI News(RSS)
精选72
OpenAI 在与微软重组协议次日登陆 AWS

微软与 OpenAI 解除了独家合作协议。次日,亚马逊云科技(AWS)便在其 Bedrock 平台上推出了三项新的 OpenAI 服务,其中包括一项双方共同构建的智能体服务。此举标志着 OpenAI 模型正式结束了在微软 Azure 云上的独家托管状态,开始通过 AWS 向更广泛的客户提供。

OpenAI行业动态部署/工程

推荐理由:微软独家协议刚解除,OpenAI就立马登陆AWS并合作推出Agent服务,云AI的阵营格局这下真的松动了,创业公司选平台不再被单一绑定。
20:39
ginobefun@hongming731
53
腾讯Harness Engineering:以领域知识为护城河的AI工程实践

腾讯Harness Engineering提出,构建AI工作流仅是管道,沉淀团队的私域与领域知识才是可持续的“复利资产”与技术护城河。团队设计了一套三维知识分层架构,并通过独立Git仓库实现跨项目共享与协作。工作流与知识库紧密集成,在启动、执行、归档阶段形成闭环。同时,引入异步审批机制突破人机交互瓶颈,实现24小时无缝流转。系统坚持“文件系统即状态机”原则,将所有知识转化为可版本控制的文件资产,确保每次交付都能积累经验。

智能体现象/趋势部署/工程
20:00
OpenRouter:Announcements(RSS)
50
OpenRouter 集成 Stripe Projects,支持通过 CLI 一行命令创建账户并获取 API 密钥与计费

运行 stripe projects add openrouter/api 即可从命令行获取 OpenRouter 账户、API 密钥和 Stripe 计费,AI 智能体同样可以执行此操作。

智能体产品更新部署/工程
20:00
OpenRouter:Announcements(RSS)
精选60
OpenRouter 推出 CLI 创建账户功能,集成 Stripe 计费

运行 stripe projects add openrouter/api 即可从命令行创建 OpenRouter 账户、获取 API 密钥并配置 Stripe 计费。AI 智能体同样可自动化完成该操作,无需手动注册。

智能体产品更新部署/工程

推荐理由:OpenRouter 把注册和计费全塞进一条 CLI 命令,Stripe Projects 加持,agent 都能自己开户了,重度 API 玩家可以省点事,不过就一工具链缝合,不打开也知道。
20:00
OpenRouter:Announcements(RSS)
精选65
通过 Stripe Projects 命令行创建 OpenRouter 账户

运行 stripe projects add openrouter/api 命令,即可直接从命令行创建 OpenRouter 账户、获取 API 密钥并开通 Stripe 计费功能。该操作支持自动化代理执行,实现了账户开通与支付配置的一站式集成。

产品更新部署/工程

推荐理由:OpenRouter 把账户创建搬到了 CLI,你的 agent 也可以直接开号了,这对于需要自动化计费流程的开发者是个便利小更新,但普通用户几乎感受不到变化。
19:07
公众号:通义实验室(千问)
53
FlashQLA:让 Qwen 的注意力层跑得更快
开源/仓库推理部署/工程
18:34
IT之家(RSS)
52
通用汽车将在美为 400 万辆 2022 款及更新汽车推送谷歌 Gemini AI 助手

通用汽车宣布在美国为约400万辆2022款及更新的凯迪拉克、雪佛兰、别克和GMC车型推送谷歌Gemini AI助手,这是Gemini在汽车行业内规模最大的部署之一。该助手将与车辆信息娱乐系统中的谷歌服务及OnStar连接能力深度集成,提供增强的AI体验。此外,Gemini更新未来将逐步扩展到其他市场并支持更多语言。

Google产品更新部署/工程
16:33
IT之家(RSS)
51
EA CEO 威尔逊:公司 85% 质检工作已由 AI 完成

艺电(EA)首席执行官安德鲁・威尔逊透露,公司85%的质检工作已由AI和机器学习算法完成,主要用于检测游戏闪退等基础问题。尽管自动化比例高,但质检部门的招聘人数却创下新高,因为AI的检测结果仍需大量人工进行分析,反而增加了就业需求。威尔逊强调,目前AI只起辅助增效作用,但鉴于EA已将AI定为发展方向,未来不排除其更深度替代人力的可能。同时,行业普遍应用AI已成趋势,九成游戏工作室已在开发中使用AI技术。

行业动态部署/工程
16:10
Hacker News 热门(buzzing.cc 中文翻译)
50
Show HN: 汽车架构:卡帕西循环,聚焦于CPU

开源项目Auto-Architecture实现了针对CPU优化的Karpathy's Loop算法,该算法原由AI研究员安德烈·卡帕西提出,常用于神经网络训练与推理的优化循环。项目将这一循环方法专门适配于CPU架构,旨在提升计算效率与资源利用率。该项目已在GitHub开源,并在Hacker News上获得103个点赞,展示了社区对其技术思路的关注。

开源/仓库部署/工程
14:33
IT之家(RSS)
64
结束与微软独家合作,OpenAI 模型接入亚马逊 AWS

OpenAI与微软调整独家合作协议后,迅速与亚马逊AWS达成合作。AWS宣布将OpenAI最新大模型(如GPT-5.5)接入其Amazon Bedrock平台,并提供Codex代码Agent及由OpenAI赋能的托管Agent(均为有限预览版)。企业可通过现有Bedrock接口直接调用这些模型,无需额外部署基础设施或适配新安全体系。服务用量可抵扣企业AWS合约额度,并支持命令行工具、桌面客户端及VS Code插件。

OpenAI行业动态部署/工程
13:35
阿绎 AYi@AYi_AInotes
59
Damn,这可能是2026年最被低估的开发者生产力工具💻🤖!

开源项目jcode通过替换Claude的默认调用框架,实现内存占用减少20倍、启动速度加快245倍的惊人提升,并支持AI代理自我迭代的“Self-Dev”模式。同时,蚂蚁发布的Ling-2.6-1T模型以“token效率”为核心,能将成本降至可比模型的四分之一,综合智能接近GPT-5.4非推理水平。这两者共同揭示AI行业竞争重点正从参数规模转向真实生产环境下的成本与效率。

阿绎 AYi: 说个暴论,2026 年 AI 行业的转折点,不是 GPT-5.5,也不是 o3,是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。 我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务, 结果真的太...

智能体AnthropicGitHub开源/仓库
12:33
IT之家(RSS)
58
没用一颗 GPU 加速卡:纯国产 CPU 架构 E 级超算"灵晟"在深圳点亮,持续性能超 2EFlops 剑指世界第一

国产E级超算“灵晟”在深圳全面点亮并完成测试,正式开放应用。该系统由卢宇彤担任总设计师,完全依托国产通用CPU实现软硬件全栈自主可控,未使用任何GPU加速卡。其持续双精度浮点运算性能超过2EFlops,理论上超越当前全球公开超算榜首。系统采用分阶段建设与大规模液冷技术,存储容量达650PB,并已在遥感、气象、药物研发等九大领域取得重要应用成果。

行业动态部署/工程
11:37
歸藏(guizang.ai)@op7418
46
重度用户因服务不稳定而离开 GitHub,揭示 AI 时代 Git 服务新机遇

Ghostty 负责人宣布将主要开发工作从 GitHub 迁移至自建服务,仅将其保留为代码库。作为拥有超 5 万粉丝的每日重度用户,他指出 GitHub 频繁的故障已严重影响开发,特别是 Actions、PR 和 Issues 等服务的不稳定阻碍了代码评审和 CI 流程。他认为,在 AI 时代 GitHub 已成为 Vibe Coding 的关键基础设施,但微软难以维持其可靠性。这揭示了一个市场机会:若能提供更稳定、且更适合 AI 及 AI Agent 的 Git 服务,将可能占据巨大优势。其推文引用也印证了长期用户因服务问题被迫离开的无奈与趋势。

Mitchell Hashimoto: Ghostty is leaving GitHub. I'm GitHub user 1299, joined Feb 2008. I've visited GitHub almost every single day for over 1...

GitHub开源生态现象/趋势部署/工程
10:46
SiliconFlow@SiliconFlowAI
精选63
👀 🚀 🙌 【引用 @SiliconFlowAI】:开发者们正在用他们的 token 投票 🔥 SiliconFlow 现已成为日 token 使用量排名第一的第三方模型提供商 在 @OpenRouter 上, • 每日约 280B token • 每月约 1.9T token • 33 个前沿模型:DeepSeek V4 系列、GLM 5.1、Kimi K2.6 等 衷心感谢每一位与我们共同构建的开发者 更多精彩即将到来🚀

SiliconFlow: Builders are voting with their tokens 🔥 SiliconFlow is now the #1 third-party model provider by daily token usage On @O...

开源生态行业动态部署/工程

推荐理由:如果你在选模型API,这个数据比任何benchmark都有说服力。每天280B token的真金白银投票,国产模型厂商里硅基流动已经跑出来了。
10:37
DeepSeek@deepseek_ai
47
DeepSeek-V4-Pro 的优惠期限已延长至 2026 年 5 月 31 日 15:59(UTC)! 【引用 @deepseek_ai】:🔥DeepSeek-V4-Pro API 提供 75% 折扣,优惠截止至 2026 年 5 月 5 日 15:59(UTC 时间)!不要错过这次大幅优惠。 🛠️集成更新: 🔹Claude Code:将模型设置为 deepseek-v4-pro【1m】 以解锁 100 万上下文! 🔹OpenCode:更新至 v1.14.24+ 🔹OpenClaw:更新至 v2026.4.24+ 查看最新官方 API 文档获取完整详情:https://api-docs.deepseek.com/quick_start/pricing

DeepSeek: 🔥DeepSeek-V4-Pro API is 75% OFF until May 5th, 2026, 15:59 (UTC Time)! Don't miss out on this massive discount. 🛠️Inte...

DeepSeek行业动态部署/工程
10:11
meng shao@shao__meng
67
Browser-Trace:浏览器可观测性工具技能

Browser-Trace是Browserbase团队开发的浏览器可观测性工具,可在不干扰主自动化流程(如Playwright)的前提下,通过附加只读CDP客户端,将DevTools事件、网络请求、控制台日志、DOM快照和截图系统记录到文件系统。其核心机制包括实时记录CDP事件流、定时采样截图与HTML,以及事后按页面导航和事件类型对日志分桶切片,便于检索分析。该工具适用于自动化故障诊断、实时会话监控,以及需要将网络、DOM和截图按时间戳对齐进行因果推断的场景。使用中需注意采样间隔、进程管理等实践约束。

derek: Introducing the /browser-trace skill, Give your agent 100% observability into its browser: dump network requests, DOM co...

智能体教程/实践部署/工程
07:40
宝玉@dotey
60
OpenAI与AWS扩大合作,模型与工具登陆Amazon Bedrock平台

OpenAI宣布与AWS深化合作,将GPT-5.5等模型、Codex编程工具及Bedrock托管智能体引入Amazon Bedrock平台,以限量预览形式上线。企业客户现可直接在AWS环境中调用OpenAI模型,复用现有安全、合规与账单体系,加速AI应用落地。Codex配置简便,支持多端使用,周活用户超400万。此次合作使Bedrock集齐Claude、LLaMA等主流模型,增强了AWS在云端AI竞争中的优势。

OpenAI Newsroom: Earlier this year, OpenAI and @amazon partnered to bring OpenAI's frontier capabilities to enterprises, startups, and cu...

智能体OpenAI产品更新部署/工程
07:07
Rohan Paul@rohanpaul_ai
56
彭博社:美国食品药品监督管理局计划通过人工智能实时检查试验数据来加速药物测试。 这可能将通常流程缩短数月或数年。 该机构将追踪关于新药是否有效且保持安全的高层级信号。 它不会收集所有患者数据。通常开发一种药物需要10到12年,其中45%是文书工作时间。
政策/监管部署/工程
06:35
Claude Code:GitHub Releases(RSS)
52
版本v2.1.122更新摘要

本次更新主要新增了通过环境变量选择Bedrock服务层级的功能,并支持在/resume搜索框粘贴PR链接以定位创建该PR的原始会话。同时修复了多项关键问题:修正了源会话含时间线回退条目时,/branch命令可能创建失败分支的问题;解决了发送给新版模型的图像被错误调整为2576px(应为2000px上限)的问题;增强了OpenTelemetry日志记录,确保数字属性以数值类型输出;并修复了Vertex AI/Bedrock在生成会话标题等场景下可能返回无效请求错误的问题。此外,还包含对MCP工具显示、CLI命令退出行为等多项细节的优化与修正。

AnthropicMCP/工具产品更新部署/工程
06:09
Hacker News 热门(buzzing.cc 中文翻译)
53
OpenAI 模型即将登陆亚马逊 Bedrock:专访 OpenAI 和 AWS 首席执行官

OpenAI 与亚马逊 AWS 宣布合作,将其 AI 模型集成到 Bedrock 托管服务平台。用户可通过 AWS 直接访问 OpenAI 的先进模型,如 GPT 系列,从而简化企业部署 AI 应用的过程。此次集成提升了模型的可访问性和管理效率。在专访中,OpenAI 首席执行官 Sam Altman 和 AWS 首席执行官 Matt Garman 强调了双方在推动 AI 普及方面的合作细节,包括对 Bedrock Managed Agents 的优化,旨在为企业提供更高效的 AI 解决方案。

OpenAI大佬观点部署/工程
05:38
HuggingFace Daily Papers(社区热门论文)
49
通过表示稳定性提升表格检索的鲁棒性

基于Transformer的表格检索系统将结构化表格扁平化为序列,导致即使语义不变,不同序列化格式(如CSV、HTML)也会产生显著差异的检索结果。研究将不同格式的嵌入视为共享语义的噪声视图,以其质心作为规范表示。质心平均法能有效抑制格式特异性变异,在多个检索模型的比较中优于单一格式。此外,研究引入轻量级残差瓶颈适配器,将单格式嵌入映射向质心目标,并施加协方差正则化。该适配器提升了多个稠密检索器的鲁棒性,但改进效果因模型而异,对稀疏检索提升较弱。相关代码与模型已开源。

检索增强论文/研究部署/工程
05:10
SemiAnalysis@SemiAnalysis_
43
在AI热潮中,CPU一度被认为已无足轻重。GPU和网络技术吸引了所有目光,尽管数据中心大规模建设,CPU需求却看似停滞。 这一说法如今已被颠覆。(1/5) 🧵
现象/趋势部署/工程
03:07
Rohan Paul@rohanpaul_ai
60
OpenAI正将其模型部署至AWS,结束了与微软的独家服务器绑定。微软已取消相关限制条款,允许开发者在亚马逊Bedrock平台内使用OpenAI工具。此举由亚马逊150亿美元投资促成,OpenAI则承诺从AWS购买价值1380亿美元的服务器容量。微软虽保留至2032年的非独家IP许可,但失去了独家性和部分收入分成,股价应声下跌。市场视此调整为微软竞争优势的削弱,而亚马逊成为明确赢家,谷歌云也获得了竞争机会。这一转变可能缓解反垄断审查,并让微软能释放资本用于发展Copilot及自身云业务。

Rohan Paul: OpenAI is moving away from its exclusive Microsoft arrangement, making room for possible partnerships with Amazon and Go...

MicrosoftOpenAI行业动态部署/工程
02:09
Hacker News 热门(buzzing.cc 中文翻译)
56
人工智能在最大规模的开源病历软件中发现了38处漏洞

一项人工智能安全研究在目前规模最大的开源电子病历软件OpenEMR中发现了38个安全漏洞。这些漏洞涵盖多个类别,包括跨站脚本、SQL注入和身份验证绕过等高风险问题。该软件被全球超过10万家医疗服务提供商所使用,影响范围广泛。研究团队利用AI驱动的代码分析工具完成了此次漏洞挖掘,凸显了AI在提升软件安全审计效率方面的潜力。所有已发现的漏洞细节均已报告给开发团队进行修复。

智能体安全/对齐部署/工程
01:40
宝玉@dotey
53
AI终端工具Warp客户端正式开源,推行"人管方向,AI干活"新模式

现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。

Warp: Warp is now open-source.

开源/仓库编码部署/工程
01:37
Rohan Paul@rohanpaul_ai
51
Actian发布VectorAI DB:专为边缘环境设计的向量数据库,助力企业RAG部署

根据Menlo Ventures数据,51%的企业AI生产部署采用RAG技术,而仅9%主要依赖微调。Actian推出的VectorAI DB是一款专为云访问受限、延迟高或风险大的边缘环境设计的向量数据库。它支持在本地、边缘或物理隔离网络中运行RAG流水线、语义搜索和实时AI智能体,核心优势包括数据保留在内部网络、原生集成LangChain/LlamaIndex、实时索引更新以及混合搜索功能。该产品已通过黑客马拉松验证,应用于海事AI、设备端治疗师等场景,现正式向公众开放。

Emma K McGrattan: We're excited to announce VectorAI DB, the first vector database purpose-built for high-performance, reliable AI at the ...

检索增强产品更新部署/工程
01:35
阿绎 AYi@AYi_AInotes
66
蚂蚁发布Ling-2.6-1T模型,以token效率革新生产级AI

蚂蚁集团AGI团队发布Ling-2.6-1T模型,其核心创新在于聚焦token效率而非参数规模。该模型采用MoE架构,每次推理仅激活7.4B参数,结合Linear Attention与Multi-Token Prediction技术,在保持接近GPT-5.4非推理水平的高智能同时,将token成本降至可比模型的四分之一。在Artificial Analysis评测中以极低消耗获得高分,并在SWE-bench等硬核Agent场景领先。该模型专为处理海量真实生产请求设计,旨在为高频Agent应用提供高效、低成本的解决方案,并通过免费API策略加速生态布局,预示AI竞赛重心正向真实生产成本效率转移。

阿绎 AYi: 后续来了兄弟们,卧槽真的太炸了,同样的任务,同样的配置,速度比Claude Sonnet 4.6还快 6 倍,成本低约 50 倍, openrouter 和 官方 API 均限时免费 1 周使用时间,白嫖的机会,冲啊兄弟们! 我上周那条讲E...

智能体模型发布部署/工程
01:11
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选71
OpenAI模型、Codex与托管智能体登陆AWS平台

OpenAI的GPT系列模型、代码生成模型Codex以及托管智能体现已正式上线亚马逊云科技。企业用户可直接在AWS环境中集成并调用这些AI服务,基于自身云基础设施构建安全、可控的定制化人工智能应用。此次合作将OpenAI的前沿模型能力与企业级云环境的安全性和可扩展性相结合,为企业部署生成式AI与自动化智能体提供了新的平台选择。

OpenAI行业动态部署/工程

推荐理由:OpenAI 终于上了 AWS,这意味着大量被云锁定的企业不用再绕道 API,直接在自家环境里跑 GPT 和 Codex,对做企业级 AI 产品的人来说是个真信号。
01:09
SemiAnalysis@SemiAnalysis_
66
地球上每一块AI芯片都需要一种单一的薄膜材料。GPU、TPU、定制ASIC。无一例外。全球98%的供应由一家日本化学公司控制。目前没有可投入生产的替代品。唯一的生产商产能已排期至2027年。正在提价。交货期超过6个月。NVIDIA如此担忧,以至于他们自行承担一半资本支出以扩建供应商的晶圆厂。关键词是"umami"。目前无人讨论此事。但很快人们就会开始关注。
现象/趋势行业动态部署/工程
00:38
AK@_akhaliq
58
Apple 推出随机键值路由 实现自适应深度缓存共享 论文: https://huggingface.co/papers/2604.22782
论文/研究部署/工程
00:09
Hacker News 热门(buzzing.cc 中文翻译)
62
GitHub Copilot 代码审查功能将开始消耗 GitHub Actions 配额

GitHub宣布自2026年6月1日起,GitHub Copilot的代码审查功能将开始消耗用户的GitHub Actions配额分钟数。这一变化意味着开发者使用该AI辅助审查代码时,将计入其月度Actions使用量,可能影响免费额度用户或用量较大的团队。此前该功能可能未计入配额或采用独立计费方式,新政策将统一至Actions计费体系。

产品更新编码部署/工程
4月28日
23:53
OpenRouter@OpenRouter
精选61
我们研究了市场上Opus 4.7的数据,发现成本增加了12-27%,但短提示除外,实际上短提示的成本效益更高。 完整文章:https://openrouter.ai/announcements/opus-47-tokenizer-analysis
Anthropic现象/趋势部署/工程

推荐理由:OpenRouter 用自家平台数据实测 Opus 4.7 的真实成本变化,不是官方 PR 而是第三方视角,做成本预算的产品人和开发者值得看一眼再决定要不要迁移。
23:51
Ant Ling@AntLingAGI
精选62
AntLingAGI与SGLang团队合作,正式推出Ling-2.6-flash(亦称Elephant-alpha)即时指令模型,并在SGLang平台上实现了首发支持。该模型总参数量达104B,但活跃参数仅7.4B,专为低延迟的智能体工作流优化,能够实现即时响应。它在编码、文档处理和智能体任务中展现出极高的token效率,所用token数量显著减少。尽管活跃参数较少,其模型质量仍与当前SOTA水平相当,兼具速度与执行力,适合需要快速响应的生产级智能体应用。团队强调,快速且稳定的推理是提升用户体验的关键。

LMSYS Org: 🎉 Meet Ling-2.6-flash from @AntLingAGI, an instant instruct model with 104B total params (7.4B active). Day-0 support i...

智能体模型发布部署/工程

推荐理由:104B 总参但只激活 7.4B,蚂蚁这步棋是冲着 Agent 场景的低延迟去的,做 Agent 产品的人值得跑一下看看实际体感。
23:39
Mistral AI:News(网页)
68
Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持

Mistral AI 正式推出 Workflows 公开预览版,该产品定位为企业AI的编排层,旨在通过提供持久性、可观察性和容错性,帮助AI驱动的工作流从概念验证可靠过渡到生产环境。它集成于Studio平台,允许开发者用Python编写工作流,并可发布至Le Chat供组织成员触发。其核心功能包括持久化执行(支持从断点恢复)、完整的步骤跟踪与审计,以及通过 wait_for_input() 等方法实现人工介入审批。目前已有ASML、ABANCA等企业客户使用其自动化货物放行、文档合规检查等关键业务流程,将原本耗时数小时的人工操作缩短至几分钟。

智能体产品更新部署/工程
23:38
TestingCatalog News 🗞@testingcatalog
58
Plurai公司推出vibe-training方法,旨在解决AI代理在演示中表现良好但面对真实用户时易出错的痛点。该方法允许开发者通过提示或少量示例快速定义意图,自动生成边缘案例数据集,并训练出与特定用例对齐的专用模型。其核心优势在于能在几分钟内构建生产就绪的实时评估与防护机制,使用小型语言模型实现低于100毫秒的延迟,成本比使用大型语言模型作为评判器降低超过8倍,并将到达用户的故障率较前沿LLM评判器减少43%,从而以极低成本实现超越现有大模型的性能。

Ilan Kadar: Big day for us, finally sharing what we've been cooking for a while. Over the past year, we kept seeing the same pattern...

智能体产品更新部署/工程
‹ 上一页
1…4243444546…50
下一页 ›