AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
5月27日周三
02:11Anthropic:Engineering(事故复盘 + 工程实践 · 网页)70精选我们如何对不同产品中的Claude进行隔离控制
01:00Xiaomi MiMo58MiMo-V2.5系列API价格永久降低99%,同步推出新Token计划
00:15公众号:小米 MiMo57MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官
00:10Replit ⠕63Replit 应用添加登录的两种方式
00:01Hacker News 热门(buzzing.cc 中文翻译)51与前沿实验室相比,外包加本地AI的方案很快将更具成本效益
00:00Deedy65OpenRouter年处理量达1.5千万亿token
5月26日周二
23:01François Chollet65Uber称AI成本难以证明合理
22:31Chubby♨️54Uber与微软AI成本问题揭示模型路由缺失,Merge Gateway推出自定义路由器解决方案
22:27Emad55AI模型竞争:工程规模化与后发者的追赶
22:18OpenRouter69同事件精选OpenRouter完成1.13亿美元B轮融资同一事件,精选展示《OpenRouter 获得1.13亿美元B轮融资》
20:12公众号:百度智能云(文心)50百度伐谋2.0赋能排产排程,产能提升20%
18:28X.PIN67华为AI芯片:绕过制程限制的扩展路径
16:00Alibaba Cloud39推理成AI竞赛新焦点,云端重构迎智能体时代
15:11IT之家(RSS)39映众推出 NVIDIA MGX 4U GPU 服务器:第六代英特尔至强平台,8 块 RTX Pro 6000 Blackwell
14:18AYi69小白零基础教程:Grok Build安装使用指南(专为非技术型SuperGrok及X Premium+用户制作)
11:11IT之家(RSS)56思特威与紫光展锐合作开发 MicroLED 光互连方案
11:11IT之家(RSS)39消息称英特尔加码玻璃基板,新墨西哥州工厂瞄准全球首座量产基地
11:11IT之家(RSS)52Perplexity 开源内部安全扫描工具 Bumblebee,助力行业应对软件供应链投毒
09:31ginobefun62BestBlogs 早报:Claude Code 实践、AI 自动化悖论、百川医疗 AI
09:11IT之家(RSS)64不换设计直接降温:SK 海力士发布控温散热存储技术"iHBM",降低热阻超 30%
07:31ginobefun73FreeLLMAPI聚合免费API,月供8亿Token
06:58Hacker News 热门(buzzing.cc 中文翻译)40挪威采购2拍字节华为闪存用于LLM训练
06:31ginobefun57AI工程中提示、上下文与框架工程的层次解析
05:36MarkTechPost(RSS)55Together AI开源OSCAR:面向长上下文大语言模型服务的注意力感知2位KV缓存量化系统
02:28Rohan Paul69黄仁勋谈芯片出口管制与AI竞争格局
00:23向阳乔木65Quickshare工具升级:一键部署,解决AI内容微信分享难题
5月25日周一
23:53Qwen61Qwen3.7-Max隐式缓存功能上线
23:23向阳乔木55Codex一键部署umami统计,实现口喷建站
23:11IT之家(RSS)54美光 HBM4 增产进展顺利,HBM4E 计划明年启动大规模生产
22:38Peter Steinberger 🦞62技能描述应精简,避免浪费上下文窗口
20:24Alibaba Cloud36NVIDIA架构师解析Qwen推理优化全栈加速
19:28Hacker News 热门(buzzing.cc 中文翻译)52用树莓派搭建树莓派
19:24Alibaba Cloud41英特尔与通义千问共探AI智能体基础设施建设
18:36MarkTechPost(RSS)652026年AI智能体与MCP服务器的最佳认证平台
18:11IT之家(RSS)36重磅特别来宾:英伟达黄仁勋将参与 Marvell 台北国际电脑展主题演讲
16:51SiliconFlow55Kimi K2.6在SiliconFlow平台降价约15%
16:06MarkTechPost(RSS)58WorkOS 发布 auth.md:一种基于 OAuth 标准的开放智能体注册协议
13:51宝玉50Kimi Code重写为TypeScript版本发布
12:28Hacker News 热门(buzzing.cc 中文翻译)70精选感知图像编解码器:实用学习型图像压缩中的关键因素
11:11IT之家(RSS)54芯动科技国产首发全套 UALink 纵向扩展高速互联 IP 组合
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月27日
02:11
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选70
我们如何对不同产品中的Claude进行隔离控制

Anthropic通过三重机制控制Claude智能体的部署风险,包括用户误用、模型异常行为和外部攻击。其防护策略聚焦于三个层面:通过沙箱、虚拟机和网络出口控制限制智能体运行环境;利用系统提示词和模型训练引导其行为;以及对MCP服务器、第三方插件等外部内容实施细粒度权限管理。文章以Claude Code、claude.ai和Claude Cowork为例,阐述了不同产品如何设计对应的隔离架构。

智能体Anthropic安全/对齐部署/工程

推荐理由:Anthropic 这次没画饼,实打实把 Claude 三款产品两年来的安全坑和架构演变全摊开讲了,从沙箱逃逸到钓鱼攻击,做 agent 的人读一遍能少踩很多坑。
01:00
Xiaomi MiMo@XiaomiMiMo
58
MiMo-V2.5系列API价格永久降低99%,同步推出新Token计划

MiMo-V2.5系列API价格宣布永久性大幅降低,最高降幅达99%,并统一了所有上下文长度的定价。同时,Token计划升级,用户支付同等价格可获得的可用Token数量增加了5至8倍,计费规则更简单透明。作为对现有用户的回馈,当前所有Token计划额度将被完全重置。MiMo-V2.5-TTS功能限时免费。这些改进源于整个MiMo技术栈的持续推理优化和系统服务效率提升,详细技术博客后续发布。

行业动态部署/工程
00:15
公众号:小米 MiMo
57
MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官

MiMo-V2.5 系列 API 永久降价,新定价最高降幅达 99%,不再区分上下文窗口长度,于北京时间 5 月 27 日 0 点生效。Token Plan 计费优化,用量提升至原来 5-8 倍,计费规则更清晰。百万亿 Token 创造者激励计划提前收官,100T Tokens 已全部发放。现有 Token Plan 用户额度于 5 月 27 日 0 点全量重置,按新规则执行。推理优化基于 SGLang HiCache 支持 SWA,KV Cache 搬运量降至近 1/7,可缓存 token 数量提升至近 5 倍。

产品更新推理部署/工程
00:10
Replit ⠕@Replit
63
在 Replit 上为你的应用添加登录有两种方式: → Replit Auth:零配置,用户使用其 Replit 账户登录 → Clerk Auth:你自己的品牌化登录,开发/生产环境均只需一个提示词。文档和视频见下方 👇 文档:https://docs.replit.com/learn/projects-and-artifacts/auth#auth
产品更新部署/工程
00:01
Hacker News 热门(buzzing.cc 中文翻译)
51
与前沿实验室相比,外包加本地AI的方案很快将更具成本效益

一项分析指出,通过将任务外包给第三方并结合本地部署的大语言模型(LocalAI),企业或很快能在成本效益上超越仅依赖前沿实验室(如 OpenAI 或 Anthropic)的方案。该观点预测了 AI 服务交付模式的转变。

现象/趋势部署/工程
00:00
Deedy@deedydas
65
OpenRouter现在每年服务1.5千万亿token! 这个token处理量是: - Google API的15-30% - OpenAI的20-40% - 超过Microsoft Azure Foundry的50% 这比我们一年前投资时大了15倍。 自2月完成这轮13亿美元融资以来,收入已经翻倍!
OpenAI行业动态部署/工程
5月26日
23:01
François Chollet@fchollet
65
开发者生产力难以管理。

Ed Zitron: Uber's COO has said that it's getting "harder to justify" its AI costs because there was no way to show a link between A...

行业动态部署/工程
22:31
Chubby♨️@kimmonismus
54
Uber在4个月内消耗34亿美元AI预算,微软正全公司范围取消Claude Code许可证,根本原因在于请求与模型之间缺乏路由层。Merge Gateway推出的"构建你自己的路由器"功能,允许团队根据自定义基准测试,将每个请求路由到最适合的模型。正如引用推文所指出的,团队常追逐所谓"最佳"新模型并频繁重新集成,但根本不存在通用的"最佳"模型,只有适合特定产品、用户和用例的模型。该功能由@merge_api提供,前200位评论用户可获得100美元额度。

Shensi Ding: Introducing Merge Gateway - Build Your Own Router. You're three sprints into your coding assistant. You pick the most hy...

MCP/工具产品更新部署/工程
22:27
Emad@EMostaque
55
本推文认为,人们低估了AI模型发展中"工程规模化"相较于"突破性研究"的重要性。Cursor以远低于大厂的成本运营并追赶上了Anthropic/OpenAI的模型,印证了这一趋势。引用中,xAI的Elon Musk回应称其AI会很棒,并指出xAI仅成立3年,年龄只有Anthropic的一半、OpenAI的四分之一,他誓言将继续努力,并期待3年后的竞争格局。

Elon Musk: What you say is true, but nonetheless our AI will be great. Whether it is the best remains to be seen, but I will never ...

AnthropicOpenAI大佬观点部署/工程
22:18
OpenRouter@OpenRouter
同事件精选69
今天我们宣布完成由@CapitalGVC领投的1.13亿美元B轮融资。 过去6个月,随着AI从实验快速转向生产,OpenRouter的周处理量从5万亿增长到25万亿token。 我们对未来充满期待。
行业动态部署/工程
同一事件,精选展示《OpenRouter 获得1.13亿美元B轮融资》
推荐理由:AI路由的头部玩家拿到1.13亿美金,每周调用量从5T涨到25T,这不是PR数字,是AI从实验走向生产的真信号。
20:12
公众号:百度智能云(文心)
50
百度伐谋2.0赋能排产排程,产能提升20%

百度伐谋2.0产业决策智能体落地排产场景,业务人员用自然语言描述优先级和现场变化(如设备故障、工人请假),系统自动将约束转化为优化模型并迭代求解,将顾问数小时的建模压缩到对话内完成。每次纠偏实时调整方案,隐性经验被结构化沉淀为企业可复用模型。在日均数百订单、十几条产线的大型家具制造企业中,产能提升20%。

智能体教程/实践部署/工程
18:28
X.PIN@thexpin
67
华为AI芯片:绕过制程限制的扩展路径

华为将不依赖更小制程节点,通过封装与架构创新来扩展其昇腾AI芯片。根据何庭波的论文,华为计划在2025年至2030年间,通过Chiplets、2.5D扇出封装和3D堆叠技术,推进其昇腾SuperPoD系列,具体产品包括2025年的910C、2026年的950及后续的990。约2030年,Ascend 990将引入LogicFolding技术,目标是到2035年实现100倍的集成度跃升。

端侧论文/研究部署/工程
16:00
Alibaba Cloud@alibaba_cloud
39
AI Key Frames - 直击 Qwen 直播现场。 最大的模型不会赢得 AI 竞赛--最快的系统才会。Fireworks AI 工程副总裁云锦解释了为何推理已成为真正的战场,以及云端如何为智能体时代而重建。步入 AI 原生浪潮。 🚀 敬请关注:https://int.alibabacloud.com/m/1000413447/
推理行业动态部署/工程
15:11
IT之家(RSS)
39
映众推出 NVIDIA MGX 4U GPU 服务器:第六代英特尔至强平台,8 块 RTX Pro 6000 Blackwell
产品更新部署/工程
14:18
AYi@AYi_AInotes
69
小白零基础教程:Grok Build安装使用指南(专为非技术型SuperGrok及X Premium+用户制作)

这是一条面向非技术用户的 Grok Build 安装与使用教程视频。教程演示了如何通过一行命令快速安装 Grok Build,并展示了如何用它创建真实可用的网站。其核心功能包括:利用 Grok Imagine 自动生成图片与视频,以及支持在多个文件夹中同时运行不同的项目。在使用过程中,Grok 会自动执行所需命令,无需用户具备任何编程经验。该教程由原作者 Daniel_Farinax 制作,以解答朋友们的疑问,并获得了马斯克的转发认可。

Dan: Beginner video: How to install & use Grok Build (made for non-technical SuperGrok and X Premium+ users) I got so many qu...

教程/实践编码部署/工程
11:11
IT之家(RSS)
56
思特威与紫光展锐合作开发 MicroLED 光互连方案

思特威与紫光展锐达成战略合作,将结合思特威的光电技术与紫光展锐的高速 SerDes 等核心技术,联合研发新一代 MicroLED CPO 光互连解决方案。该方案采用并行架构,单位传输能耗可降至铜缆方案的 5%,旨在解决传统光互连成本高、集成度低、功耗高的痛点。合作目标是为 AI 数据中心算力集群、智能汽车、工业机器人等场景提供高带宽、低功耗的国产化核心方案。

行业动态部署/工程
11:11
IT之家(RSS)
39
消息称英特尔加码玻璃基板,新墨西哥州工厂瞄准全球首座量产基地

英特尔计划将新墨西哥州里奥兰乔工厂改造为全球首个玻璃基板量产基地,以推进先进封装技术。相比传统有机基板,玻璃基板更平整、不易翘曲,可提升封装密度与芯片互连能力。该工厂占地218英亩,自1980年启用,2021年后转向先进封装,现已成为美国最先进的一体化封装设施,同时也在为外部客户制造硅光子产品。从产能布局看,该工厂比钱德勒的试产线更接近规模化量产。

行业动态部署/工程
11:11
IT之家(RSS)
52
Perplexity 开源内部安全扫描工具 Bumblebee,助力行业应对软件供应链投毒
开源/仓库部署/工程
09:31
ginobefun@hongming731
62
BestBlogs 早报:Claude Code 实践、AI 自动化悖论、百川医疗 AI

Anthropic 工程师 Ara 分享内部使用 Claude Code 的三项核心实践:将规格说明升级为 HTML 以提升结构密度;让模型通过 ask_user_question 工具主动采访需求;采用智能体原生 DOM 验证框架,实现人工、Opus 4.7 无头浏览器及 CI/CD 的统一验证。Every 公司 CEO Dan Shipper 用团队一年内从 15 人扩张至近 30 人的数据,反驳 AI 会大规模裁员的叙事,认为自动化反而催生需求增长与质量管控需求。百川智能创始人王小川透露,公司已收缩通用模型与金融等业务线,All in 医疗大模型,并即将发布新医疗大模型 M4。

智能体Anthropic现象/趋势编码
09:11
IT之家(RSS)
64
不换设计直接降温:SK 海力士发布控温散热存储技术"iHBM",降低热阻超 30%

SK海力士推出“iHBM”控温散热存储技术,在HBM封装内直接集成名为“ICE”的冷却元件,为芯片热点构建专用散热通道。该技术使热阻降低超过30%,并兼容现有封装设计。SK海力士计划将其应用于下一代HBM5产品。

行业动态部署/工程
07:31
ginobefun@hongming731
73
非常酷,准备试一下~ FreeLLMAPI 是一个开源代理,聚合了多个提供商的免费 API 额度,每月能提供约 8 亿 Token,并具有自动故障转移和兼容 OpenAI 的端点。

Alvaro Cintas: "I'm out of free API credits" is officially over 🤯 FreeLLMAPI is an open-source proxy. Each provider's free tier is a t...

开源/仓库部署/工程
06:58
Hacker News 热门(buzzing.cc 中文翻译)
40
挪威采购2拍字节华为闪存用于LLM训练

根据报道,挪威采购了2拍字节(PB)的华为闪存存储设备。这批高性能存储设备将被用于支持大型语言模型(LLM)的训练工作。此举反映了AI模型开发对大规模、高吞吐量存储解决方案的持续需求。

数据/训练行业动态部署/工程
06:31
ginobefun@hongming731
57
该推文澄清了AI工程中三个常被混淆的概念。提示工程聚焦于单次调用的信息准备,负责组装角色、指令、示例等构成完整输入。上下文工程管理多步任务中有限的上下文窗口,核心在于有选择性地保留、压缩和丢弃信息。框架工程则构建完整的智能体执行系统,其循环包括"收集"、"执行"和"验证"阶段。三者呈嵌套关系:框架工程是外层容器,其"收集"阶段整合了管理窗口记忆的上下文工程和生成最终提示词的提示工程。

Akshay 🚀: from prompt to context to harness engineering. three terms keep coming up in AI engineering, and they get conflated all ...

智能体教程/实践部署/工程
05:36
MarkTechPost(RSS)
55
Together AI开源OSCAR:面向长上下文大语言模型服务的注意力感知2位KV缓存量化系统

Together AI开源OSCAR,一种用于长上下文大语言模型服务的注意力感知2位KV缓存量化方法。该方法在离线状态下,从注意力感知的协方差结构中为键和值推导出独立的旋转。在2.28 bits per KV element的量化精度下,OSCAR将通义千问(Qwen3-4B-Thinking-2507)和通义千问(Qwen3-8B)的BF16精度差距分别缩小至3.78点和1.42点,同时实现约8倍的KV内存缩减,并在100K上下文长度下带来高达3倍的解码速度提升。

开源/仓库推理部署/工程
02:28
Rohan Paul@rohanpaul_ai
69
黄仁勋在访谈中回应了是否会向华为出售芯片的问题。他指出,对华芯片出口管制并未能阻止中国AI发展,反而因市场空白而刺激了华为等本土芯片产业的成长,使其获得了学习、规模化和出口的动力。真正的AI竞争已不仅局限于最快芯片,而是涵盖芯片、能源、基础设施、模型、应用和标准等整套"智能操作层"的竞争。长期风险在于,美国的限制可能使其技术最终被排斥在美国本想影响的体系之外。

Rohan Paul: Jensen Huang explains how blocking China from Nvidia does not mean blocking China from AI. The usual export-control stor...

大佬观点部署/工程
00:23
向阳乔木@vista8
65
Quickshare工具升级:一键部署,解决AI内容微信分享难题

该推文介绍了Quickshare工具,用于将AI生成的HTML、Markdown等内容转化为可分享链接,以解决在微信中分享此类内容不便的问题。工具新推出基于Cloudflare的一键部署版本,并新增管理后台。用户可通过AI智能体安装部署,其核心功能还包括为链接添加密码保护,方便审核等场景。

GitHub开源/仓库部署/工程
5月25日
23:53
Qwen@Alibaba_Qwen
61
✅隐式缓存现已在Qwen3.7-Max上线--自动启用,无需设置。 ⚡️开箱即用,更快更便宜。 需要更高、更确定的命中率?请尝试显式缓存。🙌 🔗最佳实践🔗:https://www.alibabacloud.com/help/en/model-studio/explicit-cache-best-practice
产品更新推理部署/工程
23:23
向阳乔木@vista8
55
Codex一键部署umami统计,实现口喷建站

用户通过Codex在VPS上自部署了umami统计工具,可为网站添加无限量流量监控。相比官方版有限制,自部署方案支持对任意网站通过指令快速启用统计功能。整个过程包括网站搭建、域名配置及数据统计均可由Codex通过SSH自动化完成,体现了“口喷建站”的便捷性。

OpenAI教程/实践编码部署/工程
23:11
IT之家(RSS)
54
美光 HBM4 增产进展顺利,HBM4E 计划明年启动大规模生产
数据/训练行业动态部署/工程
22:38
Peter Steinberger 🦞@steipete
62
大家好:当你编写技能时,请让你的智能体注重 token 效率,放宽语法要求。我看到太多技能在描述中写了长篇大论,而所有这些内容都会被加载到每个上下文中。 我写了一个技能来找出最糟糕的例子。https://github.com/steipete/agent-scripts/blob/main/skills/skill-cleaner/SKILL.md
智能体教程/实践部署/工程
20:24
Alibaba Cloud@alibaba_cloud
36
在2026年Qwen大会上,NVIDIA高级解决方案架构师翟健在基础模型论坛上深入解析《Qwen推理优化:通过NVIDIA全栈加速实现突破性能》。感受AI原生动力。 🚀 敬请期待:https://click.qwencloud.com/m/20000000190/
行业动态部署/工程
19:28
Hacker News 热门(buzzing.cc 中文翻译)
52
用树莓派搭建树莓派

有作者分享了一个技术实践,其核心是利用一台树莓派来构建(或安装、设置)另一个树莓派的操作系统。这本质上是一个计算机领域的“自举”(bootstrapping)过程,即系统用自身来构建或启动自身。该文章(原英文标题为“Building Pi with Pi”)的分享在 Hacker News 社区获得了关注。此摘要严格依据原文信息生成。

教程/实践部署/工程
19:24
Alibaba Cloud@alibaba_cloud
41
在2026年通义千问大会上,英特尔高级云解决方案架构师张健将加入Agent Native Cloud论坛,探讨如何使用英特尔至强处理器构建快速、可靠且高性价比的AI智能体基础设施。共同迈入AI原生时代。 🚀 敬请关注:https://click.qwencloud.com/m/20000000190/
智能体行业动态部署/工程
18:36
MarkTechPost(RSS)
65
2026年AI智能体与MCP服务器的最佳认证平台

随着MCP月SDK下载量超过9700万且AI智能体进入生产工作流,认证已成为团队面临的关键基础设施决策。文章评估了八家领先平台——WorkOS、Stytch、Auth0 by Okta、Composio、Nango、Arcade、TrueFoundry和Cloudflare在规范合规性、企业身份深度、集成广度以及2026年部署的现实适用性方面的表现。

智能体MCP/工具教程/实践部署/工程
18:11
IT之家(RSS)
36
重磅特别来宾:英伟达黄仁勋将参与 Marvell 台北国际电脑展主题演讲
行业动态部署/工程
16:51
SiliconFlow@SiliconFlowAI
55
@Kimi_Moonshot K2.6在SiliconFlow上享受约15%折扣💰 输入价格:$0.90/M ➡️ $0.77/M 结合 → 在@OpenRouter上表现顶尖:平均工具调用错误率0.21% → 缓存命中率超80% → FP8量化 + 零数据留存 花更少,调试更少,发布更多 开发者们别错过 立即开始使用SiliconFlow上的Kimi K2.6 ↓
产品更新部署/工程
16:06
MarkTechPost(RSS)
58
WorkOS 发布 auth.md:一种基于 OAuth 标准的开放智能体注册协议

WorkOS 推出 auth.md 协议,为 AI 智能体提供标准化注册流程。这是一个部署在应用域名的 Markdown 文件,告知智能体支持哪些注册流程、请求哪些权限范围以及如何获取绑定真实用户的凭证,无需人工填写表单。该协议建立在现有 OAuth 标准之上。

智能体开源/仓库部署/工程
13:51
宝玉@dotey
50
Kimi官方推出了基于TypeScript和pi-tui重写的命令行工具kimi-code,替代了此前基于Python的kimi-cli版本。作者回顾了之前关于用Python重写失败的讨论,并提到目前正推动将一些在Claude Code上体验良好的功能整合到新工具中。项目已在GitHub开源。

Yufan Sheng: 翻译一下,Kimi 自己基于 Python 写的 kimi-cli,在今天换成了基于 Typescript 和 pi-tui 写的新 kimi-code。 已经在 PUA 对应的研发小哥哥加一些我在 Claude Code 上用得很爽的功能...

GitHub产品更新部署/工程
12:28
Hacker News 热门(buzzing.cc 中文翻译)
精选70
感知图像编解码器:实用学习型图像压缩中的关键因素

苹果公司的研究探讨了感知图像编解码器,分析其在实用学习型图像压缩中的关键作用。该研究聚焦于提升压缩效率与视觉质量平衡的实际需求。

开源/仓库论文/研究部署/工程

推荐理由:苹果官方把学习型图像压缩落地时真正重要的几个因素讲透了,附带代码,做视频编码和图像传输的同行值得看。
11:11
IT之家(RSS)
54
芯动科技国产首发全套 UALink 纵向扩展高速互联 IP 组合
产品更新部署/工程
‹ 上一页
1…2627282930…50
下一页 ›