AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月20日周六
12:24宝玉57Codex 上线 Handoff 跨设备任务迁移功能
12:23Orange AI45独立开发者的实战经验分享 【引用 @MengkePM】:http://x.com/i/article/2067506549107691520
11:59IT之家(RSS)46英特尔与AMD联合发布ACE 1.15规范,增强x86架构AI算力
09:27SemiAnalysis47SemiAnalysis:AI网络铜缆与光缆互补而非对立
06:10Chubby♨️40中美AI模型API价格差距对比
05:55Rohan Paul66摩根士丹利:全球数据中心建设资本支出约2.9万亿美元,AI资本支出依赖债务融资或引发社会级风险
05:53Ethan Mollick51企业低估高智能模型的价值
04:26OpenRouter:Announcements(RSS)68精选OpenRouter vs LiteLLM:如何选择 LLM 网关
04:26OpenRouter:Announcements(RSS)59精选OpenRouter vs Portkey:你的团队该选哪个LLM网关?
01:54Rohan Paul64DeepAdapt 推出 ACI 运行时学习层:GPU 转 CPU,成本降 82%、推理快 33 倍
6月19日周五
23:23Rohan Paul68美国担忧顶级EUV光刻机流入中国,ASML否认
23:00AYi64普通人一个月工资可开一家互联网公司,AI时代创业成本降至每月$20
23:00CMU:Machine Learning Blog51医疗保健基准测试的质量取决于其隐含假设
22:22Artificial Intelligence News(RSS)38SAP 与 Google Cloud 部署智能体商务架构
22:00Cloudflare Blog62精选Cloudflare 为 AI 智能体推出临时账户
21:23SemiAnalysis4699% AI芯片初创失败因软件难
21:22Hacker News 热门(buzzing.cc 中文翻译)66Datasette 发布插件 datasette-apps:在 Datasette 中托管自定义 HTML 应用
21:20TechCrunch:AI(RSS)54Allbirds 转型 AI 后更名为 Smartbird,新 CEO 计划部署托管计算集群
18:01Artificial Intelligence News(RSS)40e2e-assure 发布 Cumulo:英国唯一主权级 AI 驱动 IT/OT 一体化 SOC 平台
16:25TechCrunch:AI(RSS)67美国称ASML最先进EUV光刻机可能流入中国,ASML否认
10:27Hacker News 热门(buzzing.cc 中文翻译)63TesterArmy (YC P26) - 用于测试网页和移动应用的代理程序
10:18AYi53Peter Thiel领投1.4亿美元押注海上AI数据中心,Aether AI获首轮融资推因果大模型
09:57Hacker News 热门(buzzing.cc 中文翻译)51从 GNU Stow 迁移到 Chezmoi
09:27OpenRouter:Announcements(RSS)60精选OpenClaw 接入 OpenRouter
07:16IT之家(RSS)45英特尔任命李锡熙为代工执行副总裁,强化AI芯片先进封装等
06:48Berryxia.AI42Claude Code 上线 Artifacts 功能,支持团队共享交互页面
03:18Cloudflare Blog52Cloudflare 发布多阶段漏洞发现工具,详解对抗性审查与上下文绕过技术
03:16Google Developers Blog(RSS)48Google 庆祝A2A协议发布一周年:协作智能体生态
03:08OpenAI:官网动态(RSS · 排除企业/客户案例)58精选企业版新用量分析与更新的支出控制
02:51Jeff Dean49Google 发布 TPU v2 至 Ironwood 五代训练超算演进论文
02:49TechCrunch:AI(RSS)57亚马逊计划出售AI芯片Trainium,直接挑战Nvidia
01:51Claude:Blog(网页)68精选Claude Enterprise 推出企业托管 MCP 连接器授权管理
01:20jason42GPT-5.5现实应用性能数据亮眼
00:54Rohan Paul52美国批准加快数据中心电网接入计划
00:50Elon Musk50Grok模型上线Databricks平台
00:26SemiAnalysis65SemiAnalysis:勿信2026数据中心容量砍半说
00:25xAI:News(网页)45Grok 现集成 Databricks Agent Bricks
00:22Artificial Intelligence News(RSS)37计算机视觉货架跟踪推动零售业生产力提升
00:21xAI38Grok模型上线Databricks Agent Bricks
6月18日周四
23:55AK41GLM-5.2 多平台免费使用 6 小时
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月20日
12:24
宝玉@dotey
57
Codex 上线 Handoff 跨设备任务迁移功能

Codex 推出 Handoff 功能,支持用自然语言指令将正在进行的任务连同完整 Git 状态(未提交代码、当前分支)从笔记本迁移到远程服务器继续运行,之后可再拉回本地。前提:本地需在 Settings > Connections > SSH 配置远程主机;远程也需安装 Codex 并开启“允许其他设备连接”,双方登录同一 ChatGPT 账号;远程需有同一 Git 仓库的克隆并保存为项目,子目录路径需匹配。该功能解决了 AI 编程中途离开时任务进度的托管问题。

Guinness Chen: Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...

OpenAI产品更新编码部署/工程
12:23
Orange AI@oran_ge
45
独立开发者的实战经验分享 【引用 @MengkePM】:http://x.com/i/article/2067506549107691520

Mengke Wang: http://x.com/i/article/2067506549107691520

教程/实践编码部署/工程
11:59
IT之家(RSS)
46
英特尔与AMD联合发布ACE 1.15规范,增强x86架构AI算力

6月19日,x86生态系统咨询小组(EAG)发布ACE规范1.15,通过原生矩阵乘法引擎和低精度格式增强x86 AI性能。ACE在AVX向量指令基础上新增图块寄存器状态,并纳入AVX10下的格式转换指令。支持INT8、INT32、FP32、BF16、FP16、E8M0、FP8及MX联盟定义的多类MX格式。部署上,AMD Zen 6将引入新AI数据类型,Zen 7配备新矩阵引擎与AI数据格式扩展。英特尔与AMD于2024年联合成立EAG。

数据/训练行业动态部署/工程
09:27
SemiAnalysis@SemiAnalysis_
47
SemiAnalysis:AI网络铜缆与光缆互补而非对立

投资者常将AI网络视为铜缆与光缆的二元选择,但SemiAnalysis认为二者互补。GPU集群规模扩大,高效连接驱动各类网络需求增长。铜缆在满足距离、功耗、成本与可靠性时仍是首选,光缆则在带宽和距离超出铜缆极限时必需。Nvidia策略一致:能用铜缆用铜缆,必须用光缆才用。因此光学增长不取代铜缆,铜缆持久也不意味着光学不增长。随着AI系统规模与复杂度提升,两者都将受益于GPU、交换机、机架与集群间数据传输需求的增加。

现象/趋势部署/工程
06:10
Chubby♨️@kimmonismus
40
关键AI模型的API价格(美国 vs 中国)对比显示,中国在模型 token 价格方面简直无敌,与西方公司和模型不在一个水平线上。

zerohedge: API prices of key AI models: US vs China

现象/趋势部署/工程
05:55
Rohan Paul@rohanpaul_ai
66
摩根士丹利估计,到2028年全球数据中心建设资本支出约2.9万亿美元,资金来源包括超大规模企业现金流1.4万亿美元、公司债2000亿、证券化信贷1500亿、私人信贷/资产融资/合资债务8000亿等。AI资本支出愈发依赖信贷,损失可能超出股东范围。NYU教授Damodaran指出,与互联网泡沫不同,AI资本支出规模史无前例且大部分由债务融资(尤其是私人资本),一旦调整,违约和困境将蔓延至整个社会,而非仅股东受损。

Rohan Paul: dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...

大佬观点行业动态部署/工程
05:53
Ethan Mollick@emollick
51
我怀疑企业低估了使用更高智能的价值,即便在较弱AI似乎能以更低价格达成KPI的任务中也是如此。 至少应构建能灵活尝试更智能模型的架构,看看是否会带来不同。
大佬观点推理部署/工程
04:26
OpenRouter:Announcements(RSS)
精选68
OpenRouter vs LiteLLM:如何选择 LLM 网关

OpenRouter 是托管在 Cloudflare 边缘的 LLM 网关,无需管理基础设施,收取 5.5% 平台费(前 100 万次请求免费),支持 70+ 提供商和自动故障转移。LiteLLM 是自部署代理(Docker/PostgreSQL/Redis),数据不离开内网,免费开源,但需承担基础设施成本(生产部署约数百美元/月)。当模型月支出超过约 $3,600(基础设施 $200/月)或 $9,100(基础设施 $500/月)时自托管更划算。LiteLLM 提供六种路由策略和自定义 Python 路由;OpenRouter 具备 SOC 2、GDPR 认证和零数据保留选项。两者可串联使用。

开源生态评测/基准部署/工程

推荐理由:OpenRouter 这份官方对比很坦诚,把成本、延迟、合规的权衡掰开了讲,自建 LiteLLM 和托管谁更划算的算术也给清楚了,做 LLM 网关选型的直接看这篇就够了。
04:26
OpenRouter:Announcements(RSS)
精选59
OpenRouter vs Portkey:你的团队该选哪个LLM网关?

OpenRouter是托管路由网络,买credits后通过一个API路由至70+供应商,自动故障转移,无需自有密钥;覆盖300+模型(含20+免费),按用量收费(零加成+5.5%平台费,首100万免费),支持零数据保留和欧盟路由。Portkey是AI控制平面(2026年被Palo Alto收购),置于用户密钥之上,增加治理、提示管理、护栏和可观测性;提供1600+ LLM统一API,按日志计费(Developer免费,Production $49/月),支持HIPAA、SSO、私有部署。两者均可组合使用。

教程/实践部署/工程

推荐理由:OpenRouter自己下场写对比,虽然立场明显,但对「路由网络 vs. 控制平面」的定位拆解很清晰,选网关的时候可以当决策清单看。
01:54
Rohan Paul@rohanpaul_ai
64
DeepAdapt 推出 ACI 运行时学习层:GPU 转 CPU,成本降 82%、推理快 33 倍

DeepAdapt 发布 ACI(自适应持续智能)运行时学习层,通过将重复工作负载从 GPU 转移至标准 CPU,实现运营成本降低 82%、推理速度提升 33 倍(中位延迟 159 ms)。ACI 在推理时实时学习模型决策、人工修正与反馈,已知请求直接本地 CPU 处理,仅不确定或复杂请求回传底层 LLM。基准测试:token 消耗降 90%、生产级成本降 5.7 倍、准确率 96%(对比无 ACI 的 85%)、每千次决策能耗降 85.7%、规则违规减 4.8 倍。无需微调或重训,即插即用,GPU 依赖随系统成熟递减。该架构先用于云端 LLM 智能体,未来对个人设备同样重要。

产品更新推理部署/工程
6月19日
23:23
Rohan Paul@rohanpaul_ai
68
美国担忧顶级EUV光刻机流入中国,ASML否认

美国商务部长Lutnick向ASML高层提出担忧,指一台顶级EUV光刻机可能已流入中国,违反出口管制。ASML否认向中国出售EUV设备。EUV每台约2.5亿美元,全球运行314台,据彭博中国为零。若违规属实将是美国对华芯片管制重大突破。ASML股价早盘跌约2.6%。路透曾报道深圳用ASML前员工搭建原型机但离量产有差距。美国可强制ASML切断与中国客户合作,荷兰已限制EUV及部分DUV出口,进一步收紧可能影响ASML约20%的2026年中国区收入。

政策/监管部署/工程
23:00
AYi@AYi_AInotes
64
普通人一个月工资可开一家互联网公司,AI时代创业成本降至每月$20

推文指出,普通人一个月工资足以启动一家跑通商业闭环的互联网公司,每月固定成本约$20,主要来自Claude Pro或OpenAI Codex辅助开发。其余后端数据库、部署、认证、分析、监控、缓存、邮件、支付等全链路基建均有免费起步额度,域名约$1/月。同时,引用指出当前AI范式(视频生成、VLA)仅学习统计相关性,缺乏因果理解;UCSD黄碧薇教授提出四代AI划分(相关性小模型→因果小模型→相关性大模型/LLM→因果大模型),其团队Aether AI今日完成首轮融资。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

OpenAI大佬观点部署/工程
23:00
CMU:Machine Learning Blog
51
医疗保健基准测试的质量取决于其隐含假设

LLM在作为医疗助手时,评估与部署场景下的性能存在显著差距——Bean等人(2025)发现准确率相差61个百分点。这一差距并非源于基准测试设计缺陷,而是因为评估协议中嵌入的隐含假设在部署时不再成立。研究提出将假设分为任务假设和结果假设两类,用以诊断差距成因并明确弥合路径:需将假设显式化、检验哪些假设在部署中成立,并据此更新评估协议。

现象/趋势部署/工程
22:22
Artificial Intelligence News(RSS)
38
SAP 与 Google Cloud 部署智能体商务架构

SAP 与 Google Cloud 联合部署智能体商务架构,通过 Universal Commerce Protocol 标准化零售商、支付网关与自主智能体之间的数据交换,实现从搜索、交易到售后的全序列自动化执行。SAP Commerce Cloud 集成 Google Gemini 能力构建 Shopping Assistant,支持聊天、语音和文本交互,实时查询库存确保推荐可行。该架构基于 SAP Business Data Cloud Connect for Google BigQuery 的双向零拷贝数据链接,融合天气、位置等外部变量与客户画像、交易历史等内部行为数据,由 SAP Engagement Cloud 驱动自主智能体编排个性化互动。SAP 研究显示,78% 的企业认为 AI 对 2026 年保留客户至关重要,但仅 37% 的公司跨客户体验平台共享数据、39% 跨 CRM 共享。

智能体Google行业动态部署/工程
22:00
Cloudflare Blog
精选62
Cloudflare 为 AI 智能体推出临时账户

Cloudflare 在 Workers 上推出临时账户(Temporary Accounts),允许 AI 智能体直接运行 wrangler deploy --temporary,在数秒内获取一个可用的实时 Worker,无需绕开面向人类设计的部署流程。该功能旨在降低智能体部署门槛。

智能体MCP/工具产品更新部署/工程
关联讨论 1 条Simon Willison 博客
推荐理由:Cloudflare 给 agent 开临时账号这个功能很聪明,一步解决了身份验证和资源清理的麻烦,做智能体部署的可以认真试试。
21:23
SemiAnalysis@SemiAnalysis_
46
100%的AI芯片初创公司都有幻灯片/"模拟性能数据"显示它们的芯片好得多,但99%的定制ASIC失败了。为什么?直到你意识到AI芯片是关于软件的,MATH才算是MATH。构建芯片并把数字放到幻灯片上相对容易;构建出色的软件很难。这就是为什么99%的AI芯片初创公司会失败。
现象/趋势部署/工程
21:22
Hacker News 热门(buzzing.cc 中文翻译)
66
Datasette 发布插件 datasette-apps:在 Datasette 中托管自定义 HTML 应用

Datasette 发布新插件 datasette-apps,允许托管自包含 HTML+JavaScript 应用。应用在严格沙箱中运行(sandbox 属性和 CSP 头),无法访问 cookies、localStorage 或外部 HTTP 请求,防止数据泄露。应用可用 JavaScript 对 Datasette 数据执行只读 SQL 查询,若配置存储查询还可写入。应用与父窗口通过 postMessage 或 MessageChannel 通信。灵感来自 Claude Artifacts,为 HTML 前端提供 Datasette 后端。试用需 GitHub 登录 agent.datasette.io 演示实例。

产品更新开源生态部署/工程
21:20
TechCrunch:AI(RSS)
54
Allbirds 转型 AI 后更名为 Smartbird,新 CEO 计划部署托管计算集群

鞋履品牌 Allbirds 4 月宣布转型 AI,以 4300 万美元出售鞋业务并从股市融资 1 亿美元,更名为 Smartbird。前 AWS 高管、工程博士 Nadia Carlsten 昨日起出任 CEO,年薪 70 万美元并获价值约 900 万美元股票。Smartbird 定位 AI 基础设施提供商,为制药、能源、金融、公共部门等需要数据主权和直接控制服务器的客户提供托管计算集群。Carlsten 称客户需求在数百到数千颗芯片,强调集群灵活性而非大规模 GPU。目前她是一人创始人兼唯一员工,正在招募领导团队,预计年底前为多个客户部署计算集群。

行业动态部署/工程
18:01
Artificial Intelligence News(RSS)
40
e2e-assure 发布 Cumulo:英国唯一主权级 AI 驱动 IT/OT 一体化 SOC 平台

e2e-assure 推出 Cumulo,该平台基于数字孪生技术,通过被动发现持续维护客户环境映射,支持安全攻击模拟与风险预判。零日 SOC 能力可将实时威胁情报直接应用为检测规则。客户专属本地大语言模型部署于主权环境,推理在客户控制基础设施内完成。平台采用分层 AI 架构,多个模型交叉校验每项调查并设置反幻觉层;SC 级安全团队保持“人在回路”决策,避免 AI 自主运行。

产品更新部署/工程
16:25
TechCrunch:AI(RSS)
67
美国称ASML最先进EUV光刻机可能流入中国,ASML否认

美国商务部长Howard Lutnick近日多次对ASML高管表示,担心该公司唯一的EUV光刻机可能已流入中国,构成重大出口管制违规。ASML坚决否认,称每台机器都受追踪,中国从未有过EUV系统。CEO Christophe Fouquet表示公司已建立内部防火墙,中国员工无法接触EUV技术。ASML市值约7000亿美元,预计2026年约20%收入来自对华许可销售的旧款DUV设备。同时,美国商务部去年底同意拨款1.5亿美元给xLight研发下一代光源技术,Peter Thiel支持的Substrate也在开发EUV竞品,国会两党法案拟全面禁止ASML对华DUV出口。

政策/监管部署/工程
10:27
Hacker News 热门(buzzing.cc 中文翻译)
63
TesterArmy (YC P26) - 用于测试网页和移动应用的代理程序

TesterArmy 是一个 AI 代理程序,持续监控网站和移动应用的关键用户流程,并在出现问题时向团队发出警报。只需粘贴 URL 即可创建项目,无需 SDK、测试脚本或基础设施维护。用户用自然语言描述测试场景,AI 代理自动导航页面、填写表单、处理 OAuth 和 OTP 登录流程。支持通过 GitHub App 自动 PR 检查、定时运行生产监控或通过 webhook 触发。每次运行后提供截图、录屏和可操作的 bug 报告,可通过仪表盘、CLI 或 Pull Request 查看。设置只需不到 2 分钟。

智能体产品更新部署/工程
10:18
AYi@AYi_AInotes
53
Peter Thiel领投1.4亿美元押注海上AI数据中心,Aether AI获首轮融资推因果大模型

Peter Thiel领投1.4亿美元B轮,押注完全离网的海上AI数据中心。第三代浮动节点Ocean-3单节点1MW,靠海浪发电、海水冷却、低轨卫星回传,无需征地接电网。首台试点预计今年8月在北太平洋下水,规模化商用至少等到2027年。同时,Aether AI官宣首轮融资,UCSD黄碧薇教授推出因果AI,将AI分为相关性小模型、因果小模型、LLM、因果大模型四代,旨在从视频中自动提取物理规律。

AYi: 人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...

现象/趋势部署/工程
09:57
Hacker News 热门(buzzing.cc 中文翻译)
51
从 GNU Stow 迁移到 Chezmoi

作者曾在多台 Mac 上用 GNU Stow 管理 dotfiles,但符号链接导致仓库脏工作树和引导新机时的文件冲突。后改用 Chezmoi:以 ~/.local/share/chezmoi 为源目录,chezmoi add 按 home 目录结构命名(dot_ 前缀代替前导点),chezmoi apply 写入真实文件而非符号链接,避免自动回写。支持 private_ 权限控制、.tmpl Go 模板以及 .chezmoiscripts 下的 macOS 初始化脚本。目前跟踪 zsh、git、shellcheck、ghostty、GitHub CLI 的配置,以及 Claude Code 的 settings.json、Codex 的 config.toml 和 dot_agents/skills 下的 agent skill 文件,并用三个 gitconfig 按目录分离工作/个人身份。

教程/实践部署/工程
09:27
OpenRouter:Announcements(RSS)
精选60
OpenClaw 接入 OpenRouter

OpenClaw 已内置 OpenRouter 支持,一条命令即可为 AI 智能体配置统一密钥、统一账单,并实现跨 300 多个模型的自动故障转移。同时提供具体设置步骤以及常见错误的修复方法。

智能体教程/实践部署/工程

推荐理由:给用 OpenClaw 搭 agent 的人一个直接可用的集成指南,还附带了常见报错修复,比零散摸索省时间。
07:16
IT之家(RSS)
45
英特尔任命李锡熙为代工执行副总裁,强化AI芯片先进封装等

英特尔6月18日宣布,任命李锡熙(Seok-Hee Lee)为代工执行副总裁,直接向CEO陈立武汇报,全面负责先进封装、系统集成、后端技术开发与制造,以强化AI计算能力。李锡熙曾在英特尔工作10年,后任SK海力士CEO,主导收购Intel NAND闪存业务并推进HBM技术。同时,Naga Chandrasekaran继续领导前端技术开发与制造,加速Intel 18A、Intel 14A量产;执行副总裁Navid Shahriari在效力37年后退休。

行业动态部署/工程
06:48
Berryxia.AI@berryxia
42
Claude Code 上线 Artifacts 功能,支持团队共享交互页面

Claude Code 新增 Artifacts 功能(Team 和 Enterprise 计划 beta 版)。用户可从 coding session 生成交互页面(如 PR 演示、项目 dashboard),通过私有链接分享给团队;页面随 session 自动刷新,调用代码库、插件、技能等全部上下文。该更新旨在将 Claude Code 从单人工具拓展为团队实时协作平台,解决上下文传递和版本同步痛点。

Claude: New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...

Anthropic产品更新编码部署/工程
03:18
Cloudflare Blog
52
Cloudflare 发布多阶段漏洞发现工具,详解对抗性审查与上下文绕过技术

Cloudflare 分享了其多阶段漏洞发现工具的技术架构,包含自动化分类循环。该系统通过管理状态控制、引入对抗性审查来压制误报,并围绕 LLM 上下文窗口限制设计路由策略。

安全/对齐教程/实践部署/工程
03:16
Google Developers Blog(RSS)
48
Google 庆祝A2A协议发布一周年:协作智能体生态

Google 庆祝Agent-to-Agent(A2A)协议发布一周年。A2A专为生成式AI设计,相比传统REST API提供安全边界、零上下文污染、动态自主性和工作负载分布四大架构优势。应用实例FoldRun是一个独立的智能体接口,可在Gemini Enterprise或Gemini CLI等A2A兼容环境中部署,自动管理蛋白质结构预测任务,动态选择AlphaFold 2、OpenFold 3或Boltz-2等模型,无需自定义胶水代码。

智能体Google教程/实践部署/工程
03:08
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选58
企业版新用量分析与更新的支出控制

OpenAI 为 ChatGPT Enterprise 推出信用额度用量分析与更新的支出控制功能。全局管理控制台(Global Admin Console)统一展示 ChatGPT 和 Codex 的信用消耗,支持按时间、用户、产品、模型追踪用量趋势。管理员可为整个工作区设置默认限额,按群组配置额度,并为个人设置叠加限制。员工可查看个人用量并申请增加额度(附工作上下文)。这些功能即日起可用。

OpenAI产品更新部署/工程

推荐理由:仅面向ChatGPT Enterprise管理员的使用分析和预算控制更新,帮助企业追踪团队用量、控制成本,但并非行业级事件,管理者可当即启用。
02:51
Jeff Dean@JeffDean
49
Google 发布 TPU v2 至 Ironwood 五代训练超算演进论文

Jeff Dean 等 Google 同事发布论文,回顾 TPU v2 到 Ironwood 五代训练超算的演进,将于 2026 年 7/8 月发表于 IEEE Micro。关键变化:TPU v2 采用气冷,v3 起改为水冷;互联从 2D 升级为 3D torus;每 pod 芯片数从 256 增至 9216;每 flop 能效提升约 30 倍。此外,Google 内部工作负载已大幅转向基于 Transformer 的模型。

arXivGoogle数据/训练论文/研究
02:49
TechCrunch:AI(RSS)
57
亚马逊计划出售AI芯片Trainium,直接挑战Nvidia

AWS正与多家公司谈判,计划直接出售自研AI芯片Trainium用于数据中心,目前处于早期阶段。CEO Andy Jassy在4月股东信中指出,若芯片业务独立,年营收运行率可达约500亿美元,接近Intel的年收入。当前Trainium产能已售罄,下一代Trainium4的产能也在一年多前就告罄。尽管Nvidia年营收运行率高达3260亿美元,但Amazon若成功售芯将构成其最大挑战之一。AWS此前因依赖芯片驱动的云服务生态(存储、安全、网络等)而拒绝直接销售,但Jassy认为未来向第三方出售机架级芯片的可能性很大。

行业动态部署/工程
01:51
Claude:Blog(网页)
精选68
Claude Enterprise 推出企业托管 MCP 连接器授权管理

Claude Enterprise 推出企业托管授权功能,管理员可通过身份提供商(率先支持 Okta)为整个组织配置 MCP 连接器。用户首次登录 Claude 时自动获得授权,无需手动操作,实现零接触设置。该功能基于 Model Context Protocol 的 Enterprise-Managed Authorization 扩展构建,支持 Asana、Atlassian、Canva、Figma、Granola、Linear、Supabase 等 MCP 提供商,Slack 即将支持。授权管理集成到现有 IdP 工作流中,可按组限定范围、通过 IdP 快速撤销授权,并支持要求连接器仅通过 IdP 连接以隔离工作与个人使用。

AnthropicMCP/工具产品更新部署/工程

推荐理由:企业 MCP 连接器不再需要每个用户手动授权,这是 MCP 生态从个人扩展到组织的关键一步,管理员终于可以像管理其他 SaaS 一样管理 Claude 的工具链。
01:20
jason@jxnlco
42
看起来 GPT-5.5 在现实世界应用中有非常扎实的性能数据!
OpenAI产品更新部署/工程
00:54
Rohan Paul@rohanpaul_ai
52
美国批准加快数据中心电网接入计划

美国批准加快数据中心电网接入计划。PJM每年最多审查10个项目,但每个项目容量须至少250MW,主要针对大型发电厂。瓶颈在于互联审批流程缓慢。PJM警告未来10年可能出现60GW电力缺口,压力来自数据中心对服务器、冷却等持续供电需求。新计划从2026年7月运行至2027年,入选项目预计在10个月内获得电网协议,3年内投入运营。

政策/监管部署/工程
00:50
Elon Musk@elonmusk
50
Grok模型现已在Databricks Agent Bricks上可用,可将xAI最新模型引入企业数据以构建强大的AI智能体。Elon Musk宣布了这一消息。

xAI: Grok models are now available on Databricks Agent Bricks. Bring SpaceXAI's latest models to your enterprise data to powe...

xAI产品更新部署/工程
00:26
SemiAnalysis@SemiAnalysis_
65
停止说2026年美国数据中心一半容量被取消: 不要相信那些Vibecoded Estimates, 而是逐一审查每个申报文件。 https://newsletter.semianalysis.com/p/stop-saying-half-of-2026-us-datacenter
行业动态部署/工程
00:25
xAI:News(网页)
45
Grok 现集成 Databricks Agent Bricks

Grok 模型现已原生集成到 Databricks Agent Bricks 平台。在 2026 年 Data + AI Summit 上,Databricks 宣布与 SpaceXAI 合作,使 Grok 与其他前沿及开源模型在同一受控平台中可用。Agent Bricks 结合 Lakehouse 数据上下文与控制和选择,帮助工程团队构建处理大规模数据的 AI 智能体。此外,企业也可在 Amazon Bedrock 上运行 Grok 模型。

xAI行业动态部署/工程
00:22
Artificial Intelligence News(RSS)
37
计算机视觉货架跟踪推动零售业生产力提升

计算机视觉自动跟踪货架正帮助零售商应对利润侵蚀。行业低效消耗6.4%总销售额,2026年损失将达1964亿美元(同比增21%),远超3%的销售增速。九成零售商面临管理困难,全面部署商店智能平台的企业占60%(同比升18个百分点);年收入超50亿美元的公司中73%已规模化部署,低于10亿美元的仅42%。BJ's Wholesale Club部署Simbe机器人监测库存与价格,生成数字孪生后在线拣货效率年提升40%。Albertsons计划通过AI优化定价与品类管理,三个财年内实现15亿美元生产力提升。但部署顺序失衡:仅33%投资货架数字化硬件,2026年错误定价率将达13%(较2024年升4个百分点)。

现象/趋势部署/工程
00:21
xAI@xai
38
Grok 模型现已可在 Databricks Agent Bricks 上使用。 将 SpaceXAI 的最新模型引入您的企业数据,以驱动强大的 AI 智能体。 https://x.ai/news/grok-databricks
智能体xAI行业动态部署/工程
6月18日
23:55
AK@_akhaliq
41
GLM-5.2 在 Hugging Face Inference Providers 上通过 Zai、Together AI、Novita、Fireworks、DeepInfra 免费提供,持续 6 小时 可搭配 Pi、opencode、Codex、Claude Code 或任何编码智能体进行设置。
Hugging Face产品更新部署/工程
‹ 上一页
1…89101112…50
下一页 ›