6月9日

05:17

karminski-牙医@karminski3

推文介绍了如何使用 llmistanbul 在网页上10秒内训练一个小模型（电子鹦鹉）。只需将纯文本文档（如哈利波特1-7）拖入即可，建议使用 Apple Silicon Mac（M1-M5），避免 markdown/json 等格式。N 卡（3080Ti）适配不佳。提醒尊重版权，勿公开发布他人作品。

教程/实践端侧部署/工程

05:09

TechCrunch：AI（RSS）

Apple 免除小型开发者的 AI 云 API 费用

Apple 为首次 App Store 下载量不足 200 万的开发者免除云 API 费用，以降低 AI 实验门槛。

行业动态部署/工程

03:02

Hacker News 热门（buzzing.cc 中文翻译）

xAI看起来更像是一家数据中心房地产投资信托基金，而非前沿实验室

xAI在资产结构和运营模式上被比作数据中心REIT，而非传统的前沿AI实验室，这一观点来自martinalderson.com的分析文章。

Anthropic xAI 数据/训练现象/趋势

01:40

The Decoder：AI News（RSS）

Intel重获新生：Google和Nvidia将其视为台积电AI芯片的备选

Google向Intel订购超过300万颗AI芯片，计划于2028年交付。Nvidia正在测试Intel的制造工艺，用于其即将推出的Feynman架构。两家公司的动作源于台积电（TSMC）无法满足AI芯片需求。Intel长期低迷的晶圆代工部门因此获得第二次机会。

Google 行业动态部署/工程

01:09

MarkTechPost（RSS）

小米MiMo与TileRT推出MiMo-V2.5-Pro-UltraSpeed，万亿参数模型在8-GPU节点上解码超1000 tokens/s

小米MiMo团队与TileRT合作发布MiMo-V2.5-Pro-UltraSpeed服务模式，专为MiMo-V2.5-Pro模型设计。该方案在单个8-GPU消费级节点上，实现了1万亿参数模型超过1000 tokens/s的解码速度。

推理论文/研究部署/工程

01:01

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选74

小米 MiMo-v2.5-Pro-UltraSpeed 发布：1T 参数模型，每秒 1000 token

小米在 6 月 8 日发布 MiMo-v2.5-Pro-UltraSpeed 模型，拥有 1T 参数规模，推理速度达到每秒 1000 个 token。该模型来自小米旗下的 mimo.xiaomi.com 项目。

arXiv 开源生态推理模型发布

同一事件，精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式，1T 模型输出突破 1000 tokens/s》

推荐理由：小米把万亿模型推上 1000 tokens/s，不是纸面速度，而是模型与系统深耦合的结果，对实时推理和编程智能体是真正可落地的信号。限时申请有点可惜，但开源部分值得关注。

6月8日

23:54

OpenRouter@OpenRouter

本月不出所料是成本削减月。根据我们过去3年的数据，重大突破之后往往会出现成本压力。我们将从今天开始，每周至少推出一次主要功能，帮助您降低推理成本。持续更新列表 👇

OpenRouter: New server tool: Advisor Let smaller models consult a higher-intelligence "advisor" model. Helps them escape doom loops,...

智能体产品更新部署/工程

关联讨论 2 条

23:11

Rohan Paul@rohanpaul_ai

Coinbase CEO Brian Armstrong 预测，对智能的需求近乎无限，但 80% 的工作负载将在 12-18 个月内迁移到便宜 99% 的模型，仅 20% 继续运行在追求最高 IQ 的最新模型上（如科学突破、高级编排型 AI 智能体）。他类比高端 MacBook/游戏 PC 的配置占比，但指出模型价格下降远超摩尔定律。Armstrong 认为未来瓶颈是能源和算力，而非更好的模型。Coinbase 正将用户提示词路由到更便宜的模型，部分情况下 token 用量指数增长，成本基本持平。

Brian Armstrong: Good take My guess is - demand for intelligence is near infinite - but 80% of workloads will be running on 99% cheaper m...

大佬观点部署/工程

22:40

Xiaomi MiMo@XiaomiMiMo

同事件精选82

小米 MiMo-V2.5-Pro-UltraSpeed 突破 1，000 tokens/s，单台 8-GPGPU 节点运行 1T MoE 模型

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed，首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度，仅用单台标准 8-GPGPU 节点（非 Cerebras 或 Groq 方案）。提供限时免费聊天体验，UltraSpeed API 价格为 3 倍，输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日（PDT），企业可邮件联系 business-mimo@xiaomi.com。

推理模型发布部署/工程

同一事件，精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式，1T 模型输出突破 1000 tokens/s》

推荐理由：小米用单节点8卡标准GPU在1T MoE模型上跑出1000+ tokens/s，没有走晶圆级或专用芯片的路子，直接把推理成本门槛拉低了一大截，做实时对话和Agent的可以申请免费聊天先上手感受一下。

20:44

Artificial Intelligence News（RSS）

Aviva 部署 AI 阻止 2.3 亿英镑复杂保险欺诈

英国保险公司 Aviva 利用 AI 工具识别出创纪录的 2.3 亿英镑保险欺诈索赔，以应对欺诈者使用新一代工具带来的挑战。当前欺诈手段愈加复杂，AI 既被用于防御，也被攻击方利用。Aviva 通过 AI 技术提升检测能力，遏制日益严重的保险欺诈问题。

行业动态部署/工程

20:00

OpenRouter：Announcements（RSS）

同事件精选63

OpenRouter Agent SDK 推出 HITL 工具：满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求

OpenRouter 的 Agent SDK 新增人类参与循环（HITL）工具，用于 AI 智能体的合规监督。该工具可帮助 AI 智能体满足欧盟 AI 法案、科罗拉多州自动化决策技术法（SB26-189）以及 NIST AI 风险框架（NIST AI RMF）的监管要求。

智能体教程/实践部署/工程

同一事件，精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体》

推荐理由：8 月就是欧盟 AI 法案高风险的生效日，这个教程把三个监管框架的 HITL 要求变成可直接复用的代码，做金融医疗代理的开发者该收藏。

19:58

Huawei Cloud@HuaweiCloud1

华为云发布Agentic Infra新范式及系列AI产品

华为云在 INSPIRE 2026 上推出 Agentic Infra 新范式，作为统一承载通用与 AI 负载的基础设施。同时发布全新一代模型训练推理平台与企业智能体平台，并宣布在其 Industry AI Foundry 中设立四个专属专区：智慧医疗专区、具身 AI 专区、智能制造专区和科学计算专区。

智能体产品更新部署/工程

19:20

IT之家（RSS）

Arm 推出 AppReady for Windows：加速构建原生 WoA 应用

Arm 联合 Microsoft 推出 AppReady for Windows 项目，旨在引导开发者获取学习资源，构建原生 Windows on Arm（WoA）应用。项目整合 AI 赋能工具、开发指导与专家支持，帮助开发者检查关键依赖项是否已有 WoA 原生版本、审视构建系统与编译器设置、识别架构相关代码及性能关键路径，并获取原生开发指导。AI 工具可扫描代码、识别可移植性问题并加速移植。

Microsoft 端侧行业动态部署/工程

19:10

Alibaba Cloud@alibaba_cloud

发现为什么全球企业选择阿里云 E-MapReduce （EMR）。在 TPC-H 和 TPC-DS 基准测试中排名第一，集成 Hadoop、Spark、StarRocks 等。在本视频中： ✅ 灵活部署（Serverless、ECS、ACK） ✅ AI 原生：通过 SQL/PySpark 运行大语言模型 ✅ Spark 快 4 倍，StarRocks 快 10 倍，成本更低 ✅ 企业级安全弹性、高效、智能的大数据。 🔗 了解更多：https://int.alibabacloud.com/m/1000414155/

产品更新数据/训练部署/工程

18:40

Alibaba Cloud@alibaba_cloud

阿里云STAROps UModel：知识图谱让AIOps效率提升10倍

AI Agent成本飙升，Uber预算浪费暴露了“Tokenmaxxing”陷阱。阿里云STAROps推出UModel解决方案，采用结构优先方法，用知识图谱替代盲文本推理，通过即时解析依赖关系大幅减少Token消耗和工具调用，实现10倍效率提升，同时确保企业系统可审计与零信任准确性。

智能体产品更新部署/工程

18:10

Alibaba Cloud@alibaba_cloud

阿里云发布AgentScope Java 2.0，面向企业级AI智能体开发。新版本主要特性：分布式无状态架构，支持K8s弹性扩缩容与会话恢复；多租户隔离，通过Workspace抽象实现安全数据分离；长期稳定性，HarnessAgent负责上下文管理与容错；安全执行，提供细粒度权限控制和Human-in-the-Loop支持。适用于JVM生产环境。开源地址见推文链接。

智能体开源/仓库部署/工程

13:20

IT之家（RSS）

OWC Stack AI 确认基于群联 aiDAPTIV，为外置式内存化闪存方案

OWC 在今年 5 月宣布的 Stack AI 是一款雷电 5“AI 加速器”与外置存储解决方案，在 COMPUTEX 2026 上确认基于群联 aiDAPTIV 方案，为外置式 AI 内存 NAND 扩充方案。aiDAPTIV 将闪存纳入系统有效内存，把部分 AI 内存需求卸载到高耐久性 SSD 上，降低对 DRAM 依赖，使大型 AI 智能体可在本地运行。此前的 aiDAPTIV 多为内置型，Stack AI 为外置版本，部署更灵活。

产品更新推理端侧部署/工程

13:20

IT之家（RSS）

TrendForce：SpaceX IPO 将带动全球卫星产值 2027 年达 4470 亿美元，年增 14%

TrendForce 预测，受卫星宽带、手机直连卫星及 AI 运算需求推动，SpaceX 未来 IPO 将带动全球卫星产业产值在 2027 年达 4470 亿美元，年增 14%。SpaceX 通过收购 EchoStar 频段加速新兴市场手机直连卫星部署，并布局 AI 太空运算，在卫星轨道端直接分析农业监测等影像数据，同时扩建自有 AI 运算芯片厂 Terafab，强化垂直整合能力。

行业动态部署/工程

10:20

IT之家（RSS）

英伟达与韩国斗山集团扩大合作，覆盖物理 AI、机器人及 AI 工厂基础设施

英伟达与韩国斗山集团6月8日宣布扩展合作，覆盖四大板块：斗山机器人将整合英伟达Isaac Sim、Cosmos及Jetson Thor，升级“智能体机器人操作系统”，并探索双臂及人形机器人；斗山山猫将引入物理AI至建筑、农业及物料搬运设备；斗山重工拟以燃气轮机、小型模块化反应堆等为英伟达AI工厂供电；斗山电子材料以覆铜板支持英伟达MGX生态AI服务器及网络设备PCB。

具身智能行业动态部署/工程

09:19

IT之家（RSS）

SK电讯基于NVIDIA DSX平台建设GW级AI工厂云，2027年投运

SK电讯宣布基于NVIDIA AI工厂平台DSX构建AI数据中心，目标将AI云服务规模扩展至GW级别。首先采用Blackwell架构GPU用于训练与推理，后续逐步导入Vera Rubin平台。该AI工厂计划于2027年在韩国投运。SK电讯计划将AI基础设施扩展至全亚洲，成为NVIDIA亚洲AI基础设施关键合作伙伴。此外，双方还在机器人仿真和训练平台方面展开合作。

行业动态部署/工程

09:08

Rohan Paul@rohanpaul_ai

SK海力士与英伟达达成多年内存合作，为下一代AI超级计算机和PC联合开发内存

SK海力士与英伟达达成多年内存合作，将为英伟达下一代AI超级计算机Vera Rubin、Vera CPU、RTX Spark PC及Jetson Thor平台联合开发内存。合作强调内存设计需提前数年与GPU协同设计、制造规划及资本投入，不能再于GPU完成后才设计。双方还将把AI引入芯片制造，利用NVIDIA CUDA-X、PhysicsNeMo、Omniverse、OpenUSD、cuOpt加速芯片设计和半导体仿真，并计划建立工厂数字孪生，在软件中模拟机器人、晶圆和物流后再投入产线。该合作进一步巩固了SK海力士在AI硬件供应链中的关键地位。

端侧行业动态部署/工程

06:38

Rohan Paul@rohanpaul_ai

FT/MIT：AI编辑增300%，发布仅30%瓶颈明显

FT报道MIT一项研究，跟踪软件团队从文件编辑到审查到发布的完整生产漏斗。使用AI后，开发者创建或编辑文件数量增加近300%，但在审查阶段增益降至150%，最终到软件发布仅提升约30%。这表明AI在加速局部编码任务上效果显著，但人类审查、协调、产品判断、测试和发布流程仍是决定产出价值的关键瓶颈，大量额外工作未能转化为最终产品。

现象/趋势部署/工程

00:27

AYi@AYi_AInotes

免费获取AI额度的四个隐藏入口

文章盘点四大渠道：① OpenAI Codex for OSS，开源项目维护者可免费获6个月ChatGPT Pro（价值$1200）及API credits；② Anything AI，新用户通过促销链接注册可得2万credits，需重复点击触发bonus；③ Lenny's Product Pass，付费订阅其年度Newsletter（$200-400）可兑换总价值$30000+的AI工具一年会员，先到先得且要求新用户；④ 三大云startup credits，微软Founders Hub最低$1K-$5K（无VC要求），谷歌AI-first创业最高$350K但要求严，AWS可叠加（自筹$1K+YC等）。每个口子均有门槛限制。

Google OpenAI 开源生态教程/实践

6月7日

20:27

AYi@AYi_AInotes

Anthropic 从 OpenAI 挖走自研芯片关键人物 Clive Chan

Anthropic 挖走 OpenAI 自研芯片团队第二位硬件员工 Clive Chan，他主导与 Broadcom 合作的芯片设计，2.4 年亲历项目从零到即将部署。Clive 称无法抵抗“从山脚爬一座新山”的冲动，本周加入 Anthropic。主推文分析挖角逻辑：并非靠薪资，而是让核心员工感到 OpenAI 窗口期关闭，Anthropic 在基础科学、长期押注和硬件人才密度上提供更大攀登空间。过去一年已陆续挖走基础研究、安全及 AI 硬件等核心人才。

Clive Chan: Personal update: I've decided to leave OpenAI. I'm proud to have been part of the custom chip program and grateful to ev...

Anthropic OpenAI 行业动态部署/工程

20:19

IT之家（RSS）

富士康展示液冷版 RTX 6000 Blackwell GPU

富士康在2026年台北电脑展期间展示了一款液冷版 RTX 6000 Blackwell GPU，面向服务器和数据中心场景。该卡采用单槽设计，全面覆盖液冷散热模块，拥有96GB GDDR7显存，可运行AI大模型、复杂仿真及专业图形任务。电源接口改用远离PCIe插槽的独立插槽，未使用标准12V-2x6接口。

产品更新推理部署/工程

19:27

AYi@AYi_AInotes

精选78

"我在田里雇了一名工程师，它叫 Codex" -- 北海道一个西兰花农的 8 个真实 AI 用法

日本北海道农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题，涵盖 8 个用法：拍照识别西兰花病害、卫星监测获取 NDVI 数据、用 ESP32 和 LINE 机器人远程控制温室卷帘、为农场群聊开发机器人管理温度与排期、从聊天记录追踪播种数量、学习 RTK-GPS 自动转向原理并评估自建成本、设计基于 Airtable 的农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及，“如同身边有一位超级工程师”。

OpenAI 教程/实践端侧部署/工程

推荐理由：一个北海道农民把 ChatGPT 和 Codex 用成了农场的‘外挂工程师’，从病害诊断到温室远程控制，每个用法都附原始提示词——农业从业者可以直接抄作业。

17:04

MarkTechPost（RSS）

2026年最佳21款低代码与无代码AI工具盘点

低代码与无代码AI平台正将提示词转化为可运行的应用、智能体或模型。该指南比较了21款工具，涵盖应用构建器、自动化、AI智能体和机器学习平台四类，每款均附带官方链接。

评测/基准部署/工程

15:14

凡人小北@frxiaobei

Notion因Anthropic的Opus 4.7和4.8模型出现性能下降（degraded performance），导致选择这些模型的用户故障率升高，已禁用所有Anthropic模型并将请求切流至替代供应商。大部分用户可继续使用Notion AI，但Anthropic专属功能不可用。评论认为这种应急切流比榜单更能说明问题：AI成为生产环境一部分后，长期维持一致性能才是真正护城河。

Notion Status: Anthropic's Opus 4.7 and 4.8 models are experiencing degraded performance, which is causing a higher rate of failures fo...

Anthropic 大佬观点部署/工程

14:21

OpenRouter@OpenRouter

不同模型提供商在缓存命中率和有效价格上有什么差异？现在你可以从 Pricing 标签查看实时缓存命中率和历史流量。这里是 Opus 4.8：https://openrouter.ai/anthropic/claude-opus-4.8/pricing

产品更新部署/工程

08:19

IT之家（RSS）

三峡集团首个无人机智能巡检管理体系投运，覆盖12座新能源场站

近日，三峡集团首个无人机智能巡检管理体系在内蒙古投入运行，首批覆盖12座新能源场站，总装机640万千瓦。体系配套21座无人机机巢、28架巡检无人机，实现光伏、风机、集电线路、升压站巡检全覆盖。相比人工巡检，每年节省工时超11万小时，效率提升13.2倍，隐患提前检出率63%。依托自主开发的智能巡检平台，通过AI甄别缺陷，并建立专项管控机制落实双审批、全报备、实时监控，确保飞行全程可追溯、可管控、可闭环。

行业动态部署/工程

08:09

Claude Code：GitHub Releases（RSS）

Claude Code v2.1.168 发布

Claude Code v2.1.168 版本发布，更新内容仅为错误修复和可靠性改进。因原文较短，无法达成 50-100 字。

Anthropic 产品更新部署/工程

07:56

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选75

谷歌将每月向SpaceX支付9.2亿美元，以获取xAI数据中心的计算能力

谷歌与SpaceX达成协议，每月支付9.2亿美元，获得位于xAI数据中心的计算能力。该交易的具体金额和合作细节于本周披露，将极大扩充谷歌的算力资源。

Google 行业动态部署/工程

同一事件，精选展示《SpaceX与Google达成云计算新协议》

推荐理由：Google月砸9.2亿租SpaceX的GPU，这个金额暴露了巨头对算力的饥渴，虽然xAI自己还在亏损，这笔交易更像是IPO前的造势，但对基础设施市场绝对是一个冲击信号。

06:34

MarkTechPost（RSS）

同事件精选74

Google 发布 Colab CLI，开发者与 AI 智能体可在终端中远程调用 Colab GPU 与 TPU 运行 Python 代码

Google 发布 Colab CLI，允许开发者和 AI 智能体在终端中直接运行本地 Python 代码，并利用远程 Colab 的 GPU 与 TPU 运行时进行加速。通过这一命令行工具，用户无需打开浏览器即可无缝连接 Colab 计算资源，为自动化和脚本化 AI 工作流提供了更便捷的接口。

Google 产品更新部署/工程

同一事件，精选展示《Google Colab CLI 发布》

推荐理由：Colab CLI把远程GPU接入终端，且AI Agent可直接调用，让Colab从笔记本变成计算后端，个人开发者云端算力使用方式会被改变。

03:34

Rohan Paul@rohanpaul_ai

亿万富翁投资者Ron Baron表示，SpaceX是"你永远无法拥有足够多的最伟大想法"。据Reuters，SpaceX 750亿美元IPO已获约1500亿美元需求（2倍超额认购）。路演中，SpaceX称其AI业务可追逐23万亿美元市场，通过降低太空访问成本，目标连接超过30亿未联网人口。SpaceX还认为，美国发电量与计算机产能增长已落后中国，可通过在太空部署数据中心等基础设施来弥补。

Rohan Paul: Rreuters: SpaceX's $75B IPO is already seeing about $150B in demand (2x oversubscribed) SpaceX has said its AI business ...

行业动态部署/工程

03:26

AYi@AYi_AInotes

前日本公务员用AI管理100公顷农场

一名前日本公务员（不会种地）在北海道用AI管理100公顷农场。他借助ChatGPT和Codex自行编写代码，构建全自动农场系统：ESP32+LINE机器人远程控制温室通风/卷帘电机；温度监测+自动通风机器人；Airtable农场数据库（田地、任务、传感器、材料）；卫星NDVI作物健康地图叠加在田地上；AI生成布线图。展示了普通人用AI解决实际问题的正确方式。

AYi: http://x.com/i/article/2063237792746831872

教程/实践编码部署/工程

02:25

AYi@AYi_AInotes

全网最全面的Hermes桌面端教程！

教程/实践部署/工程

6月6日

23:30

Rohan Paul@rohanpaul_ai

SpaceX 750亿美元IPO获约1500亿美元需求，AI业务瞄准23万亿市场

据路透报道，SpaceX 750亿美元IPO已获约1500亿美元需求（2倍超额认购）。SpaceX在路演中表示，其AI业务可瞄准23万亿美元市场，通过太空建设AI算力突破地球限制。公司称美国电力与算力增长落后于中国，计划用SpaceX发射将数据中心等送入太空弥补差距。此前SpaceX披露与Google的云服务协议，Google每月支付9.2亿美元（约110亿美元/年）用于xAI数据中心算力。

Rohan Paul: SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a...

Google xAI 行业动态部署/工程

21:53

Hacker News 热门（buzzing.cc 中文翻译）

谷歌将每月向SpaceX支付9.2亿美元用于计算服务

科技巨头谷歌与航天公司SpaceX达成协议，每月支付9.2亿美元，用于购买计算服务。该消息根据Hacker News 6月6日的信息曝光，显示这一高额交易已得到确认。谷歌将向SpaceX支付每月9.2亿美元的费用，以获得其计算能力的支持。

Google 行业动态部署/工程

21:17

IT之家（RSS）

精选70

OpenCV 5 发布：升级全新 DNN 引擎、原生支持大模型

OpenCV 5 正式发布，采用基于图的 DNN 引擎，ONNX 算子覆盖率从 4.x 的不到 23% 提升至超 80%，原生支持 Transformer、视觉语言模型（VLM）和大语言模型（LLM）。其他更新包括：更好的 Python 集成与命名参数、更紧凑核心代码、清晰硬件加速层、原生 FP16/BF16、规范化 0D/1D 张量、扩展 3D 视觉及现代化文档。该库 GitHub 拥有超 86,000 stars，每日安装量超一百万次。

多模态开源/仓库推理部署/工程

推荐理由：OpenCV 5 是一次架构级大更新，DNN 引擎重写、ONNX 覆盖率从 23% 跳到 80%，原生支持大模型推理，做模型部署的该关注了。

20:29

meng shao@shao__meng

Anthropic 白皮书：面向 AI Agent 的零信任安全框架

Anthropic 5 月发布白皮书，提出企业部署自主 AI Agent 时须将零信任原则延伸至 Agent 架构。报告指出双重加速：前沿模型将漏洞发现到利用周期压缩至数小时；Agent 能自主解释目标、选工具、执行多步操作，传统访问控制无法阻止“合法权限内作恶”。核心原则：永不信任始终验证、假设已遭入侵、最小权限；另附设计检验——控制是让攻击不可能，还是仅增加麻烦？报告分五部分：Agent 为何是新安全对象、威胁图谱、三层能力成熟度模型、八阶段实施工作流、防御运营适配自主威胁速度。

智能体 Anthropic 安全/对齐部署/工程