AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月9日周二
05:17karminski-牙医70llmistanbul 10秒训练电子鹦鹉模型教程
05:09TechCrunch:AI(RSS)52Apple 免除小型开发者的 AI 云 API 费用
03:02Hacker News 热门(buzzing.cc 中文翻译)62xAI看起来更像是一家数据中心房地产投资信托基金,而非前沿实验室
01:40The Decoder:AI News(RSS)62Intel重获新生:Google和Nvidia将其视为台积电AI芯片的备选
01:09MarkTechPost(RSS)66小米MiMo与TileRT推出MiMo-V2.5-Pro-UltraSpeed,万亿参数模型在8-GPU节点上解码超1000 tokens/s
01:01Hacker News 热门(buzzing.cc 中文翻译)74同事件精选小米 MiMo-v2.5-Pro-UltraSpeed 发布:1T 参数模型,每秒 1000 token同一事件,精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s》
6月8日周一
23:54OpenRouter66OpenRouter 成本削减月 每周推新功能
23:11Rohan Paul63Coinbase CEO 预测 AI 工作负载迁移
22:40Xiaomi MiMo82同事件精选小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型同一事件,精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s》
20:44Artificial Intelligence News(RSS)44Aviva 部署 AI 阻止 2.3 亿英镑复杂保险欺诈
20:00OpenRouter:Announcements(RSS)63同事件精选OpenRouter Agent SDK 推出 HITL 工具:满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
19:58Huawei Cloud56华为云发布Agentic Infra新范式及系列AI产品
19:20IT之家(RSS)51Arm 推出 AppReady for Windows:加速构建原生 WoA 应用
19:10Alibaba Cloud27阿里云EMR性能与AI原生能力获企业认可
18:40Alibaba Cloud56阿里云STAROps UModel:知识图谱让AIOps效率提升10倍
18:10Alibaba Cloud66AgentScope Java 2.0 发布
13:20IT之家(RSS)46OWC Stack AI 确认基于群联 aiDAPTIV,为外置式内存化闪存方案
13:20IT之家(RSS)36TrendForce:SpaceX IPO 将带动全球卫星产值 2027 年达 4470 亿美元,年增 14%
10:20IT之家(RSS)57英伟达与韩国斗山集团扩大合作,覆盖物理 AI、机器人及 AI 工厂基础设施
09:19IT之家(RSS)54SK电讯基于NVIDIA DSX平台建设GW级AI工厂云,2027年投运
09:08Rohan Paul61SK海力士与英伟达达成多年内存合作,为下一代AI超级计算机和PC联合开发内存
06:38Rohan Paul53FT/MIT:AI编辑增300%,发布仅30%瓶颈明显
00:27AYi69免费获取AI额度的四个隐藏入口
6月7日周日
20:27AYi71Anthropic 从 OpenAI 挖走自研芯片关键人物 Clive Chan
20:19IT之家(RSS)42富士康展示液冷版 RTX 6000 Blackwell GPU
19:27AYi78精选"我在田里雇了一名工程师,它叫 Codex" -- 北海道一个西兰花农的 8 个真实 AI 用法
17:04MarkTechPost(RSS)562026年最佳21款低代码与无代码AI工具盘点
15:14凡人小北63Notion AI因Opus 4.7/4.8性能下降禁用Anthropic模型
14:21OpenRouter62Opus 4.8 缓存命中率与有效价格可实时查看
08:19IT之家(RSS)40三峡集团首个无人机智能巡检管理体系投运,覆盖12座新能源场站
08:09Claude Code:GitHub Releases(RSS)31Claude Code v2.1.168 发布
07:56Hacker News 热门(buzzing.cc 中文翻译)75同事件精选谷歌将每月向SpaceX支付9.2亿美元,以获取xAI数据中心的计算能力同一事件,精选展示《SpaceX与Google达成云计算新协议》
06:34MarkTechPost(RSS)74同事件精选Google 发布 Colab CLI,开发者与 AI 智能体可在终端中远程调用 Colab GPU 与 TPU 运行 Python 代码同一事件,精选展示《Google Colab CLI 发布》
03:34Rohan Paul71Baron:SpaceX是"最伟大的想法",AI业务瞄准新兴市场
03:26AYi62前日本公务员用AI管理100公顷农场
02:25AYi58Hermes桌面端教程全网最全
6月6日周六
23:30Rohan Paul70SpaceX 750亿美元IPO获约1500亿美元需求,AI业务瞄准23万亿市场
21:53Hacker News 热门(buzzing.cc 中文翻译)69谷歌将每月向SpaceX支付9.2亿美元用于计算服务
21:17IT之家(RSS)70精选OpenCV 5 发布:升级全新 DNN 引擎、原生支持大模型
20:29meng shao59Anthropic 白皮书:面向 AI Agent 的零信任安全框架
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月9日
05:17
karminski-牙医@karminski3
70
llmistanbul 10秒训练电子鹦鹉模型教程

推文介绍了如何使用 llmistanbul 在网页上10秒内训练一个小模型(电子鹦鹉)。只需将纯文本文档(如哈利波特1-7)拖入即可,建议使用 Apple Silicon Mac(M1-M5),避免 markdown/json 等格式。N 卡(3080Ti)适配不佳。提醒尊重版权,勿公开发布他人作品。

教程/实践端侧部署/工程
05:09
TechCrunch:AI(RSS)
52
Apple 免除小型开发者的 AI 云 API 费用

Apple 为首次 App Store 下载量不足 200 万的开发者免除云 API 费用,以降低 AI 实验门槛。

行业动态部署/工程
03:02
Hacker News 热门(buzzing.cc 中文翻译)
62
xAI看起来更像是一家数据中心房地产投资信托基金,而非前沿实验室

xAI在资产结构和运营模式上被比作数据中心REIT,而非传统的前沿AI实验室,这一观点来自martinalderson.com的分析文章。

AnthropicxAI数据/训练现象/趋势
01:40
The Decoder:AI News(RSS)
62
Intel重获新生:Google和Nvidia将其视为台积电AI芯片的备选

Google向Intel订购超过300万颗AI芯片,计划于2028年交付。Nvidia正在测试Intel的制造工艺,用于其即将推出的Feynman架构。两家公司的动作源于台积电(TSMC)无法满足AI芯片需求。Intel长期低迷的晶圆代工部门因此获得第二次机会。

Google行业动态部署/工程
01:09
MarkTechPost(RSS)
66
小米MiMo与TileRT推出MiMo-V2.5-Pro-UltraSpeed,万亿参数模型在8-GPU节点上解码超1000 tokens/s

小米MiMo团队与TileRT合作发布MiMo-V2.5-Pro-UltraSpeed服务模式,专为MiMo-V2.5-Pro模型设计。该方案在单个8-GPU消费级节点上,实现了1万亿参数模型超过1000 tokens/s的解码速度。

推理论文/研究部署/工程
01:01
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选74
小米 MiMo-v2.5-Pro-UltraSpeed 发布:1T 参数模型,每秒 1000 token

小米在 6 月 8 日发布 MiMo-v2.5-Pro-UltraSpeed 模型,拥有 1T 参数规模,推理速度达到每秒 1000 个 token。该模型来自小米旗下的 mimo.xiaomi.com 项目。

arXiv开源生态推理模型发布
同一事件,精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s》
推荐理由:小米把万亿模型推上 1000 tokens/s,不是纸面速度,而是模型与系统深耦合的结果,对实时推理和编程智能体是真正可落地的信号。限时申请有点可惜,但开源部分值得关注。
6月8日
23:54
OpenRouter@OpenRouter
66
本月不出所料是成本削减月。 根据我们过去3年的数据,重大突破之后往往会出现成本压力。 我们将从今天开始,每周至少推出一次主要功能,帮助您降低推理成本。 持续更新列表 👇

OpenRouter: New server tool: Advisor Let smaller models consult a higher-intelligence "advisor" model. Helps them escape doom loops,...

智能体产品更新部署/工程
关联讨论 2 条OpenRouter:Announcements(RSS)X:OpenRouter (@OpenRouter)
23:11
Rohan Paul@rohanpaul_ai
63
Coinbase CEO Brian Armstrong 预测,对智能的需求近乎无限,但 80% 的工作负载将在 12-18 个月内迁移到便宜 99% 的模型,仅 20% 继续运行在追求最高 IQ 的最新模型上(如科学突破、高级编排型 AI 智能体)。他类比高端 MacBook/游戏 PC 的配置占比,但指出模型价格下降远超摩尔定律。Armstrong 认为未来瓶颈是能源和算力,而非更好的模型。Coinbase 正将用户提示词路由到更便宜的模型,部分情况下 token 用量指数增长,成本基本持平。

Brian Armstrong: Good take My guess is - demand for intelligence is near infinite - but 80% of workloads will be running on 99% cheaper m...

大佬观点部署/工程
22:40
Xiaomi MiMo@XiaomiMiMo
同事件精选82
小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 business-mimo@xiaomi.com。

推理模型发布部署/工程
同一事件,精选展示《小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s》
推荐理由:小米用单节点8卡标准GPU在1T MoE模型上跑出1000+ tokens/s,没有走晶圆级或专用芯片的路子,直接把推理成本门槛拉低了一大截,做实时对话和Agent的可以申请免费聊天先上手感受一下。
20:44
Artificial Intelligence News(RSS)
44
Aviva 部署 AI 阻止 2.3 亿英镑复杂保险欺诈

英国保险公司 Aviva 利用 AI 工具识别出创纪录的 2.3 亿英镑保险欺诈索赔,以应对欺诈者使用新一代工具带来的挑战。当前欺诈手段愈加复杂,AI 既被用于防御,也被攻击方利用。Aviva 通过 AI 技术提升检测能力,遏制日益严重的保险欺诈问题。

行业动态部署/工程
20:00
OpenRouter:Announcements(RSS)
同事件精选63
OpenRouter Agent SDK 推出 HITL 工具:满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求

OpenRouter 的 Agent SDK 新增人类参与循环(HITL)工具,用于 AI 智能体的合规监督。该工具可帮助 AI 智能体满足欧盟 AI 法案、科罗拉多州自动化决策技术法(SB26-189)以及 NIST AI 风险框架(NIST AI RMF)的监管要求。

智能体教程/实践部署/工程
同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
推荐理由:8 月就是欧盟 AI 法案高风险的生效日,这个教程把三个监管框架的 HITL 要求变成可直接复用的代码,做金融医疗代理的开发者该收藏。
19:58
Huawei Cloud@HuaweiCloud1
56
华为云发布Agentic Infra新范式及系列AI产品

华为云在 INSPIRE 2026 上推出 Agentic Infra 新范式,作为统一承载通用与 AI 负载的基础设施。同时发布全新一代模型训练推理平台与企业智能体平台,并宣布在其 Industry AI Foundry 中设立四个专属专区:智慧医疗专区、具身 AI 专区、智能制造专区和科学计算专区。

智能体产品更新部署/工程
19:20
IT之家(RSS)
51
Arm 推出 AppReady for Windows:加速构建原生 WoA 应用

Arm 联合 Microsoft 推出 AppReady for Windows 项目,旨在引导开发者获取学习资源,构建原生 Windows on Arm(WoA)应用。项目整合 AI 赋能工具、开发指导与专家支持,帮助开发者检查关键依赖项是否已有 WoA 原生版本、审视构建系统与编译器设置、识别架构相关代码及性能关键路径,并获取原生开发指导。AI 工具可扫描代码、识别可移植性问题并加速移植。

Microsoft端侧行业动态部署/工程
19:10
Alibaba Cloud@alibaba_cloud
27
发现为什么全球企业选择阿里云 E-MapReduce (EMR)。在 TPC-H 和 TPC-DS 基准测试中排名第一,集成 Hadoop、Spark、StarRocks 等。 在本视频中: ✅ 灵活部署(Serverless、ECS、ACK) ✅ AI 原生:通过 SQL/PySpark 运行大语言模型 ✅ Spark 快 4 倍,StarRocks 快 10 倍,成本更低 ✅ 企业级安全 弹性、高效、智能的大数据。 🔗 了解更多:https://int.alibabacloud.com/m/1000414155/
产品更新数据/训练部署/工程
18:40
Alibaba Cloud@alibaba_cloud
56
阿里云STAROps UModel:知识图谱让AIOps效率提升10倍

AI Agent成本飙升,Uber预算浪费暴露了“Tokenmaxxing”陷阱。阿里云STAROps推出UModel解决方案,采用结构优先方法,用知识图谱替代盲文本推理,通过即时解析依赖关系大幅减少Token消耗和工具调用,实现10倍效率提升,同时确保企业系统可审计与零信任准确性。

智能体产品更新部署/工程
18:10
Alibaba Cloud@alibaba_cloud
66
阿里云发布AgentScope Java 2.0,面向企业级AI智能体开发。新版本主要特性:分布式无状态架构,支持K8s弹性扩缩容与会话恢复;多租户隔离,通过Workspace抽象实现安全数据分离;长期稳定性,HarnessAgent负责上下文管理与容错;安全执行,提供细粒度权限控制和Human-in-the-Loop支持。适用于JVM生产环境。开源地址见推文链接。
智能体开源/仓库部署/工程
13:20
IT之家(RSS)
46
OWC Stack AI 确认基于群联 aiDAPTIV,为外置式内存化闪存方案

OWC 在今年 5 月宣布的 Stack AI 是一款雷电 5“AI 加速器”与外置存储解决方案,在 COMPUTEX 2026 上确认基于群联 aiDAPTIV 方案,为外置式 AI 内存 NAND 扩充方案。aiDAPTIV 将闪存纳入系统有效内存,把部分 AI 内存需求卸载到高耐久性 SSD 上,降低对 DRAM 依赖,使大型 AI 智能体可在本地运行。此前的 aiDAPTIV 多为内置型,Stack AI 为外置版本,部署更灵活。

产品更新推理端侧部署/工程
13:20
IT之家(RSS)
36
TrendForce:SpaceX IPO 将带动全球卫星产值 2027 年达 4470 亿美元,年增 14%

TrendForce 预测,受卫星宽带、手机直连卫星及 AI 运算需求推动,SpaceX 未来 IPO 将带动全球卫星产业产值在 2027 年达 4470 亿美元,年增 14%。SpaceX 通过收购 EchoStar 频段加速新兴市场手机直连卫星部署,并布局 AI 太空运算,在卫星轨道端直接分析农业监测等影像数据,同时扩建自有 AI 运算芯片厂 Terafab,强化垂直整合能力。

行业动态部署/工程
10:20
IT之家(RSS)
57
英伟达与韩国斗山集团扩大合作,覆盖物理 AI、机器人及 AI 工厂基础设施

英伟达与韩国斗山集团6月8日宣布扩展合作,覆盖四大板块:斗山机器人将整合英伟达Isaac Sim、Cosmos及Jetson Thor,升级“智能体机器人操作系统”,并探索双臂及人形机器人;斗山山猫将引入物理AI至建筑、农业及物料搬运设备;斗山重工拟以燃气轮机、小型模块化反应堆等为英伟达AI工厂供电;斗山电子材料以覆铜板支持英伟达MGX生态AI服务器及网络设备PCB。

具身智能行业动态部署/工程
09:19
IT之家(RSS)
54
SK电讯基于NVIDIA DSX平台建设GW级AI工厂云,2027年投运

SK电讯宣布基于NVIDIA AI工厂平台DSX构建AI数据中心,目标将AI云服务规模扩展至GW级别。首先采用Blackwell架构GPU用于训练与推理,后续逐步导入Vera Rubin平台。该AI工厂计划于2027年在韩国投运。SK电讯计划将AI基础设施扩展至全亚洲,成为NVIDIA亚洲AI基础设施关键合作伙伴。此外,双方还在机器人仿真和训练平台方面展开合作。

行业动态部署/工程
09:08
Rohan Paul@rohanpaul_ai
61
SK海力士与英伟达达成多年内存合作,为下一代AI超级计算机和PC联合开发内存

SK海力士与英伟达达成多年内存合作,将为英伟达下一代AI超级计算机Vera Rubin、Vera CPU、RTX Spark PC及Jetson Thor平台联合开发内存。合作强调内存设计需提前数年与GPU协同设计、制造规划及资本投入,不能再于GPU完成后才设计。双方还将把AI引入芯片制造,利用NVIDIA CUDA-X、PhysicsNeMo、Omniverse、OpenUSD、cuOpt加速芯片设计和半导体仿真,并计划建立工厂数字孪生,在软件中模拟机器人、晶圆和物流后再投入产线。该合作进一步巩固了SK海力士在AI硬件供应链中的关键地位。

端侧行业动态部署/工程
06:38
Rohan Paul@rohanpaul_ai
53
FT/MIT:AI编辑增300%,发布仅30%瓶颈明显

FT报道MIT一项研究,跟踪软件团队从文件编辑到审查到发布的完整生产漏斗。使用AI后,开发者创建或编辑文件数量增加近300%,但在审查阶段增益降至150%,最终到软件发布仅提升约30%。这表明AI在加速局部编码任务上效果显著,但人类审查、协调、产品判断、测试和发布流程仍是决定产出价值的关键瓶颈,大量额外工作未能转化为最终产品。

现象/趋势部署/工程
00:27
AYi@AYi_AInotes
69
免费获取AI额度的四个隐藏入口

文章盘点四大渠道:① OpenAI Codex for OSS,开源项目维护者可免费获6个月ChatGPT Pro(价值$1200)及API credits;② Anything AI,新用户通过促销链接注册可得2万credits,需重复点击触发bonus;③ Lenny's Product Pass,付费订阅其年度Newsletter($200-400)可兑换总价值$30000+的AI工具一年会员,先到先得且要求新用户;④ 三大云startup credits,微软Founders Hub最低$1K-$5K(无VC要求),谷歌AI-first创业最高$350K但要求严,AWS可叠加(自筹$1K+YC等)。每个口子均有门槛限制。

GoogleOpenAI开源生态教程/实践
6月7日
20:27
AYi@AYi_AInotes
71
Anthropic 从 OpenAI 挖走自研芯片关键人物 Clive Chan

Anthropic 挖走 OpenAI 自研芯片团队第二位硬件员工 Clive Chan,他主导与 Broadcom 合作的芯片设计,2.4 年亲历项目从零到即将部署。Clive 称无法抵抗“从山脚爬一座新山”的冲动,本周加入 Anthropic。主推文分析挖角逻辑:并非靠薪资,而是让核心员工感到 OpenAI 窗口期关闭,Anthropic 在基础科学、长期押注和硬件人才密度上提供更大攀登空间。过去一年已陆续挖走基础研究、安全及 AI 硬件等核心人才。

Clive Chan: Personal update: I've decided to leave OpenAI. I'm proud to have been part of the custom chip program and grateful to ev...

AnthropicOpenAI行业动态部署/工程
20:19
IT之家(RSS)
42
富士康展示液冷版 RTX 6000 Blackwell GPU

富士康在2026年台北电脑展期间展示了一款液冷版 RTX 6000 Blackwell GPU,面向服务器和数据中心场景。该卡采用单槽设计,全面覆盖液冷散热模块,拥有96GB GDDR7显存,可运行AI大模型、复杂仿真及专业图形任务。电源接口改用远离PCIe插槽的独立插槽,未使用标准12V-2x6接口。

产品更新推理部署/工程
19:27
AYi@AYi_AInotes
精选78
"我在田里雇了一名工程师,它叫 Codex" -- 北海道一个西兰花农的 8 个真实 AI 用法

日本北海道农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题,涵盖 8 个用法:拍照识别西兰花病害、卫星监测获取 NDVI 数据、用 ESP32 和 LINE 机器人远程控制温室卷帘、为农场群聊开发机器人管理温度与排期、从聊天记录追踪播种数量、学习 RTK-GPS 自动转向原理并评估自建成本、设计基于 Airtable 的农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。

OpenAI教程/实践端侧部署/工程

推荐理由:一个北海道农民把 ChatGPT 和 Codex 用成了农场的‘外挂工程师’,从病害诊断到温室远程控制,每个用法都附原始提示词——农业从业者可以直接抄作业。
17:04
MarkTechPost(RSS)
56
2026年最佳21款低代码与无代码AI工具盘点

低代码与无代码AI平台正将提示词转化为可运行的应用、智能体或模型。该指南比较了21款工具,涵盖应用构建器、自动化、AI智能体和机器学习平台四类,每款均附带官方链接。

评测/基准部署/工程
15:14
凡人小北@frxiaobei
63
Notion因Anthropic的Opus 4.7和4.8模型出现性能下降(degraded performance),导致选择这些模型的用户故障率升高,已禁用所有Anthropic模型并将请求切流至替代供应商。大部分用户可继续使用Notion AI,但Anthropic专属功能不可用。评论认为这种应急切流比榜单更能说明问题:AI成为生产环境一部分后,长期维持一致性能才是真正护城河。

Notion Status: Anthropic's Opus 4.7 and 4.8 models are experiencing degraded performance, which is causing a higher rate of failures fo...

Anthropic大佬观点部署/工程
14:21
OpenRouter@OpenRouter
62
不同模型提供商在缓存命中率和有效价格上有什么差异? 现在你可以从 Pricing 标签查看实时缓存命中率和历史流量。这里是 Opus 4.8:https://openrouter.ai/anthropic/claude-opus-4.8/pricing
产品更新部署/工程
08:19
IT之家(RSS)
40
三峡集团首个无人机智能巡检管理体系投运,覆盖12座新能源场站

近日,三峡集团首个无人机智能巡检管理体系在内蒙古投入运行,首批覆盖12座新能源场站,总装机640万千瓦。体系配套21座无人机机巢、28架巡检无人机,实现光伏、风机、集电线路、升压站巡检全覆盖。相比人工巡检,每年节省工时超11万小时,效率提升13.2倍,隐患提前检出率63%。依托自主开发的智能巡检平台,通过AI甄别缺陷,并建立专项管控机制落实双审批、全报备、实时监控,确保飞行全程可追溯、可管控、可闭环。

行业动态部署/工程
08:09
Claude Code:GitHub Releases(RSS)
31
Claude Code v2.1.168 发布

Claude Code v2.1.168 版本发布,更新内容仅为错误修复和可靠性改进。因原文较短,无法达成 50-100 字。

Anthropic产品更新部署/工程
07:56
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选75
谷歌将每月向SpaceX支付9.2亿美元,以获取xAI数据中心的计算能力

谷歌与SpaceX达成协议,每月支付9.2亿美元,获得位于xAI数据中心的计算能力。该交易的具体金额和合作细节于本周披露,将极大扩充谷歌的算力资源。

Google行业动态部署/工程
同一事件,精选展示《SpaceX与Google达成云计算新协议》
推荐理由:Google月砸9.2亿租SpaceX的GPU,这个金额暴露了巨头对算力的饥渴,虽然xAI自己还在亏损,这笔交易更像是IPO前的造势,但对基础设施市场绝对是一个冲击信号。
06:34
MarkTechPost(RSS)
同事件精选74
Google 发布 Colab CLI,开发者与 AI 智能体可在终端中远程调用 Colab GPU 与 TPU 运行 Python 代码

Google 发布 Colab CLI,允许开发者和 AI 智能体在终端中直接运行本地 Python 代码,并利用远程 Colab 的 GPU 与 TPU 运行时进行加速。通过这一命令行工具,用户无需打开浏览器即可无缝连接 Colab 计算资源,为自动化和脚本化 AI 工作流提供了更便捷的接口。

Google产品更新部署/工程
同一事件,精选展示《Google Colab CLI 发布》
推荐理由:Colab CLI把远程GPU接入终端,且AI Agent可直接调用,让Colab从笔记本变成计算后端,个人开发者云端算力使用方式会被改变。
03:34
Rohan Paul@rohanpaul_ai
71
亿万富翁投资者Ron Baron表示,SpaceX是"你永远无法拥有足够多的最伟大想法"。据Reuters,SpaceX 750亿美元IPO已获约1500亿美元需求(2倍超额认购)。路演中,SpaceX称其AI业务可追逐23万亿美元市场,通过降低太空访问成本,目标连接超过30亿未联网人口。SpaceX还认为,美国发电量与计算机产能增长已落后中国,可通过在太空部署数据中心等基础设施来弥补。

Rohan Paul: Rreuters: SpaceX's $75B IPO is already seeing about $150B in demand (2x oversubscribed) SpaceX has said its AI business ...

行业动态部署/工程
03:26
AYi@AYi_AInotes
62
前日本公务员用AI管理100公顷农场

一名前日本公务员(不会种地)在北海道用AI管理100公顷农场。他借助ChatGPT和Codex自行编写代码,构建全自动农场系统:ESP32+LINE机器人远程控制温室通风/卷帘电机;温度监测+自动通风机器人;Airtable农场数据库(田地、任务、传感器、材料);卫星NDVI作物健康地图叠加在田地上;AI生成布线图。展示了普通人用AI解决实际问题的正确方式。

AYi: http://x.com/i/article/2063237792746831872

教程/实践编码部署/工程
02:25
AYi@AYi_AInotes
58
全网最全面的Hermes桌面端教程!
教程/实践部署/工程
6月6日
23:30
Rohan Paul@rohanpaul_ai
70
SpaceX 750亿美元IPO获约1500亿美元需求,AI业务瞄准23万亿市场

据路透报道,SpaceX 750亿美元IPO已获约1500亿美元需求(2倍超额认购)。SpaceX在路演中表示,其AI业务可瞄准23万亿美元市场,通过太空建设AI算力突破地球限制。公司称美国电力与算力增长落后于中国,计划用SpaceX发射将数据中心等送入太空弥补差距。此前SpaceX披露与Google的云服务协议,Google每月支付9.2亿美元(约110亿美元/年)用于xAI数据中心算力。

Rohan Paul: SpaceX just disclosed a new Cloud Service Agreement with Google. Google to pay SpaceX $920 million a month (about $11B a...

GooglexAI行业动态部署/工程
21:53
Hacker News 热门(buzzing.cc 中文翻译)
69
谷歌将每月向SpaceX支付9.2亿美元用于计算服务

科技巨头谷歌与航天公司SpaceX达成协议,每月支付9.2亿美元,用于购买计算服务。该消息根据Hacker News 6月6日的信息曝光,显示这一高额交易已得到确认。谷歌将向SpaceX支付每月9.2亿美元的费用,以获得其计算能力的支持。

Google行业动态部署/工程
21:17
IT之家(RSS)
精选70
OpenCV 5 发布:升级全新 DNN 引擎、原生支持大模型

OpenCV 5 正式发布,采用基于图的 DNN 引擎,ONNX 算子覆盖率从 4.x 的不到 23% 提升至超 80%,原生支持 Transformer、视觉语言模型(VLM)和大语言模型(LLM)。其他更新包括:更好的 Python 集成与命名参数、更紧凑核心代码、清晰硬件加速层、原生 FP16/BF16、规范化 0D/1D 张量、扩展 3D 视觉及现代化文档。该库 GitHub 拥有超 86,000 stars,每日安装量超一百万次。

多模态开源/仓库推理部署/工程

推荐理由:OpenCV 5 是一次架构级大更新,DNN 引擎重写、ONNX 覆盖率从 23% 跳到 80%,原生支持大模型推理,做模型部署的该关注了。
20:29
meng shao@shao__meng
59
Anthropic 白皮书:面向 AI Agent 的零信任安全框架

Anthropic 5 月发布白皮书,提出企业部署自主 AI Agent 时须将零信任原则延伸至 Agent 架构。报告指出双重加速:前沿模型将漏洞发现到利用周期压缩至数小时;Agent 能自主解释目标、选工具、执行多步操作,传统访问控制无法阻止“合法权限内作恶”。核心原则:永不信任始终验证、假设已遭入侵、最小权限;另附设计检验——控制是让攻击不可能,还是仅增加麻烦?报告分五部分:Agent 为何是新安全对象、威胁图谱、三层能力成熟度模型、八阶段实施工作流、防御运营适配自主威胁速度。

智能体Anthropic安全/对齐部署/工程
‹ 上一页
1…1617181920…50
下一页 ›