全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「部署/工程」清除

6月2日周二

11:53AYi63门槛最低的云服务福利：Microsoft for Startups Founders Hub 深度解析

11:03Tibo68OpenAI前沿模型与Codex登陆AWS

09:42MarkTechPost（RSS）59使用 NVIDIA Apex （FusedAdam， FusedLayerNorm）和 torch.amp 加速 Transformer 训程程

09:33Hacker News 热门（buzzing.cc 中文翻译）49OpenAI 前沿模型和 Codex 现已在 AWS 上提供

09:33Hacker News 热门（buzzing.cc 中文翻译）79Alphabet 宣布筹集 800 亿美元股权融资，用于扩展人工智能基础设施和计算能力

09:23MiniMax (official)55MiniMax M3 模型架构与推理直播讨论

09:18SemiAnalysis66Modal 发布强化学习开源库与训练经验总结

09:07IT之家（RSS）64谷歌母公司 Alphabet 宣布 800 亿美元大额融资，用于 AI 基础设施与算力建设

09:07IT之家（RSS）46微星宣布 NVIDIA RTX Spark 迷你主机 EdgeMesa N AI+

08:47Greg Brockman67OpenAI + Amazon Bedrock：

08:00HuggingFace Daily Papers（社区热门论文）65推理的影子价格：LLM最优预算分配的经济学视角

08:00HuggingFace Daily Papers（社区热门论文）64Agent libOS：受库操作系统启发的长时间运行、能力可控的LLM智能体运行时

07:45Greg Brockman61OpenAI前沿模型与Codex现可通过AWS使用

07:05TechCrunch：AI（RSS）70精选Alphabet计划筹资800亿美元用于AI建设

06:16🚨 AI News | TestingCatalog79OpenAI前沿模型与Codex正式登陆AWS

06:01jason62OpenAI前沿模型与Codex登陆AWS Bedrock

06:00OpenAI72OpenAI前沿模型与Codex登陆AWS平台

05:48OpenAI：官网动态（RSS · 排除企业/客户案例）66精选OpenAI前沿模型与Codex现可在AWS上使用

05:47OpenAI Developers73OpenAI模型与Codex现已集成至AWS工作流

04:48jason52Codex Python 应用服务器发布

04:40Rohan Paul78OpenAI在密歇根州开建Stargate Michigan 1GW数据中心

04:23Replit ⠕75Replit 用单个提示词免费构建完整业务

03:53Replit ⠕73精选Replit 用单个提示词构建完整业务

03:31Logan Kilpatrick53Gemini API 新增按密钥筛选用量功能

03:16OpenAI：官网动态（RSS · 排除企业/客户案例）65精选OpenAI在密歇根州启动Stargate 1GW数据中心建设

03:11Chubby♨️10Kim Newsletter：NVIDIA Computex与MiniMax M3详解

03:07Hacker News：AI 热帖55Launch HN： Expanse （YC P26） - 解锁被浪费的GPU算力

02:12Ars Technica：AI（RSS）38从15小时到1分钟：AI/ML如何加速通用汽车开发

01:41Chubby♨️67NVIDIA发布桌面级AI超级计算机DGX Station for Windows

00:25OpenRouter77精选Auto Router 新增成本质量权衡参数

6月1日周一

23:42Berryxia.AI62FastClaw：云原生多租户Agent框架，大幅降低运行成本

22:38Hugging Face：Blog（RSS）60精选超越LLM：为何可扩展的企业AI采用取决于智能体逻辑

21:39Rohan Paul69LobeHub发布AI代理调度平台"Chief Agent Operator"

21:04Alibaba Cloud58阿里云在SAP大会展示AI与云服务新进展

18:33Hacker News 热门（buzzing.cc 中文翻译）64一台10年前的至强处理器就足够了

18:02SiliconFlow57OpenRouter顶级编程智能体接入Discord指南

17:05IT之家（RSS）52高通发布数据中心品牌 Dragonfly

15:04IT之家（RSS）73同事件精选英伟达和台积电将 AI 引入晶圆厂，推动半导体设计与制造发展同一事件，精选展示《NVIDIA Vera Rubin 平台如何解决智能体 AI 的规模扩展问题》

15:03公众号：数字生命卡兹克53英伟达发布RTX Spark：消费级芯片，统一内存生态支持本地AI与Agent

14:51HuggingFace Daily Papers（社区热门论文）68Adaptive Auto-Harness：面向开放任务流智能体系统部署的持续自改进框架

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月2日

11:53

AYi@AYi_AInotes

63

门槛最低的云服务福利：Microsoft for Startups Founders Hub 深度解析

Microsoft for Startups Founders Hub 提供最高 $150k 的 Azure 云额度（含 Azure OpenAI 服务）。自助申请可获 $1000 起，随项目进展可升至 $25k，顶档 $150k 需 Series A+。其最大优势是门槛极低，无需风投或孵化器背景，在进行中的项目即可申请，并赠送 GitHub Enterprise、Microsoft 365 等权益。该福利近期更新后，与面向学生的、总价值 $3500+ 的 GitHub 学生大礼包形成对比，后者为学生提供 GitHub Copilot Pro、JetBrains 全家桶等 50 多种工具的免费/折扣权益，同样零门槛。

AYi: Damn,这绝对是学生党这辈子能薅到的最狠的羊毛,没有之一😭 GitHub学生大礼包2026年全面升级总价值直接干到$3500+!! 而且真的是零门槛, 只要你是学生,基本都能过。这可不是什么几块钱的优惠券啊宝子们, 这是GitHub...

GitHub Microsoft 教程/实践部署/工程

11:03

Tibo@thsottiaux

68

OpenAI宣布其前沿模型与Codex现已在Amazon Bedrock上全面可用，为企业提供了通过现有安全、合规与治理工作流使用OpenAI的新途径。此举标志着OpenAI能力在AWS上的更广泛扩展的开端，未来将纳入如Daybreak等网络安全功能。

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI 行业动态部署/工程

09:42

MarkTechPost（RSS）

59

使用 NVIDIA Apex （FusedAdam， FusedLayerNorm）和 torch.amp 加速 Transformer 训程程

通过从源码构建 NVIDIA Apex 并检测融合内核，对 Transformer 训练中的关键组件进行基准测试。内容涵盖了 NVIDIA Apex 提供的 FusedAdam 优化器与 FusedLayerNorm 层归一化的性能表现，并将其与 PyTorch 原生的混合精度训练工具 torch.amp 进行了对比。文章旨在实践验证这些工具在提升训练速度方面的具体效果。

教程/实践数据/训练部署/工程

09:33

Hacker News 热门（buzzing.cc 中文翻译）

49

OpenAI 前沿模型和 Codex 现已在 AWS 上提供

OpenAI 的前沿模型与 Codex 平台现已在 AWS 上正式可用。这表明 OpenAI 将其核心 AI 能力扩展至亚马逊云服务，为企业用户提供了新的云平台选择。

OpenAI 产品更新部署/工程

09:33

Hacker News 热门（buzzing.cc 中文翻译）

79

Alphabet 宣布筹集 800 亿美元股权融资，用于扩展人工智能基础设施和计算能力

Alphabet 宣布计划通过发行股票筹集 800 亿美元资金，这是其历史上规模最大的融资之一。此次融资所得资金将专门用于进一步扩展公司的 AI 基础设施和计算能力，以支持其在人工智能领域的持续发展和战略部署。

Google 数据/训练行业动态部署/工程

09:23

MiniMax (official)@MiniMax_AI

55

我们现在正在直播 🔴 与 @togethercompute 一起深入探讨 M3：模型、MSA 架构以及驱动它的推理技术。欢迎加入 👇 https://x.com/i/spaces/1nxeLLDDBEaJX/peek

Together AI: Make sure to join our live Spaces chat on MiniMax M3 starting in 4 hours. You can pre-submit questions by replying to th...

推理教程/实践部署/工程

09:18

SemiAnalysis@SemiAnalysis_

66

你的强化学习训练效率取决于沙盒基础设施。来看看 Modal 如何让你的 rollout 持续运行！

Modal: Reinforcement learning has exploded on Modal, and we've been cooking. Here's a review of lessons learned helping teams t...

开源/仓库部署/工程

09:07

IT之家（RSS）

64

谷歌母公司 Alphabet 宣布 800 亿美元大额融资，用于 AI 基础设施与算力建设

谷歌母公司 Alphabet 宣布进行总额 800 亿美元的股权融资，资金将用于投资 AI 基础设施与算力。此次融资具体包括：通过包销公开发行筹集 300 亿美元；按市值发行 400 亿美元股票；以及接受伯克希尔·哈撒韦 100 亿美元的私募投资。Alphabet 此前表示，其 2026 年资本支出将达到 1800~1900 亿美元，且 Google Cloud 业务在 2026 年第一季度营收同比增长 63%，积压订单规模超过 4600 亿美元。

Google 行业动态部署/工程

09:07

IT之家（RSS）

46

微星宣布 NVIDIA RTX Spark 迷你主机 EdgeMesa N AI+

微星推出 EdgeMesa N AI+ 迷你主机，搭载 NVIDIA RTX Spark 超级芯片，具备 20 核 CPU 与 6144 CUDA Blackwell GPU，支持最高 128GB 统一内存，FP4 稀疏 AI 算力可达 1 Petaflop。该主机后部配备 4 个 USB-C、1 个 HDMI 与 1 个 10GbE RJ45 网口，可通过 HDMI 和 3 个 USB-C 20Gbps 接口实现四屏输出。其紧凑设计适用于医疗、零售、金融、机器人和智慧城市等需要高性能 AI 计算的行业场景。

产品更新端侧部署/工程

08:47

Greg Brockman@gdb

67

OpenAI的GPT-5.5、GPT-5.4及Codex编程智能体现已在Amazon Bedrock平台正式上线。开发者可通过Bedrock的下一代推理引擎部署这些模型，享受自动扩展能力。具体应用包括使用GPT-5.5和GPT-5.4构建能处理多步骤编码、数据分析和知识工作的自主AI智能体，或将Codex编程智能体集成至开发工作流，并通过Bedrock进行所有模型调用。该服务按token计费，支持弹性扩展。

Amazon Web Services: Now generally available, @OpenAI GPT-5.5, GPT-5.4, and Codex on Amazon Bedrock. Deploy frontier AI models with automatic...

OpenAI 行业动态部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

65

推理的影子价格：LLM最优预算分配的经济学视角

本文将推理预算分配建模为受经济学原理支配的全局约束优化问题。通过移位激增函数（shifted-surge function）量化每查询推理效用，推导出基于全局影子价格的最优分配策略，实现资源稀缺下边际效用均衡。据此提出的CLEAR方法，将资不抵债的查询理性放弃，资源重新分配给接近涌现阈值的可解查询。在多种推理任务与流量模式实验中，CLEAR显著改善总token成本与平均准确率的Pareto前沿，资源稀缺时全局准确率相比均匀分配最高提升3倍。

推理论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

64

Agent libOS：受库操作系统启发的长时间运行、能力可控的LLM智能体运行时

Agent libOS是一个运行在常规主机操作系统之上的运行时基底，将LLM智能体建模为可调度的AgentProcess，具备进程标识、父子关系、生命周期、工具表、类型化对象内存、显式能力、人工队列、检查点、事件和审计记录。其核心设计原则是：工具是类似libc的包装器，运行时原语（文件系统访问、对象访问、休眠、人工审批、JIT工具注册、外部副作用）作为权限边界，按显式能力和策略进行检查。当前Python原型实现了异步调度、命名空间局部对象内存、运行时集成的人工批准、一次性权限授予、每进程工作目录、shell与图像注册原语、Deno/TypeScript JIT工具、文件系统/对象桥工具、可注入的资源提供者基底，以及123个回归测试。Agent libOS旨在展示一个可调度、授权、恢复和审计长时间运行LLM智能体的运行时基底，而不将工具分发视为信任边界。

智能体安全/对齐论文/研究部署/工程

07:45

Greg Brockman@gdb

61

OpenAI前沿模型与Codex现已在Amazon Bedrock上对企业客户全面可用，企业可通过现有的安全、合规与治理工作流程在AWS上使用OpenAI进行构建。这也是OpenAI能力在AWS上更广泛扩展的开始，未来将包括Daybreak等网络安全能力。

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI 产品更新部署/工程

07:05

TechCrunch：AI（RSS）

精选70

Alphabet计划筹资800亿美元用于AI建设

Alphabet计划通过出售股票筹集800亿美元资金，以支持其人工智能建设。

Google 行业动态部署/工程

关联讨论 1 条X：Sundar Pichai (@sundarpichai)

推荐理由：Alphabet 这 800 亿美元融资计划，是 AI 基建军备竞赛的显著信号，未来算力供给将大幅扩张，做 AI 服务的可以提前评估成本预期。

06:16

🚨 AI News | TestingCatalog@testingcatalog

79

OpenAI的前沿模型与Codex现已在AWS Bedrock平台正式上线（一般可用）。这为企业提供了通过其现有的安全、合规和治理工作流，直接在Amazon Bedrock上使用OpenAI能力的新途径。同时，OpenAI表示，这是其在AWS上更广泛扩展能力的开始，其网络安全平台Daybreak（包含网络模型和Codex Security）未来也将在AWS上提供。

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI 产品更新安全/对齐部署/工程

06:01

jason@jxnlco

62

现已在Bedrock上可用！【引用 @OpenAI】：OpenAI前沿模型和Codex现已在AWS上全面可用，为企业提供了一种新方式，通过其现有的安全、合规和治理工作流，在Amazon Bedrock上使用OpenAI进行构建。这同时也是OpenAI在AWS上更广泛能力扩展的开端，包括未来将提供Daybreak等网络安全能力。 https://openai.com/index/openai-frontier-models-and-codex-are-now-available-on-aws/

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI 产品更新编码部署/工程

06:00

OpenAI@OpenAI

72

OpenAI前沿模型和Codex现已在AWS全面可用，为企业提供了一种新方式：通过其现有的安全、合规和治理工作流，在Amazon Bedrock上使用OpenAI进行构建。这也标志着OpenAI在AWS上更广泛扩展的开始，未来将包括Daybreak等网络安全能力的可用性。 https://openai.com/index/openai-frontier-models-and-codex-are-now-available-on-aws/

OpenAI 产品更新部署/工程

05:48

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选66

OpenAI前沿模型与Codex现可在AWS上使用

OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术，从而加速从评估到生产部署的过程。

智能体 OpenAI 产品更新编码

推荐理由：这不是模型发布，而是渠道开闸，企业拿着现有 AWS 安全体系就能用上 GPT-5.5，合规部门终于不用再纠结。Codex 也直接嵌入开发流程，落地阻力小了一大截。

05:47

OpenAI Developers@OpenAIDevs

73

OpenAI前沿模型和Codex现已在AWS上全面可用。企业可以通过Amazon Bedrock服务，利用其已有的安全、合规与治理工作流，来构建基于OpenAI的AI应用及软件工程工作流。此次上线是OpenAI能力在AWS上更广泛扩展的开始，未来还将包括Daybreak等网络安全功能的可用性。

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI 产品更新部署/工程

04:48

jason@jxnlco

52

你将构建什么？【引用 @jxnlco】：哇，我们刚刚发布了 Codex 的 Python 应用服务器感谢 @ah20im

jason: wow we just shipped codex app server for python shoutouts to @ah20im

OpenAI 产品更新开源/仓库部署/工程

04:40

Rohan Paul@rohanpaul_ai

78

OpenAI在美国密歇根州破土动工，启动名为"The Barn"的Stargate Michigan项目，这是一座规模达1GW的AI数据中心。该数据中心将采用闭环冷却技术，耗水量仅与普通办公楼相当，并承诺自身承担能源基础设施成本，不增加当地用户负担。项目预计创造数千个工会岗位。此外，OpenAI将为密歇根州所有大学、社区学院和技术学校的学生提供超过4000万美元的免费Codex额度。

OpenAI Newsroom: We're breaking ground on Stargate Michigan-a 1GW data center utilizing closed-loop cooling that uses water at the rate o...

OpenAI 行业动态部署/工程

04:23

Replit ⠕@Replit

75

你能用单个提示词免费构建一个真正的业务吗？从今天起，在 Replit 上，答案是肯定的。从单个提示词开始，获得一个网站、移动应用、幻灯片和发布视频。此外，还能解锁来自 @stripe @atlas、@QuickBooks、@mercury 和 @doolaHQ 的福利。

智能体产品更新部署/工程

03:53

Replit ⠕@Replit

精选73

你能用单个提示词免费构建一个真实的业务吗？从今天起，在 Replit 上，答案是肯定的。从一个提示词开始，获得一个网站、移动应用、幻灯片和发布视频。此外，还能解锁使用 @stripe @atlas， @QuickBooks， @mercury & @doolaHQ 运营业务的福利。

产品更新编码部署/工程

推荐理由：Replit 从写代码进化到了‘一个提示生成网站+App+PPT+视频’，还串起了 Stripe 和 QuickBooks，‘建个生意玩玩’的成本降到史低，产品人和独立开发者值得试。

03:31

Logan Kilpatrick@OfficialLoganK

53

我们刚刚发布了 Gemini API 用量按 API Key 分类的首个版本 🗝️，你现在可以通过 API Key 来筛选请求图表了！其他领域更精细的控制功能也将很快推出：）

Google 产品更新部署/工程

03:16

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选65

OpenAI在密歇根州启动Stargate 1GW数据中心建设

OpenAI在密歇根州启动了名为Stargate的1GW数据中心项目。作为AI基础设施建设的一部分，该项目旨在扩大人工智能技术的可及性、为当地创造就业机会并支持社区发展。

OpenAI 行业动态部署/工程

推荐理由：Stargate 的首个 GW 级数据中心真的动工了，算力基建从 PPT 变成推土机，对这个行业的长期供给比任何单点模型都有分量。密歇根州的学生还能拿到 Codex 额度，算是一点落地的小甜头。

03:11

Chubby♨️@kimmonismus

10

当然，在今天的通讯中，我详细写了NVIDIA在Computex上发布的内容，然后重点介绍了MiniMax的M3。所有这些以及更多内容都在我的通讯里：）

Superintelligence.: Today's Newsletter on Superintelligence has just been sent! Today's main article is: "🧠 MiniMax M3 Opens Frontier Agent...

行业动态部署/工程

03:07

Hacker News：AI 热帖

55

Launch HN： Expanse （YC P26） - 解锁被浪费的GPU算力

Expanse是YC孵化的HPC/GPU集群优化工具，通过分析作业代码和硬件遥测来预测实际资源需求。它指出数据中心有效利用率通常仅30%-40%，一个国家规模HPC集群中59%的计算被浪费，按云上价格计算约850万美元/月。该工具能提供提交时的资源预测（含置信区间）、实时可观测性和故障诊断。在基准测试中，其性能是通用模型的8倍。Expanse适配Kubernetes和SLURM，通过持续学习使模型随作业量增长而更精确。

产品更新部署/工程

02:12

Ars Technica：AI（RSS）

38

从15小时到1分钟：AI/ML如何加速通用汽车开发

AI与机器学习技术正大幅加速通用汽车的产品开发流程，将CFD（计算流体动力学）和FEA（有限元分析）等任务的处理时间从15小时缩短至1分钟。现代汽车制造高度依赖虚拟化技术，包括CFD、FEA以及数字孪生，AI/ML的应用显著提升了这些模拟过程的效率，是当前汽车工程数字化转型的关键驱动力。

现象/趋势部署/工程

01:41

Chubby♨️@kimmonismus

67

NVIDIA发布桌面级AI超级计算机DGX Station for Windows

NVIDIA发布了DGX Station for Windows，这是一款桌面级AI超级计算机，搭载新的GB300 Grace Blackwell Ultra Desktop Superchip。其核心规格包括72核Grace CPU与Blackwell Ultra GPU通过NVLink-C2C连接，提供最高748GB统一内存与20 petaflops FP4算力，可本地运行最高达1万亿参数的模型。该设备计划于2026年第四季度发货。同时，NVIDIA推出了开源运行时OpenShell，可在Windows系统层面为AI智能体构建安全沙箱。

NVIDIA Newsroom: Introducing NVIDIA DGX Station for Windows, the world's most powerful deskside AI supercomputer with Windows powered by ...

智能体产品更新端侧部署/工程

00:25

OpenRouter@OpenRouter

精选77

Auto Router 现在允许你调整其在成本与质量之间的权衡。新增 `cost_quality_tradeoff` 参数，范围 0 到 10：设为 0 时，它总是选择最强大的模型，无论价格如何。设为 10 时，最便宜的模型胜出。

产品更新部署/工程

推荐理由：OpenRouter 给 Auto Router 加了成本质量权衡参数，0 到 10，0 是最强模型不管价格，10 是便宜模型优先。做 AI 产品想自己控制成本线，这个参数比只靠自动判断实用很多，值得细调。

6月1日

23:42

Berryxia.AI@berryxia

62

FastClaw是一个面向云原生多租户场景的轻量级Agent运行框架。它通过存算分离的架构，让Agent无需常驻，而是根据请求动态挂载sandbox提供服务。实测显示，将托管服务从OpenClaw迁移到FastClaw后，服务器数量从18台降至3台，运营成本降至约1/6。此外，FastClaw代码体积约为OpenClaw的1/40，运行资源占用约为其1/7，支持单二进制分发和秒级启动。这个框架非常适合处理批量任务。

idoubi: 我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。几个月下来,托管服务的 MRR ...

智能体 GitHub 开源/仓库部署/工程

22:38

Hugging Face：Blog（RSS）

精选60

超越LLM：为何可扩展的企业AI采用取决于智能体逻辑

可扩展的企业AI采用需超越大语言模型，依靠智能体逻辑来引导模型执行动态、长周期且受约束的企业工作流，从而提升质量、降低成本并建立信任。文中以IBM watsonx Code Assistant for Z为例，展示了智能体逻辑如何通过程序分析等技术，在理解大型遗留代码库时，相比纯LLM基线方法，能以约30倍更低的token消耗达到更优性能。在加速测试生成任务中，该方法亦能使代码覆盖度提升20%-45%，同时token消耗降低最高达15倍。

智能体推理现象/趋势部署/工程

推荐理由：不是又一篇炒作 agent 的文章，IBM 拿真实项目数据说清楚了‘agent logic’怎么让大模型在企业落地时既降本又增效。

21:39

Rohan Paul@rohanpaul_ai

69

LobeHub发布AI代理调度平台"Chief Agent Operator"

LobeHub发布了名为“Chief Agent Operator”的平台。用户无需自行构建或提示代理，只需提出需求，平台便从一个拥有273,000个技能的市场中自动匹配、部署合适的AI智能体。这些智能体可在云端24/7运行，并通过Slack、Discord等IM工具汇报进展。该平台旨在解决当前工作流中需手动管理多个代理、重复提供上下文等问题，据称可节省超50%成本。其定位是作为统一调度层，管理如Claude Code、Cursor等各类AI代理工具的运作与结果回传。

智能体产品更新部署/工程

21:04

Alibaba Cloud@alibaba_cloud

58

阿里云近日在SAP Sapphire Madrid 2026上展示了最新里程碑，进一步深化我们的全球联盟。我们正在扩展用于SAP HANA的16TB RAM re8 ECS实例，并将通义千问大语言模型与Model Studio集成到SAP中，以赋能企业智能化。

行业动态部署/工程

18:33

Hacker News 热门（buzzing.cc 中文翻译）

64

一台10年前的至强处理器就足够了

Gemma 4 模型已可在 2016 年的至强处理器上运行。该事实在 Hacker News 上获得关注。

Google 教程/实践端侧部署/工程

18:02

SiliconFlow@SiliconFlowAI

57

OpenRouter上排名第一的编程智能体，现已入驻你的Discord服务器分步设置、模型选择与专业技巧以下是使用NousResearch Hermes Agent + SiliconFlow所需的一切 🧵

智能体教程/实践部署/工程

17:05

IT之家（RSS）

52

高通发布数据中心品牌 Dragonfly

高通在COMPUTEX 2026上宣布推出数据中心品牌Dragonfly，预计包含数据中心CPU与AI ASIC产品，并与客户端的骁龙、AIoT的Dragonwing共同构成新品牌组合。CEO安蒙预测，到2030年AI Token（词元）需求将达到401.48×10^16。更多细节将于6月24日揭晓。

产品更新推理部署/工程

15:04

IT之家（RSS）

同事件精选73

英伟达和台积电将 AI 引入晶圆厂，推动半导体设计与制造发展

行业动态部署/工程

同一事件，精选展示《NVIDIA Vera Rubin 平台如何解决智能体 AI 的规模扩展问题》

推荐理由：这是 AI 反哺半导体制造的关键信号，英伟达的 GPU 和软件栈正渗透进台积电产线，从计算光刻到缺陷检测全链条提速，芯片迭代周期可能因此压缩一档。

15:03

公众号：数字生命卡兹克

53

英伟达发布RTX Spark：消费级芯片，统一内存生态支持本地AI与Agent

英伟达在GTC Taipei 2026发布全新消费级芯片RTX Spark，基于与DGX Spark相同的GB10芯片，最高1 PFLOP FP4 AI性能、20个CPU核心、6144个GPU核心和128GB LPDDR5X统一内存，可本地运行120B参数大模型。RTX Spark在消费级PC上首次将统一内存与完整CUDA生态结合，让GPU直接访问共享内存池，突破传统显存限制。微软将与其全面重构Windows系统，原生支持本地Agent运行；Adobe等应用已针对RTX Spark优化，Photoshop和Premiere性能提升两倍，并原生支持Agent调用。

大佬观点部署/工程

14:51

HuggingFace Daily Papers（社区热门论文）

68

Adaptive Auto-Harness：面向开放任务流智能体系统部署的持续自改进框架

现有 Auto-Harness 系统仅针对固定离线基准评测，而开放任务流存在无终点历史、异构任务与分布偏移，导致单一密集更新装备性能先升后降。本文提出 Adaptive Auto-Harness，将距 oracle 装备差距分解为进化损失与适配损失，采用状态化多智能体进化器、带求解时路由的装备树及人类引导钩子来解决。在预测市场、安全竞赛与事件预测三个任务流上，该方法优于五个基线，消融实验验证了各模块贡献。代码已开源。

智能体 GitHub 论文/研究部署/工程

1…21 222324 25…50