AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月2日周二
11:53AYi63门槛最低的云服务福利:Microsoft for Startups Founders Hub 深度解析
11:03Tibo68OpenAI前沿模型与Codex登陆AWS
09:42MarkTechPost(RSS)59使用 NVIDIA Apex (FusedAdam, FusedLayerNorm) 和 torch.amp 加速 Transformer 训程程
09:33Hacker News 热门(buzzing.cc 中文翻译)49OpenAI 前沿模型和 Codex 现已在 AWS 上提供
09:33Hacker News 热门(buzzing.cc 中文翻译)79Alphabet 宣布筹集 800 亿美元股权融资,用于扩展人工智能基础设施和计算能力
09:23MiniMax (official)55MiniMax M3 模型架构与推理直播讨论
09:18SemiAnalysis66Modal 发布强化学习开源库与训练经验总结
09:07IT之家(RSS)64谷歌母公司 Alphabet 宣布 800 亿美元大额融资,用于 AI 基础设施与算力建设
09:07IT之家(RSS)46微星宣布 NVIDIA RTX Spark 迷你主机 EdgeMesa N AI+
08:47Greg Brockman67OpenAI + Amazon Bedrock:
08:00HuggingFace Daily Papers(社区热门论文)65推理的影子价格:LLM最优预算分配的经济学视角
08:00HuggingFace Daily Papers(社区热门论文)64Agent libOS:受库操作系统启发的长时间运行、能力可控的LLM智能体运行时
07:45Greg Brockman61OpenAI前沿模型与Codex现可通过AWS使用
07:05TechCrunch:AI(RSS)70精选Alphabet计划筹资800亿美元用于AI建设
06:16🚨 AI News | TestingCatalog79OpenAI前沿模型与Codex正式登陆AWS
06:01jason62OpenAI前沿模型与Codex登陆AWS Bedrock
06:00OpenAI72OpenAI前沿模型与Codex登陆AWS平台
05:48OpenAI:官网动态(RSS · 排除企业/客户案例)66精选OpenAI前沿模型与Codex现可在AWS上使用
05:47OpenAI Developers73OpenAI模型与Codex现已集成至AWS工作流
04:48jason52Codex Python 应用服务器发布
04:40Rohan Paul78OpenAI在密歇根州开建Stargate Michigan 1GW数据中心
04:23Replit ⠕75Replit 用单个提示词免费构建完整业务
03:53Replit ⠕73精选Replit 用单个提示词构建完整业务
03:31Logan Kilpatrick53Gemini API 新增按密钥筛选用量功能
03:16OpenAI:官网动态(RSS · 排除企业/客户案例)65精选OpenAI在密歇根州启动Stargate 1GW数据中心建设
03:11Chubby♨️10Kim Newsletter:NVIDIA Computex与MiniMax M3详解
03:07Hacker News:AI 热帖55Launch HN: Expanse (YC P26) - 解锁被浪费的GPU算力
02:12Ars Technica:AI(RSS)38从15小时到1分钟:AI/ML如何加速通用汽车开发
01:41Chubby♨️67NVIDIA发布桌面级AI超级计算机DGX Station for Windows
00:25OpenRouter77精选Auto Router 新增成本质量权衡参数
6月1日周一
23:42Berryxia.AI62FastClaw:云原生多租户Agent框架,大幅降低运行成本
22:38Hugging Face:Blog(RSS)60精选超越LLM:为何可扩展的企业AI采用取决于智能体逻辑
21:39Rohan Paul69LobeHub发布AI代理调度平台"Chief Agent Operator"
21:04Alibaba Cloud58阿里云在SAP大会展示AI与云服务新进展
18:33Hacker News 热门(buzzing.cc 中文翻译)64一台10年前的至强处理器就足够了
18:02SiliconFlow57OpenRouter顶级编程智能体接入Discord指南
17:05IT之家(RSS)52高通发布数据中心品牌 Dragonfly
15:04IT之家(RSS)73同事件精选英伟达和台积电将 AI 引入晶圆厂,推动半导体设计与制造发展同一事件,精选展示《NVIDIA Vera Rubin 平台如何解决智能体 AI 的规模扩展问题》
15:03公众号:数字生命卡兹克53英伟达发布RTX Spark:消费级芯片,统一内存生态支持本地AI与Agent
14:51HuggingFace Daily Papers(社区热门论文)68Adaptive Auto-Harness:面向开放任务流智能体系统部署的持续自改进框架
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月2日
11:53
AYi@AYi_AInotes
63
门槛最低的云服务福利:Microsoft for Startups Founders Hub 深度解析

Microsoft for Startups Founders Hub 提供最高 $150k 的 Azure 云额度(含 Azure OpenAI 服务)。自助申请可获 $1000 起,随项目进展可升至 $25k,顶档 $150k 需 Series A+。其最大优势是门槛极低,无需风投或孵化器背景,在进行中的项目即可申请,并赠送 GitHub Enterprise、Microsoft 365 等权益。该福利近期更新后,与面向学生的、总价值 $3500+ 的 GitHub 学生大礼包形成对比,后者为学生提供 GitHub Copilot Pro、JetBrains 全家桶等 50 多种工具的免费/折扣权益,同样零门槛。

AYi: Damn,这绝对是学生党这辈子能薅到的最狠的羊毛,没有之一😭 GitHub学生大礼包2026年全面升级 总价值直接干到$3500+!! 而且真的是零门槛, 只要你是学生,基本都能过。 这可不是什么几块钱的优惠券啊宝子们, 这是GitHub...

GitHubMicrosoft教程/实践部署/工程
11:03
Tibo@thsottiaux
68
OpenAI宣布其前沿模型与Codex现已在Amazon Bedrock上全面可用,为企业提供了通过现有安全、合规与治理工作流使用OpenAI的新途径。此举标志着OpenAI能力在AWS上的更广泛扩展的开端,未来将纳入如Daybreak等网络安全功能。

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI行业动态部署/工程
09:42
MarkTechPost(RSS)
59
使用 NVIDIA Apex (FusedAdam, FusedLayerNorm) 和 torch.amp 加速 Transformer 训程程

通过从源码构建 NVIDIA Apex 并检测融合内核,对 Transformer 训练中的关键组件进行基准测试。内容涵盖了 NVIDIA Apex 提供的 FusedAdam 优化器与 FusedLayerNorm 层归一化的性能表现,并将其与 PyTorch 原生的混合精度训练工具 torch.amp 进行了对比。文章旨在实践验证这些工具在提升训练速度方面的具体效果。

教程/实践数据/训练部署/工程
09:33
Hacker News 热门(buzzing.cc 中文翻译)
49
OpenAI 前沿模型和 Codex 现已在 AWS 上提供

OpenAI 的前沿模型与 Codex 平台现已在 AWS 上正式可用。这表明 OpenAI 将其核心 AI 能力扩展至亚马逊云服务,为企业用户提供了新的云平台选择。

OpenAI产品更新部署/工程
09:33
Hacker News 热门(buzzing.cc 中文翻译)
79
Alphabet 宣布筹集 800 亿美元股权融资,用于扩展人工智能基础设施和计算能力

Alphabet 宣布计划通过发行股票筹集 800 亿美元资金,这是其历史上规模最大的融资之一。此次融资所得资金将专门用于进一步扩展公司的 AI 基础设施和计算能力,以支持其在人工智能领域的持续发展和战略部署。

Google数据/训练行业动态部署/工程
09:23
MiniMax (official)@MiniMax_AI
55
我们现在正在直播 🔴 与 @togethercompute 一起深入探讨 M3:模型、MSA 架构以及驱动它的推理技术。 欢迎加入 👇 https://x.com/i/spaces/1nxeLLDDBEaJX/peek

Together AI: Make sure to join our live Spaces chat on MiniMax M3 starting in 4 hours. You can pre-submit questions by replying to th...

推理教程/实践部署/工程
09:18
SemiAnalysis@SemiAnalysis_
66
你的强化学习训练效率取决于沙盒基础设施。来看看 Modal 如何让你的 rollout 持续运行!

Modal: Reinforcement learning has exploded on Modal, and we've been cooking. Here's a review of lessons learned helping teams t...

开源/仓库部署/工程
09:07
IT之家(RSS)
64
谷歌母公司 Alphabet 宣布 800 亿美元大额融资,用于 AI 基础设施与算力建设

谷歌母公司 Alphabet 宣布进行总额 800 亿美元的股权融资,资金将用于投资 AI 基础设施与算力。此次融资具体包括:通过包销公开发行筹集 300 亿美元;按市值发行 400 亿美元股票;以及接受伯克希尔·哈撒韦 100 亿美元的私募投资。Alphabet 此前表示,其 2026 年资本支出将达到 1800~1900 亿美元,且 Google Cloud 业务在 2026 年第一季度营收同比增长 63%,积压订单规模超过 4600 亿美元。

Google行业动态部署/工程
09:07
IT之家(RSS)
46
微星宣布 NVIDIA RTX Spark 迷你主机 EdgeMesa N AI+

微星推出 EdgeMesa N AI+ 迷你主机,搭载 NVIDIA RTX Spark 超级芯片,具备 20 核 CPU 与 6144 CUDA Blackwell GPU,支持最高 128GB 统一内存,FP4 稀疏 AI 算力可达 1 Petaflop。该主机后部配备 4 个 USB-C、1 个 HDMI 与 1 个 10GbE RJ45 网口,可通过 HDMI 和 3 个 USB-C 20Gbps 接口实现四屏输出。其紧凑设计适用于医疗、零售、金融、机器人和智慧城市等需要高性能 AI 计算的行业场景。

产品更新端侧部署/工程
08:47
Greg Brockman@gdb
67
OpenAI的GPT-5.5、GPT-5.4及Codex编程智能体现已在Amazon Bedrock平台正式上线。开发者可通过Bedrock的下一代推理引擎部署这些模型,享受自动扩展能力。具体应用包括使用GPT-5.5和GPT-5.4构建能处理多步骤编码、数据分析和知识工作的自主AI智能体,或将Codex编程智能体集成至开发工作流,并通过Bedrock进行所有模型调用。该服务按token计费,支持弹性扩展。

Amazon Web Services: Now generally available, @OpenAI GPT-5.5, GPT-5.4, and Codex on Amazon Bedrock. Deploy frontier AI models with automatic...

OpenAI行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
65
推理的影子价格:LLM最优预算分配的经济学视角

本文将推理预算分配建模为受经济学原理支配的全局约束优化问题。通过移位激增函数(shifted-surge function)量化每查询推理效用,推导出基于全局影子价格的最优分配策略,实现资源稀缺下边际效用均衡。据此提出的CLEAR方法,将资不抵债的查询理性放弃,资源重新分配给接近涌现阈值的可解查询。在多种推理任务与流量模式实验中,CLEAR显著改善总token成本与平均准确率的Pareto前沿,资源稀缺时全局准确率相比均匀分配最高提升3倍。

推理论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
64
Agent libOS:受库操作系统启发的长时间运行、能力可控的LLM智能体运行时

Agent libOS是一个运行在常规主机操作系统之上的运行时基底,将LLM智能体建模为可调度的AgentProcess,具备进程标识、父子关系、生命周期、工具表、类型化对象内存、显式能力、人工队列、检查点、事件和审计记录。其核心设计原则是:工具是类似libc的包装器,运行时原语(文件系统访问、对象访问、休眠、人工审批、JIT工具注册、外部副作用)作为权限边界,按显式能力和策略进行检查。当前Python原型实现了异步调度、命名空间局部对象内存、运行时集成的人工批准、一次性权限授予、每进程工作目录、shell与图像注册原语、Deno/TypeScript JIT工具、文件系统/对象桥工具、可注入的资源提供者基底,以及123个回归测试。Agent libOS旨在展示一个可调度、授权、恢复和审计长时间运行LLM智能体的运行时基底,而不将工具分发视为信任边界。

智能体安全/对齐论文/研究部署/工程
07:45
Greg Brockman@gdb
61
OpenAI前沿模型与Codex现已在Amazon Bedrock上对企业客户全面可用,企业可通过现有的安全、合规与治理工作流程在AWS上使用OpenAI进行构建。这也是OpenAI能力在AWS上更广泛扩展的开始,未来将包括Daybreak等网络安全能力。

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI产品更新部署/工程
07:05
TechCrunch:AI(RSS)
精选70
Alphabet计划筹资800亿美元用于AI建设

Alphabet计划通过出售股票筹集800亿美元资金,以支持其人工智能建设。

Google行业动态部署/工程
关联讨论 1 条X:Sundar Pichai (@sundarpichai)
推荐理由:Alphabet 这 800 亿美元融资计划,是 AI 基建军备竞赛的显著信号,未来算力供给将大幅扩张,做 AI 服务的可以提前评估成本预期。
06:16
🚨 AI News | TestingCatalog@testingcatalog
79
OpenAI的前沿模型与Codex现已在AWS Bedrock平台正式上线(一般可用)。这为企业提供了通过其现有的安全、合规和治理工作流,直接在Amazon Bedrock上使用OpenAI能力的新途径。同时,OpenAI表示,这是其在AWS上更广泛扩展能力的开始,其网络安全平台Daybreak(包含网络模型和Codex Security)未来也将在AWS上提供。

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI产品更新安全/对齐部署/工程
06:01
jason@jxnlco
62
现已在Bedrock上可用! 【引用 @OpenAI】:OpenAI前沿模型和Codex现已在AWS上全面可用,为企业提供了一种新方式,通过其现有的安全、合规和治理工作流,在Amazon Bedrock上使用OpenAI进行构建。 这同时也是OpenAI在AWS上更广泛能力扩展的开端,包括未来将提供Daybreak等网络安全能力。 https://openai.com/index/openai-frontier-models-and-codex-are-now-available-on-aws/

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI产品更新编码部署/工程
06:00
OpenAI@OpenAI
72
OpenAI前沿模型和Codex现已在AWS全面可用,为企业提供了一种新方式:通过其现有的安全、合规和治理工作流,在Amazon Bedrock上使用OpenAI进行构建。 这也标志着OpenAI在AWS上更广泛扩展的开始,未来将包括Daybreak等网络安全能力的可用性。 https://openai.com/index/openai-frontier-models-and-codex-are-now-available-on-aws/
OpenAI产品更新部署/工程
05:48
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选66
OpenAI前沿模型与Codex现可在AWS上使用

OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术,从而加速从评估到生产部署的过程。

智能体OpenAI产品更新编码

推荐理由:这不是模型发布,而是渠道开闸,企业拿着现有 AWS 安全体系就能用上 GPT-5.5,合规部门终于不用再纠结。Codex 也直接嵌入开发流程,落地阻力小了一大截。
05:47
OpenAI Developers@OpenAIDevs
73
OpenAI前沿模型和Codex现已在AWS上全面可用。企业可以通过Amazon Bedrock服务,利用其已有的安全、合规与治理工作流,来构建基于OpenAI的AI应用及软件工程工作流。此次上线是OpenAI能力在AWS上更广泛扩展的开始,未来还将包括Daybreak等网络安全功能的可用性。

OpenAI: OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bed...

OpenAI产品更新部署/工程
04:48
jason@jxnlco
52
你将构建什么? 【引用 @jxnlco】:哇,我们刚刚发布了 Codex 的 Python 应用服务器 感谢 @ah20im

jason: wow we just shipped codex app server for python shoutouts to @ah20im

OpenAI产品更新开源/仓库部署/工程
04:40
Rohan Paul@rohanpaul_ai
78
OpenAI在美国密歇根州破土动工,启动名为"The Barn"的Stargate Michigan项目,这是一座规模达1GW的AI数据中心。该数据中心将采用闭环冷却技术,耗水量仅与普通办公楼相当,并承诺自身承担能源基础设施成本,不增加当地用户负担。项目预计创造数千个工会岗位。此外,OpenAI将为密歇根州所有大学、社区学院和技术学校的学生提供超过4000万美元的免费Codex额度。

OpenAI Newsroom: We're breaking ground on Stargate Michigan-a 1GW data center utilizing closed-loop cooling that uses water at the rate o...

OpenAI行业动态部署/工程
04:23
Replit ⠕@Replit
75
你能用单个提示词免费构建一个真正的业务吗? 从今天起,在 Replit 上,答案是肯定的。 从单个提示词开始,获得一个网站、移动应用、幻灯片和发布视频。 此外,还能解锁来自 @stripe @atlas、@QuickBooks、@mercury 和 @doolaHQ 的福利。
智能体产品更新部署/工程
03:53
Replit ⠕@Replit
精选73
你能用单个提示词免费构建一个真实的业务吗? 从今天起,在 Replit 上,答案是肯定的。 从一个提示词开始,获得一个网站、移动应用、幻灯片和发布视频。 此外,还能解锁使用 @stripe @atlas, @QuickBooks, @mercury & @doolaHQ 运营业务的福利。
产品更新编码部署/工程

推荐理由:Replit 从写代码进化到了‘一个提示生成网站+App+PPT+视频’,还串起了 Stripe 和 QuickBooks,‘建个生意玩玩’的成本降到史低,产品人和独立开发者值得试。
03:31
Logan Kilpatrick@OfficialLoganK
53
我们刚刚发布了 Gemini API 用量按 API Key 分类的首个版本 🗝️,你现在可以通过 API Key 来筛选请求图表了!其他领域更精细的控制功能也将很快推出 : )
Google产品更新部署/工程
03:16
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选65
OpenAI在密歇根州启动Stargate 1GW数据中心建设

OpenAI在密歇根州启动了名为Stargate的1GW数据中心项目。作为AI基础设施建设的一部分,该项目旨在扩大人工智能技术的可及性、为当地创造就业机会并支持社区发展。

OpenAI行业动态部署/工程

推荐理由:Stargate 的首个 GW 级数据中心真的动工了,算力基建从 PPT 变成推土机,对这个行业的长期供给比任何单点模型都有分量。密歇根州的学生还能拿到 Codex 额度,算是一点落地的小甜头。
03:11
Chubby♨️@kimmonismus
10
当然,在今天的通讯中,我详细写了NVIDIA在Computex上发布的内容,然后重点介绍了MiniMax的M3。所有这些以及更多内容都在我的通讯里 :)

Superintelligence.: Today's Newsletter on Superintelligence has just been sent! Today's main article is: "🧠 MiniMax M3 Opens Frontier Agent...

行业动态部署/工程
03:07
Hacker News:AI 热帖
55
Launch HN: Expanse (YC P26) - 解锁被浪费的GPU算力

Expanse是YC孵化的HPC/GPU集群优化工具,通过分析作业代码和硬件遥测来预测实际资源需求。它指出数据中心有效利用率通常仅30%-40%,一个国家规模HPC集群中59%的计算被浪费,按云上价格计算约850万美元/月。该工具能提供提交时的资源预测(含置信区间)、实时可观测性和故障诊断。在基准测试中,其性能是通用模型的8倍。Expanse适配Kubernetes和SLURM,通过持续学习使模型随作业量增长而更精确。

产品更新部署/工程
02:12
Ars Technica:AI(RSS)
38
从15小时到1分钟:AI/ML如何加速通用汽车开发

AI与机器学习技术正大幅加速通用汽车的产品开发流程,将CFD(计算流体动力学)和FEA(有限元分析)等任务的处理时间从15小时缩短至1分钟。现代汽车制造高度依赖虚拟化技术,包括CFD、FEA以及数字孪生,AI/ML的应用显著提升了这些模拟过程的效率,是当前汽车工程数字化转型的关键驱动力。

现象/趋势部署/工程
01:41
Chubby♨️@kimmonismus
67
NVIDIA发布桌面级AI超级计算机DGX Station for Windows

NVIDIA发布了DGX Station for Windows,这是一款桌面级AI超级计算机,搭载新的GB300 Grace Blackwell Ultra Desktop Superchip。其核心规格包括72核Grace CPU与Blackwell Ultra GPU通过NVLink-C2C连接,提供最高748GB统一内存与20 petaflops FP4算力,可本地运行最高达1万亿参数的模型。该设备计划于2026年第四季度发货。同时,NVIDIA推出了开源运行时OpenShell,可在Windows系统层面为AI智能体构建安全沙箱。

NVIDIA Newsroom: Introducing NVIDIA DGX Station for Windows, the world's most powerful deskside AI supercomputer with Windows powered by ...

智能体产品更新端侧部署/工程
00:25
OpenRouter@OpenRouter
精选77
Auto Router 现在允许你调整其在成本与质量之间的权衡。 新增 `cost_quality_tradeoff` 参数,范围 0 到 10: 设为 0 时,它总是选择最强大的模型,无论价格如何。设为 10 时,最便宜的模型胜出。
产品更新部署/工程

推荐理由:OpenRouter 给 Auto Router 加了成本质量权衡参数,0 到 10,0 是最强模型不管价格,10 是便宜模型优先。做 AI 产品想自己控制成本线,这个参数比只靠自动判断实用很多,值得细调。
6月1日
23:42
Berryxia.AI@berryxia
62
FastClaw是一个面向云原生多租户场景的轻量级Agent运行框架。它通过存算分离的架构,让Agent无需常驻,而是根据请求动态挂载sandbox提供服务。实测显示,将托管服务从OpenClaw迁移到FastClaw后,服务器数量从18台降至3台,运营成本降至约1/6。此外,FastClaw代码体积约为OpenClaw的1/40,运行资源占用约为其1/7,支持单二进制分发和秒级启动。这个框架非常适合处理批量任务。

idoubi: 我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。 几个月下来,托管服务的 MRR ...

智能体GitHub开源/仓库部署/工程
22:38
Hugging Face:Blog(RSS)
精选60
超越LLM:为何可扩展的企业AI采用取决于智能体逻辑

可扩展的企业AI采用需超越大语言模型,依靠智能体逻辑来引导模型执行动态、长周期且受约束的企业工作流,从而提升质量、降低成本并建立信任。文中以IBM watsonx Code Assistant for Z为例,展示了智能体逻辑如何通过程序分析等技术,在理解大型遗留代码库时,相比纯LLM基线方法,能以约30倍更低的token消耗达到更优性能。在加速测试生成任务中,该方法亦能使代码覆盖度提升20%-45%,同时token消耗降低最高达15倍。

智能体推理现象/趋势部署/工程

推荐理由:不是又一篇炒作 agent 的文章,IBM 拿真实项目数据说清楚了‘agent logic’怎么让大模型在企业落地时既降本又增效。
21:39
Rohan Paul@rohanpaul_ai
69
LobeHub发布AI代理调度平台"Chief Agent Operator"

LobeHub发布了名为“Chief Agent Operator”的平台。用户无需自行构建或提示代理,只需提出需求,平台便从一个拥有273,000个技能的市场中自动匹配、部署合适的AI智能体。这些智能体可在云端24/7运行,并通过Slack、Discord等IM工具汇报进展。该平台旨在解决当前工作流中需手动管理多个代理、重复提供上下文等问题,据称可节省超50%成本。其定位是作为统一调度层,管理如Claude Code、Cursor等各类AI代理工具的运作与结果回传。

智能体产品更新部署/工程
21:04
Alibaba Cloud@alibaba_cloud
58
阿里云近日在SAP Sapphire Madrid 2026上展示了最新里程碑,进一步深化我们的全球联盟。我们正在扩展用于SAP HANA的16TB RAM re8 ECS实例,并将通义千问大语言模型与Model Studio集成到SAP中,以赋能企业智能化。
行业动态部署/工程
18:33
Hacker News 热门(buzzing.cc 中文翻译)
64
一台10年前的至强处理器就足够了

Gemma 4 模型已可在 2016 年的至强处理器上运行。该事实在 Hacker News 上获得关注。

Google教程/实践端侧部署/工程
18:02
SiliconFlow@SiliconFlowAI
57
OpenRouter上排名第一的编程智能体,现已入驻你的Discord服务器 分步设置、模型选择与专业技巧 以下是使用NousResearch Hermes Agent + SiliconFlow所需的一切 🧵
智能体教程/实践部署/工程
17:05
IT之家(RSS)
52
高通发布数据中心品牌 Dragonfly

高通在COMPUTEX 2026上宣布推出数据中心品牌Dragonfly,预计包含数据中心CPU与AI ASIC产品,并与客户端的骁龙、AIoT的Dragonwing共同构成新品牌组合。CEO安蒙预测,到2030年AI Token(词元)需求将达到401.48×10^16。更多细节将于6月24日揭晓。

产品更新推理部署/工程
15:04
IT之家(RSS)
同事件精选73
英伟达和台积电将 AI 引入晶圆厂,推动半导体设计与制造发展
行业动态部署/工程
同一事件,精选展示《NVIDIA Vera Rubin 平台如何解决智能体 AI 的规模扩展问题》
推荐理由:这是 AI 反哺半导体制造的关键信号,英伟达的 GPU 和软件栈正渗透进台积电产线,从计算光刻到缺陷检测全链条提速,芯片迭代周期可能因此压缩一档。
15:03
公众号:数字生命卡兹克
53
英伟达发布RTX Spark:消费级芯片,统一内存生态支持本地AI与Agent

英伟达在GTC Taipei 2026发布全新消费级芯片RTX Spark,基于与DGX Spark相同的GB10芯片,最高1 PFLOP FP4 AI性能、20个CPU核心、6144个GPU核心和128GB LPDDR5X统一内存,可本地运行120B参数大模型。RTX Spark在消费级PC上首次将统一内存与完整CUDA生态结合,让GPU直接访问共享内存池,突破传统显存限制。微软将与其全面重构Windows系统,原生支持本地Agent运行;Adobe等应用已针对RTX Spark优化,Photoshop和Premiere性能提升两倍,并原生支持Agent调用。

大佬观点部署/工程
14:51
HuggingFace Daily Papers(社区热门论文)
68
Adaptive Auto-Harness:面向开放任务流智能体系统部署的持续自改进框架

现有 Auto-Harness 系统仅针对固定离线基准评测,而开放任务流存在无终点历史、异构任务与分布偏移,导致单一密集更新装备性能先升后降。本文提出 Adaptive Auto-Harness,将距 oracle 装备差距分解为进化损失与适配损失,采用状态化多智能体进化器、带求解时路由的装备树及人类引导钩子来解决。在预测市场、安全竞赛与事件预测三个任务流上,该方法优于五个基线,消融实验验证了各模块贡献。代码已开源。

智能体GitHub论文/研究部署/工程
‹ 上一页
1…2122232425…50
下一页 ›