AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月3日周三
05:21SemiAnalysis53Cerebras晶圆级芯片实现近100%良率
04:55MiniMax (official)57MiniMax M3 生产部署深度解析
04:46Rohan Paul63Satya Nadella 谈微软 Fairwater 数据中心:一个 AI 超级工厂
04:09IT之家(RSS)59从端侧到云端统一加速:英伟达、微软展示 AI 智能体完整部署栈,Fairwater 工厂提前上线
03:56Replit ⠕70精选Replit 与微软合作发布 Fabric 集成
03:09IT之家(RSS)63微软升级 Windows 365:支持开发者预配置环境、企业级 AI 智能体,新增 32 vCPU 与 GPU 型云电脑
03:08TechCrunch:AI(RSS)64微软发布开源框架 Adaptive Spec-driven Scoring:支持用文本描述创建 AI 评估测试
02:54ClaudeDevs77精选Claude Platform 新增 CLI 工具
02:34Tibo67Codex 企业版新增网站托管与视觉反馈功能
02:23Peter Steinberger 🦞67OpenClaw 与微软合作进入企业市场
02:09IT之家(RSS)60微软为 AI 智能体划清安全边界,为 Win11 发布 MXC SDK
02:04OpenClaw🦞69精选OpenClaw 与微软合作进入企业生态
01:21SemiAnalysis52AI服务器定制化浪潮下,ODM厂商迎来新机遇
01:08IT之家(RSS)68微软发布"开发者优化版"Win11,进一步拥抱 Linux 并推出 WSL 容器
00:45Claude:Blog(网页)74精选Claude Code团队实践:智能体编程如何重塑工程组织与流程
00:33OpenAI70同事件精选OpenAI Codex Sites 功能发布同一事件,精选展示《Codex 赋能每一种角色、工具和工作流》
00:29OpenRouter68精选DigitalOcean AI云服务上线OpenRouter
00:16Chubby♨️47Kombai 2.0:首个AI设计工程师发布
00:13OpenAI:官网动态(RSS · 排除企业/客户案例)70精选Codex 赋能每一种角色、工具和工作流
00:08IT之家(RSS)61孙正义时隔 26 年再成亚洲首富,个人净资产达 1004 亿美元
6月2日周二
22:51OpenBMB56MiniCPM-o 4.5 已合并至 vLLM-Omni
22:44Rohan Paul57AI驱动预测最便宜安全AWS Spot实例舰队
22:21OpenBMB67精选MiniCPM-V 4.6 现已支持 vLLM v0.22.0
21:21SemiAnalysis54Ornn H100指数下跌引争议,SemiAnalysis指其数据失真
21:08IT之家(RSS)61联发科表态:下一代芯片独家采用英特尔 EMIB-T 封装,预计 2027 年 Q4 量产
21:08IT之家(RSS)57全球首条 S+C+L 三波段超低损多芯光缆线路在青岛建成开通
20:08IT之家(RSS)582026 世界杯引入多项 AI 技术:足球内置 500Hz 芯片,每秒采集 500 次数据辅助判罚
20:08IT之家(RSS)53英伟达 Spectrum-X 以太网硅光技术已全面量产,较传统网络能效提升 5 倍
19:08IT之家(RSS)64黄仁勋称美满电子将成为下一家万亿美元公司
18:42The Decoder:AI News(RSS)66伯克希尔·哈撒韦押注100亿美元,支持Alphabet AI基础设施扩建
18:07IT之家(RSS)50技嘉推出"AI TOP"桌面生态系统:含三款台式整机,至高可运行405B参数大语言模型
17:55蚂蚁 inclusionAI:HuggingFace 新模型54蚂蚁 inclusionAI 发布 Ling-2.6-flash-base 基础模型
17:13Rohan Paul82Alphabet 计划筹集800亿美元资金支持AI算力扩张
17:07IT之家(RSS)51腾讯云智能体开发平台 DeepSeek-V4 系列模型明日起大幅降价,最高降幅 97.5%
17:04Hacker News 热门(buzzing.cc 中文翻译)49Groq 融资进展
16:43Rohan Paul86Alphabet计划融资800亿美元以大幅增加AI支出,Berkshire将投资100亿美元
16:13MarkTechPost(RSS)65JetBrains 发布 Mellum2:用于多模型 AI 流水线快速专用任务的 12B MoE 模型
16:12The Decoder:AI News(RSS)55OpenAI模型现已登陆Amazon Web Services
12:19OpenRouter:Announcements(RSS)77精选OpenRouter 5月发布亮点
12:00swyx59WorkOS演讲挑战Matt Pocock,团队正A/B测试
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月3日
05:21
SemiAnalysis@SemiAnalysis_
53
Cerebras做到了业界认为不可能的事:将整个46,225mm2晶圆制成单芯片。如此大面积的硅片缺陷不可避免,因此他们内置了冗余,并采用定制的逐批次光罩来绕过每个不良核心,最终实现了接近100%的可用晶圆率。结果:单片硅片上集成了90万个核心和44GB SRAM,无需封装,无片外跳转。他们并未止步于此,目前正在探索将DRAM晶圆通过混合键合堆叠在上方,以获得更快的更多内存。(1/4) 🧵
产品更新部署/工程
04:55
MiniMax (official)@MiniMax_AI
57
@togethercompute 团队对 MiniMax M3 生产部署的精彩深度解析。 M3 凭借其 1M 上下文、原生多模态和 MiniMax Sparse Attention,需要在分页解码、索引评分和多模态预处理方面进行大量工作才能实现高效运行。 这就是前沿合作的样子🤝。

Together AI: http://x.com/i/article/2061891247762026496

行业动态部署/工程
04:46
Rohan Paul@rohanpaul_ai
63
Satya Nadella 谈微软 Fairwater 数据中心:一个 AI 超级工厂

在微软 Build 2026 主题演讲中,Satya Nadella 介绍了 Fairwater 数据中心,这是一个为 AI 设计的“超级工厂”。其核心是垂直设计的双层 AI 数据中心架构,允许在三维空间内密集部署机架,在保持 GPU 间低延迟、高带宽网络连接的前提下,实现更高的计算密度,使整个集群更像一台大型 AI 机器。另一大亮点是其极高的冷却效率:冷却系统只需填充一次,实际运行中水耗几乎为零,其年度总用水量约等于一家餐厅的日用水量。这是微软构建“前沿智能生态系统”硬件基础的一部分。

Satya Nadella: Great to be back at Microsoft Build today. For us, it is not about any one piece of technology or even the platform. It ...

Microsoft产品更新部署/工程
04:09
IT之家(RSS)
59
从端侧到云端统一加速:英伟达、微软展示 AI 智能体完整部署栈,Fairwater 工厂提前上线

在 Build 2026 上,英伟达与微软展示了覆盖端侧到云端的统一 AI 智能体部署栈。端侧发布了提供 1 petaflop AI 算力与最高 128GB 统一内存的 RTX Spark,以及搭载 GB300 芯片、可本地运行最高万亿参数模型的 DGX Station for Windows。云端,Nemotron 3 Ultra 推理模型上线微软 Foundry,Claude 模型也已在 Azure 的 GB300 系统中原生运行。数据层,微软 Fabric Data Warehouse 内置的 NVIDIA 加速计算使 SQL 执行速度最高提升至 CPU 基线的 6 倍。此外,微软位于威斯康星州的 Fairwater AI 工厂提前上线,并已完成对下一代 NVIDIA Vera Rubin 平台的验证,其推理吞吐量提升最高达 10 倍。

智能体Microsoft产品更新端侧
03:56
Replit ⠕@Replit
精选70
宣布与 @Microsoft 的新合作 组织现在可以在 Replit 中构建内部工具、工作流或数据仪表板,并直接发布到 Microsoft Fabric,内置安全、身份验证和治理功能。
Microsoft产品更新部署/工程

推荐理由:对同时用 Replit 和 Microsoft Fabric 的企业来说,这个集成省了一步繁琐的部署工作,把内部工具开发到上线的链路压短了一截,但如果你没用过 Fabric 就不会有感知。
03:09
IT之家(RSS)
63
微软升级 Windows 365:支持开发者预配置环境、企业级 AI 智能体,新增 32 vCPU 与 GPU 型云电脑

微软在 Build 2026 大会上宣布对 Windows 365 进行重大更新。此次更新推出了预装 VS Code、Git 等工具的 Windows 11 Developer Configuration Image(公开预览版),以加快开发者环境部署。新增 32 vCPU 和 GPU Select 套餐,满足高性能计算与图形工作负载需求。同时,正式发布 Windows 365 for Agents 平台,为企业 AI 智能体提供安全、可管理的专属 Cloud PC 运行环境。此外,Azure Compute Gallery 支持现已可用,Windows 365 Frontline 更名为 Windows 365 Flex。

Microsoft产品更新部署/工程
03:08
TechCrunch:AI(RSS)
64
微软发布开源框架 Adaptive Spec-driven Scoring:支持用文本描述创建 AI 评估测试

微软开源发布 Adaptive Spec-driven Scoring for Evaluation and Regression Testing 框架。开发者可通过文本描述快速生成 AI 行为测试,用于模型评估与回归测试。

Microsoft产品更新安全/对齐部署/工程
02:54
ClaudeDevs@ClaudeDevs
精选77
我们为 Claude Platform 添加了一个 CLI,使每个 API 端点都可以从你的终端运行。 调用 Messages API,启动 Claude 托管智能体,并将结果直接管道传输到你的 shell。 ant CLI 被使用 claude-api 技能的编码智能体(Claude Code)很好地理解。
AnthropicMCP/工具产品更新部署/工程

推荐理由:Ant CLI 把 Claude Platform 的所有 API 端点都弄进了终端,配合 Claude Code 用很顺手,做 Agent 或脚本开发的可以直接上手玩。
02:34
Tibo@thsottiaux
67
Codex 日常工作使用中新增大量实用功能。 如果你使用商业计划,现在可以托管和分享网站,我们推出了大幅改进的插件和技能以适应广泛的角色,并且你可以在文档、幻灯片、表格等中通过视觉注释向你的智能体提供反馈。
OpenAI产品更新编码部署/工程
02:23
Peter Steinberger 🦞@steipete
67
很荣幸与微软合作,将 OpenClaw 带入企业!

OpenClaw🦞: "You can run OpenClaw inside your company now." Annoucing our work with @Microsoft to bring OpenClaw to the Microsoft an...

Microsoft产品更新部署/工程
02:09
IT之家(RSS)
60
微软为 AI 智能体划清安全边界,为 Win11 发布 MXC SDK

微软在 Build 2026 大会上正式推出 Microsoft Execution Containers(MXC)SDK 早期预览版,旨在为 Windows 及 WSL 上的 AI 智能体提供策略驱动的安全执行环境。该 SDK 提供进程隔离(适用于轻量级编码智能体)和会话隔离(将智能体环境与人类桌面完全隔离)两种核心模式。其未来路线图包括 Micro-VM、Linux 容器以及云端的 Windows 365 for Agents。目前,OpenClaw、NVIDIA OpenShell 等工具已支持集成。同时,微软宣布其多模型智能体扫描工具 MDASH 集成至 Microsoft Defender。

Microsoft产品更新安全/对齐部署/工程
02:04
OpenClaw🦞@openclaw
精选69
"你现在可以在公司内部运行 OpenClaw 了。" 宣布我们与 @Microsoft 的合作,将 OpenClaw 带入微软和 Windows 生态系统。Claws 现在可以在企业环境中安全运行。
智能体Microsoft产品更新部署/工程
关联讨论 1 条The Verge:AI(RSS)
推荐理由:OpenClaw 和微软的合作,让企业终于能在自家 Windows 环境里跑这个 AI Agent,对看重合规与安全的团队来说,这比功能更新更实在。
01:21
SemiAnalysis@SemiAnalysis_
52
AI服务器定制化浪潮下,ODM厂商迎来新机遇

超大规模云服务商引入多样化的GPU、XPU和CPU芯片,导致AI服务器机架和板卡设计更加多元化。为满足不同客户需求,ODM厂商需要扩大设计团队规模,并增加组装与测试产能。这为ODM提供了接触新客户、拓展客户群的良机。随着AI服务器设计日趋定制化,早期介入与客户信任将成为赢得长期业务的关键。

行业动态部署/工程
01:08
IT之家(RSS)
68
微软发布"开发者优化版"Win11,进一步拥抱 Linux 并推出 WSL 容器

微软在 Build 2026 开发者大会上发布了面向开发者的 Windows 11 体验优化。核心更新包括将 WSL 容器内置到系统中,提供原生创建和操作 Linux 容器的方式。同时推出了基于 Rust 的 Coreutils for Windows,实现跨平台命令行工具兼容。微软还发布了实验性的 Intelligent Terminal 智能终端。在端侧 AI 方面,推出了更小更快的小语言模型 Aion 1.0 Instruct(将开源)以及 140 亿参数、上下文长度 32K 的 Aion 1.0 Plan 推理模型。硬件上发布了搭载 NVIDIA RTX Spark 的 Surface RTX Spark Dev Box,以及可本地运行 1 万亿参数模型的 DGX Station for Windows。

Microsoft产品更新安全/对齐端侧
00:45
Claude:Blog(网页)
精选74
Claude Code团队实践:智能体编程如何重塑工程组织与流程

在Code w/ Claude SF 2026活动上,Claude Code工程团队分享了将智能体编程设为默认工作方式后带来的流程与结构变革。核心变化包括:规划转向即时(JIT)模式,强调快速原型与反馈;上下文收集变为“先问Claude”;代码审查中Claude处理风格与测试,人工专注于法律、安全等专业判断。新范式下,工程瓶颈从编写代码转向验证、审查与安全维护。

Anthropic大佬观点现象/趋势部署/工程
关联讨论 2 条公众号:数字生命卡兹克X:邵猛 (@shao__meng)
推荐理由:Anthropic 工程总监把 Claude Code 团队流程全晒了出来,从抛弃半年路线图到代码审查只留专家复审,每一步都反直觉但实战有效,工程领导者直接抄作业。
00:33
OpenAI@OpenAI
同事件精选70
构建应用从未如此简单。 通过 Sites,Codex 可以将你的工作、想法和计划转化为一个交互式网站或应用,你的团队可以通过一个 URL 进行探索、使用和分享。 该功能将首先向 Business 和 Enterprise 计划推出,之后会更广泛地扩展。
OpenAI产品更新部署/工程
同一事件,精选展示《Codex 赋能每一种角色、工具和工作流》
推荐理由:Codex Sites 让应用构建门槛降到「描述即生成」,对企业团队快速验证想法是实打实的效率提升,但只开放 Business/Enterprise 意味着个人开发者还得等等。
00:29
OpenRouter@OpenRouter
精选68
⚡ 新增服务商:DigitalOcean 的 AI-Native Cloud 现已在 OpenRouter 上线。 提供高性能推理,覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一(数据来自 @ArtificialAnlys)。 查看其数据并试用模型:https://openrouter.ai/provider/digitalocean
DeepSeek产品更新推理部署/工程

推荐理由:OpenRouter 新上线的 DigitalOcean 推理服务,把 DeepSeek V3.2 的延迟压到了全场最低,比官方还快,做实时应用的值得立刻切过去试一下。
00:16
Chubby♨️@kimmonismus
47
Kombai 2.0 被定位为首个AI设计工程师,旨在融合设计与工程。该工具允许用户在画布内直接生成动画素材,跳过了传统图像生成的中间环节,并能将设计变更同步回代码库。其目标是打破设计和工程分属不同工作流的旧模式,服务于一个设计师能交付代码、工程师寻求无缝集成、所有人都想构建优秀用户体验的新世界。

Dipanjan Dey: Introducing Kombai 2.0 - the first AI design engineer. We keep hearing that AGI is almost here. Still, we're stuck with ...

产品更新编码部署/工程
00:13
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选70
Codex 赋能每一种角色、工具和工作流

OpenAI 的 Codex 新增了插件、站点和注释等功能。这些新功能旨在帮助分析师、营销人员、设计师、投资者等各类团队,利用 AI 完成更多工作。Codex 进一步拓展其作为 AI 编码工具的应用场景,以支持更广泛的角色、集成更多工具并优化现有工作流。

MCP/工具OpenAI产品更新部署/工程
关联讨论 5 条X:Rohan Paul (@rohanpaul_ai)X:Sam Altman (@sama)IT之家(RSS)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)
推荐理由:Codex不再只是开发者工具,六个角色插件和Sites功能把AI带进了营销、销售、投资等日常流,非技术团队可以直接上手,这是大企业AI落地的实用一步。
00:08
IT之家(RSS)
61
孙正义时隔 26 年再成亚洲首富,个人净资产达 1004 亿美元

福布斯实时富豪榜数据显示,软银创始人孙正义个人净资产升至1004亿美元,时隔26年再次成为亚洲首富。这主要源于其近期在法国宣布投资750亿欧元建设AI数据中心,以及软银对OpenAI的累计投资已超640亿美元并持有约13%股权。软银市值近期达49.30万亿日元,超越丰田,成为日本市值最高的公司。同时,软银2025财年归母净利润达5508亿日元,同比增4.7%,创历史新高。

OpenAI行业动态部署/工程
6月2日
22:51
OpenBMB@OpenBMB
56
🎉 好消息!MiniCPM-o 4.5 已正式合并至 vLLM-Omni!👏 💡 目前,它支持单工非流式使用--这是未来发展的坚实第一步。 🚀 旅程继续!我们将与出色的开源社区一起,继续推进下一步的双工流式功能集成。 敬请期待更强大、更无缝的交互体验。敬请关注!💪 http://github.com/vllm-project/vllm-omni/pull/4067 http://huggingface.co/openbmb/MiniCPM-o-4_5
产品更新开源/仓库部署/工程
22:44
Rohan Paul@rohanpaul_ai
57
AI驱动预测最便宜安全AWS Spot实例舰队

该研究提出了一种AI驱动的服务,用于在启动前预测最便宜且安全的AWS Spot实例舰队。该服务通过时间感知模型学习AWS创建舰队的模式,并估算9个区域的舰队组合与成本,向用户返回排序后的区域选项。测试显示,在最多1500 vCPU的舰队上,预测结果与AWS完全匹配的比例达92.78%,整体准确率为99.79%,且所有推荐舰队均被AWS接受。关键发现是选择最佳区域比在单个区域内调整策略更重要,潜在成本节省最高可达64%。

数据/训练论文/研究部署/工程
22:21
OpenBMB@OpenBMB
精选67
MiniCPM-V 4.6 现已完全支持 vLLM v0.22.0! 无需自定义分支,无需额外编译。 只需拉取预构建包即可运行。 非常感谢 @vllm_project 的顺畅集成! 🤝 🤗 http://huggingface.co/openbmb/MiniCPM-V-4.6
产品更新部署/工程

推荐理由:MiniCPM-V 4.6 现在 vLLM 原生支持,不用自己折腾编译和环境了,做多模态部署的可以无痛接入,国产端侧模型生态又往前走了一步。
21:21
SemiAnalysis@SemiAnalysis_
54
近期Ornn H100指数跌至2.63美元(-7.72%)令人困惑。但这主要因为该指数具有误导性。我们的H100小时价格已连续146天在2.70-3.01美元区间内波动。仅上月Ornn指数就经历了1.80→3.22→2.63美元的剧烈波动。 原因在于OCPI仅基于已成交交易构建。但数月来我们覆盖范围内H100按需实例已售罄。不存在连续的现货交易记录。剩余数据仅来自少数贡献者的双边交易残余。小样本量极易被扭曲。
现象/趋势部署/工程
21:08
IT之家(RSS)
61
联发科表态:下一代芯片独家采用英特尔 EMIB-T 封装,预计 2027 年 Q4 量产

联发科宣布其下一代芯片将独家采用英特尔的 EMIB-T 先进封装技术,取代台积电的 CoWoS 方案。该项目计划于 2026 年第四季度流片,并在 2027 年第四季度进入量产。EMIB-T 技术通过嵌入式硅桥连接组件,旨在降低制造复杂度和成本。英特尔为该工艺设定了 98% 的良率目标,当前验证良率约为 90%。谷歌的下一代 TPU 也在评估采用 EMIB-T。

行业动态部署/工程
21:08
IT之家(RSS)
57
全球首条 S+C+L 三波段超低损多芯光缆线路在青岛建成开通

由中国移动联合产业合作伙伴自主设计的全球首条S+C+L三波段超低损多芯光缆线路在山东青岛建成开通。该线路创新采用四芯光纤结构,实测每公里传输损耗仅0.189dB,纤芯间串扰低于-40dB/100km。技术突破将超低损耗特性从C、L波段拓展至S波段,实现三波段并行传输,单芯带宽提升近50%,单条光纤容量达到传统光纤的5倍以上,可满足AI智算等需求,标志着我国空分复用光纤技术商用化取得关键进展。

行业动态部署/工程
20:08
IT之家(RSS)
58
2026 世界杯引入多项 AI 技术:足球内置 500Hz 芯片,每秒采集 500 次数据辅助判罚

2026年美加墨世界杯将部署多项AI技术。阿迪达斯官方用球“Trionda”内置500Hz传感器芯片,每秒采集500次数据,与高速摄像机协同构建三维模型。国际足联将为1248名球员建立AI数字分身,通过3D扫描生成虚拟形象以辅助争议判罚。赛事还将首次推出裁判第一视角直播,并推出Football AI Pro知识助手,可解析逾2000项关键指标。

多模态行业动态部署/工程
20:08
IT之家(RSS)
53
英伟达 Spectrum-X 以太网硅光技术已全面量产,较传统网络能效提升 5 倍

英伟达宣布其面向智能体AI工厂的下一代超级计算平台NVIDIA Vera Rubin已进入全面量产。作为该平台核心网络组件的Spectrum-X以太网硅光技术也已同步量产,这是全球首款采用光电一体封装(CPO)的以太网交换机。该技术采用200Gb/s SerDes,相比传统网络,能效提升5倍,AI整体正常运行时间提升5倍,部署时间加快1.3倍。Vera Rubin是英伟达第三代旗舰AI架构,其NVL72机柜可实现最高260 TB/s的互连带宽,智能体吞吐量较上一代提升10倍,生产规模扩大2倍。该平台正式出货预计于2026年秋季启动。

产品更新部署/工程
19:08
IT之家(RSS)
64
黄仁勋称美满电子将成为下一家万亿美元公司

在台北电脑展期间,英伟达CEO黄仁勋公开称赞数据中心芯片公司美满电子(Marvell),称其网络和连接芯片对AI基础设施至关重要,并认为美满将成为“下一家万亿美元公司”。受此影响,美满股价在美股盘前大涨25%,其今年以来的累计涨幅已超过158%。此外,英伟达此前已承诺向美满投资20亿美元。

行业动态部署/工程
18:42
The Decoder:AI News(RSS)
66
伯克希尔·哈撒韦押注100亿美元,支持Alphabet AI基础设施扩建

Alphabet正筹集800亿美元以扩展其AI基础设施,其中包含沃伦·巴菲特旗下伯克希尔·哈撒韦提供的100亿美元私人投资。该公司预计2026年资本支出将达到1900亿美元,并表示该数字未来只会继续增长。

Google行业动态部署/工程
18:07
IT之家(RSS)
50
技嘉推出"AI TOP"桌面生态系统:含三款台式整机,至高可运行405B参数大语言模型

技嘉在台北电脑展推出“AI TOP”桌面生态系统,包含三款AI台式整机。其中AI TOP 100 B850工作站采用AMD锐龙9 9950X处理器和128GB DDR5内存,最高可选配RTX 5090 32GB或AMD Radeon AI PRO 32GB显卡,声称至高可运行405B参数大语言模型。AI TOP 100 Z890搭载英特尔酷睿Ultra 9 285K处理器、128GB DDR5内存及RTX 5090显卡。旗舰级AI TOP 500 TRX50则配备24核48线程的AMD锐龙Threadripper PRO 7965WX处理器及最高768GB DDR5内存。

产品更新端侧部署/工程
17:55
蚂蚁 inclusionAI:HuggingFace 新模型
54
蚂蚁 inclusionAI 发布 Ling-2.6-flash-base 基础模型

Ling-2.6-flash-base 是蚂蚁 inclusionAI 发布的基础模型,采用闪速规模 MoE 与混合线性注意力架构(7:1 融合 Lightning Attention 与 MLA),总参数量约 104B、激活约 7.4B。模型从 Ling-2.0 检查点改造而来,经约 9.6T token 的迁移预训练、继续预训练和中段训练,上下文窗口从 4K 扩展至 256K。在知识、推理、数学、代码和长上下文基准上相比前代均有提升(如 MMLU 84.13,GSM8K 91.89)。该模型面向研究用途开放,支持继续预训练、微调和蒸馏,未经聊天对齐。

推理模型发布部署/工程
17:13
Rohan Paul@rohanpaul_ai
82
Alphabet宣布计划通过多种方式筹集约800亿美元资金,以支持其AI算力扩张支出。该融资规模超过其过去28年间七次主要股权融资总和的10倍。融资结构包括承销股票、强制性可转换优先股、伯克希尔100亿美元的私募配售以及400亿美元的ATM计划(其中约300亿与员工股权税务相关)。市场将此举视为看涨信号,表明AI发展瓶颈已从需求和模型转向算力供应,Alphabet正通过融资投资于类似铁路、电网和晶圆厂的关键基础设施。

Rohan Paul: Alphabet to raise $80B from share sales to fund AI spending splurge, Berkshire to invest $10B Very bullish news, as it s...

Google行业动态部署/工程
17:07
IT之家(RSS)
51
腾讯云智能体开发平台 DeepSeek-V4 系列模型明日起大幅降价,最高降幅 97.5%

腾讯云智能体开发平台宣布,自2026年6月3日起下调DeepSeek-V4系列模型的调用价格,其中DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%,缓存命中价格降幅高达97.5%;DeepSeek-V4-Flash模型的缓存命中价格降幅达90%。DeepSeek-V4系列模型发布于2026年4月,采用混合专家架构,总参数达1.6万亿,支持100万Token上下文长度。本次降价是在DeepSeek官方此前已调价基础上的平台层面调整。

DeepSeek行业动态部署/工程
17:04
Hacker News 热门(buzzing.cc 中文翻译)
49
Groq 融资进展

Groq 正在进行新一轮融资。根据Zach Be在Substack发布于2026年6月2日的文章探讨,HN上有101个点赞。

行业动态部署/工程
16:43
Rohan Paul@rohanpaul_ai
86
Alphabet计划融资800亿美元以大幅增加AI支出,Berkshire将投资100亿美元

Alphabet计划通过包括承销股票、可转换优先股、Berkshire的100亿美元私募配售以及一个400亿美元的市场发售计划在内的多种方式,募集高达800亿美元资金,主要用于AI基础设施投资。市场将此举视为强烈看涨信号,表明AI发展的关键瓶颈已从需求侧转向计算供给。Berkshire的投资被视为对“耐心资本”的背书,此事件也标志着行业投资逻辑正从追求软件式回报转向对铁路、电网和晶圆厂等瓶颈基础设施的重资产竞争。

Google行业动态部署/工程
16:13
MarkTechPost(RSS)
65
JetBrains 发布 Mellum2:用于多模型 AI 流水线快速专用任务的 12B MoE 模型

JetBrains 发布开源模型 Mellum2。该模型为 12B 参数的 MoE 架构,在 10.6 万亿个 token 上训练,采用 Apache 2.0 许可,专为多模型 AI 流水线中的快速、专用任务设计。

开源生态模型发布部署/工程
16:12
The Decoder:AI News(RSS)
55
OpenAI模型现已登陆Amazon Web Services

OpenAI通过Amazon Bedrock提供GPT-5.5、GPT-5.4和Codex模型,价格与OpenAI自有平台一致。这些模型可在商业和政府AWS区域运行,但目前使用范围仅限于美国,用量将计入现有AWS合同。

OpenAI行业动态部署/工程
12:19
OpenRouter:Announcements(RSS)
精选77
OpenRouter 5月发布亮点

OpenRouter 发布5月更新,推出语音与转录API、模型融合(Model Fusion)功能,并为平台添加了私有模型和企业工作区管控能力。此次更新共上线20个新模型,其中包括 Gemini 3.5 Flash 和 Claude Opus 4.8。

智能体MCP/工具产品更新部署/工程
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:OpenRouter 五月交付了一整套平台级能力,从安全护栏到语音 API 再到模型融合,Pareto Code Router 按质量阈值选廉价模型这个思路,对 coding agent 的成本控制很实用。如果你重度依赖 OpenRouter,这次更新值得细读。
12:00
swyx@swyx
59
标题低估了它--这个WorkOS的演讲表现很好,是几周来第一个真正挑战@mattpocockuk的。团队正在进行A/B测试。

Nick Nisi: My talk from AIE Europe is up! Come learn the lessons I learned while shipping real production AI systems. https://www.y...

教程/实践部署/工程
‹ 上一页
1…2021222324…50
下一页 ›