全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「部署/工程」清除

5月10日周日

09:44Berryxia.AI65字节跳动开源桌面GUI智能体UI-TARS-desktop，获31.4K星标

08:00HuggingFace Daily Papers（社区热门论文）63Forcing-KV：用于高效自回归视频扩散模型的混合KV缓存压缩

07:44Berryxia.AI54开发者力推docu.md插件，挑战HTML更适合AI的观点

07:01swyx 🌉41AI工程师必备的硬核学习指南

5月9日周六

20:32IT之家（RSS）42苏姿丰确认将出席 2026 AMD AI 开发者日，5 月 19 日上海举行

19:43Tencent Hy60Hy3预览版免费期结束三项指标居首

19:00The Decoder：AI News（RSS）59据报道，除非微软购买40%的芯片，否则博通将不会为OpenAI生产定制芯片

17:32IT之家（RSS）53消息称字节跳动增加 25% AI 基础设施支出，规模达 2000 亿元

14:29IT之家（RSS）57消息称 Anthropic 与美国 CDN 巨头阿卡迈达成 18 亿美元算力合作，应对 AI 需求激增

13:29IT之家（RSS）45我国百余家单位联合共建"太空云"生态，推动天基信息服务智能化

11:35歸藏(guizang.ai)63AI产品架构共识：数据与表现分离，Markdown存储与HTML展示

11:28SiliconFlow55Hermes Agent登顶OpenRouter，附使用指南

09:29IT之家（RSS）46日月光携手楠梓电投资高雄新厂，建设"CoWoS 替代"先进封装产能

09:29IT之家（RSS）49Arm：客户近两年对 AGI CPU 的总需求已超 20 亿美元

08:47Claude Code：GitHub Releases（RSS）35v2.1.137

08:35Berryxia.AI66人类大脑最聪明的地方，就是大部分时间只激活极少部分神经元。

08:00HuggingFace Daily Papers（社区热门论文）33面向弱监督日志实例异常定位：基于反事实扰动的"大海捞针"

07:34ginobefun47AI智能体能力扩张遇组织瓶颈，跨会话学习与架构革新成焦点

01:55Tibo72轻松迁移功能上线

01:48Google AI Developers22社区项目征集：展示Gemma 4 MTP等技术亮点

01:27BAIR：Berkeley AI Research Blog64精选自适应并行推理：高效推理扩展的新范式

01:24SemiAnalysis59数据中心选址规避城市监管重塑AI基建版图

00:54Google AI49谷歌I/O大会前11天持续发布多项AI产品更新

5月8日周五

20:22IT之家（RSS）61美加墨电力监管机构示警：数据中心让整张电网面临停摆风险

19:20IT之家（RSS）59斯坦福 AI 教授安杰尼 · 米达：若想让美国人接受数据中心，企业得先学会共情

18:20IT之家（RSS）67中国移动董事长陈忠岳：将推进全国一体化算力网建设，开放万亿级词元服务体验包

17:42Alibaba Cloud66阿里云推出Smart Studio，一站式自托管AI模型平台

16:02Alibaba Cloud51阿里云日处理200TB日志秒级监控99.99%可用

15:16IT之家（RSS）26迎广科梵特 covalent 工作站全塔台式机箱开启预约：支持 EEB / EATX 主板，999 元

15:14向阳乔木71Codex Chrome插件安装使用注意事项

14:16IT之家（RSS）48新华三发布面向万亿级大模型的全系列超节点 UniPoD S80000

13:16IT之家（RSS）58中国移动发布 MoMA 平台：单位 Token 成本压降 30%，接入超 300 款 AI 模型

12:21Berryxia.AI68优化表格Agent检索效率：Ramp Labs集成Fast Ask子代理

11:16IT之家（RSS）48电动车室内充电风险智能识别系统上线：零硬件改造，依托现有电表

11:06SemiAnalysis61vllm团队周末火速优化DeepSeekv4性能

09:16IT之家（RSS）48AMD 时隔四年重推 PCIe AIC 形态 Instinct 显卡：MI350P 规模砍半

09:16IT之家（RSS）53消息称软银与英伟达、富士康磋商，拟开发"日本制造"AI 服务器

09:16IT之家（RSS）61向 AI 优先运营模式转型，Cloudflare 裁员超 1100 人

08:16IT之家（RSS）60OpenAI 自研芯片项目遇阻：博通要求微软采购首批四成产能才愿出资

08:09meng shao79精选OpenAI 为官方 REST API 发布 CLI 工具

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月10日

09:44

Berryxia.AI@berryxia

65

字节跳动开源桌面GUI智能体UI-TARS-desktop，获31.4K星标

字节跳动开源的UI-TARS-desktop是一个本地运行的桌面GUI智能体，允许用户通过自然语言指令操控电脑。它通过截屏和视觉模型理解屏幕内容，并精准控制鼠标键盘来操作各类应用，如打开VS Code或浏览网页，全程保障数据隐私。项目支持Windows和macOS，可操作本地或远程电脑及浏览器，并提供了SDK供开发者构建自动化工具。近期发布的v0.3.0版本增强了CLI功能。该项目在GitHub上已获得31.4K星标，增长迅速。

智能体开源/仓库部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

63

Forcing-KV：用于高效自回归视频扩散模型的混合KV缓存压缩

自回归视频扩散模型因历史帧键值缓存冗余，面临注意力复杂度高、内存开销大的问题。本文提出Forcing-KV混合压缩方法，基于注意力头功能分化的实证研究，将头划分为静态头（关注块间过渡与帧内保真度）和动态头（控制帧间运动一致性），并分别采用结构化静态剪枝和基于分段相似性的动态剪枝。在保持输出质量的同时，该方法在单张NVIDIA H200 GPU上实现超过29帧/秒的生成速度，缓存内存降低30%，在480P分辨率下对LongLive和Self Forcing分别加速1.35倍和1.50倍，在1080P分辨率下更可达2.82倍加速。

多模态论文/研究部署/工程

07:44

Berryxia.AI@berryxia

54

针对"HTML比Markdown更适合AI"的言论，开发者@xicilion表示反对，并力荐其开发的docu.md阅读插件。他开发此插件旨在证明Markdown同样优秀，并希望推广这个自认为非常强大的工具。主推文作者对此表示认可并进行了推荐。

响马: 我为什么反对 html 比 markdown 更适合 ai 的言论呢? 因为我费老大劲开发了 https://docu.md 我要让更多人知道这个超腻害的阅读插件。😇

产品更新开源/仓库部署/工程

07:01

swyx 🌉@swyx

41

这是件大事，其重要性堪比Kelsey Hightower的《Kubernetes The Hard Way》，可能所有AI工程师都应该至少经历一次。虽然我通常主张"即时学习"，但这是少数需要"以防万一"学习的情况。

Ahmad: http://x.com/i/article/2050058966072524800

大佬观点部署/工程

5月9日

20:32

IT之家（RSS）

42

苏姿丰确认将出席 2026 AMD AI 开发者日，5 月 19 日上海举行

AMD将于5月19日在上海举办2026年AI开发者日活动，其董事会主席兼首席执行官苏姿丰已确认出席。活动聚焦人工智能计算、系统架构、软件开源生态与真实工程问题，旨在完整呈现AMD对AI未来发展的判断及对开发者的长期投入。本次活动并非概念发布会，而是包含专家指导实战工作坊、AI领袖技术分享、与AMD工程师面对面交流等环节的实战技术日程，面向从事模型、系统、推理、训练、工具链或应用落地的真实开发者。

行业动态部署/工程

19:43

Tencent Hy@TencentHunyuan

60

@OpenRouter 的免费期已结束。这两周期间，Hy3预览版达成：总令牌使用量排名第一代码生成排名第一工具调用排名第一在所有供应商中占据15.4%市场份额 Hy3预览版仍可在OpenRouter以有竞争力的价格使用。继续创造--并请持续反馈。 https://openrouter.ai/tencent/hy3-preview

行业动态部署/工程

19:00

The Decoder：AI News（RSS）

59

据报道，除非微软购买40%的芯片，否则博通将不会为OpenAI生产定制芯片

OpenAI与博通的定制AI芯片项目因资金问题受阻。博通要求微软承诺购买其40%的芯片产量才会投入生产，而微软尚未同意这一条件。OpenAI高管萨钦·卡蒂在内部消息中称这种依赖关系“在财务上缺乏吸引力”。仅项目第一阶段成本就高达约180亿美元。目前三方谈判陷入僵局，芯片生产计划面临搁浅风险。

Microsoft OpenAI 行业动态部署/工程

17:32

IT之家（RSS）

53

消息称字节跳动增加 25% AI 基础设施支出，规模达 2000 亿元

字节跳动今年将AI基础设施计划支出提高25%，达到2000亿元人民币。原预算为1600亿元，上调主要由于公司对AI的投入继续加深以及内存芯片成本上涨。字节跳动还计划把更大比例资金投向国产AI芯片。

行业动态部署/工程

14:29

IT之家（RSS）

57

消息称 Anthropic 与美国 CDN 巨头阿卡迈达成 18 亿美元算力合作，应对 AI 需求激增

人工智能初创公司Anthropic与美国CDN服务商阿卡迈科技签署了价值18亿美元的计算协议，以应对AI软件需求的激增。该合作消息推动阿卡迈股价连续两日大幅上涨，周四涨25%，周五进一步上涨约28%，股价达到149.05美元。阿卡迈此前已在财报中透露与某前沿模型提供商达成长期合作，公司预计第二季度收入在10.8亿至11亿美元之间。双方均未对此协议发表评论。

Anthropic 行业动态部署/工程

13:29

IT之家（RSS）

45

我国百余家单位联合共建"太空云"生态，推动天基信息服务智能化

在第二届空天信息技术大会上，中国科学院空天信息创新研究院联合百余家单位提出共建“太空云”生态倡议。该倡议旨在将分散的通信、遥感、导航及算力卫星整合为统一的云原生智能服务体系，实现从“功能单星”到“智能星云”的跨越。系统可自动匹配最优天基资源，将数据处理时延压缩至分钟级乃至秒级，用户通过便携终端即可按需调用服务。其应用覆盖应急减灾、大众服务、低空经济与6G等领域，将显著提升我国天基资源的综合应用效能。

端侧行业动态部署/工程

11:35

歸藏(guizang.ai)@op7418

63

AI产品架构共识：数据与表现分离，Markdown存储与HTML展示

当前AI产品演进形成行业共识，即采用数据与表现分离的架构。底层逻辑与记忆由纯净的Markdown存储，适合承载事实性内容。表现层则由HTML全面接管，通过精细排版和视觉元素解决Markdown长文难读问题，并支持丰富交互。HTML的痛点在于不适合版本控制，其混杂的代码和样式会为人类审阅和AI消费带来噪音与Token浪费。因此，核心是彻底分离两层：底层用Obsidian等工具管理Markdown数据，需要分享时再渲染为HTML并部署于S3等平台，提供一键消费的顺滑体验。未来AI产品将沿此解耦路径发展。

Thariq: http://x.com/i/article/2052796100608974848

数据/训练现象/趋势部署/工程

11:28

SiliconFlow@SiliconFlowAI

55

恭喜🎉 如果你想开始使用，我们有一个关于如何与SiliconFlow一起使用的逐步指南👇 【引用 @NousResearch】：Hermes Agent 现已在全球 @OpenRouter 代币排名中位列第一。虽然我们的旅程刚刚开始，但我们想借此机会感谢我们的贡献者、支持者和用户所做的一切，让我们走到今天。

Nous Research: Hermes Agent is now #1 on the Global @OpenRouter token rankings. While our journey together has just begun, we'd like to...

智能体教程/实践部署/工程

09:29

IT之家（RSS）

46

日月光携手楠梓电投资高雄新厂，建设"CoWoS 替代"先进封装产能

日月光半导体与楠梓电子宣布，将共同投资352.35亿新台币（约76.28亿元人民币），在高雄楠梓科技产业园区建设一座先进封装工厂。该工厂占地约1.76万平方米，总建筑面积超11.34万平方米，预计于2029年9月投产。其核心工艺为FOCoS与FC BGA技术，其中FOCoS的某些变体可实现XPU与HBM集成，可作为台积电CoWoS工艺的替代方案，且无需中介层的设计有助于降低生产成本。

行业动态部署/工程

09:29

IT之家（RSS）

49

Arm：客户近两年对 AGI CPU 的总需求已超 20 亿美元

Arm在财报会议上披露，客户对其首款自研处理器Arm AGI CPU在2027至2028财年的总需求规模已突破20亿美元，较3月发布时增长超一倍。公司预计该芯片将在2027财年第四季度带来近1亿美元的首批收入，并预测到2031财年自研CPU业务累计收入将达150亿美元。Arm表示，得益于现成的软件支持和机架设计，该芯片可快速部署至数据中心。此外，Arm预计2027财年许可收入增长约20%，数据中心Neoverse特许权使用费收入有望再度翻倍，公司近期还签署了两份面向智能手机和数据中心网络芯片的下一代CSS协议。

行业动态部署/工程

08:47

Claude Code：GitHub Releases（RSS）

35

本次发布的 v2.1.137 版本主要包含一项错误修复。该版本解决了 Visual Studio Code 扩展在 Windows 操作系统上无法激活的问题。此次更新专注于提升特定平台下的扩展兼容性与稳定性。

Anthropic 产品更新部署/工程

08:35

Berryxia.AI@berryxia

66

人类大脑最聪明的地方，就是大部分时间只激活极少部分神经元。

现代LLM类似人脑，前馈层中超过95%的神经元对输入保持静默，呈现高度稀疏性。但GPU硬件专为密集计算设计，非结构化稀疏导致不规则内存访问，反而让计算更少的模型运行更慢。Sakana AI与NVIDIA合作解决了这一矛盾，开发了TwELL混合稀疏格式及定制CUDA内核，将稀疏性重塑为GPU易于处理的形式。该方案动态路由99%的稀疏token通过快速路径，并为密集token提供备用矩阵。在H100 GPU上，训练和推理速度提升超20%，同时降低内存占用和能耗。相关论文、博客和代码均已开源。

hardmaru: The human brain🧠 is incredibly efficient because it only activates the specific neurons needed for a thought. Modern LL...

arXiv 推理论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

33

面向弱监督日志实例异常定位：基于反事实扰动的"大海捞针"

该研究针对大规模系统日志中实例级异常定位标注成本高的难题，提出了LogMILP弱监督框架。该框架仅使用包级标签，即可同时实现包级异常检测与实例级异常定位。其核心是通过原型引导的结构建模与反事实扰动一致性正则化，指导模型定位关键日志条目。在三个公共数据集上的实验表明，LogMILP在取得有竞争力的检测性能同时，生成的实例级定位结果更为可靠。相关代码已开源于 https://github.com/YUK1207/LogMILP。

arXiv 论文/研究部署/工程

07:34

ginobefun@hongming731

47

AI智能体能力扩张遇组织瓶颈，跨会话学习与架构革新成焦点

OpenAI将Codex集成至浏览器，Anthropic为智能体引入记忆与梦想机制，推动Agent从单次任务向跨会话自学习与原生执行演进。与此同时，阿里云开发者指出传统分工模式与多仓库架构已成为制约Agent效率的关键瓶颈。能力快速进化与组织结构重塑形成双重主线，凸显技术发展需与协作模式同步革新。

智能体 Anthropic OpenAI 现象/趋势

01:55

Tibo@thsottiaux

72

你可以直接迁移东西

OpenAI: Just gonna leave this here. https://chatgpt.com/codex/switch-to-codex/

MCP/工具 OpenAI 产品更新编码

01:48

Google AI Developers@googleaidevs

22

周末社区作品征集！你有展示 Gemma 4 多令牌预测（MTP）草稿器、文件搜索工具更新或 Gemini API 中 Webhooks 的项目或演示吗？在评论区分享出来，让它们发光 🌟

Google 其他搜索部署/工程

01:27

BAIR：Berkeley AI Research Blog

精选64

自适应并行推理：高效推理扩展的新范式

自适应并行推理是一种新范式，它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果，以应对序列推理中因探索路径增长而导致的延迟增加和“上下文腐化”问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程，在数学与代码推理基准上取得了显著性能提升，同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变，为复杂任务的推理提供了高效且可扩展的解决方案。

推理现象/趋势部署/工程

推荐理由：模型自己决定何时并行、开几个线程，这篇BAIR博客把Multiverse和ThreadWeaver的系统设计掰开了讲，做推理系统和RL的同学应该看看。

01:24

SemiAnalysis@SemiAnalysis_

59

数据中心开发商正越来越多地在非建制县土地上规划项目，这并非偶然。在城市边界之外，他们可以避开市议会审批、市政分区投票和城市土地利用审查。这正在重新绘制大规模AI基础设施的建设版图。（1/4） 🧵

现象/趋势部署/工程

00:54

Google AI@GoogleAI

49

谷歌I/O大会前11天持续发布多项AI产品更新

距离谷歌I/O大会仅11天，公司本周推出了一系列AI产品更新。Google Health应用集成Gemini，利用穿戴设备、健康应用和医疗记录提供个性化健康指导。Gemma 4引入多令牌预测技术，可将工作流速度提升高达3倍。NotebookLM新增自动源文件整理和可定制思维导图功能。Gemini API的文件搜索工具升级，支持多模态、自定义元数据和页面引用，并加入Webhooks推送通知以替代轮询。此外，Nano Banana、Veo和Google Photos Remix等热门AI功能现已登陆Google TV平台。

Google 产品更新搜索部署/工程

5月8日

20:22

IT之家（RSS）

61

美加墨电力监管机构示警：数据中心让整张电网面临停摆风险

北美电力可靠性公司（NERC）向美加墨地区发布最高级别三级警报，警告数据中心接入电网可能导致整张电网停摆。这是过去9个月内第三次类似警告。警报指出，数据中心尤其是承载AI工作负载的设施用电波动剧烈，需求在数秒内急剧变化，电网运营商缺乏应对流程。加密货币挖矿和传统数据中心同样构成威胁。NERC要求运营商立即采取必要行动，并在8月3日前提交风险缓解计划。

政策/监管行业动态部署/工程

19:20

IT之家（RSS）

59

斯坦福 AI 教授安杰尼 · 米达：若想让美国人接受数据中心，企业得先学会共情

斯坦福AI教授安杰尼·米达指出，美国科技公司需以共情和透明沟通应对数据中心建设阻力。越来越多地方社区因担忧电费上涨、环境影响和生活质量下降而反对新建数据中心，皮尤报告显示43%受访者认为数据中心推高了其电费账单。米达强调，科技公司应清晰说明数据中心对社区的实际影响与建设目的，主动倾听社区意见，否则将面临重大阻力。部分政界人士已提议暂停新项目审批。他认为，在基础设施扩张中平衡技术需求与社区关切，通过类似“营养成分标签”的透明信息缩小分歧，是推动AI发展的关键。

现象/趋势部署/工程

18:20

IT之家（RSS）

67

中国移动董事长陈忠岳：将推进全国一体化算力网建设，开放万亿级词元服务体验包

中国移动董事长陈忠岳在移动云大会上宣布，公司将推进全国一体化算力网建设，提供即取即用、普惠易用的算力服务。具体举措包括加强全光网高速直联、加速AI数据中心建设并布局吉瓦级数据园区，升级AI云算服务以支撑大模型发展。同时，中国移动将开放万亿级词元（Token）服务体验包，并发布移动模型服务平台MoMA。该平台已接入超300款业界主流AI模型，包括自研“九天”及DeepSeek、通义千问等，提供统一API网关，服务于政务、金融、工业等多类场景。

推理行业动态部署/工程

17:42

Alibaba Cloud@alibaba_cloud

66

阿里云推出Smart Studio，一站式自托管AI模型平台

阿里云发布Smart Studio平台，旨在整合AI模型测试与服务的全流程，终结用户在不同平台间切换的繁琐。该平台提供即时访问最新SOTA模型（如Qwen3.6-Max、DeepSeek-v4）的能力，支持多模态及图像视频生成模型。其核心功能包括可视化模型实验室，用于并排比较开源与闭源模型的输出效果，并能快速将Hugging Face上的模型转化为实时API，简化部署流程。

产品更新多模态部署/工程

16:02

Alibaba Cloud@alibaba_cloud

51

阿里云每日处理60多个区域的200+TB API日志--延迟低于30秒，可用性达99.99%。了解阿里云如何运用Flink + SLS将TB级网关日志转化为秒级指标。

行业动态部署/工程

15:16

IT之家（RSS）

26

迎广科梵特 covalent 工作站全塔台式机箱开启预约：支持 EEB / EATX 主板，999 元

迎广科梵特 covalent 工作站全塔台式机箱已在京东开启预约，售价999元。这款机箱专为AI与高性能计算设计，采用全塔结构，提供钢板或强化玻璃侧板选项。它支持EEB和EATX主板，可容纳多张大型显卡，兼容420mm一体式水冷，预装4颗CV140风扇。存储方面支持安装3颗3.5英寸或6颗2.5英寸硬盘，并内置风扇集线器、快拆侧板等模块化设计，满足高扩充与散热需求。

其他部署/工程

15:14

向阳乔木@vista8

71

Codex Chrome插件安装使用注意事项

安装Codex Chrome插件需注意：确保Codex为最新版本并使用官方订阅登录，第三方API模式不支持。插件安装对网络节点有要求，部分区域（如香港）可能无法使用。建议将Chrome设为默认浏览器以便引导。安装后，需在对话中通过“@ Chrome”指令调用。若连接失败，可尝试重启电脑。

智能体教程/实践部署/工程

14:16

IT之家（RSS）

48

新华三发布面向万亿级大模型的全系列超节点 UniPoD S80000

在NAVIGATE 2026峰会上，新华三发布了面向万亿级大模型的全系列超节点UniPoD S80000，覆盖32卡至1024卡，最高可扩展至16384卡，提供一站式智算解决方案。同时，围绕“AI in ALL”战略，推出了一系列全栈新品，包括：高密全液冷整机S90000，实现1U 6CPU业界最高密度；单芯片102.4T智算交换机，大幅提升带宽与利用率；AI原生存储X20000系列，单节点带宽达200GB/s；新一代AI智能云，支持超大规模纳管；业界最高性能AI防火墙M9000-X；以及凝聚了23年运维经验的灵犀运维智能体。

产品更新部署/工程

13:16

IT之家（RSS）

58

中国移动发布 MoMA 平台：单位 Token 成本压降 30%，接入超 300 款 AI 模型

中国移动发布移动模型服务平台MoMA，接入超过300款业界主流AI模型，包括自研“九天”及DeepSeek、通义千问等。平台基于国产算力部署自研推理引擎，通过智能路由与资源调度，实现单位Token成本降低约30%，资源占用率下降50%以上。其智能路由引擎支持成本、效果、均衡三种优先策略，并能实现故障秒级切换。平台还提供“机密模型”服务，通过硬件隔离技术保障政务、金融等高安全需求场景的数据安全。

产品更新推理部署/工程

12:21

Berryxia.AI@berryxia

68

优化表格Agent检索效率：Ramp Labs集成Fast Ask子代理

Ramp Labs在Ramp Sheets的Spreadsheet Agent中深度集成了Fast Ask检索子代理，解决了传统表格Agent因读取范围不当导致的效率低下和成本高昂问题。该子代理能自动导航并读取最相关数据范围，仅返回精炼答案，减少上下文污染与token消耗。其基于开源Qwen3.5-35B-A3B模型，通过与Prime Intellect合作进行RL后训练优化。实际应用中，它消除了主代理17.8%的无效工具调用，延迟接近Claude Haiku 4.5，准确率比Claude Opus 4.6高4个百分点，实现了更快、更准、更经济的系统性能。

Ramp Labs: http://x.com/i/article/2052422965019439105

智能体搜索教程/实践部署/工程

11:16

IT之家（RSS）

48

电动车室内充电风险智能识别系统上线：零硬件改造，依托现有电表

在市场监管总局指导下，云南电网成功研发“电动车室内充电风险智能识别系统”。该系统无需硬件改造，依托现有智能电表的15分钟负荷曲线数据，通过人工智能算法识别电动自行车充电的独特“电化学指纹”，实现对高层建筑内违规入户充电行为的精准识别与预警。系统构建了大数据驱动的“技术+管理”协同治理模式，可将预警信息推送至电网、物业、社区等多方，形成闭环管理。目前已在50余个居民区试运行，识别准确率达88%。

产品更新部署/工程

11:06

SemiAnalysis@SemiAnalysis_

61

@vllm_project 维护者在第0天优化DeepSeekv4性能并在周末合并了他们的初始模型支持PR。速度就是护城河

DeepSeek 开源/仓库推理部署/工程

09:16

IT之家（RSS）

48

AMD 时隔四年重推 PCIe AIC 形态 Instinct 显卡：MI350P 规模砍半

AMD近日发布了四年来首款采用PCIe AIC形态的Instinct MI350P加速卡，主要面向现有数据中心基础设施升级。该卡采用新封装，规格相较MI350X大幅缩减：XCD芯片数量减半至4个，HBM3E内存降至4堆栈144GB，性能下降约50%，晶体管数量减少约60%。产品采用双槽全高全长设计，最大功耗600W，支持无风扇被动散热。

产品更新部署/工程

09:16

IT之家（RSS）

53

消息称软银与英伟达、富士康磋商，拟开发"日本制造"AI 服务器

软银正与英伟达和富士康磋商，评估在日本本土制造AI服务器的可行性。该计划首先通过组装外购组件建立生产系统，目标是在2029年前逐步掌握完整的AI服务器制造流程。软银将打造配备高级GPU的高性能服务器，此蓝图已纳入公司中期经营计划，预计最快将于下周正式公布。软银CEO孙正义已向OpenAI投资超过300亿美元，显示出其在大型语言模型竞争中的全力投入。

行业动态部署/工程

09:16

IT之家（RSS）

61

向 AI 优先运营模式转型，Cloudflare 裁员超 1100 人

美国科技企业Cloudflare宣布裁员20%，涉及超过1100名员工，以推动公司向AI优先运营模式转型。公司CEO表示，此举并非仅为降本增效，而是为适应智能体时代重构公司架构。数据显示，Cloudflare的AI使用量在三个月内激增超过600%，公司内部日常运营已广泛依赖AI智能体对话。截至去年底，公司全职员工数为5156人，预计此次裁员将产生1.4亿至1.5亿美元的相关费用。

行业动态部署/工程

08:16

IT之家（RSS）

60

OpenAI 自研芯片项目遇阻：博通要求微软采购首批四成产能才愿出资

OpenAI与博通联合研发AI芯片项目“Nexus”陷入僵局。博通要求微软承诺采购首批芯片约40%的产能，才愿为首期建设出资。项目首期需1.3吉瓦算力，成本约180亿美元；总规模达10吉瓦，旨在2030年前上线以减少对英伟达依赖。OpenAI视自研芯片为降低运营成本关键，但微软尚未同意采购。若微软采购未达标，OpenAI需自行寻找其他买家。此前OpenAI与英伟达的类似千亿美元合作也已无果。

Microsoft OpenAI 数据/训练行业动态

08:09

meng shao@shao__meng

精选79

OpenAI 为官方 REST API 发布 CLI 工具

OpenAI 发布了官方 REST API 的命令行界面工具（CLI），将平台端点映射为 openai <资源> <命令> 的子命令，便于在 Shell 脚本、CI/CD 及运维场景中直接调用。该工具旨在替代 curl 与 jq 的组合，简化对 Admin API（如用量、项目管理）的操作，并支持通过 --format explore 快速探索新端点。开发者可通过 CLI 调用所有云端工具（包括图像生成、转录等），获得 Unix 风格的结构化输出，同时管理项目和配置 API 密钥。该项目目前处于早期阶段，更多文档即将发布。

jason liu: small ship / passion project, more details soon https://github.com/openai/openai-cli 1. call responses via cli with all ...

OpenAI 产品更新部署/工程

推荐理由：OpenAI 官方出了 CLI，把所有 REST 端点映射成子命令，以后 shell 脚本里调 API 不用再写 curl+jq 胶水了，做 CI/CD 和运维的可以直接用。

1…36 373839 40…50