全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「部署/工程」清除

6月22日周一

23:38DogeDesigner55SpaceX与Reflection签署每月1.5亿美元AI算力协议

23:12Berryxia.AI64沉浸式翻译接入免费模型教程：以小米MiMo为例

22:11Hugging Face：Blog（RSS）69精选PP-OCRv6 on Hugging Face：50 语言 OCR，参数规模 1.5M 至 34.5M

22:05IT之家（RSS）5035台英伟达AI HPC惠及超300万研究人员，欧洲启动史上最大规模AI超算建设

22:00公众号：百度智能云（文心）46百度智能云亮相张江EAI：百舸AI Infra加速具身模型，安全方案护航产业落地

21:05IT之家（RSS）59微软 AI 迎强援，得州数据中心获雪佛龙 20 年供电协议

20:11Emad20Emad Mostaque 寻 B200 按需租赁方案

19:05IT之家（RSS）55我国拟制定人形机器人变电站及家电制造场景技术要求

17:10Alibaba Cloud53阿里云AI网关FinOps上线

16:43The Decoder：AI News（RSS）66Sakana AI 推出 Fugu：动态协调多 LLM 的系统，匹配 Anthropic 顶级模型性能

15:37MarkTechPost（RSS）60MoonMath AI 开源 AMD MI300X 注意力核，全面超越 AITER v3

14:04IT之家（RSS）26英伟达自夸 AI 服务器 100% 液冷散热：能在 45°C 冷却液中运行，比洗澡水还热

13:37Ant Ling63蚂蚁百灵Ling & Ring 2.6系列模型上线OpenRouter，限时折扣至7月31日

13:04IT之家（RSS）38HD 现代基于英伟达 Isaac Sim 研发造船 AI 机器人，先用于焊接工序

12:04IT之家（RSS）46OpenAI 史上最大规模企业部署之一：三星向员工开放 ChatGPT 和 Codex

11:04IT之家（RSS）44鸿海刘扬伟：1GW 英伟达 Vera Rubin AI 数据中心需 470 亿美元

10:04IT之家（RSS）53特斯拉申请"Megapod"商标，计划推出模块化AI数据中心硬件系统

10:04IT之家（RSS）54闪迪新专利：将NAND闪存堆叠在计算芯片下方，破解存储瓶颈

08:06AYi71Netflix 工程师开源工具 Headroom，减少 95% token 消耗

08:00HuggingFace Daily Papers（社区热门论文）44RaysUp：基于几何感知射线表示的超轻量通用特征上采样框架

08:00HuggingFace Daily Papers（社区热门论文）48AOHP：面向个性化、高效与安全交互的开源操作系统级智能体框架

07:37Hacker News 热门（buzzing.cc 中文翻译）63LLM 让自建软件成本降低，但购买仍存在"可行区域"

07:36MarkTechPost（RSS）58AI智能体记忆的七种类型：技术指南

07:13OpenAI：官网动态（RSS · 排除企业/客户案例）47三星电子向员工部署ChatGPT和Codex

07:01Simon Willison 博客72同事件精选Cloudflare 临时账户 for AI agents同一事件，精选展示《Cloudflare 为 AI 智能体推出临时账户》

04:36Rohan Paul62AI数据中心金融正成为独立资产类别，杠杆贷款涌入基建热潮

00:56Chubby♨️55Cognite联合创始人Geir Engdahl：工业AI失败主因在工厂运营而非模型层

00:09Berryxia.AI6510个免费开源GitHub仓库推荐

00:06Nathan Lambert47GLM非常扎实，五分钟轻松设置

6月21日周日

18:20公众号：火山引擎26火山引擎×千行百业：让每一个Token，都落地有声

18:06Hacker News 热门（buzzing.cc 中文翻译）53PRINCE：拜耳与Thoughtworks联合开发的智能体式AI临床前数据平台

07:33MarkTechPost（RSS）64思科 AI 发布 FAPO：基于 Claude Code 的多步 LLM 流水线优化系统

05:25Chubby♨️48Meta因AI成本飙升将限制内部使用

04:33Hacker News 热门（buzzing.cc 中文翻译）66用于 AI 智能体的临时 Cloudflare 账户

01:01SemiAnalysis182026年内存短缺下的冯·诺依曼架构

6月20日周六

21:50OpenBMB50面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群

19:24meng shao51LandingAI ADE 支持密码保护文档解析

17:59IT之家（RSS）47LM Studio 与苹果合作，成功用四台 Mac Studio 运行万亿参数 Kimi K2.6 大模型

15:59IT之家（RSS）66开源工具 Headroom 爆火：Netflix 工程师打造，声称可节省 60%-95% Token 消耗量

13:59IT之家（RSS）26金山办公将于下月推出组织级AI产品"企业大脑"WPS Comate

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月22日

23:38

DogeDesigner@cb_doge

55

SpaceX与Reflection签署每月1.5亿美元AI算力协议

SpaceX与AI初创公司Reflection签订AI算力交易，每月1.5亿美元，至2029年合约总价值约63亿美元。Reflection将获得SpaceX的Colossus AI数据中心提供的算力，并使用英伟达最新GB300 AI芯片。付款自2026年7月1日起，双方在首三个月后均可提前90天通知终止协议。AI基础设施正成为SpaceX的重要新业务。

行业动态部署/工程

23:12

Berryxia.AI@berryxia

64

沉浸式翻译接入免费模型教程：以小米MiMo为例

教程演示如何将免费或低成本模型接入沉浸式翻译。步骤：设置→翻译服务→添加自定义翻译服务→选择“自定义AI”→填入API Key和接口地址（以小米MiMo为例，Base URL: https://api.xiaomimimo.com/v1/chat/completions）→选择对应模型（可勾选“输入自定义模型名称”）→点击测试服务，通过即完成配置。后续可在服务选项中切换使用自定义模型。全程视频演示。

铁锤人: http://x.com/i/article/2068948931959255040

教程/实践部署/工程

22:11

Hugging Face：Blog（RSS）

精选69

PP-OCRv6 on Hugging Face：50 语言 OCR，参数规模 1.5M 至 34.5M

PP-OCRv6 是 PaddleOCR 最新一代通用 OCR 模型族，提供 tiny（1.5M）、small（7.7M）和 medium（34.5M）三级。medium 和 small 支持 50 种语言（简体/繁体中文、英文、日文及 46 种拉丁语系）。在官方多场景基准上，medium 检测 Hmean 86.2%，识别准确率 83.2%，较 PP-OCRv5_server 分别提升 +4.6 和 +5.1 个百分点。模型采用 PPLCNetV4 统一骨干、RepLKFPN 检测模块和 EncoderWithLightSVTR 识别模块，可通过 PaddleOCR、Transformers、ONNX Runtime 等后端灵活部署。

Hugging Face 多模态模型发布部署/工程

推荐理由：OCR模型并没有因为VLM的兴起而消失，PP-OCRv6用1.5M到34.5M参数覆盖50种语言，对需要轻量、准确OCR的产品来说，这是一个务实的选择。

22:05

IT之家（RSS）

50

35台英伟达AI HPC惠及超300万研究人员，欧洲启动史上最大规模AI超算建设

英伟达宣布在欧洲启动35台AI HPC超级计算机建设，建成后超300万名研究人员可获取下一代算力。所有系统采用英伟达全栈AI基础设施，包含GB300 NVL72、GB200 NVL4系统及Quantum-X800 InfiniBand网络，服务于气候科学、医疗、量子计算等领域。欧洲自去年已部署或宣布800 EFLOPS AI算力。

行业动态部署/工程

22:00

公众号：百度智能云（文心）

46

百度智能云亮相张江EAI：百舸AI Infra加速具身模型，安全方案护航产业落地

6月16日至17日，2026张江EAI大会上，百度智能云展示百度百舸全栈AI Infra平台，针对VLA和WAM模型优化训练与推理，将开源WAM模型推理延迟降至原来的1/2甚至1/4；与上海交通大学合作的AHA-WAM模型延迟压缩至约41毫秒。百度智能云还总结具身智能三类核心安全风险（远程劫持、知识产权泄露、行为决策诱导），推出体系化安全解决方案。同时，人形机器人产业创新联盟已集聚120余家成员，百度智能云与宇树科技、乐聚机器人等获授牌。

具身智能行业动态部署/工程

21:05

IT之家（RSS）

59

微软 AI 迎强援，得州数据中心获雪佛龙 20 年供电协议

雪佛龙与微软签署20年供电协议，用天然气为得州西部“Kilby项目”数据中心供电。该项目用电需求接近270万千瓦，相当于200万户家庭规模，由GE Vernova和卡特彼勒的燃气轮机直供园区。项目尚未动工，雪佛龙今年晚些时候作最终投资决定，微软数据中心计划2028年起接收电力。微软今年资本支出1900亿美元，较2025年增61%，此前已投可再生能源和核能，现引入天然气满足AI用电增长。

Microsoft 行业动态部署/工程

20:11

Emad@EMostaque

20

按需租赁 B200 的最佳地点在哪里？理想情况下支持 CLI，以便 AI 智能体可以快速启动它们。

行业动态部署/工程

19:05

IT之家（RSS）

55

我国拟制定人形机器人变电站及家电制造场景技术要求

工信部近日公开征求意见，拟制定《人形机器人变电站场景技术要求》和《人形机器人家电制造场景技术要求》。变电站约30%巡检点位是轮式机器人盲区，新标准将建立术语体系、规定八大技术要求及全流程管理，破解不敢用困局。家电制造方面，已有多家企业使用人形机器人，标准将提出作业效果评估指标。此外，《人形机器人与具身智能售后服务规范》等也在立项中。此前通知提出，到2026年底人形机器人在代表性场景完成应用验证，形成万台级规模落地。

具身智能政策/监管部署/工程

17:10

Alibaba Cloud@alibaba_cloud

53

🚀 阿里云AI网关FinOps已上线！ • 实时Token可见性与追踪 • 灵活的用户配额与限制 • 即时防止预算超支让每个Token都物有所值。💰 https://int.alibabacloud.com/m/1000414707/ #AlibabaCloud #AIGateway #FinOps #LLM #DevOps #AIEngineering

产品更新部署/工程

16:43

The Decoder：AI News（RSS）

66

Sakana AI 推出 Fugu：动态协调多 LLM 的系统，匹配 Anthropic 顶级模型性能

日本 AI 初创公司 Sakana AI 发布 Fugu，一个能动态协调多个大语言模型的系统。Fugu 本身也是一个语言模型，可从可替换的智能体池中调用其他 LLM（含自身副本），通过单一 OpenAI 兼容 API 提供服务。Fugu 有基础版和 Fugu Ultra 变体。Sakana 公布的基准测试显示，Fugu Ultra 在编码、推理、科学和智能体评测中与 Anthropic Fable 5 和 Mythos Preview 表现相当。Fugu 旨在降低对单一 AI 供应商的依赖，模型池可完全替换。约 500 名 Beta 用户在长流程任务中测试，Fugu Ultra 的 bug 捕获量远超 GPT 5.5。两个变体现在已通过 API 上线。

智能体产品更新部署/工程

15:37

MarkTechPost（RSS）

60

MoonMath AI 开源 AMD MI300X 注意力核，全面超越 AITER v3

MoonMath AI 团队开源了一款 bf16 前向注意力核，专为 AMD MI300X（gfx942）设计，使用 HIP 编写，MIT 许可。该核在所有测试形状和三种舍入模式下均超越 AMD 官方 AITER v3：几何平均加速比 1.18×（RTNE）、1.15×（RTNA）、1.08×（RTZ），最高单形状 1.26×。性能提升来自单指令 asm 包装和内存布局优化——K 置于 LDS，V 常驻 L1，Q 和累加器保持在寄存器。该核已通过 SGLang PR 将 Wan2.1 视频扩散模型推理速度提升 1.23 倍，质量无损。当前仅支持 bf16、头维度固定 128，无因果掩码、GQA 或变长批处理。

开源/仓库部署/工程

14:04

IT之家（RSS）

26

英伟达自夸 AI 服务器 100% 液冷散热：能在 45°C 冷却液中运行，比洗澡水还热

英伟达今日发布博客，称 Rubin AI 基础设施是全球首个实现 100% 液冷的技术，系统内无任何风扇。冷却液温度最高可达 45 摄氏度（高于浴缸热水 38-40℃），更节能。行业估计冷却机厂温度每提高 1 度可降低约 4% 制冷能源成本，一座 50 兆瓦超大规模设施通过液冷每年可节省超过 400 万美元（约合 2715.6 万元人民币）。传统数据中心风扇散热噪音可达 85 分贝以上，Rubin 服务器使用 75% 水和 25% 丙二醇混合冷却液直接流经散热器从热源抽取热量，高温冷却液无需启动机械散热器和风扇即可排散热量。

产品更新部署/工程

13:37

Ant Ling@AntLingAGI

63

蚂蚁百灵Ling & Ring 2.6系列模型上线OpenRouter，限时折扣至7月31日

蚂蚁百灵在OpenRouter上架Ling & Ring 2.6系列模型。Ring-2.6-1T和Ling-2.6-1T定价：输入$0.075/1M tokens，输出$0.625/1M tokens，缓存读取$0.015/1M tokens。Ling-2.6-flash版价格更低：输入$0.01/1M tokens，输出$0.03/1M tokens，缓存读取$0.002/1M tokens。该系列面向真实智能体工作流与复杂任务，主打高效智能，提供最高90%限时折扣，优惠持续至7月31日。

产品更新部署/工程

13:04

IT之家（RSS）

38

HD 现代基于英伟达 Isaac Sim 研发造船 AI 机器人，先用于焊接工序

HD 现代正基于英伟达 Isaac Sim 平台研发实体人工智能机器人，计划先应用于船舶制造的焊接、涂装、板材折弯工序。机器人在 Omniverse 平台预学习，利用实时光线追踪和 Newton 物理引擎训练，可自主感知环境作业。HD 现代是全球首家采用 Isaac Sim 的造船企业，正联合西门子、英伟达等推进 2030 年建成“未来智能先进船厂”（FOS），其数字孪生船厂曾在 CES 2026 获黄仁勋好评。近期还与 Persona AI 合作开发人形焊接机器人，并引入彩虹机器人协作机器人至产线。

具身智能行业动态部署/工程

12:04

IT之家（RSS）

46

OpenAI 史上最大规模企业部署之一：三星向员工开放 ChatGPT 和 Codex

OpenAI 于 6 月 21 日宣布，三星电子向全球员工部署 ChatGPT Enterprise 和 Codex，覆盖韩国全体员工及全球设备体验（DX）部门，为 OpenAI 迄今最大规模企业部署之一。ChatGPT Enterprise 提供数据保护等企业级功能；Codex 可编写、审核、调试代码，帮助非技术团队将想法转化为软件和自动化工作流。自 2026 年 2 月以来，韩国 Codex 周活跃用户增长近 800%。此外，首尔国立大学为 4.7 万名成员免费提供 ChatGPT Edu，OpenAI 与 Kakao 合作将 ChatGPT 引入 KakaoTalk 群聊。LG 电子、三星 SDS 等多家韩国企业也在使用上述产品。

OpenAI 行业动态部署/工程

11:04

IT之家（RSS）

44

鸿海刘扬伟：1GW 英伟达 Vera Rubin AI 数据中心需 470 亿美元

鸿海董事长刘扬伟称，基于 NVIDIA Vera Rubin 平台打造 1GW 规模 AI 数据中心需 470 亿美元资本支出。单个 Vera Rubin 机架售价 910 万美元，1GW 数据中心约需 3557 个机架，年电力成本达 13 亿美元，硬件折旧费用是电力成本六倍。全球数据中心产业规模到 2030 年将达 1.6 万亿美元，电力容量从 2024 年 68GW 增至 174GW。AI 算力需求来自模型开发商、云服务商、政府和企业，后两者仍属蓝海。

行业动态部署/工程

10:04

IT之家（RSS）

53

特斯拉申请"Megapod"商标，计划推出模块化AI数据中心硬件系统

特斯拉向美国专利商标局提交“Megapod”意图使用商标申请，计划推出模块化AI数据中心硬件系统，包含计算机服务器、AI专用计算机硬件、网络设备、配电单元及冷却系统，是一体式机柜级整机，配套监控与运维软件。该产品将直接对标英伟达GB200 NVL72液冷机柜系统（内置72颗Blackwell GPU与36颗Grace CPU）以及戴尔PowerEdge XE9712、超微等竞品。但产品名与浸没冷却厂商Submer已注册的“MegaPod”品牌（40英尺预制式箱式数据中心，额定功率800kW，PUE 1.03）存在冲突。

行业动态部署/工程

10:04

IT之家（RSS）

54

闪迪新专利：将NAND闪存堆叠在计算芯片下方，破解存储瓶颈

闪迪获得一项新专利（US 12,430,274 B2），提出3D堆叠架构：将搭载CMOS键合阵列的NAND闪存存储裸片堆叠在主计算裸片（AI加速器或GPU）下方。同一中介层仍搭载HBM DRAM，但分工不同——HBM负责低延迟高优先级读写，NAND闪存承担大容量数据操作；宽通道互联降低传输延迟、硬件成本与整体功耗。单组HBF堆叠容量最高可达4TB。该方案目前仅停留在专利阶段，量产仍需解决功耗、制造成本等工程难题。

行业动态部署/工程

08:06

AYi@AYi_AInotes

71

Netflix 工程师开源工具 Headroom，减少 95% token 消耗

Netflix 工程师开源 Headroom，在 Codex、Cursor 等 AI 编码工具外包围本地 Agent，自动压缩日志、JSON 和代码，保留逻辑准确性，减少 95% token 消耗。数据本地化，无需改代码，已获 35k GitHub 星标。核心将降本从改提示词、换模型转向输入前置处理。

开源/仓库编码部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

44

RaysUp：基于几何感知射线表示的超轻量通用特征上采样框架

RaysUp是一个超轻量、任务无关且与视觉基础模型无关的特征上采样框架，通过将重建提升至几何感知光线域，在任意分辨率下重建高分辨率特征图。核心组件包括空间解耦引导编码器、任意分辨率交叉注意力机制、基于6D Plücker射线坐标的RayPE（射线位置编码）和几何感知邻域注意力模块。在多种密集预测任务中取得SOTA性能，参数量仅为AnyUp的16%，推理速度提升约7倍。代码已开源。

开源生态论文/研究部署/工程

08:00

HuggingFace Daily Papers（社区热门论文）

48

AOHP：面向个性化、高效与安全交互的开源操作系统级智能体框架

AOHP（Android Open Harness Project）基于Android开源项目（AOSP）构建，将AI智能体视为操作系统的一等角色，提供自适应UI和智能体友好运行时环境，同时保留安卓软硬件生态。系统引入三种智能体导向机制：个性化服务组合、高效智能体接口和安全信息流。在涵盖OS智能体关键能力的挑战任务中，AOHP的任务完成率提升21.12%，token成本降低51.55%，并满足安全策略合规要求。

智能体开源/仓库论文/研究部署/工程

07:37

Hacker News 热门（buzzing.cc 中文翻译）

63

LLM 让自建软件成本降低，但购买仍存在"可行区域"

LLM 虽大幅降低自建成本，但未归零。以年薪 $200k 的工程师为例，团队花至少2周用 Claude 自建 Jira 替代品后，每月还需2小时维护，需37个月才能收回月费 $400 的购买成本。而像 Salesforce 每座 $500/月、50 座共 $25k/月，足以雇佣 1.5 名全职工程师自建，使自建更接近合理决策。因此存在一个“可行区域”：当软件足够复杂、LLM 重构不易且定价不过高时，购买仍优于自建。

现象/趋势部署/工程

07:36

MarkTechPost（RSS）

58

AI智能体记忆的七种类型：技术指南

大语言模型默认无状态，构建智能体需借助记忆机制。七种记忆类型包括：工作记忆（上下文窗口内临时存储提示词、消息、工具输出）、语义记忆（长期存储用户偏好、事实）、情节记忆（记录过去事件与任务结果用于经验学习）、程序记忆（存储技能、工作流与行为规则）、外部/检索记忆（通过向量数据库在推理时拉取信息，即RAG）、参数记忆（嵌入模型权重中的世界知识与推理模式）、前瞻记忆（记忆未来意图与计划目标）。每种记忆对应不同时间尺度与实现方式，组合使用可构建更强的自主智能体系统。

智能体教程/实践部署/工程

07:13

OpenAI：官网动态（RSS · 排除企业/客户案例）

47

三星电子向员工部署ChatGPT和Codex

三星电子近日向韩国全体员工及全球DX部门部署ChatGPT Enterprise与Codex，成为OpenAI迄今最大规模企业部署之一。ChatGPT Enterprise用于信息检索、文档起草、数据分析等知识型任务，提供数据保护与安全控制。Codex可提升代码编写、审查和调试效率，非技术团队也能将创意转化为软件、网站和自动化工作流。Codex每周活跃用户超500万，韩国自2026年2月以来增长近800%。三星计划将AI应用于研发、制造、营销等全业务流程，并与OpenAI在AI基础设施方面深化合作。

OpenAI 行业动态部署/工程

07:01

Simon Willison 博客

同事件精选72

Cloudflare 临时账户 for AI agents

Cloudflare 推出临时账户功能，无需注册即可通过 npx wrangler deploy --temporary 部署 Workers 项目，临时项目存活 60 分钟。该功能虽标称为 AI 智能体设计，但普通用户同样适用。作者使用 GPT-5.5 xhigh 在 Codex Desktop 中构建了测试应用，验证了部署与运行流程，并展示了项目认领页面。

智能体产品更新部署/工程

同一事件，精选展示《Cloudflare 为 AI 智能体推出临时账户》

推荐理由：虽然这次打的旗号是服务 AI 智能体，但临时 Cloudflare 账号对任何想快速部署原型的开发者都是福音，降低了不少环境搭建的摩擦，值得马上试试。

04:36

Rohan Paul@rohanpaul_ai

62

AI数据中心金融正成为独立资产类别，杠杆贷款涌入基建热潮

摩根士丹利开始向数据中心开发商推销杠杆贷款市场。继投资级债券、项目融资、私人信贷、高收益债之后，通常用于LBO的杠杆贷款也涌入AI基建。摩根士丹利预计2026年AI相关债务发行或超5700亿美元，截至5月底已达约2360亿美元，是去年同期的4倍。NYU教授Damodaran对比互联网泡沫指出，AI资本支出规模史无前例，且大量由债务而非股权融资，一旦调整，违约将蔓延至社会，风险远超股价暴跌。

Rohan Paul: dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...

现象/趋势行业动态部署/工程

00:56

Chubby♨️@kimmonismus

55

Cognite联合创始人Geir Engdahl：工业AI失败主因在工厂运营而非模型层

Cognite CTO Geir Engdahl接受专访指出，工业AI失败的根源并非模型层，而是工厂现场运营。许多惊艳的AI试点无法在实际运营中存活，因为缺乏真正上下文——当错误可能带来危险时尤为关键。他探讨了工业智能体应在何时推荐、自动化或保持不介入，强调工作演示与可信系统之间存在巨大鸿沟。他预测，到2028年未采用AI驱动流程优化的工业企业将面临严峻挑战。这是一场务实、少谈噱头的对话。

智能体大佬观点部署/工程

00:09

Berryxia.AI@berryxia

65

10个免费开源GitHub仓库推荐

推荐10个免费开源GitHub仓库：Recordly（免费屏幕录制，AGPL-3.0）、Stirling-PDF（PDF工具集，50+功能，MIT）、PhotoGIMP（GIMP转Photoshop界面）、Open Notebook（自托管NotebookLM，支持PDF/URL/YouTube，18+数据源，MIT）、Odysseus（PewDiePie开发的AI工作空间，本地优先，MIT）、FreeDomain（免费域名指向Cloudflare，AGPL-3.0）、Hyperframes（HeyGen的HTML/CSS转MP4引擎，Apache-2.0）、Web-to-App（网站转Android应用，支持Node/PHP/Python运行时）、ReClip（基于yt-dlp的多平台视频/音频下载）、Excalidraw（无限画布手绘图表，端到端加密，12万+好评）。

m0h: 10 GITHUB REPOS THAT SHOULD BE ILLEGAL TO HAVE. all free. all open-source. bookmark this for later. 1️⃣ recordly - the f...

开源/仓库教程/实践部署/工程

00:06

Nathan Lambert@natolambert

47

一小时下来，第一印象绝对是GLM非常扎实（在@FireworksAI_HQ上设置非常简单，夸他们一下，我在claude code里只花了5分钟就搞定了）。

评测/基准部署/工程

6月21日

18:20

公众号：火山引擎

26

火山引擎×千行百业：让每一个Token，都落地有声

行业动态部署/工程

18:06

Hacker News 热门（buzzing.cc 中文翻译）

53

PRINCE：拜耳与Thoughtworks联合开发的智能体式AI临床前数据平台

拜耳与Thoughtworks合作开发了云端平台PRINCE，利用Agentic RAG和Text-to-SQL整合数十年临床前安全研究报告。该系统从关键词搜索演进为能回答复杂问题并起草监管文档的智能研究助手。架构通过上下文工程控制信息路由，通过驾驭工程实现编排、错误恢复与可观测性。系统以透明度、可解释性和人工参与为核心信任机制，显著提升数据可访问性与研究效率，同时确保治理与合规。

智能体检索增强教程/实践部署/工程

07:33

MarkTechPost（RSS）

64

思科 AI 发布 FAPO：基于 Claude Code 的多步 LLM 流水线优化系统

思科 AI 推出 FAPO，一个由 Claude Code 驱动的多步 LLM 流水线自动化优化系统，基于 Apache 2.0 开源。FAPO 通过步骤级故障归因，从提示词、参数到链式结构逐级升级优化。在六项基准测试中，以 GPT-4.1-mini、GPT-5.4-mini 和 Gemma 3-12B 为任务模型，与 SOTA 优化器 GEPA 对比：18 个模型-基准比较中赢下 15 个，平均增益 +14.1 个百分点；在 HoVer 和 IFBench 上触发结构升级时六组全胜，平均增益达 +33.8 个百分点；仅在 AIME 上略逊 3.1 个百分点，在采样噪声范围内。防过拟合机制包括仅检查训练集、不可变文件及独立审查。

Anthropic GitHub 产品更新部署/工程

05:25

Chubby♨️@kimmonismus

48

Meta 内部不再 token 拉满了。 Meta 正准备限制内部 AI 的使用，原因是员工 token 消耗激增，以至于公司预计仅内部 AI 成本到 2026 年就将达到数十亿美元（说的就是你，Claude）。这一举措标志着 Meta 此前鼓励"AI 驱动影响力"的立场出现急剧反转，公司目前正在构建一个 AI Gateway 来追踪开支、设定 token 预算，并引导员工转向 MetaCode 等内部工具。

Meta 行业动态部署/工程

04:33

Hacker News 热门（buzzing.cc 中文翻译）

66

用于 AI 智能体的临时 Cloudflare 账户

Cloudflare 上线面向 AI 智能体的临时账户。智能体无需注册，直接运行 wrangler deploy --temporary 即可部署 Worker，部署持续 60 分钟，期间可通过链接认领为永久账户，超时自动删除。专为无人类参与的后台 AI

智能体产品更新部署/工程

01:01

SemiAnalysis@SemiAnalysis_

18

POV：在2026年的大内存短缺期间享受冯·诺依曼架构

现象/趋势部署/工程

6月20日

21:50

OpenBMB@OpenBMB

50

面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群

面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群。128个并发智能体在DGX Spark上运行，通过vLLM连续批处理提供服务，每个智能体独立处理发票审核、退款路由、合规检查等8种业务队列。系统在1.48秒内跨智能体流式传输6604个chunks。该案例表明，1B模型的价值在于同时做出大量有用业务决策——用一群小型廉价worker并行清理队列。

Joey: Built a back-office agent swarm demo with MiniCPM5-1B. 128 concurrent agents on DGX Spark, served through vLLM continuou...

智能体开源生态教程/实践部署/工程

19:24

meng shao@shao__meng

51

LandingAI ADE 支持密码保护文档解析

LandingAI Agentic Document Extraction（ADE）现支持在 Parse 或 Parse Jobs 调用中传入 password 参数，同一请求完成解密、解析及结构化输出。该功能要求启用 Zero Data Retention（ZDR）模式，文档仅在内存处理，不持久化，适用于 HIPAA/PHI/PII 合规场景。支持 PDF、DOC、DOCX、ODT、PPT、PPTX、XLSX 格式。集成成本低：单一可选参数，非加密文件不受影响；缺密码返回 422 错误。密码经 HTTPS 传输，ZDR 下服务端不持久化，建议配合最小权限 API Key 与审计日志。REST API 及 Python/TypeScript 库均可用。

LandingAI: Parse password-protected documents! Agentic Document Extraction (ADE) accepts a password parameter directly in the Parse...

智能体产品更新部署/工程

17:59

IT之家（RSS）

47

LM Studio 与苹果合作，成功用四台 Mac Studio 运行万亿参数 Kimi K2.6 大模型

LM Studio与苹果在WWDC 2026期间合作，用四台Mac Studio集群运行月之暗面万亿参数大模型Kimi K2.6。该模型总参数1万亿，MoE架构，激活参数320亿，支持长上下文、多模态输入和智能体任务。四台Mac Studio通过苹果内存共享与互联技术组成集群，统一内存约1.5TB，生成速度约28 tokens/s，功耗低于传统GPU集群。用户可通过LM Link从MacBook Neo或iPhone安全远程访问，数据通信保持本地化。LM Link已于2026年6月初更新至LM Studio Mac应用和Locally AI iOS应用，支持端到端加密连接。

端侧行业动态部署/工程

15:59

IT之家（RSS）

66

开源工具 Headroom 爆火：Netflix 工程师打造，声称可节省 60%-95% Token 消耗量

Netflix 高级工程师 Tejas Chopra 开发的开源工具 Headroom（v0.26.0）在 AI 应用与 LLM 间建立本地透明压缩层，通过压缩 JSON、代码、RAG 片段和对话历史等冗余数据减少 Token 消耗，支持可逆压缩与 CCR 缓存机制。实测代码搜索场景 Token 从 17765 降至 1408（节省 92%），SRE 事故调试场景从 65694 降至 5118（同样节省 92%）。累计帮助用户节省约 70 万美元成本、释放超 2000 亿 Token。提供 Python/TypeScript 库、智能体代理模式、直接包装现有 AI 编程智能体以及 MCP 服务器模式，并可精简 AI 回复中客套话进一步降低成本。

GitHub MCP/工具开源/仓库部署/工程

13:59

IT之家（RSS）

26

金山办公将于下月推出组织级AI产品"企业大脑"WPS Comate

金山办公副总裁王少康在“2026人民数据大会”上透露，将于下月（7月）正式推出组织级AI办公产品“企业大脑”WPS Comate，后续将规模化交付。该产品面向知识密集的中大型组织，主打复杂业务场景，整合并激活组织内结构化与非结构化数据，利用AI理解组织结构与协作关系，生成数字员工等AI产品融入业务运营与决策，帮助员工跨工具协同完成专业任务。后续金山办公将对接客户，根据不同公司情况定制专属“企业大脑”，实现数据、系统、流程和知识资源的高效连接，打造AI统一入口。

智能体产品更新部署/工程

1…7 8910 11…50