SpaceX与AI初创公司Reflection签订AI算力交易,每月1.5亿美元,至2029年合约总价值约63亿美元。Reflection将获得SpaceX的Colossus AI数据中心提供的算力,并使用英伟达最新GB300 AI芯片。付款自2026年7月1日起,双方在首三个月后均可提前90天通知终止协议。AI基础设施正成为SpaceX的重要新业务。
SpaceX与AI初创公司Reflection签订AI算力交易,每月1.5亿美元,至2029年合约总价值约63亿美元。Reflection将获得SpaceX的Colossus AI数据中心提供的算力,并使用英伟达最新GB300 AI芯片。付款自2026年7月1日起,双方在首三个月后均可提前90天通知终止协议。AI基础设施正成为SpaceX的重要新业务。
教程演示如何将免费或低成本模型接入沉浸式翻译。步骤:设置→翻译服务→添加自定义翻译服务→选择“自定义AI”→填入API Key和接口地址(以小米MiMo为例,Base URL: https://api.xiaomimimo.com/v1/chat/completions)→选择对应模型(可勾选“输入自定义模型名称”)→点击测试服务,通过即完成配置。后续可在服务选项中切换使用自定义模型。全程视频演示。
http://x.com/i/article/2068948931959255040
PP-OCRv6 是 PaddleOCR 最新一代通用 OCR 模型族,提供 tiny(1.5M)、small(7.7M)和 medium(34.5M)三级。medium 和 small 支持 50 种语言(简体/繁体中文、英文、日文及 46 种拉丁语系)。在官方多场景基准上,medium 检测 Hmean 86.2%,识别准确率 83.2%,较 PP-OCRv5_server 分别提升 +4.6 和 +5.1 个百分点。模型采用 PPLCNetV4 统一骨干、RepLKFPN 检测模块和 EncoderWithLightSVTR 识别模块,可通过 PaddleOCR、Transformers、ONNX Runtime 等后端灵活部署。
英伟达宣布在欧洲启动35台AI HPC超级计算机建设,建成后超300万名研究人员可获取下一代算力。所有系统采用英伟达全栈AI基础设施,包含GB300 NVL72、GB200 NVL4系统及Quantum-X800 InfiniBand网络,服务于气候科学、医疗、量子计算等领域。欧洲自去年已部署或宣布800 EFLOPS AI算力。
6月16日至17日,2026张江EAI大会上,百度智能云展示百度百舸全栈AI Infra平台,针对VLA和WAM模型优化训练与推理,将开源WAM模型推理延迟降至原来的1/2甚至1/4;与上海交通大学合作的AHA-WAM模型延迟压缩至约41毫秒。百度智能云还总结具身智能三类核心安全风险(远程劫持、知识产权泄露、行为决策诱导),推出体系化安全解决方案。同时,人形机器人产业创新联盟已集聚120余家成员,百度智能云与宇树科技、乐聚机器人等获授牌。
雪佛龙与微软签署20年供电协议,用天然气为得州西部“Kilby项目”数据中心供电。该项目用电需求接近270万千瓦,相当于200万户家庭规模,由GE Vernova和卡特彼勒的燃气轮机直供园区。项目尚未动工,雪佛龙今年晚些时候作最终投资决定,微软数据中心计划2028年起接收电力。微软今年资本支出1900亿美元,较2025年增61%,此前已投可再生能源和核能,现引入天然气满足AI用电增长。
工信部近日公开征求意见,拟制定《人形机器人变电站场景技术要求》和《人形机器人家电制造场景技术要求》。变电站约30%巡检点位是轮式机器人盲区,新标准将建立术语体系、规定八大技术要求及全流程管理,破解不敢用困局。家电制造方面,已有多家企业使用人形机器人,标准将提出作业效果评估指标。此外,《人形机器人与具身智能售后服务规范》等也在立项中。此前通知提出,到2026年底人形机器人在代表性场景完成应用验证,形成万台级规模落地。
日本 AI 初创公司 Sakana AI 发布 Fugu,一个能动态协调多个大语言模型的系统。Fugu 本身也是一个语言模型,可从可替换的智能体池中调用其他 LLM(含自身副本),通过单一 OpenAI 兼容 API 提供服务。Fugu 有基础版和 Fugu Ultra 变体。Sakana 公布的基准测试显示,Fugu Ultra 在编码、推理、科学和智能体评测中与 Anthropic Fable 5 和 Mythos Preview 表现相当。Fugu 旨在降低对单一 AI 供应商的依赖,模型池可完全替换。约 500 名 Beta 用户在长流程任务中测试,Fugu Ultra 的 bug 捕获量远超 GPT 5.5。两个变体现在已通过 API 上线。
MoonMath AI 团队开源了一款 bf16 前向注意力核,专为 AMD MI300X(gfx942)设计,使用 HIP 编写,MIT 许可。该核在所有测试形状和三种舍入模式下均超越 AMD 官方 AITER v3:几何平均加速比 1.18×(RTNE)、1.15×(RTNA)、1.08×(RTZ),最高单形状 1.26×。性能提升来自单指令 asm 包装和内存布局优化——K 置于 LDS,V 常驻 L1,Q 和累加器保持在寄存器。该核已通过 SGLang PR 将 Wan2.1 视频扩散模型推理速度提升 1.23 倍,质量无损。当前仅支持 bf16、头维度固定 128,无因果掩码、GQA 或变长批处理。
英伟达今日发布博客,称 Rubin AI 基础设施是全球首个实现 100% 液冷的技术,系统内无任何风扇。冷却液温度最高可达 45 摄氏度(高于浴缸热水 38-40℃),更节能。行业估计冷却机厂温度每提高 1 度可降低约 4% 制冷能源成本,一座 50 兆瓦超大规模设施通过液冷每年可节省超过 400 万美元(约合 2715.6 万元人民币)。传统数据中心风扇散热噪音可达 85 分贝以上,Rubin 服务器使用 75% 水和 25% 丙二醇混合冷却液直接流经散热器从热源抽取热量,高温冷却液无需启动机械散热器和风扇即可排散热量。
蚂蚁百灵在OpenRouter上架Ling & Ring 2.6系列模型。Ring-2.6-1T和Ling-2.6-1T定价:输入$0.075/1M tokens,输出$0.625/1M tokens,缓存读取$0.015/1M tokens。Ling-2.6-flash版价格更低:输入$0.01/1M tokens,输出$0.03/1M tokens,缓存读取$0.002/1M tokens。该系列面向真实智能体工作流与复杂任务,主打高效智能,提供最高90%限时折扣,优惠持续至7月31日。
HD 现代正基于英伟达 Isaac Sim 平台研发实体人工智能机器人,计划先应用于船舶制造的焊接、涂装、板材折弯工序。机器人在 Omniverse 平台预学习,利用实时光线追踪和 Newton 物理引擎训练,可自主感知环境作业。HD 现代是全球首家采用 Isaac Sim 的造船企业,正联合西门子、英伟达等推进 2030 年建成“未来智能先进船厂”(FOS),其数字孪生船厂曾在 CES 2026 获黄仁勋好评。近期还与 Persona AI 合作开发人形焊接机器人,并引入彩虹机器人协作机器人至产线。
OpenAI 于 6 月 21 日宣布,三星电子向全球员工部署 ChatGPT Enterprise 和 Codex,覆盖韩国全体员工及全球设备体验(DX)部门,为 OpenAI 迄今最大规模企业部署之一。ChatGPT Enterprise 提供数据保护等企业级功能;Codex 可编写、审核、调试代码,帮助非技术团队将想法转化为软件和自动化工作流。自 2026 年 2 月以来,韩国 Codex 周活跃用户增长近 800%。此外,首尔国立大学为 4.7 万名成员免费提供 ChatGPT Edu,OpenAI 与 Kakao 合作将 ChatGPT 引入 KakaoTalk 群聊。LG 电子、三星 SDS 等多家韩国企业也在使用上述产品。
鸿海董事长刘扬伟称,基于 NVIDIA Vera Rubin 平台打造 1GW 规模 AI 数据中心需 470 亿美元资本支出。单个 Vera Rubin 机架售价 910 万美元,1GW 数据中心约需 3557 个机架,年电力成本达 13 亿美元,硬件折旧费用是电力成本六倍。全球数据中心产业规模到 2030 年将达 1.6 万亿美元,电力容量从 2024 年 68GW 增至 174GW。AI 算力需求来自模型开发商、云服务商、政府和企业,后两者仍属蓝海。
特斯拉向美国专利商标局提交“Megapod”意图使用商标申请,计划推出模块化AI数据中心硬件系统,包含计算机服务器、AI专用计算机硬件、网络设备、配电单元及冷却系统,是一体式机柜级整机,配套监控与运维软件。该产品将直接对标英伟达GB200 NVL72液冷机柜系统(内置72颗Blackwell GPU与36颗Grace CPU)以及戴尔PowerEdge XE9712、超微等竞品。但产品名与浸没冷却厂商Submer已注册的“MegaPod”品牌(40英尺预制式箱式数据中心,额定功率800kW,PUE 1.03)存在冲突。
闪迪获得一项新专利(US 12,430,274 B2),提出3D堆叠架构:将搭载CMOS键合阵列的NAND闪存存储裸片堆叠在主计算裸片(AI加速器或GPU)下方。同一中介层仍搭载HBM DRAM,但分工不同——HBM负责低延迟高优先级读写,NAND闪存承担大容量数据操作;宽通道互联降低传输延迟、硬件成本与整体功耗。单组HBF堆叠容量最高可达4TB。该方案目前仅停留在专利阶段,量产仍需解决功耗、制造成本等工程难题。
Netflix 工程师开源 Headroom,在 Codex、Cursor 等 AI 编码工具外包围本地 Agent,自动压缩日志、JSON 和代码,保留逻辑准确性,减少 95% token 消耗。数据本地化,无需改代码,已获 35k GitHub 星标。核心将降本从改提示词、换模型转向输入前置处理。
RaysUp是一个超轻量、任务无关且与视觉基础模型无关的特征上采样框架,通过将重建提升至几何感知光线域,在任意分辨率下重建高分辨率特征图。核心组件包括空间解耦引导编码器、任意分辨率交叉注意力机制、基于6D Plücker射线坐标的RayPE(射线位置编码)和几何感知邻域注意力模块。在多种密集预测任务中取得SOTA性能,参数量仅为AnyUp的16%,推理速度提升约7倍。代码已开源。
AOHP(Android Open Harness Project)基于Android开源项目(AOSP)构建,将AI智能体视为操作系统的一等角色,提供自适应UI和智能体友好运行时环境,同时保留安卓软硬件生态。系统引入三种智能体导向机制:个性化服务组合、高效智能体接口和安全信息流。在涵盖OS智能体关键能力的挑战任务中,AOHP的任务完成率提升21.12%,token成本降低51.55%,并满足安全策略合规要求。
LLM 虽大幅降低自建成本,但未归零。以年薪 $200k 的工程师为例,团队花至少2周用 Claude 自建 Jira 替代品后,每月还需2小时维护,需37个月才能收回月费 $400 的购买成本。而像 Salesforce 每座 $500/月、50 座共 $25k/月,足以雇佣 1.5 名全职工程师自建,使自建更接近合理决策。因此存在一个“可行区域”:当软件足够复杂、LLM 重构不易且定价不过高时,购买仍优于自建。
大语言模型默认无状态,构建智能体需借助记忆机制。七种记忆类型包括:工作记忆(上下文窗口内临时存储提示词、消息、工具输出)、语义记忆(长期存储用户偏好、事实)、情节记忆(记录过去事件与任务结果用于经验学习)、程序记忆(存储技能、工作流与行为规则)、外部/检索记忆(通过向量数据库在推理时拉取信息,即RAG)、参数记忆(嵌入模型权重中的世界知识与推理模式)、前瞻记忆(记忆未来意图与计划目标)。每种记忆对应不同时间尺度与实现方式,组合使用可构建更强的自主智能体系统。
三星电子近日向韩国全体员工及全球DX部门部署ChatGPT Enterprise与Codex,成为OpenAI迄今最大规模企业部署之一。ChatGPT Enterprise用于信息检索、文档起草、数据分析等知识型任务,提供数据保护与安全控制。Codex可提升代码编写、审查和调试效率,非技术团队也能将创意转化为软件、网站和自动化工作流。Codex每周活跃用户超500万,韩国自2026年2月以来增长近800%。三星计划将AI应用于研发、制造、营销等全业务流程,并与OpenAI在AI基础设施方面深化合作。
Cloudflare 推出临时账户功能,无需注册即可通过 npx wrangler deploy --temporary 部署 Workers 项目,临时项目存活 60 分钟。该功能虽标称为 AI 智能体设计,但普通用户同样适用。作者使用 GPT-5.5 xhigh 在 Codex Desktop 中构建了测试应用,验证了部署与运行流程,并展示了项目认领页面。
摩根士丹利开始向数据中心开发商推销杠杆贷款市场。继投资级债券、项目融资、私人信贷、高收益债之后,通常用于LBO的杠杆贷款也涌入AI基建。摩根士丹利预计2026年AI相关债务发行或超5700亿美元,截至5月底已达约2360亿美元,是去年同期的4倍。NYU教授Damodaran对比互联网泡沫指出,AI资本支出规模史无前例,且大量由债务而非股权融资,一旦调整,违约将蔓延至社会,风险远超股价暴跌。
dot-com bubble vs. a possible AI bubble. From the famous "Dean of Valuation", Professor Aswath Damodaran, of NYU Stern S...
Cognite CTO Geir Engdahl接受专访指出,工业AI失败的根源并非模型层,而是工厂现场运营。许多惊艳的AI试点无法在实际运营中存活,因为缺乏真正上下文——当错误可能带来危险时尤为关键。他探讨了工业智能体应在何时推荐、自动化或保持不介入,强调工作演示与可信系统之间存在巨大鸿沟。他预测,到2028年未采用AI驱动流程优化的工业企业将面临严峻挑战。这是一场务实、少谈噱头的对话。
推荐10个免费开源GitHub仓库:Recordly(免费屏幕录制,AGPL-3.0)、Stirling-PDF(PDF工具集,50+功能,MIT)、PhotoGIMP(GIMP转Photoshop界面)、Open Notebook(自托管NotebookLM,支持PDF/URL/YouTube,18+数据源,MIT)、Odysseus(PewDiePie开发的AI工作空间,本地优先,MIT)、FreeDomain(免费域名指向Cloudflare,AGPL-3.0)、Hyperframes(HeyGen的HTML/CSS转MP4引擎,Apache-2.0)、Web-to-App(网站转Android应用,支持Node/PHP/Python运行时)、ReClip(基于yt-dlp的多平台视频/音频下载)、Excalidraw(无限画布手绘图表,端到端加密,12万+好评)。
10 GITHUB REPOS THAT SHOULD BE ILLEGAL TO HAVE. all free. all open-source. bookmark this for later. 1️⃣ recordly - the f...
拜耳与Thoughtworks合作开发了云端平台PRINCE,利用Agentic RAG和Text-to-SQL整合数十年临床前安全研究报告。该系统从关键词搜索演进为能回答复杂问题并起草监管文档的智能研究助手。架构通过上下文工程控制信息路由,通过驾驭工程实现编排、错误恢复与可观测性。系统以透明度、可解释性和人工参与为核心信任机制,显著提升数据可访问性与研究效率,同时确保治理与合规。
思科 AI 推出 FAPO,一个由 Claude Code 驱动的多步 LLM 流水线自动化优化系统,基于 Apache 2.0 开源。FAPO 通过步骤级故障归因,从提示词、参数到链式结构逐级升级优化。在六项基准测试中,以 GPT-4.1-mini、GPT-5.4-mini 和 Gemma 3-12B 为任务模型,与 SOTA 优化器 GEPA 对比:18 个模型-基准比较中赢下 15 个,平均增益 +14.1 个百分点;在 HoVer 和 IFBench 上触发结构升级时六组全胜,平均增益达 +33.8 个百分点;仅在 AIME 上略逊 3.1 个百分点,在采样噪声范围内。防过拟合机制包括仅检查训练集、不可变文件及独立审查。
Cloudflare 上线面向 AI 智能体的临时账户。智能体无需注册,直接运行 wrangler deploy --temporary 即可部署 Worker,部署持续 60 分钟,期间可通过链接认领为永久账户,超时自动删除。专为无人类参与的后台 AI
面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群。128个并发智能体在DGX Spark上运行,通过vLLM连续批处理提供服务,每个智能体独立处理发票审核、退款路由、合规检查等8种业务队列。系统在1.48秒内跨智能体流式传输6604个chunks。该案例表明,1B模型的价值在于同时做出大量有用业务决策——用一群小型廉价worker并行清理队列。
Built a back-office agent swarm demo with MiniCPM5-1B. 128 concurrent agents on DGX Spark, served through vLLM continuou...
LandingAI Agentic Document Extraction(ADE)现支持在 Parse 或 Parse Jobs 调用中传入 password 参数,同一请求完成解密、解析及结构化输出。该功能要求启用 Zero Data Retention(ZDR)模式,文档仅在内存处理,不持久化,适用于 HIPAA/PHI/PII 合规场景。支持 PDF、DOC、DOCX、ODT、PPT、PPTX、XLSX 格式。集成成本低:单一可选参数,非加密文件不受影响;缺密码返回 422 错误。密码经 HTTPS 传输,ZDR 下服务端不持久化,建议配合最小权限 API Key 与审计日志。REST API 及 Python/TypeScript 库均可用。
Parse password-protected documents! Agentic Document Extraction (ADE) accepts a password parameter directly in the Parse...
LM Studio与苹果在WWDC 2026期间合作,用四台Mac Studio集群运行月之暗面万亿参数大模型Kimi K2.6。该模型总参数1万亿,MoE架构,激活参数320亿,支持长上下文、多模态输入和智能体任务。四台Mac Studio通过苹果内存共享与互联技术组成集群,统一内存约1.5TB,生成速度约28 tokens/s,功耗低于传统GPU集群。用户可通过LM Link从MacBook Neo或iPhone安全远程访问,数据通信保持本地化。LM Link已于2026年6月初更新至LM Studio Mac应用和Locally AI iOS应用,支持端到端加密连接。
Netflix 高级工程师 Tejas Chopra 开发的开源工具 Headroom(v0.26.0)在 AI 应用与 LLM 间建立本地透明压缩层,通过压缩 JSON、代码、RAG 片段和对话历史等冗余数据减少 Token 消耗,支持可逆压缩与 CCR 缓存机制。实测代码搜索场景 Token 从 17765 降至 1408(节省 92%),SRE 事故调试场景从 65694 降至 5118(同样节省 92%)。累计帮助用户节省约 70 万美元成本、释放超 2000 亿 Token。提供 Python/TypeScript 库、智能体代理模式、直接包装现有 AI 编程智能体以及 MCP 服务器模式,并可精简 AI 回复中客套话进一步降低成本。
金山办公副总裁王少康在“2026人民数据大会”上透露,将于下月(7月)正式推出组织级AI办公产品“企业大脑”WPS Comate,后续将规模化交付。该产品面向知识密集的中大型组织,主打复杂业务场景,整合并激活组织内结构化与非结构化数据,利用AI理解组织结构与协作关系,生成数字员工等AI产品融入业务运营与决策,帮助员工跨工具协同完成专业任务。后续金山办公将对接客户,根据不同公司情况定制专属“企业大脑”,实现数据、系统、流程和知识资源的高效连接,打造AI统一入口。