AMD 在 2026 台北国际电脑展展示其首个机架级 AI 平台 Helios,核心配置包括第 6 代 EPYC Venice 处理器与 72 颗 Instinct MI455X 加速器,总计 31TB HBM4 显存、1400TB/s 带宽,计划 2026 年内供货。FP4 稠密精度下理论算力达 2900 PFLOPS,略落后于英伟达 NVL72 VR200,但显存容量占优,适合大语言模型等任务。72 颗加速器通过 UALink-over-Ethernet 互连,scale-up 带宽最高 260TB/s;配备 Pensando Vulcano 网卡,支持 Ultra Ethernet 规范的 800GbE,scale-out 带宽 43TB/s。
在摩根大通直播中,Elon Musk 谈到在太空建设 AI 数据中心时表示,这并非难事,甚至比 Starlink V3 通信卫星更简单。AI 数据中心只需太阳能供电、散热器及基本卫星设备,通过激光链接接入 Starlink 通信星座,再传回地面;由于 Starlink 使用可穿透云层甚至屋顶的频率,地面链接不受天气影响。
Live from our global headquarters: Jamie Dimon and Elon Musk discuss SpaceX and more. https://x.com/i/broadcasts/1NGarrM...
本期早报聚焦三则动态:OpenAI发布ChatGPT dreaming V3,记忆架构重写为“写入时合成”,效率提升5倍,免费用户可用个性化记忆摘要;阿里云工程师落地LLM-Wiki模式,从传统RAG转向“写入时合成”知识库,封装五大研发技能包实现PRD到全自动研发;SpaceX招股书披露与Anthropic签订450亿美元算力合同,每月12.5亿美元至2029年5月,年收入增加80%,并持有18712枚比特币。记忆与知识库的“写入时合成”成共同范式。
OpenAI Codex 推出“Build iOS Apps”官方插件,将 iOS 应用开发闭环引入 Codex 工作流。用户可在 Codex 内直接查看和测试 iOS 应用、打开 SwiftUI previews 并进行代码热重载,无需切换到 Xcode 或模拟器。底层基于 XcodeBuildMCP 构建自动化工作流,支持构建、测试、模拟器运行、UI 检查、日志与调试状态采集。值得关注的两个开源项目:serve-sim(提供 streaming simulator 能力)和 SnapshotPreviews(用于提取 SwiftUI previews 集成工具链)。
More of the iOS app loop, now inside Codex. The Build iOS Apps plugin lets Codex view and test your iOS app in the in-ap...
Cursor 也发布了类似 Codex Sites 的「Canvases」 这个方向就对了,Coding Agent 本来就能完全吃掉 Lovable、v0、http://bolt.new 的 AI 建站功能,再结合在 Coding 和 Design、Debug、Deploy 等方面的闭环能力,从产品定义、设计、开发、测试到部署运维,完整覆盖。
With canvases, Cursor can create apps like dashboards, reports, and internal tools. Now you can publish a canvas and sha...
商汤香港总经理Lewis Fung在TVB新闻中指出,当每个行业都使用AI时,算力会成为瓶颈,而算力背后是电力。作为扎根香港的总部和创新枢纽,商汤计划在当地运营高效计算中心,以支撑城市的AI发展雄心,并公开招募相关人才。
马斯克在JPMorgan活动上回应SpaceX上市问题:他已被建议上市近10年,自2014-2015年起SpaceX就已实现正现金流并自筹资金,之前的私募轮次实际是面向投资者和员工的流动性/回购轮次。当前不同之处在于SpaceX正进入显著资本增长阶段,计划发射约10万颗通信卫星(可能超10万颗),AI和机器人对带宽需求巨大,还将在太空中建设AI数据中心,马斯克认为这将成为AI扩张的主要手段。
Live from our global headquarters: Jamie Dimon and Elon Musk discuss SpaceX and more. https://x.com/i/broadcasts/1NGarrM...
关联讨论 1 条X:cb_doge (@cb_doge)6 月 5 日,LM Studio 更新 Mac 版 Locally 应用,新增 LM Link 功能,用户可直接在 iPhone 上调用 Mac 本地运行的大语言模型。需两端登录同一 LM Studio 账号,通过定制 Tailscale 网状虚拟专用网络建立端到端加密连接。支持 Mac 上任意模型,包括 Apple Intelligence 基础模型,体验取决于 Mac 性能。预览阶段免费,后续将推出付费方案,具体未公布。
Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...
同一事件,精选展示《Codex 赋能每一种角色、工具和工作流》华为发布 KVarN,一个原生 vLLM 后端,专门用于键值缓存(KV-cache)量化。项目已在 GitHub 上公开,在 Hacker News 上获得 100 点热度。
Boson AI 与 LMSYS 联合推出基于 SGLang-Omni 推理框架的 Higgs Audio v3 TTS 端到端服务。该模型约 4B 参数,基于 Qwen3-4B 骨干,支持 100 种语言(内部评测覆盖 111 种),在 Seed-TTS、CV3、MiniMax-Multilingual 及 Higgs-Multilingual 零样本语音克隆任务中达到单字级 WER/CER。开发者可通过文本内控制标签实时调整情感(20+种)、风格、韵律(语速/音高/停顿)及音效。模型支持流式合成,文本未完整时即可开始生成语音并保持一致性。SGLang-Omni 专为多阶段生成模型设计,统一调度 AR 解码与轻量计算,实现低延迟推理。
贝恩咨询对951家公司的调查显示,近40%的企业AI成本节省幅度不足10%,而大多数公司原定目标为11%至20%。原因之一是仅有7%的企业实际运行完全自主的AI智能体,其商业案例却假设了全自动化。
澳大利亚Luyten公司发布全球首款机器人塔吊式起重机平台Ascend,将塔吊结构、机器人技术、3D混凝土打印及AI整合。系统工作半径45米,支撑结构最高100米,安装调试仅需1-2天。通过AI生成打印路径、优化流程并实时监控,配合专用Ultimatecrete打印混凝土,旨在减少人工依赖和模板需求,提升材料利用率。
Hugging Face 重新设计 hf CLI,使其同时服务人类用户和编码智能体(Claude Code、Codex 等)。CLI 通过环境变量自动检测智能体驱动,输出紧凑无截断的 TSV 格式,避免 ANSI 和交互提示,大幅降低 token 消耗。复杂多步任务中,不使用 CLI 的智能体 token 消耗最高达 hf CLI 的 6 倍。2026 年 4 月起,Hugging Face 追踪 Hub 智能体流量,Claude Code 约 4 万用户、近 4900 万次请求,Codex 紧随其后。
撼与 Sparkle 在台北电脑展展示单槽 Intel Arc Pro B70 32GB 显卡,型号 Sparkle Intel Arc Pro B70 32 GB Blower 1S。该卡搭载完整 BMG-G31 GPU,配备 32 个 Xe2 核心与 32GB 显存,采用涡轮散热和单 16pin 供电,加速频率 2800 MHz。单槽设计使工作站可同时安装 8 块,总显存 256GB,支持本地运行参数超 2000 亿的 AI 大语言模型。相比双槽版(230W TGP),单槽版 TGP 降至 160W。售价尚未公布,预计近期上市。
IR3DE是一个基于岭回归的线性路由器,为每个提示选择最合适的领域专家大语言模型。在两个因果语言建模(CLM)任务中,IR3DE性能与其他基线相当;在推理任务中,归一化性能达到98.4%,超越其他方法。该路由器支持动态添加或移除领域专家,无需重新训练,代码已开源。
亚马逊宣布了新版本的完全自主仓库机器人 Proteus,新增语言交互能力。借助 AI 升级,人类员工可以像与同事交谈一样向 Proteus 分配任务,无需再使用专用软件指挥这款用于搬运重物和大推车的地面机器人。此前工人必须通过代码操作该乌龟型系统。
Anthropic 在其官方博客发布文章,介绍其在各产品中管控 Claude 的具体方式。该文章在 Hacker News 上获得 103 个点赞。
北京作为全国首批“双智”城市,在海淀区19个路口正式上线AI红绿灯系统。该系统通过3D空间轨迹连续拼接技术生成全息路口,利用大模型实时分析交通流量、排队长度和拥堵状况,50秒内生成约200套配时方案,并自动延长绿灯1-15秒。四道口地区13个交叉路口上线后,整体车速提升约21%,拥堵指数下降约19%。北京计划进一步推广基于交通流量的实时智能交通管控。
三星在2026台北国际电脑展展示面向HBM5内存的HPB(热阻断路径)封装散热结构,通过在封装内部加入独立热柱降低散热压力。HPB已在HBM4E上验证,HBM4E首批12层样品已出货,速率14Gbps,可扩展至16Gbps,每堆叠带宽3.6TB/s。三星确认HBM5基底芯片将从4nm转向自家2nm工艺。SK海力士采用不同路线,其iHBM方案将冷却元件嵌入D2D PHY层,可较现有产品降低超过30%热阻。
GitLab 裁员约 14%(约 350 人),作为重组一部分,退出 22 个国家/地区并精简管理层级。CEO Bill Staples 称 AI 智能体以机器规模运行,给开发者基础设施带来超出设计承受能力的压力;公司已启动 Git 代际重构以支持 100 倍增长,并与一家未透露名称的 AI 实验室合作,构建面向智能体优化的 API 和编排工具。2026 年 Q1 营收 2.64 亿美元,同比增 23%,毛利率 88%,预计产生 3000 万至 3500 万美元重组费用。
加州蒙特利公园市以约86%赞成票通过永久禁止数据中心的法案,成为首个通过投票禁令而非市议会临时叫停的美国城市。这反映全国性反AI数据中心浪潮:盖洛普民调显示70%美国人反对本地建设,至少十几个州正考虑暂停。微软纳德拉在Build大会花较大篇幅回应相关偏见与担忧。背后除了电力、水耗、房价等可解决忧虑,还混合了对AI的恐惧及人类优越感受损(弗洛伊德所谓“对人类自恋的第四次打击”)。作者担心抵制会愈演愈烈,但数据中心对AI带来的科学黄金时代不可或缺。
SK集团董事长崔泰源与台积电董事长魏哲家会面,双方同意拓展下一代HBM开发和先进封装领域合作。SK海力士在Computex 2026展出HBM4E 48GB 12Hi样品,引脚速率16.0Gbps,单堆栈带宽4.0TB/s,带宽提升38%,单Die容量提升33%。此外,SK海力士展示了基于V9 TLC的PCIe Gen5客户端固态硬盘PVF01,为其首款DRAM-less架构cSSD。
台积电董事长魏哲家在股东会上披露,一季度合并营收约11341亿元新台币,税后净利润5724.8亿元新台币,每股净利润22.08元新台币。第二季度合并营收预计390亿至402亿美元,毛利率65.5%-67.5%。AI需求转向智能体模式,推升token消耗支撑先进半导体。预计全年营收增长超30%,现金股利提升超30%。针对High-NA EUV传言,魏哲家澄清公司早已购入,但暂不量产,正努力降本。他还重申保障员工权益,因多数员工也是股东。
联合国大学水、环境与健康研究所报告指出,受AI需求驱动,去年全球数据中心耗电448太瓦时(AI占五分之一),耗水4.5万亿升,碳排放1.89亿吨。预计到2030年,年耗电量将翻倍至945太瓦时(AI占40%),耗水增至9.3万亿升,碳排放升至3.99亿吨,占地面积从6900平方公里扩展至14500平方公里。报告警告若忽视环境成本,AI落地还将加剧土地紧张与电子废弃物问题。
欧盟宣布将对新建及存量数据中心制定最低能效标准,配套需求评估需在2027年前完成。目前欧盟数据中心装机容量为12吉瓦,预计2030年增至28吉瓦,届时用电量占比将突破2.5%。欧盟还在制定可持续性标签,考核水资源消耗、清洁能源供电比例等指标,大型数据中心须对外公示。此举隶属于一揽子科技扶持法案,旨在壮大本土云计算与AI产业,并包括用生成式AI简化新能源项目审批、划拨专项资金研发电网AI管控工具。
我擦! 我发现现在Apple的MLX框架和模型都可以Day0发布了? 这看来是同步进行操作的,MLX框架以及和模型厂商直接第一时间进行了对接啊! 强烈建议Mac的同学直接上MLX框架的模型,速度一般至少10-20%还是有的。
If you're waiting Gemma 4 12b through @ollama, its here: gemma4:12b gemma4:12b-it-q4_K_M gemma4:12b-it-q8_0 gemma4:12b-i...
Uber 在新任总裁黑泽尔贝克主导下裁减人力资源部门 23% 的员工,波及招聘等岗位,占 3.4 万全体员工总数的远不足 1%。CEO 科斯罗萨西称此举旨在提升人力团队效率,并明确裁员与 AI 无关。Uber 证实已对员工使用的 AI 智能体工具设置分级消费限额,基础档月额度 1500 美元(约 10168 元人民币),更高档位逐级上调。据《The Information》报道,Uber 仅用四个月即耗尽 2026 年度全部 AI 项目预算。
LatentSkill通过预训练超网络将文本技能转换为即插即用的LoRA适配器,将技能知识存储在权重空间而非上下文空间,消除每步推理中的技能token开销。在ALFWorld上,seen和unseen分割成功率分别比上下文技能基线高出21.4和13.4个百分点,预填充token减少64.1%;Search-QA精确匹配提高3.0点,技能token开销降低72.2%。生成的技能LoRA形成结构化语义几何,可通过缩放系数精确控制,对齐后能通过参数空间算术组合。该方法提供了高效、模块化且暴露度更低的权重空间技能基底。
Wasmer 借助 Codex(基于 GPT-5.5)构建了一个用于边缘计算的 Node.js 运行时,将开发速度提升 10 到 20 倍,交付周期从数月缩短至数周。
We're partnering with @xai to bring Grok to @Cloudflare AI Gateway. • Grok LLMs, audio, image, and video models are now ...
关联讨论 1 条X:Elon Musk (@elonmusk, xAI)一篇教程介绍如何通过注册模块化函数,并在Workers、Functions和Cron Triggers等多个触发器间复用这些函数,使用iii构建文档智能后端。该文章展示了模块化注册与跨触发器复用的核心方法。