美国商务部长Lutnick向ASML高层提出担忧,指一台顶级EUV光刻机可能已流入中国,违反出口管制。ASML否认向中国出售EUV设备。EUV每台约2.5亿美元,全球运行314台,据彭博中国为零。若违规属实将是美国对华芯片管制重大突破。ASML股价早盘跌约2.6%。路透曾报道深圳用ASML前员工搭建原型机但离量产有差距。美国可强制ASML切断与中国客户合作,荷兰已限制EUV及部分DUV出口,进一步收紧可能影响ASML约20%的2026年中国区收入。
美国商务部长Lutnick向ASML高层提出担忧,指一台顶级EUV光刻机可能已流入中国,违反出口管制。ASML否认向中国出售EUV设备。EUV每台约2.5亿美元,全球运行314台,据彭博中国为零。若违规属实将是美国对华芯片管制重大突破。ASML股价早盘跌约2.6%。路透曾报道深圳用ASML前员工搭建原型机但离量产有差距。美国可强制ASML切断与中国客户合作,荷兰已限制EUV及部分DUV出口,进一步收紧可能影响ASML约20%的2026年中国区收入。
推文指出,普通人一个月工资足以启动一家跑通商业闭环的互联网公司,每月固定成本约$20,主要来自Claude Pro或OpenAI Codex辅助开发。其余后端数据库、部署、认证、分析、监控、缓存、邮件、支付等全链路基建均有免费起步额度,域名约$1/月。同时,引用指出当前AI范式(视频生成、VLA)仅学习统计相关性,缺乏因果理解;UCSD黄碧薇教授提出四代AI划分(相关性小模型→因果小模型→相关性大模型/LLM→因果大模型),其团队Aether AI今日完成首轮融资。
人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...
Peter Thiel领投1.4亿美元B轮,押注完全离网的海上AI数据中心。第三代浮动节点Ocean-3单节点1MW,靠海浪发电、海水冷却、低轨卫星回传,无需征地接电网。首台试点预计今年8月在北太平洋下水,规模化商用至少等到2027年。同时,Aether AI官宣首轮融资,UCSD黄碧薇教授推出因果AI,将AI分为相关性小模型、因果小模型、LLM、因果大模型四代,旨在从视频中自动提取物理规律。
人类到今天都写不出一颗煎蛋的物理方程, 一颗鸡蛋打进热油锅,它怎么凝固、怎么摊开、边缘怎么变焦, 没有任何一个公式能描述清楚,这种例子在物理世界里多到数不过来。 而这恰恰是当下通用 AI 范式的天花板,视频生成、VLA 学的都是像素层面的统...
Claude Code 新增 Artifacts 功能(Team 和 Enterprise 计划 beta 版)。用户可从 coding session 生成交互页面(如 PR 演示、项目 dashboard),通过私有链接分享给团队;页面随 session 自动刷新,调用代码库、插件、技能等全部上下文。该更新旨在将 Claude Code 从单人工具拓展为团队实时协作平台,解决上下文传递和版本同步痛点。
New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...
Jeff Dean 等 Google 同事发布论文,回顾 TPU v2 到 Ironwood 五代训练超算的演进,将于 2026 年 7/8 月发表于 IEEE Micro。关键变化:TPU v2 采用气冷,v3 起改为水冷;互联从 2D 升级为 3D torus;每 pod 芯片数从 256 增至 9216;每 flop 能效提升约 30 倍。此外,Google 内部工作负载已大幅转向基于 Transformer 的模型。
美国批准加快数据中心电网接入计划。PJM每年最多审查10个项目,但每个项目容量须至少250MW,主要针对大型发电厂。瓶颈在于互联审批流程缓慢。PJM警告未来10年可能出现60GW电力缺口,压力来自数据中心对服务器、冷却等持续供电需求。新计划从2026年7月运行至2027年,入选项目预计在10个月内获得电网协议,3年内投入运营。
Grok models are now available on Databricks Agent Bricks. Bring SpaceXAI's latest models to your enterprise data to powe...
商汤推出 SenseNova-U1-8B-MoT-Infographic 模型的 8-step 蒸馏 LoRA(SenseNova-U1-8B-MoT-Infographic-LoRA-8step-V1.0),实现 12.5 倍推理加速,信息图(infographic)生成质量基本与基模型持平。模型权重已开源至 HuggingFace,GitHub 提供使用文档。
阿里云本周在法国启用了首个数据中心,这是继德国和英国之后的第三个欧洲节点,计划今年下半年在该地区推出智能体AI服务。此举正值欧盟委员会6月3日发布《云计算和AI发展法案》,该法案明确指出“有限的数据中心容量”威胁欧洲数字独立。欧洲的数据主权推动旨在减少对美国云巨头AWS、Azure、Google Cloud的依赖。目前阿里云在欧洲的扩张尚未遇到重大政治阻力。
台积电在6月11日日本JPCA Show 2026展示玻璃核心载板投影片,宣布与Ibiden及群创合作,用于CoPoS的oS,结构为玻璃上下各黏合ABF的三层设计。单价较现有ABF载板高出数倍,除Nvidia外另有2家美系客户表达高度兴趣。技术方面,由250x250mm切割,ABF增层采用GL107混搭ABF-GCP,以24–28层测试,电源完整性改善可提升AI算力。TGV为核心know-how,由台积电与群创掌握。目标4Q28–1Q29量产。
台积电在JPCA Show 2026公开玻璃核心基板,与Ibiden、Innolux合作,采用玻璃芯夹两层ABF的三层结构,用于CoPoS的“oS”部分。基板单位成本数倍于现有ABF,Innolux处理的玻璃最贵。客户包括Nvidia和两家美国公司。验证显示其解决了力学与电学难题,显著改善电源完整性。目前切割自250×250mm基板,ABF层24-28层,对应2027–2028年AI芯片主流规格。CoW测试车辆已验证复合材料机械结构瓶颈已突破。
🚀 Our new blog: Optimizing Ling-2.6-1T on TPU with SGLang-JAX: Hiding MoE Data Movement Behind Compute with One Pallas ...
美国司法部近日保护 xAI 位于密西西比州的 AI 数据中心,认为高速 AI 基础设施属于美国国家安全基础。司法部将 Grok 及其系统视为关键技术而非普通消费软件,因先进模型可支持国防行动。此举反映政策转变:美国不希望战略 AI 工作负载依赖脆弱供应链、缓慢审批流程或外国控制算力。AI 算力正成为国防资源,可用电力、数据中心规模、模型能力与运营准备度紧密关联。
Vercel 发布开源 Agent 框架 Eve,核心设计“Agent 即目录”:通过 agent.ts、instructions.md、tools、skills、subagents、channels、schedules、connections 等文件声明行为。内置持久会话(可 checkpoint)、沙箱隔离(本地 Docker/Vercel Sandbox)、Human-in-the-loop 审批(不占算力)、MCP/OpenAPI 连接(鉴权由框架代理)、多 Channel 支持(HTTP/Slack/Discord)、OpenTelemetry 追踪与 eve eval 门禁。本地 eve dev TUI,部署为普通 Vercel 项目,不中断进行中会话。内部已验证:d0 月 3 万+ 查询,Lead Agent 年成本约 $5k 回报 32 倍,Vertex 约 92% 工单自动解决。
Introducing eve, an agent framework. agent/ agent.ts instructions.md tools/ skills/ sandbox/ schedules/ Like Next.js, fo...
关联讨论 1 条MarkTechPost(RSS)We built an internal AI system called Builderbot. It coordinates agents across our entire codebase. Engineers tag it in ...
.@grok Build is on DigitalOcean Marketplace. 🆕☁️🤖 SSH in. Run grok. Build. @xAI's coding agent, pre-configured on Digi...
Trendforce报告显示AMD正积极采购锁定CW激光器供应。此前NVIDIA已与Lumentum/Coherent签订多年协议锁死核心产能,西方独立产能仅剩Sivers、AAOI等少数厂商,Lumentum自身受限可能外包至日本产线,后者已满负荷。CPO+硅光子成AI标配,InP基板持续紧缺。AMD是第一张多米诺骨牌,Amazon、Microsoft等云厂商大概率跟进。但CPO大规模放量或要到2026-2028年,期间存在预期已涨、小盘波动大、LPO技术替代、扩产良率瓶颈及宏观不确定性等风险。
Trendforce reports that $AMD is actively trying to secure CW laser supply with multiple major procurement orders... Is p...
TensorDyne 发布 AI 推理机架 Napier,声称在 DeepSeek-R1 上基于内部模拟达到 363,000 tokens/s(用户速度 210 tokens/s),是 NVIDIA NVL72 GB300(27,400 tokens/s)的 13 倍。Napier 在对数空间中运算,将乘法转为加法,从而降低芯片面积与功耗,更多晶体管用于 SRAM,每 token 能耗更低、推理密度更高。此举改变 AI 推理经济学,不再单纯比拼 FLOPS,而是转向功率、内存局部性、互连延迟与 token 服务成本。
1. as a mental model it is more correct to think of fable+ class models as english -> code interpreters - converts your ...
GLM-5.2 now available in Go text · 1M context · same pricing as 5.1
Grok is now available on Amazon Bedrock. AWS developers can now build with Grok 4.3, the industry leader in hallucinatio...
Anthropic发布了Swift包,使Claude模型适配苹果定义的LanguageModel协议,从而能在iPhone和Mac本地运行。这一转变打破了Anthropic一向要求别人适配其API的惯例。背后是苹果通过统一接口把自己变成AI模型分发平台,开发者用同一套代码可在本地模型和Gemini等之间切换。推文认为行业竞争已从模型能力转向规则标准,在苹果生态内顺应其规矩比硬扛更明智。
Artificial Analysis 昨日发布 Intelligence Index v4.1 更新,主要变化有三项:升级的评测 Terminal-Bench 2.1、τ³-Bench Banking 和 GDPval-AA v2;提供每项任务的成本、时间与模型 token 消耗数据,并展示这些指标与智能水平的权衡;新增缓存输入 token 报告,显示特定模型使用的缓存 token 量及其对成本的影响。
商汤与香港科技园签署谅解备忘录,合作建设香港最大规模本地自研AI数据中心,目标计算容量40,000 PetaFLOPS+(2030年达成),分阶段投产。该数据中心将服务本地、跨境及国际客户的模型训练、推理与大规模应用部署。商汤基于上海AIDC经验,带来成熟运营能力、自研GPU技术、高速光互连及可再生能源与储能技术。香港作为商汤总部与关键研发基地,此举旨在巩固其全球AI前沿地位。
Tensordyne 发布突破性推理系统,采用对数 AI 计算芯片。相比 NVIDIA Blackwell,每瓦特 token 数提升 17 倍,吞吐量提升 13 倍。核心创新是在硬件中实现高效对数运算,将乘法转为加法,从而缩小计算电路、减少晶体管、降低功耗,释放芯片空间用于更多张量引擎、高带宽 SRAM 和 HBM3e 内存。针对 DeepSeek-R1,单机架可达 363K tokens/sec,对照系统仅 27.4K。Napier 处理器已完成流片,在台积电 3nm 制程生产。
http://x.com/i/article/2066408998698442752
TokenPilot 提出一种针对 LLM 智能体的缓存高效上下文管理方法,通过摄入感知压缩和生命周期感知驱逐两大机制,在 PinchBench 和 Claw-Eval 基准上实现 61–87% 的成本降低,同时保持有竞争力的分数。传统方法通常直接截断或摘要历史,容易导致文本偏移、破坏 prompt 缓存。TokenPilot 在工具结果进入上下文前进行清理,保持早期提示布局稳定;同时延迟删除旧任务历史,因为已完成的工作仍可能为引用相同文件或目标的后续任务提供帮助。