Zoom in on this TPU 8t ASIC block diagram. Optimized for massive-scale pre-training and embedding-heavy workloads, TPU 8...
Zoom in on this TPU 8t ASIC block diagram. Optimized for massive-scale pre-training and embedding-heavy workloads, TPU 8...
GitHub Copilot 宣布将转向按使用量计费模式。这一变化意味着用户的付费方式将从现行的固定订阅制,转变为根据实际使用量来计算费用。具体计费细节和转换时间表尚未公布,但此举旨在为不同使用强度的用户提供更灵活的付费选项。该消息在技术社区引发关注,在Hacker News上获得了111个讨论点数。
每年系统故障导致损失超万亿美元,工程师需通过分析时间序列数据快速定位问题。时间序列问答(TSQA)是关键运维任务,对AI模型构成挑战。为此,研究团队推出ARFBench基准,基于Datadog真实内部事件及遥测数据构建。测试显示,当前领先的大型语言模型、视觉语言模型和时间序列基础模型在ARFBench上表现均有较大改进空间。团队提出混合TSFM-VLM模型,其整体性能接近前沿水平,为TSQA任务提供了新评估框架和改进方向。
How do AI Agents spend your money? Most teams treat agent token costs as a rounding error even though the data says they...
OpenClaw 2026.4.25 🦞 🔊 TTS got serious 🧩 Plugins start faster 📊 OTEL can see the weird stuff 🛠️ Browser + install/u...
自6月1日起,GitHub Copilot 的使用将开始消耗 GitHub AI Credits,计费模式正式从固定订阅制转变为基于实际使用量的计费。这一变化意味着用户的费用将与 AI 助手的具体调用量直接挂钩,而非统一的月费或年费。
OpenAI正致力于通过开源与开放科学推动人工智能的进步与民主化。这一举措旨在降低AI技术的使用门槛,促进更广泛的创新与合作。其Privacy Filter工具为开发者提供了构建可扩展Web应用的关键支持,帮助在保障用户数据隐私的同时,高效集成AI能力。这一方向强调了技术开放性与负责任开发并重的理念。
I had a good time discussing yesterday's Google TPU v8t and v8i announcement at Cloud Next with Amin Vahdat along with @...
Meta 已与初创公司 Overview Energy 签署协议,计划采购高达 1 吉瓦的太空太阳能电力,旨在为其人工智能数据中心提供清洁能源。这项合作的核心挑战在于,相关的太空太阳能技术目前尚未实现商业化应用。协议凸显了科技巨头对大规模可再生能源的前瞻性布局,但实际供电仍需等待技术突破。
根据 Epoch AI 机构基于 AI Chip Owners 数据库的估算,截至 2025 年第四季度,谷歌凭借其大规模部署的自研 TPU 芯片,成为全球最大的单一 AI 算力持有者,掌握了全球累计 AI 算力的大约四分之一,其规模超过了微软、Meta 和亚马逊。该统计覆盖了英伟达、AMD、谷歌、亚马逊及华为的主要 AI 芯片,据信已涵盖全球绝大多数专用 AI 算力。微软与 Meta 的自研芯片虽未纳入此次统计,但对整体估算影响甚微。
Google在Cloud Next 2026上首次将定制芯片拆分为专用架构,推出训练芯片TPU 8t与推理芯片TPU 8i。TPU 8t超级模块配备9600个液冷芯片,峰值算力达121 FP4 ExaFlops,较前代提升约3倍;TPU 8i的性价比提升80%,片上内存增至三倍,并通过新拓扑结构将网络延迟减半。Anthropic、Meta及OpenAI均已采购千兆瓦级TPU算力,其中OpenAI首次采用Google芯片,动摇了NVIDIA在前沿AI训练市场的垄断地位。两款芯片分别由Broadcom和MediaTek共同设计,TSMC代工。尽管NVIDIA仍占据81%的AI芯片市场份额,但实质性的竞争时代已拉开序幕。
受全球AI基础设施投资热潮推动,阿斯麦(ASML)正加速扩产极紫外(EUV)光刻机。公司计划今年量产至少60台EUV光刻机,并计划将年产能进一步提升至80台。为突破产能瓶颈,阿斯麦已在美国、德国、韩国等地扩建无尘车间,并投入约22亿美元资本开支。尽管面临供应链与人才挑战,市场需求依然旺盛,公司预计年营收将达420亿至470亿美元。
谷歌在Cloud Next 2026上首次将TPU v8拆分为训练芯片TPU 8t和推理芯片TPU 8i,宣称训练速度提升2.8倍,推理性价比提高80%,并通过自研Arm架构Axion CPU实现全栈垂直控制。同时,DeepSeek V4-Pro成为首个在华为昇腾NPU平台上完成训练与推理验证的前沿大模型,其定价与昇腾950芯片量产计划挂钩,输出成本远低于主流西方模型。这标志着美国制裁试图阻止的硬件脱钩可能已不可逆转,全球AI芯片竞争进入新阶段。
在2026北京车展,广汽传祺推出越7越野车和向往E8 PHEV MPV,首次搭载星源插混技术。越7配备GMC 3.0雷霆版,驱动电机峰值功率205kW,1.5T发动机最大功率125kW,综合功率达400kW,轮端扭矩10000N·m,支持单轮脱困。向往E8 PHEV采用GMC 3.0疾风版,DHT重98.5kg,电控效率99.2%,传动效率98.7%,发动机热效率提升3%,AI能量控制平台节油率提高15%。该车百公里亏电油耗3.98升,纯电续航281km,综合续航1537km。
Ubuntu 未来一年将逐步整合 AI 功能,从增强现有系统能力入手,让 AI 模型在后台运行以辅助操作。开发方向偏向本地推理,并计划整合智能体工作流。AI 应用扩展至服务器端,例如帮助分析系统日志。Canonical 目标是将 Ubuntu 打造成更懂上下文的操作系统,但强调不会变成 AI 产品,而是通过审慎、安全的整合提升整体能力。
谷歌正依靠人工智能边缘计算战略,以追赶云计算市场的领先者亚马逊和微软。该公司通过将AI技术整合到边缘设备,旨在提升云服务性能、降低延迟并扩大市场份额。这一举措针对亚马逊AWS和微软Azure的主导地位,谷歌希望借助边缘AI的实时数据处理和隐私优势吸引企业客户,加速缩小竞争差距。目前,云计算市场竞争激烈,谷歌的AI边缘布局被视为关键追赶手段。
分析师郭明錤报告指出,OpenAI 正与 MediaTek 和 Qualcomm 合作开发定制智能手机处理器,Luxshare 担任系统设计和制造的独家合作伙伴。这一合作旨在为 OpenAI 的人工智能技术提供专用硬件支持,可能优化芯片性能并减少对外部供应商的依赖,标志着该公司向硬件领域的战略扩展。
ASML计划大幅提升其极紫外(EUV)光刻机的产量,以应对AI芯片需求的快速增长。该公司在EUV光刻机市场占据垄断地位,该设备是制造先进AI芯片的核心机器。根据《华尔街日报》报道,增产旨在跟上市场对AI芯片的激增需求,确保供应链稳定,支持人工智能技术的持续发展。这一举措将直接推动全球AI芯片产能扩张,缓解当前供应压力。
Chrome 开发者文档推出了 Prompt API,这是一个用于 AI 提示管理的应用程序编程接口,帮助开发者以编程方式处理提示词,提升开发效率。该 API 的发布信息在 Hacker News 上获得102点积分,反映出技术社区对此工具的关注和积极评价。开发者可通过官方文档进一步了解其功能和应用场景。
在2026北京车展上,东风汽车与华为乾崑联合打造的奕境品牌首秀,并全球首发了旗舰大六座SUV奕境X9。该车行业首发具备强光不反光特性的后排吸顶柔光屏,并首发搭载华为乾崑智驾ADS 5系统与鸿蒙座舱Harmony Space 6。车身尺寸为长5301mm、轴距3120mm,预计售价约50万元。品牌计划未来三年推出5款新车,并已在全国80城布局超300家体验门店。
中国信通院宣布启动DeepSeek V4国产化适配测试,旨在推动该模型与国产软硬件的深度协同及产业应用。测试将依托重点实验室和AISHPerf基准体系,面向芯片、服务器、一体机、集群、开发框架及工具链等产品系统展开。评估覆盖模型全系列,聚焦推理、微调等流程,从适配易用性、功能完备性、性能及成本多维度进行,并新增长序列处理、代码生成与理解等测评方向,以构建立体化评测体系。此前,多家国产硬件厂商已在模型发布当日完成了“0day适配”。
OpenAI开源了15亿参数的PII脱敏模型Privacy Filter,采用混合专家设计,每次仅激活约5000万参数,可在笔记本电脑等设备上运行。它能根据上下文识别姓名、地址等八类敏感信息,在基准测试中F1分数达97.43%。该模型作为本地预过滤层,帮助用户在文本发送至云端AI前脱敏数据,但高敏感场景仍需结合人工审核。
开发者在测试多个Chatbot客户端时,发现普遍不支持上传音视频文件进行对话,这给全模态大模型的测试带来了不便。因此,他选择了一个开源Chatbot UI项目,并计划用Codex对其进行改造以适配需求。该开源项目参考了ChatGPT、Grok、Gemini和Perplexity等主流产品的界面,设计了多个不同的机器人对话界面,目前在GitHub上已获得近1万颗星。
高德纳预测,2026年全球数据中心系统支出将达7879.9亿美元,连续第二年增速超过50%。同期,全球整体IT支出预计为6.31655万亿美元,同比增长13.5%,较今年2月的预测上调了2.7个百分点。增长主要由人工智能基础设施和先进存储需求驱动,AI工作负载的扩展推高了高性能计算及相关处理器、加速器的投资,并使高带宽内存等领域利润显著提升。
据报道,DRAM制造商南亚科技在台积电的协助下,成功打入英伟达下一代Vera Rubin平台的内存供应链,有望为其供应LPDDR5X SOCAMM2内存模组。此举为英伟达在三大原厂外引入了第四家供应商,有助于保障供应稳定;同时也能助力南亚科技切入高利润的企业级DRAM市场。不过,该平台设计需要9600MT/s的高速内存,而南亚科技官网目前公示的最高规格仅为7500MT/s,其产品能否满足要求仍是未知数。
Cluely的CEO Roy Lee在NYU活动中,以500美元现金询问在场AI学生和工程师是否上线过公开项目,几乎无人举手。这揭示了AI圈的普遍现象:工程师们热衷讨论大模型、Agent等理论,却缺乏将知识转化为公开产品的执行力。LLM虽能解决大部分技术问题,但部署、用户体验和成本控制等实际工作才是关键。知识在AI时代已泛滥,真正稀缺的是执行力。呼吁工程师立即实践,做出哪怕不完美的公开产品。
追觅科技创始人俞浩发文炮轰小红书价值观与盈利模式“有毒”。苹果新任CEO特努斯将于9月主持可折叠iPhone发布会,公司未来计划进入约10个新产品类别。华为余承东透露,尊界品牌一款高定新车价格将达200万元级别,计划6月底发布。此外,人类马拉松成绩首次突破2小时大关;砺算科技GPU通过微软WHQL认证,成为国内首家;DeepSeek宣布其API输入缓存命中价格大幅下调。
Anthropic 在 Opus 4.7 中更换了 tokenizer。OpenRouter 通过对比用户从 Opus 4.6 迁移到 4.7 的实际使用数据,精确测量了 tokenizer 变更对成本的影响。
本文提出软各向异性图(SAD),一种基于图像平面自适应站点参数化的显式可微分图像表示方法。SAD通过各站点定义各向异性度量与加权距离,并依据像素前K个站点的softmax混合计算颜色,形成具有可学习温度的软加权Voronoi划分,在保持清晰边界的同时保留有效梯度。该方法支持基于前K映射的高效渲染,并采用受跳转扩散启发的传播方案更新站点。在Kodak数据集上,SAD以2.2秒编码时间达到46.0 dB PSNR,训练速度比先进基线快4-19倍,且在相同码率下性能更优。SAD还能无缝集成至可微分流程,并具备快速随机访问与紧凑存储优势。
Anthropic在Claude Opus 4.7版本中更新了分词器。通过对比4.6到4.7版本的实际使用数据,分析发现这一技术调整改变了文本转换为令牌的方式,直接影响API计价。相同的文本输入可能产生不同数量的令牌,从而导致用户的实际使用成本发生可量化的变化。这一调整虽不改变模型能力,但关乎运营开销,是开发者和企业用户需评估的关键因素。
本文提出GoClick,一个仅含2.3亿参数的轻量级视觉语言模型,用于图形用户界面元素定位。针对资源受限设备,模型采用编码器-解码器架构,在小参数量下优于仅解码器架构。通过渐进式数据精炼流程,从1080万原始数据中筛选出380万高质量样本进行训练,显著提升定位精度。实验表明,GoClick在多项基准测试中达到与大型模型相当的准确度,同时保持小体积和高推理速度。集成于设备-云端协作框架时,能有效协助云端任务规划器精确定位元素,提升任务成功率。
阿里巴巴提出一种通过双强化学习飞轮训练智能体的新方法,并基于此推出了AgenticQwen-30B-A3B模型。该模型总参数量为300亿,但每次推理仅激活30亿参数,在TAU-2和BFCL-V4多轮工具使用基准测试中取得了50.2的平均分,性能与参数量达2350亿的Qwen3-235B相当。其核心在于并行运行两个飞轮:推理循环将模型自身错误转化为更难训练问题;智能体循环则将简单工具使用轨迹扩展为多分支行为树,并通过模拟用户误导主动增加训练难度。该方法意味着开发者无需为常规工具任务支付高昂的尖端模型成本,且飞轮配方可复用,能从智能体自身失败中生成困难样本。
Mistral AI 宣布其产品 Workflows 进入公开预览阶段。这是该公司提供的一款用于构建、测试和运行AI智能体与应用的工具,面向需要执行业务工作流的用户。
Eden AI 作为 OpenRouter 的欧洲替代方案正式上线,该平台聚合了多家 AI 提供商的模型,旨在为欧洲用户提供符合本地数据法规的 AI 服务。其在 Hacker News 上获得 100 点赞,显示出社区对该替代方案的关注。此举为欧洲市场提供了更多元、合规的 AI 模型接入选择。