阿里平头哥发布首款智能网卡“磐脉 920”,这是国内首个内置 PCIe Switch 的 400G 智能网卡,已量产并率先部署于阿里云数据中心。该产品专为应对AI算力增长和“通信墙”难题设计,搭载自主芯片,采用PCIe 5.0与112G PAM4以太网技术,支持400Gbps带宽和400Mpps收发包效率。其通过支持多路径RDMA缩短训练时间,并借助内置PCIe Switch实现GPU与SSD的低时延直连,使系统成本降低30%。
阿里平头哥发布首款智能网卡“磐脉 920”,这是国内首个内置 PCIe Switch 的 400G 智能网卡,已量产并率先部署于阿里云数据中心。该产品专为应对AI算力增长和“通信墙”难题设计,搭载自主芯片,采用PCIe 5.0与112G PAM4以太网技术,支持400Gbps带宽和400Mpps收发包效率。其通过支持多路径RDMA缩短训练时间,并借助内置PCIe Switch实现GPU与SSD的低时延直连,使系统成本降低30%。
紫光股份2026年第一季度报告显示,公司营业总收入279.85亿元,同比增长34.61%;归母净利润7.88亿元,同比大幅增长126.06%。但经营现金流为-30.93亿元,同比下降267.96%。控股子公司新华三集团表现突出,营业收入达221.89亿元,增长45.08%。公司正积极抢抓人工智能市场机遇,推进“算力×联接”战略,加速智算和国产化业务落地。
FlashQLA 发布了一组专为梯度下降网络优化的融合线性注意力内核。新内核在设计上对计算模式和后向传播更加友好,旨在提升训练效率。该技术通过优化内核融合策略,改进了注意力机制的计算性能,是提升大规模模型训练速度的关键底层优化。
为应对游客增长与劳动力短缺,日本航空将于5月起在羽田机场试点部署宇树科技G1人形机器人。该机器人将协助地勤人员搬运行李和货物,演示中已能完成将货物搬运至飞机传送带等任务。此次试点由GMO Internet Group协助,利用英伟达Isaac Simulator在虚拟环境中训练机器人并创建数字孪生,优化后迁移至实体机器以实现顺畅操作。日本面临老龄化挑战,预计到2040年需要超过650万外国劳动力以维持经济增长。
谷歌云在Google Cloud Next大会上推出由英伟达Vera Rubin系统驱动的A5X裸金属实例。该实例采用英伟达ConnectX-9 SuperNIC和谷歌Virgo Network AI数据中心架构,单站点集群可扩展至8万个Rubin GPU,多站点集群更可支持多达96万个GPU,旨在运行超大规模AI工作负载,为客户提供高性能、低延迟的物理服务器解决方案。
工业富联2026年第一季度业绩大幅增长,营业总收入2510.78亿元,归母净利润105.95亿元,同比分别增长56.52%和102.55%。业绩爆发主要受AI算力需求驱动,云计算业务收入翻倍,AI GPU机柜和AI ASIC服务器出货量分别增长3.8倍和3.2倍。此外,800G及以上高速交换机出货量同比增长1.6倍,CPO全光交换机样机开始出货。公司经营活动现金流净额达250.24亿元,同比激增1826.20%。
自 2026 年 6 月 1 日起,GitHub Copilot 的计费方式将从基于高级请求次数改为基于实际使用量(令牌)计算。这一调整意味着用户将为其消耗的计算资源付费,而非固定的请求套餐,使计费更直接地关联到具体使用规模。
谷歌在印度安得拉邦维沙卡帕特南启动人工智能中心建设,计划未来五年投资150亿美元(约1025亿元人民币)构建综合AI生态系统。该项目将与印度企业Nxtra by Airtel、AdaniConneX合作,建成印度国内首个千兆瓦级AI数据中心,以支持先进AI部署和数字服务扩展。同时,谷歌将通过“美印互联”计划扩展光纤网络,并优先接入清洁能源,助力印度在2030年实现500吉瓦非化石能源目标。
加州大学圣克鲁兹分校研究团队开发出一款名为Neo的人工智能算法,可有效消除地面望远镜因大气湍流导致的图像畸变。该算法基于条件生成对抗网络,通过训练使地面观测图像的清晰度提升至太空望远镜水准,天体形态参数测量准确度提高2至10倍。目前该技术已应用于智利薇拉・C・鲁宾天文台,该台配备8.4米口径反射镜,造价约8亿美元。此前类似AI算法已将詹姆斯・韦布空间望远镜的数据分析时间从数年缩短至数日,助力多项天文发现。
元戎启行与高通共同宣布,基于高通Snapdragon Ride平台至尊版(骁龙8797)芯片打造的ADAS方案已开始面向量产项目出货。这是业界首款基于该平台的量产ADAS解决方案,将搭载于中国智能网联汽车品牌的旗舰车型。该方案推动了VLA模型在车端的实际部署,使系统具备理解、推理与决策能力,提升驾驶安全性与体验。双方还正基于同一平台开发舱驾融合方案,以实现驾驶辅助与车内智能交互的协同。
Python 包管理工具 pip 发布 26.1 版本,引入两项关键功能。一是新增 pip lock 命令,可生成记录所有依赖精确版本的锁文件(如 pylock.toml)。二是提供 --uploaded-prior-to PXD 选项以实现依赖冷却期,可强制安装指定天数前发布的旧版本包,例如使用 P4D 安装至少 4 天前的 LLM 版本 0.30,有助于提升供应链安全。该版本已停止对 Python 3.9 的支持。
DeepSeek宣布将其旗舰模型DeepSeek-V4-Pro的API限时2.5折优惠活动延长至2026年5月31日。同时,公司进行了多项价格与模型调整:全系列模型的输入缓存命中价格降至首发价的十分之一;deepseek-chat与deepseek-reasoner两个模型名将被弃用,其功能分别由deepseek-v4-flash的非思考与思考模式承接。目前,DeepSeek-V4-Pro的缓存命中输入价格低至每百万tokens 0.025元。该模型采用混合专家架构,总参数量达1.6万亿,支持百万级上下文窗口。官方表示,受高端算力限制,当前Pro版本服务吞吐有限,预计下半年昇腾950超节点批量上市后,其价格还将大幅下调。
根据Ornn Compute Price Index数据,NVIDIA B200 GPU的现货租赁价格在六周内飙升114%,从三月初的2.31美元涨至本周的4.95美元/小时。此次价格暴涨与GPT-5.5等前沿模型发布带来的需求冲击紧密相关,这些模型需要Blackwell架构提供的内存支持。与此同时,B200与上一代H200的价差从0.28美元大幅扩大至1.80美元,不同云服务商之间的报价差距也扩大了一倍以上,反映出市场供应紧张。预计夏季B200价格将维持在5美元以上,云端推理成本持续上升。
Runway通过采用Kueue作为Kubernetes准入控制器,将GPU利用率提升超过20%,同时保障团队容量。其核心机制是为关键工作预留配额,并设立共享队列借用闲置容量,当配额所有者需要时通过抢占回收资源。该系统运行于昂贵的多租户GPU集群,支持多节点训练的拓扑感知调度和弹性工作负载。具体实现中,团队拥有专用预留队列,而默认队列作为共享机会池,可借用闲置配额运行可中断工作负载。当预留队列需资源时,Kueue基于优先级和运行时间抢占默认队列中的任务,实现资源高效管理。
阿里巴巴达摩院联合广东省人民医院等机构,研发出肠癌筛查AI模型DAMO COCA。该模型基于平扫CT影像,采用两阶段深度学习架构,在国际上首次实现了无需肠道准备、患者“无感”的肠癌机会性筛查。在回顾2.7万人影像的试验中,模型精准识别出5例漏诊肠癌,敏感性达86.6%,特异性高达99.8%。与10名影像科医生相比,其敏感性显著高出20.4%,并能辅助医生将敏感性提升14.5%。相关成果已发表于顶级期刊《肿瘤学年鉴》。
NVIDIA 在 Hugging Face 上发布了一款名为 NV-Raw2Insights-US 的物理信息人工智能模型,专门用于自适应超声成像。该模型能够直接处理原始超声射频数据,实时生成高质量的诊断图像。它通过结合物理定律与深度学习,显著提升了图像分辨率和对比度,同时将传统处理流程中的多个步骤整合为单一前向传播,大幅提高了计算效率。这一进展有望推动超声设备向更便携、智能和精准的方向发展。
本研究通过一项为期21天的真实资本链上交易实验,探讨了自主语言模型代理的可靠性。在受控市场中,3,505个用户注资的代理交易真实ETH,产生了750万次调用、约30万次链上操作及2000万美元交易量,提交交易的结算成功率达99.9%。研究发现,可靠性不仅依赖于基础模型,更源于操作层设计,包括提示编译、策略验证与执行防护等。上线前测试揭示了纯文本基准难以评估的故障模式,如伪造交易规则和手续费瘫痪,通过针对性框架调整,相关故障率显著下降,受影响测试群体的资本部署率从42.9%提升至78.0%。研究表明,管理真实资本的代理需在从用户指令到结算的完整路径上进行评估。
本文针对联邦学习中冗余或噪声样本导致模型性能下降的问题,提出一种基于多任务自动编码器的样本选择方法。该方法通过中央服务器协调,采用OCSVM、隔离森林和自适应损失阈值等无监督异常检测技术过滤客户端噪声样本,并引入中央服务器控制的多类深度支持向量数据描述损失以增强特征选择。在CIFAR10和MNIST数据集上的实验表明,在非独立同分布设置及高达40%的噪声水平下,基于损失的样本选择能显著提升模型精度,其中CIFAR10上最高提升7.02%。联邦SVDD损失进一步优化了特征选择,额外带来最高0.99%的精度提升。
一篇技术文章分享了在长达十小时的航班上离线运行本地大型语言模型的实验。作者通过优化,成功在配备Apple Silicon芯片的笔记本电脑上运行了70亿参数的Llama 2模型。关键变化在于通过量化等技术大幅降低了模型对内存和算力的需求,使其能在无网络环境下持续工作。实验实现了约每秒5个token的生成速度,证明了在移动设备上进行实用级离线AI推理的可行性。
GitHub Copilot 宣布将转向按使用量计费模式。这一变化意味着用户的付费方式将从现行的固定订阅制,转变为根据实际使用量来计算费用。具体计费细节和转换时间表尚未公布,但此举旨在为不同使用强度的用户提供更灵活的付费选项。该消息在技术社区引发关注,在Hacker News上获得了111个讨论点数。
每年系统故障导致损失超万亿美元,工程师需通过分析时间序列数据快速定位问题。时间序列问答(TSQA)是关键运维任务,对AI模型构成挑战。为此,研究团队推出ARFBench基准,基于Datadog真实内部事件及遥测数据构建。测试显示,当前领先的大型语言模型、视觉语言模型和时间序列基础模型在ARFBench上表现均有较大改进空间。团队提出混合TSFM-VLM模型,其整体性能接近前沿水平,为TSQA任务提供了新评估框架和改进方向。
自6月1日起,GitHub Copilot 的使用将开始消耗 GitHub AI Credits,计费模式正式从固定订阅制转变为基于实际使用量的计费。这一变化意味着用户的费用将与 AI 助手的具体调用量直接挂钩,而非统一的月费或年费。
OpenAI正致力于通过开源与开放科学推动人工智能的进步与民主化。这一举措旨在降低AI技术的使用门槛,促进更广泛的创新与合作。其Privacy Filter工具为开发者提供了构建可扩展Web应用的关键支持,帮助在保障用户数据隐私的同时,高效集成AI能力。这一方向强调了技术开放性与负责任开发并重的理念。
Meta 已与初创公司 Overview Energy 签署协议,计划采购高达 1 吉瓦的太空太阳能电力,旨在为其人工智能数据中心提供清洁能源。这项合作的核心挑战在于,相关的太空太阳能技术目前尚未实现商业化应用。协议凸显了科技巨头对大规模可再生能源的前瞻性布局,但实际供电仍需等待技术突破。
根据 Epoch AI 机构基于 AI Chip Owners 数据库的估算,截至 2025 年第四季度,谷歌凭借其大规模部署的自研 TPU 芯片,成为全球最大的单一 AI 算力持有者,掌握了全球累计 AI 算力的大约四分之一,其规模超过了微软、Meta 和亚马逊。该统计覆盖了英伟达、AMD、谷歌、亚马逊及华为的主要 AI 芯片,据信已涵盖全球绝大多数专用 AI 算力。微软与 Meta 的自研芯片虽未纳入此次统计,但对整体估算影响甚微。
受全球AI基础设施投资热潮推动,阿斯麦(ASML)正加速扩产极紫外(EUV)光刻机。公司计划今年量产至少60台EUV光刻机,并计划将年产能进一步提升至80台。为突破产能瓶颈,阿斯麦已在美国、德国、韩国等地扩建无尘车间,并投入约22亿美元资本开支。尽管面临供应链与人才挑战,市场需求依然旺盛,公司预计年营收将达420亿至470亿美元。
在2026北京车展,广汽传祺推出越7越野车和向往E8 PHEV MPV,首次搭载星源插混技术。越7配备GMC 3.0雷霆版,驱动电机峰值功率205kW,1.5T发动机最大功率125kW,综合功率达400kW,轮端扭矩10000N·m,支持单轮脱困。向往E8 PHEV采用GMC 3.0疾风版,DHT重98.5kg,电控效率99.2%,传动效率98.7%,发动机热效率提升3%,AI能量控制平台节油率提高15%。该车百公里亏电油耗3.98升,纯电续航281km,综合续航1537km。
Ubuntu 未来一年将逐步整合 AI 功能,从增强现有系统能力入手,让 AI 模型在后台运行以辅助操作。开发方向偏向本地推理,并计划整合智能体工作流。AI 应用扩展至服务器端,例如帮助分析系统日志。Canonical 目标是将 Ubuntu 打造成更懂上下文的操作系统,但强调不会变成 AI 产品,而是通过审慎、安全的整合提升整体能力。
谷歌正依靠人工智能边缘计算战略,以追赶云计算市场的领先者亚马逊和微软。该公司通过将AI技术整合到边缘设备,旨在提升云服务性能、降低延迟并扩大市场份额。这一举措针对亚马逊AWS和微软Azure的主导地位,谷歌希望借助边缘AI的实时数据处理和隐私优势吸引企业客户,加速缩小竞争差距。目前,云计算市场竞争激烈,谷歌的AI边缘布局被视为关键追赶手段。
分析师郭明錤报告指出,OpenAI 正与 MediaTek 和 Qualcomm 合作开发定制智能手机处理器,Luxshare 担任系统设计和制造的独家合作伙伴。这一合作旨在为 OpenAI 的人工智能技术提供专用硬件支持,可能优化芯片性能并减少对外部供应商的依赖,标志着该公司向硬件领域的战略扩展。
ASML计划大幅提升其极紫外(EUV)光刻机的产量,以应对AI芯片需求的快速增长。该公司在EUV光刻机市场占据垄断地位,该设备是制造先进AI芯片的核心机器。根据《华尔街日报》报道,增产旨在跟上市场对AI芯片的激增需求,确保供应链稳定,支持人工智能技术的持续发展。这一举措将直接推动全球AI芯片产能扩张,缓解当前供应压力。
Chrome 开发者文档推出了 Prompt API,这是一个用于 AI 提示管理的应用程序编程接口,帮助开发者以编程方式处理提示词,提升开发效率。该 API 的发布信息在 Hacker News 上获得102点积分,反映出技术社区对此工具的关注和积极评价。开发者可通过官方文档进一步了解其功能和应用场景。
在2026北京车展上,东风汽车与华为乾崑联合打造的奕境品牌首秀,并全球首发了旗舰大六座SUV奕境X9。该车行业首发具备强光不反光特性的后排吸顶柔光屏,并首发搭载华为乾崑智驾ADS 5系统与鸿蒙座舱Harmony Space 6。车身尺寸为长5301mm、轴距3120mm,预计售价约50万元。品牌计划未来三年推出5款新车,并已在全国80城布局超300家体验门店。
中国信通院宣布启动DeepSeek V4国产化适配测试,旨在推动该模型与国产软硬件的深度协同及产业应用。测试将依托重点实验室和AISHPerf基准体系,面向芯片、服务器、一体机、集群、开发框架及工具链等产品系统展开。评估覆盖模型全系列,聚焦推理、微调等流程,从适配易用性、功能完备性、性能及成本多维度进行,并新增长序列处理、代码生成与理解等测评方向,以构建立体化评测体系。此前,多家国产硬件厂商已在模型发布当日完成了“0day适配”。
OpenAI开源了15亿参数的PII脱敏模型Privacy Filter,采用混合专家设计,每次仅激活约5000万参数,可在笔记本电脑等设备上运行。它能根据上下文识别姓名、地址等八类敏感信息,在基准测试中F1分数达97.43%。该模型作为本地预过滤层,帮助用户在文本发送至云端AI前脱敏数据,但高敏感场景仍需结合人工审核。
高德纳预测,2026年全球数据中心系统支出将达7879.9亿美元,连续第二年增速超过50%。同期,全球整体IT支出预计为6.31655万亿美元,同比增长13.5%,较今年2月的预测上调了2.7个百分点。增长主要由人工智能基础设施和先进存储需求驱动,AI工作负载的扩展推高了高性能计算及相关处理器、加速器的投资,并使高带宽内存等领域利润显著提升。
据报道,DRAM制造商南亚科技在台积电的协助下,成功打入英伟达下一代Vera Rubin平台的内存供应链,有望为其供应LPDDR5X SOCAMM2内存模组。此举为英伟达在三大原厂外引入了第四家供应商,有助于保障供应稳定;同时也能助力南亚科技切入高利润的企业级DRAM市场。不过,该平台设计需要9600MT/s的高速内存,而南亚科技官网目前公示的最高规格仅为7500MT/s,其产品能否满足要求仍是未知数。
追觅科技创始人俞浩发文炮轰小红书价值观与盈利模式“有毒”。苹果新任CEO特努斯将于9月主持可折叠iPhone发布会,公司未来计划进入约10个新产品类别。华为余承东透露,尊界品牌一款高定新车价格将达200万元级别,计划6月底发布。此外,人类马拉松成绩首次突破2小时大关;砺算科技GPU通过微软WHQL认证,成为国内首家;DeepSeek宣布其API输入缓存命中价格大幅下调。
Anthropic 在 Opus 4.7 中更换了 tokenizer。OpenRouter 通过对比用户从 Opus 4.6 迁移到 4.7 的实际使用数据,精确测量了 tokenizer 变更对成本的影响。
本文提出软各向异性图(SAD),一种基于图像平面自适应站点参数化的显式可微分图像表示方法。SAD通过各站点定义各向异性度量与加权距离,并依据像素前K个站点的softmax混合计算颜色,形成具有可学习温度的软加权Voronoi划分,在保持清晰边界的同时保留有效梯度。该方法支持基于前K映射的高效渲染,并采用受跳转扩散启发的传播方案更新站点。在Kodak数据集上,SAD以2.2秒编码时间达到46.0 dB PSNR,训练速度比先进基线快4-19倍,且在相同码率下性能更优。SAD还能无缝集成至可微分流程,并具备快速随机访问与紧凑存储优势。