Introducing: Base44's new platform migration feature. If your needs have outgrown your current software, you can now bri...
Introducing: Base44's new platform migration feature. If your needs have outgrown your current software, you can now bri...
Mistral AI 正式推出了名为 Workflows 的编排层。该产品旨在帮助企业将人工智能驱动的流程转化为可用于生产环境的成熟系统,标志着 Mistral AI 正式进入企业级AI流程编排与自动化市场。
三星 Exynos 2600 芯片支持 ENSS 技术,利用 AI 将低分辨率渲染画面升频,提升画质和流畅度,号称“手机版 DLSS”。该技术通过 AI 超分使画面更清晰,并插帧优化运动表现,降低 GPU 负担。同时改善手机散热和能效,实测图形性能比竞争对手高 15%。目前仅 Exynos 2600 芯片支持 ENSS,三星计划未来扩展此技术。
NVIDIA正式发布GeForce RTX 5070笔记本电脑GPU的12GB显存版本,该版本将与现有的8GB版本同步销售。新版本采用24Gb(3GB)GDDR7显存颗粒,旨在缓解当前显存供应紧张的压力。目前多数RTX 50系列显卡标配16Gb(2GB)GDDR7显存,此次新增的12GB版本将为合作厂商提供额外的显存资源,有助于推出更多样化的RTX 5070笔记本电脑产品。
企业AI编排平台Workflows发布公开预览版,旨在解决企业团队将AI模型可靠投入生产环境的难题。该平台专注于为AI赋能的业务流程提供生产环境所需的持久性、可观测性和容错能力,帮助其从原型阶段过渡到实际生产。包括ASML、ABANCA、CMA-CGM在内的多家领先机构已使用Workflows来自动化其关键流程。
比亚迪正式发布汉EV闪充版,起售价17.98万元。新车搭载第二代刀片电池与闪充技术,电池容量69.07千瓦时,CLTC续航里程达705公里,充电9分钟即可充满,并宣称是全球能耗最低的C级轿车,百公里电耗10.8度。车辆配备“天神之眼”5.0辅助驾驶系统,新增后排座椅通风加热功能。用户可享11项权益,包括1年免费闪充、金融方案等,并可选装价值1.2万元的进阶辅助驾驶或限时特惠3999元的“汉纳百川”生活套装。
阿里平头哥发布首款智能网卡“磐脉 920”,这是国内首个内置 PCIe Switch 的 400G 智能网卡,已量产并率先部署于阿里云数据中心。该产品专为应对AI算力增长和“通信墙”难题设计,搭载自主芯片,采用PCIe 5.0与112G PAM4以太网技术,支持400Gbps带宽和400Mpps收发包效率。其通过支持多路径RDMA缩短训练时间,并借助内置PCIe Switch实现GPU与SSD的低时延直连,使系统成本降低30%。
紫光股份2026年第一季度报告显示,公司营业总收入279.85亿元,同比增长34.61%;归母净利润7.88亿元,同比大幅增长126.06%。但经营现金流为-30.93亿元,同比下降267.96%。控股子公司新华三集团表现突出,营业收入达221.89亿元,增长45.08%。公司正积极抢抓人工智能市场机遇,推进“算力×联接”战略,加速智算和国产化业务落地。
FlashQLA 发布了一组专为梯度下降网络优化的融合线性注意力内核。新内核在设计上对计算模式和后向传播更加友好,旨在提升训练效率。该技术通过优化内核融合策略,改进了注意力机制的计算性能,是提升大规模模型训练速度的关键底层优化。
为应对游客增长与劳动力短缺,日本航空将于5月起在羽田机场试点部署宇树科技G1人形机器人。该机器人将协助地勤人员搬运行李和货物,演示中已能完成将货物搬运至飞机传送带等任务。此次试点由GMO Internet Group协助,利用英伟达Isaac Simulator在虚拟环境中训练机器人并创建数字孪生,优化后迁移至实体机器以实现顺畅操作。日本面临老龄化挑战,预计到2040年需要超过650万外国劳动力以维持经济增长。
谷歌云在Google Cloud Next大会上推出由英伟达Vera Rubin系统驱动的A5X裸金属实例。该实例采用英伟达ConnectX-9 SuperNIC和谷歌Virgo Network AI数据中心架构,单站点集群可扩展至8万个Rubin GPU,多站点集群更可支持多达96万个GPU,旨在运行超大规模AI工作负载,为客户提供高性能、低延迟的物理服务器解决方案。
工业富联2026年第一季度业绩大幅增长,营业总收入2510.78亿元,归母净利润105.95亿元,同比分别增长56.52%和102.55%。业绩爆发主要受AI算力需求驱动,云计算业务收入翻倍,AI GPU机柜和AI ASIC服务器出货量分别增长3.8倍和3.2倍。此外,800G及以上高速交换机出货量同比增长1.6倍,CPO全光交换机样机开始出货。公司经营活动现金流净额达250.24亿元,同比激增1826.20%。
自 2026 年 6 月 1 日起,GitHub Copilot 的计费方式将从基于高级请求次数改为基于实际使用量(令牌)计算。这一调整意味着用户将为其消耗的计算资源付费,而非固定的请求套餐,使计费更直接地关联到具体使用规模。
谷歌在印度安得拉邦维沙卡帕特南启动人工智能中心建设,计划未来五年投资150亿美元(约1025亿元人民币)构建综合AI生态系统。该项目将与印度企业Nxtra by Airtel、AdaniConneX合作,建成印度国内首个千兆瓦级AI数据中心,以支持先进AI部署和数字服务扩展。同时,谷歌将通过“美印互联”计划扩展光纤网络,并优先接入清洁能源,助力印度在2030年实现500吉瓦非化石能源目标。
加州大学圣克鲁兹分校研究团队开发出一款名为Neo的人工智能算法,可有效消除地面望远镜因大气湍流导致的图像畸变。该算法基于条件生成对抗网络,通过训练使地面观测图像的清晰度提升至太空望远镜水准,天体形态参数测量准确度提高2至10倍。目前该技术已应用于智利薇拉・C・鲁宾天文台,该台配备8.4米口径反射镜,造价约8亿美元。此前类似AI算法已将詹姆斯・韦布空间望远镜的数据分析时间从数年缩短至数日,助力多项天文发现。
元戎启行与高通共同宣布,基于高通Snapdragon Ride平台至尊版(骁龙8797)芯片打造的ADAS方案已开始面向量产项目出货。这是业界首款基于该平台的量产ADAS解决方案,将搭载于中国智能网联汽车品牌的旗舰车型。该方案推动了VLA模型在车端的实际部署,使系统具备理解、推理与决策能力,提升驾驶安全性与体验。双方还正基于同一平台开发舱驾融合方案,以实现驾驶辅助与车内智能交互的协同。
Python 包管理工具 pip 发布 26.1 版本,引入两项关键功能。一是新增 pip lock 命令,可生成记录所有依赖精确版本的锁文件(如 pylock.toml)。二是提供 --uploaded-prior-to PXD 选项以实现依赖冷却期,可强制安装指定天数前发布的旧版本包,例如使用 P4D 安装至少 4 天前的 LLM 版本 0.30,有助于提升供应链安全。该版本已停止对 Python 3.9 的支持。
DeepSeek宣布将其旗舰模型DeepSeek-V4-Pro的API限时2.5折优惠活动延长至2026年5月31日。同时,公司进行了多项价格与模型调整:全系列模型的输入缓存命中价格降至首发价的十分之一;deepseek-chat与deepseek-reasoner两个模型名将被弃用,其功能分别由deepseek-v4-flash的非思考与思考模式承接。目前,DeepSeek-V4-Pro的缓存命中输入价格低至每百万tokens 0.025元。该模型采用混合专家架构,总参数量达1.6万亿,支持百万级上下文窗口。官方表示,受高端算力限制,当前Pro版本服务吞吐有限,预计下半年昇腾950超节点批量上市后,其价格还将大幅下调。
根据Ornn Compute Price Index数据,NVIDIA B200 GPU的现货租赁价格在六周内飙升114%,从三月初的2.31美元涨至本周的4.95美元/小时。此次价格暴涨与GPT-5.5等前沿模型发布带来的需求冲击紧密相关,这些模型需要Blackwell架构提供的内存支持。与此同时,B200与上一代H200的价差从0.28美元大幅扩大至1.80美元,不同云服务商之间的报价差距也扩大了一倍以上,反映出市场供应紧张。预计夏季B200价格将维持在5美元以上,云端推理成本持续上升。
Runway通过采用Kueue作为Kubernetes准入控制器,将GPU利用率提升超过20%,同时保障团队容量。其核心机制是为关键工作预留配额,并设立共享队列借用闲置容量,当配额所有者需要时通过抢占回收资源。该系统运行于昂贵的多租户GPU集群,支持多节点训练的拓扑感知调度和弹性工作负载。具体实现中,团队拥有专用预留队列,而默认队列作为共享机会池,可借用闲置配额运行可中断工作负载。当预留队列需资源时,Kueue基于优先级和运行时间抢占默认队列中的任务,实现资源高效管理。
百度文库与百度网盘联合推出的GenFlow 4.0已正式上线,每月服务超过1亿活跃用户并处理2亿项任务。此次升级的核心是全新的Office Agent,用户可通过单一提示并行调用PowerPoint、Excel和Word代理。该版本深度集成OpenClaw,支持从百度网盘PC端或移动应用一键部署,将网盘转化为个人AI工作空间。更多进展将于2026年5月13日至14日在北京举行的百度Create大会上公布,大会主题为“Agents at Scale”。
阿里巴巴达摩院联合广东省人民医院等机构,研发出肠癌筛查AI模型DAMO COCA。该模型基于平扫CT影像,采用两阶段深度学习架构,在国际上首次实现了无需肠道准备、患者“无感”的肠癌机会性筛查。在回顾2.7万人影像的试验中,模型精准识别出5例漏诊肠癌,敏感性达86.6%,特异性高达99.8%。与10名影像科医生相比,其敏感性显著高出20.4%,并能辅助医生将敏感性提升14.5%。相关成果已发表于顶级期刊《肿瘤学年鉴》。
InferenceX已将DeepSeek V4 Pro集成至vLLM项目,在B200、B300、H200和GB200等硬件上的性能测试显示,B300的推理速度比H200快达8倍。团队正在基于vLLM 0.20版本进行基准测试,该版本引入了全新的DeepGEMM MegaMoE技术,将专家并行调度、组合、通用矩阵乘法及SwiGLU激活函数融合为单一巨型内核,预计将带来更优性能。文中感谢了来自NVIDIA AI、社区贡献者及相关团队的开发人员对开源项目的投入与努力。
NVIDIA 在 Hugging Face 上发布了一款名为 NV-Raw2Insights-US 的物理信息人工智能模型,专门用于自适应超声成像。该模型能够直接处理原始超声射频数据,实时生成高质量的诊断图像。它通过结合物理定律与深度学习,显著提升了图像分辨率和对比度,同时将传统处理流程中的多个步骤整合为单一前向传播,大幅提高了计算效率。这一进展有望推动超声设备向更便携、智能和精准的方向发展。
本研究通过一项为期21天的真实资本链上交易实验,探讨了自主语言模型代理的可靠性。在受控市场中,3,505个用户注资的代理交易真实ETH,产生了750万次调用、约30万次链上操作及2000万美元交易量,提交交易的结算成功率达99.9%。研究发现,可靠性不仅依赖于基础模型,更源于操作层设计,包括提示编译、策略验证与执行防护等。上线前测试揭示了纯文本基准难以评估的故障模式,如伪造交易规则和手续费瘫痪,通过针对性框架调整,相关故障率显著下降,受影响测试群体的资本部署率从42.9%提升至78.0%。研究表明,管理真实资本的代理需在从用户指令到结算的完整路径上进行评估。
本文针对联邦学习中冗余或噪声样本导致模型性能下降的问题,提出一种基于多任务自动编码器的样本选择方法。该方法通过中央服务器协调,采用OCSVM、隔离森林和自适应损失阈值等无监督异常检测技术过滤客户端噪声样本,并引入中央服务器控制的多类深度支持向量数据描述损失以增强特征选择。在CIFAR10和MNIST数据集上的实验表明,在非独立同分布设置及高达40%的噪声水平下,基于损失的样本选择能显著提升模型精度,其中CIFAR10上最高提升7.02%。联邦SVDD损失进一步优化了特征选择,额外带来最高0.99%的精度提升。
Very interesting announcement from OpenAI this morning. We're excited to make OpenAI's models available directly to cust...
Music-2.6 from @MiniMax_AI is free on Cloudflare this week! Generate full-length songs or instrumentals from a text prom...
These partnerships with Overview and Noon build on our approach to helping strengthen the grid and power our AI infrastr...
一篇技术文章分享了在长达十小时的航班上离线运行本地大型语言模型的实验。作者通过优化,成功在配备Apple Silicon芯片的笔记本电脑上运行了70亿参数的Llama 2模型。关键变化在于通过量化等技术大幅降低了模型对内存和算力的需求,使其能在无网络环境下持续工作。实验实现了约每秒5个token的生成速度,证明了在移动设备上进行实用级离线AI推理的可行性。
Intel的EMIB封装技术被外部客户如Google的TPU采用,但Intel自身产品正转向UCIe技术。Diamond Rapids预计使用UCIe over substrate实现长距离die-to-die互连。在ISSCC上,Intel展示了UCIe-S D2D链接,在22nm工艺下达到48 Gb/s/lane,距离达30mm,数据率和带宽密度优于3nm设计。substrate配置为5-2-5,而EMIB为11-2-11。由于substrate短缺,Intel的“最佳”封装技术对除Intel外的客户更具优势。
最新研究发现,企业为提升精确性而微调RAG嵌入模型,可能导致检索质量下降高达40%。其核心矛盾在于,单个密集嵌入向量被同时要求承担广泛主题召回和精确语义判别的双重任务。当强制模型区分细微结构差异(如否定、语序颠倒)时,会损害其跨领域聚合相关材料的能力。解决方案是采用两阶段检索:先用嵌入模型快速召回,再通过能感知结构的词元级比对来验证候选结果。这揭示了“几乎相同的句子”与“相同含义”本质不同,在合同、合规等高精度领域混淆二者将导致系统关键失效。
GitHub Copilot 将于6月1日起改用基于AI积分的用量计费模型,以支持更多Agent和高级工作流。各档订阅价格不变,每月赠送等额积分,代码补全等基础功能不消耗积分。新规则按Token消耗计费,积分用尽后无降级选项,代码审查会额外消耗Actions时长。企业用户有三个月过渡期及积分池福利。5月初将上线账单预览功能,年付和轻度用户受影响小,但重度用户需关注成本变化。
Starting June 1st, GitHub Copilot will move to a usage-based billing model as GitHub Copilot supports more agentic and a...