在北京车展上,火山引擎发布了基于Agentic AI架构的新一代汽车AI解决方案,包含AI座舱套件和豆包座舱助手两大方案。新方案通过一个AI大脑深度联动整车功能域,实现了感知、推理、执行、记忆、学习的一体化闭环,颠覆了上一代架构。其中,AI座舱套件支持车企灵活配置,豆包座舱助手则为完整产品级交付,将于年内量产。目前,搭载豆包大模型的智能汽车已超700万辆,覆盖50多个品牌,日均完成超3000万次座舱交互。
华为宣布其昇腾超节点全系列产品已全面支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术,实现了高吞吐、低时延的推理部署。具体性能上,DeepSeek V4-Pro模型在8K输入下,单卡解码吞吐达4700TPS,时延约20ms;V4-Flash模型单卡吞吐为1600TPS,时延约10ms。此外,昇腾A3超节点系列也全面适配,并提供训练参考实现;基于64卡配置,V4-Flash模型在8K/1K场景下单卡吞吐超过2000TPS。
英特尔CEO陈立武指出,AI工作负载正从训练转向推理,这显著提升了CPU的重要性。CPU与GPU的配比已从过去的1:8收紧至约1:4,未来有望进一步趋向1:1的平衡。在推理场景中,CPU在任务编排和控制调度方面更具优势。行业数据显示,AI智能体时代每吉瓦所需的CPU核心数可能从3000万激增至1.2亿,增长4倍。受此推动,英特尔第一季度数据中心与AI部门营收同比增长22%,达到51亿美元。
在2026北京车展上,北京现代艾尼氪金星(IONIQ V)概念车全球首秀,标志着IONIQ品牌正式进入中国市场。该品牌未来在华车型均以行星命名,并由中国设计团队原创打造。IONIQ V基于E-GMP纯电平台,支持纯电/增程双动力,具备800V快充能力。其车身尺寸为长4900mm、宽1890mm、高1470mm,轴距2900mm,内饰配备27英寸超薄4K大屏。车辆在智能化层面融合了Momenta、高通芯片、宁德时代电池及文心大模型等技术。此外,现代汽车计划将中国生产的汽车出口至中东、英国等市场。
Infisical团队开源了Agent Vault,这是一个专为AI代理设计的凭证代理与存储库。该项目旨在安全地管理AI代理在运行时所使用的API密钥、数据库密码等敏感凭证,防止其直接暴露在代码或环境中。Agent Vault作为代理与外部服务之间的中间层,集中处理身份验证,从而提升安全性并简化凭证管理流程。该项目已在GitHub发布,并在Hacker News上获得了101点关注度。
小米澎湃OS开发者平台正式推出支付服务Skill能力,支持主流AI开发工具。该服务通过标准化接口,帮助商户快速对接收银台及支付功能,内置完整流程与适配方案,大幅简化开发周期。开发者仅需下载安装Skill、通过自然语言交互接入支付能力、自动联调测试三步即可完成接入,一次性支持小米支付、微信支付、支付宝等多种支付方式,并覆盖App/H5/小程序支付、拆单、退款等多项功能。
寒武纪宣布已完成对深度求索最新开源模型DeepSeek-V4的Day 0适配,模型发布当日即可稳定运行。适配针对其285B和1.6T两个版本,代码已开源。通过自研高性能算子库对模型新结构进行专项加速,并在vLLM推理框架中全面支持5D混合并行、低精度量化等技术,以优化词元吞吐和端到端推理效率。同时,深度挖掘硬件特性以最小化通信开销,提升分布式推理性能。DeepSeek-V4拥有百万字上下文,能力领先,现已开放体验和API调用。
谷歌发布了 TorchTPU,使 PyTorch 能够原生在 TPU 上运行,并实现谷歌级规模的计算。这一变化让开发者无需大幅修改代码即可利用 TPU 的高性能硬件,显著提升了 PyTorch 在大型模型训练和推理任务中的效率与可扩展性。此举标志着 PyTorch 与谷歌定制硬件生态的深度集成,为人工智能研究与开发提供了新的强大基础设施。
关联讨论 1 条Google Developers Blog(RSS)吉利汽车在北京车展发布中国首款原生开发Robotaxi原型车Eva Cab。该车基于全域AI 2.0技术体系打造,搭载全球首个量子级AI电子电气架构EEA 4.0,并采用量子加密技术保障安全。其核心亮点是全球首搭2160线数字化激光雷达,具备每秒2592万点的成像能力,最远探测距离达600米。车辆同时配备L4级自动驾驶软件方案千里浩瀚G-ASD。曹操出行深度定制版计划于2027年量产并投入商业化运营。
Simon Willison 发布了一个名为 Millisecond Converter 的在线工具,专门用于将 LLM 报告的提示持续时间从毫秒自动转换为更易读的秒和分钟单位。该工具解决了用户需要手动进行时间单位换算的不便,可通过特定网址直接访问,并被归类为实用工具类别。
Anthropic与NEC达成战略合作,旨在打造日本规模最大的AI原生工程团队。NEC将成为Anthropic在日本的首个全球合作伙伴,为集团全球约3万名员工部署Claude AI工具。双方将针对金融、制造和地方政府等领域,联合开发安全的行业专用AI解决方案,并将Claude集成到NEC的安全运营中心及下一代网络安全服务中。NEC内部将设立卓越中心,通过技术培训构建AI工程团队,并广泛应用Claude Code等工具。目前,全球员工的工具部署与行业解决方案的联合开发已同步启动。
研究提出UniGenDet框架,首次将图像生成与生成图像检测任务置于统一的生成-判别架构中进行协同进化。该框架设计了共生多模态自注意力机制和统一微调算法,使生成任务能提升真实性判别的可解释性,同时真实性标准指导生成更高保真度的图像。通过检测器引导的生成对齐机制促进信息交换,在多个数据集上的实验表明,该方法取得了最先进的性能。代码已开源。
TingIS 是一个面向企业级事件发现的端到端系统,旨在从高噪声、高吞吐的客户事件中提取可操作风险情报。其核心是多阶段事件链接引擎,结合高效索引与大型语言模型,仅依据少量多样描述即可稳定合并与提取事件。系统集成级联路由机制实现精准业务归属,并采用融合领域知识、统计模式和行为过滤的多维降噪管道。在生产环境中,TingIS 每分钟处理超 2000 条消息,P90 警报延迟为 3.5 分钟,高优先级事件发现率达 95%。真实数据基准测试表明,其在路由准确性、聚类质量与信噪比上均显著优于基线方法。
针对作者风格与文本内容纠缠导致模型泛化能力差的问题,本文提出可解释作者身份变分自编码器(EAVAE)框架。该框架通过架构设计分离风格与内容表征,先以监督对比学习预训练风格编码器,再结合变分自编码器微调。其核心创新是一个新型判别器,既能区分表征是否属于同一作者或内容源,又能生成自然语言解释以增强可解释性。实验表明,EAVAE在Amazon Reviews等多个数据集上实现了最先进的作者归属性能,并在M4数据集的少样本AI生成文本检测任务中表现优异。代码与数据已开源。
针对大语言模型存在事实错误与幻觉的问题,本文提出了DAVinCI双重归因与验证框架。该框架首先将模型生成的声明归因于内部组件和外部来源,随后利用蕴含推理和置信度校准进行验证。在FEVER等数据集上的评估表明,DAVinCI将分类准确率、归因精确率、召回率和F1分数提升了5-20%。研究通过消融实验分析了关键组件的影响,并发布了可集成至现有LLM流程的模块化方案。该框架为构建可审计、可信赖的AI系统提供了可扩展路径。
本期邮件通讯内容包含:4只骑自行车的鹈鹕、1只骑电动滑板车的负鼠、最多5只携带火腿无线电并隐藏在人群中的浣熊。此外还收录了5篇博客文章、8个链接、3条引用,并发布了《智能体工程模式指南》的新章节。所有内容已同步推送至订阅者邮箱。
深蓝汽车发布全新中型纯电轿跑L06 Max,提供560Max和670Max两款配置,限时到手价分别为11.89万元和12.89万元。新车核心亮点包括:首次在中国品牌量产车型中搭载调节频率达1000次/秒的磁流变底盘;采用7700T一体化压铸技术提升车身刚性;CLTC最高续航670公里,支持3C超充。智能方面搭载DEEPAL AD Pro辅助驾驶系统,并率先接入DeepSeek大模型提供AI语音交互,主打高“质价比”。
本研究将时间作为可学习的视觉概念,开发了用于推理与操控视频时序的模型。通过自监督学习,模型能利用视频的多模态线索检测速度变化并估计播放速率。基于此,我们从真实世界视频中构建了最大的慢动作数据集。利用该数据,我们进一步开发了具备时序控制能力的模型,包括按指定速度生成运动的“速度条件视频生成”,以及将低帧率模糊视频转换为高帧率清晰序列的“时间超分辨率”。这项研究将时间确立为视频学习中一个可操控的感知维度,为时序可控的视频生成、时间取证检测及理解事件演变的世界模型开辟了新途径。
研究团队发布了原生统一多模态模型Omni,其训练数据涵盖文本、图像、视频、3D几何及隐藏表征。该训练过程催生了“上下文展开”机制,模型在生成预测前会显式地对多种模态表征进行跨模态推理。这一机制使模型能够聚合异构模态间的互补信息,从而更忠实地逼近共享的多模态知识流形,并提升下游推理的保真度。因此,Omni在多模态生成与理解基准测试中均表现出色,同时展示了先进的多模态上下文内生成能力。
针对交互式视频生成模型缺乏公平比较基准的问题,本文提出了首个统一测试平台WorldMark。它包含三个核心部分:一个将共享WASD动作映射到各模型原生控制的统一接口,确保六大模型能在完全相同的场景与轨迹上对比;一个涵盖500个测试案例的分层测试集,覆盖不同视角、风格与难度等级;以及一个支持视觉质量、控制对齐和世界一致性评测的模块化工具包。所有数据与代码均已公开,同时上线的在线平台World Model Arena支持模型并排对比与实时排名。
研究针对创意人脸风格化中身份保持的评估难题,提出了StyleID数据集与评估框架。该框架包含两个部分:StyleBench-H基准集收集了人类对基于扩散与流匹配生成的不同风格强度图像的异同判断;StyleBench-S监督集则通过受控二选一强制选择实验获取心理测量识别强度曲线。基于StyleBench-S对现有语义编码器进行微调,使其相似度排序与人类跨风格、跨强度的感知保持一致。实验表明,校准后的模型与人类判断的相关性显著提升,并对域外艺术家绘制肖像表现出更强的鲁棒性。所有数据集、代码与预训练模型均已公开。
VLAA-GUI 是一个模块化 GUI 智能体框架,围绕停止、恢复与搜索三个核心组件构建。其强制性完整性验证器要求每一步完成时都必须提供可观察的 UI 成功证据,并通过决策规则交叉审查完成声明。强制性循环中断器提供多层过滤机制,在重复失败时切换交互模式,在屏幕状态持续重现时强制改变策略。按需调用的搜索代理可直接向具备搜索能力的大语言模型查询陌生工作流程。框架还集成了按需调用的编码代理与接地代理。在包含 Linux 和 Windows 任务的 OSWorld 与 WindowsAgentArena 基准测试中,VLAA-GUI 在五个顶级骨干模型上均取得最佳性能,分别达到 77.5% 和 61.0% 的成功率。其中三个骨干模型在 OSWorld 上单次通过即超越人类表现。消融实验表明所有三个组件均能持续提升强骨干模型性能,而循环中断器几乎将易循环模型浪费的步骤减半。
在2026北京车展上,猛士汽车与华为乾崑宣布全面深化合作,并首发了合作新车猛士 M817 Ultimate。该车搭载了可主动预判路况的磐石底盘2.0和宣称140km/h不掉电的极猛动力2.0。其核心智能亮点是全球首搭华为乾崑智驾ADS 5系统,并首发NCA越野版功能,同时配备了量产最高896线激光雷达。ADS 5系统此前已正式发布,其算法、全维防碰撞系统及车位到车位智驾体验均得到显著升级,新增了全地形自适应越野模式。
cURL开发者Daniel Stenberg警示,AI生成的漏洞报告已从“垃圾信息”演变为“高质量混乱”。2026年报告提交频率激增至2025年的2倍,平均间隔跌破25小时,导致维护者工作量指数级增长。尽管报告质量提升,真实漏洞确认比例反弹至约16%,但高频提交仍使维护者不堪重负。同时,AI工具也缩短了攻击者的漏洞挖掘时间,可能在修复前被利用,加剧了安全风险。
OPPO Enco Clip2 耳夹耳机于4月24日正式开售,售价849元。耳机提供高光金与深空灰两种配色,单耳仅重5.2克,采用超薄自适应钛片设计。续航方面,总续航达40小时,单次可使用9.5小时。音质上联合丹拿调音,配备双DAC双单元。其独家适配苹果语音指令,支持切歌、通话等操作。核心亮点是首发搭载6nm芯片,实现100倍降噪算力提升,提供AI通话降噪功能。
在2026北京车展上,长安、东风、北汽、比亚迪、吉利、长城、理想、上汽大众、上汽智己等多家车企宣布接入阿里千问大模型。接入后,部分车型将能通过一句话指令完成复杂路径规划、闲聊、查新闻、订酒店、买门票、点外卖、查快递等全场景服务。阿里云提供了“端+云”协同架构:端侧部署Qwen-Omni模型负责感知与快速响应,云端千问则链接数字世界并调用阿里巴巴生态服务。此前,一汽红旗已于3月26日率先接入千问。
在2026北京车展上,长安汽车推出了首款搭载蓝鲸超擎混动系统的第四代逸动,抢订价7.99-9.49万元。新车百公里城区油耗低至2.98L,较同级燃油车油耗降低50%。其车身尺寸为4785/1840/1460mm,轴距2765mm。内饰配备10.25英寸仪表盘和14.6英寸中控屏,集成天枢智慧座舱与DeepSeek AI大模型语音。动力系统采用热效率近45%的混动发动机与效率98.1%的高功率电驱,配合高倍率电池。按年行驶1.5万公里计算,每年可节省油费约3882元。
Anthropic确认,过去两个月用户关于Claude代码质量下降的投诉确实源于真实问题。根本原因并非模型本身,而是其运行框架中的三个独立故障。其中一个关键故障是:3月26日的一项更改本应在会话闲置一小时后清除Claude的旧思考以降低延迟,但一个错误导致此清除操作在后续每个回合都重复发生,致使Claude显得健忘且重复。这些框架层面的故障复杂且直接影响用户体验,尤其对需要长期会话的代理系统构建者有重要参考意义。该公司已发布详细的事后分析报告。
关联讨论 1 条X:小互 (@xiaohu)Perplexity首席执行官阿拉温德·斯里尼瓦斯指出,AI发展不会颠覆iPhone,反而会提升其作为“数字护照”的重要性。AI系统依赖上下文信息提供精准服务,而iPhone存储着支付、身份、健康等核心个人数据,这些数据价值随AI能力增强而提升,构成了苹果的关键壁垒。同时,AI运算正向终端转移,利用Apple Silicon硬件实现本地运行,这不仅能降低延迟,也更符合苹果的隐私保护模型,避免敏感数据外泄。
马斯克在特斯拉财报会上表示,从长期看,除全新Roadster外,特斯拉全系产品都将转向自动驾驶。这意味着公司战略重心已几乎完全押注于自动驾驶,而Roadster的角色则转变为专为想亲自驾驶的用户保留的“光环车型”。然而,该车型自2017年亮相后屡次延期,最新股东文件显示其生产设施“待定”、处于“设计开发阶段”,距离真正投产仍需多年。
豆包App上线“帮你选”功能,内嵌于导航栏。该功能以对话式交互为核心,用户通过语音或文字提出购物需求,豆包会快速梳理并列出选项的优缺点、价格对比,提供个性化建议。关键进展在于该功能已与抖音电商深度打通,构建交易闭环,用户可在豆包App内直接下单支付,无需跳转至抖音。此前,豆包已于3月开始内测“购物下单”功能。字节跳动CEO梁汝波曾表示,豆包用户规模增长较快,但与国际头部竞品仍有差距。
Meta宣布计划裁员约8000人,占员工总数的10%,同时冻结6000个空缺岗位。裁员将于5月20日落地,旨在提升运营效率,对冲AI投入带来的成本压力。CEO扎克伯格正大力押注AI,开发大语言模型和聊天机器人,导致资本支出预计达历史新高,并签署多笔数十亿美元级AI合作。内部员工被鼓励使用AI智能体辅助工作,员工总数接近79000人。其他科技巨头如微软也在压缩人力成本。
DeepSeek正与战略投资者洽谈一轮融资,目标估值超200亿美元,但融资规模仅数亿美元。此举主要目的是为员工股票期权确立明确市场估值,以稳定团队、应对激烈人才竞争。过去一年,因竞争对手估值飙升,公司已流失多名关键研究人员。在AI行业,期权常占薪酬大头,缺乏清晰估值使公司在与月之暗面、MiniMax等对手竞争时处于劣势。多数员工仍认同公司理想主义路线,融资旨在让他们能专注研究。
Claude 代码工具发布 v2.1.119 版本,带来多项功能优化与问题修复。主要更新包括:用户配置现持久化至本地文件;新增 `prUrlTemplate` 设置以自定义 PR 徽章链接;`--from-pr` 命令扩展支持 GitLab、Bitbucket 等多个平台。工具权限与交互行为在多处实现统一,例如 `--print` 模式现在遵从代理的前置元数据定义。界面体验获得改进,如斜杠命令建议会高亮匹配字符,长描述自动换行。此外,本次更新修复了大量已知问题,涉及粘贴格式错乱、工具意外隐藏、MCP 服务器连接失败、权限模式行为异常及界面显示错误等。
苹果正开发6大新产品类别,涵盖AI AirPods、智能眼镜、挂饰设备、智能显示屏、桌面机器人和安防摄像头,以拓展可穿戴设备和智能家居生态。其中AI AirPods为现有产品延伸,其余5款属全新领域。智能眼镜预计2026年底或2027年初发布,2027年底前上市;智能显示屏(HomePad)计划2026年秋季推出,竞逐家居控制中枢;桌面机器人目标2027年上市,但可能延期至2028年。
东风汽车与字节跳动旗下火山引擎签署战略合作协议,双方将围绕智能座舱、企业数智化升级及AI云平台建设展开深度合作,共同定义和打造下一代“AI Car”。合作重点包括整合东风汽车的整车研发制造经验与火山引擎在人工智能、云计算领域的技术优势,共同打造智能座舱的新一代AI交互体验,并持续推动豆包大模型及云计算技术在汽车全产业链的融合与创新应用。
华为在乾崑技术大会上发布面向自动驾驶的乾崑智驾ADS 5系统,奕境汽车首款旗舰SUV奕境X9及全新红旗H9将搭载该系统。苹果iPhone 18 Pro Max金属机模曝光。全国范围启动一体化电视推广,电视机将内置机顶盒功能。爱奇艺回应剧集暂停页广告争议,称已下架相关广告并加强审核。淘宝天猫上线售后AI假图识别模型,以应对利用AI生成虚假凭证的恶意退款行为。此外,日本福岛核电站2号机组测得“极高”水平核辐射,蔡磊透露部分渐冻症药物已进入临床试验。
小米发布全链路语音大模型系列MiMo-V2.5,包含TTS(语音合成)与ASR(语音识别)两大核心。TTS系列包含三款模型:基础版内置多款音色并支持精细控制;VoiceDesign版可一句话生成新音色;VoiceClone版能通过少量样本高保真复刻音色。三者均支持通过自然语言指令和音频标签精细调度声音表现,已在小米MiMo开放平台限时免费。ASR模型已正式开源,在中英双语、方言、强噪音及多人对话等复杂场景下的识别性能达到业界领先水平。
研究提出了一种通过长时运动嵌入来高效生成运动学的方法,直接对从追踪器模型获取的大规模轨迹中学习到的嵌入进行操作,将场景动态建模效率提升了数个数量级。该方法能够根据文本提示或空间戳指定的目标,高效生成长而真实的运动序列,避免了传统全视频合成在探索多种可能未来时效率低下的问题。
现有文档OCR主要针对纯文本或Markdown,丢弃了使LaTeX对科学出版至关重要的结构和可执行属性。研究将科学PDF重建为可编译LaTeX的页面级任务,并为此引入了基准测试TexOCR-Bench和大规模训练语料TexOCR-Train。TexOCR-Bench采用多维评估套件,联合评估转录保真度、结构忠实度和端到端可编译性。利用TexOCR-Train,通过监督微调和强化学习训练了一个20亿参数的TexOCR模型,其强化学习的可验证奖励源自直接强制执行可编译性和引用完整性的LaTeX单元测试。在TexOCR-Bench上对21个前沿模型的实验表明,现有系统经常违反关键文档不变性,包括一致的章节结构、正确的浮动体放置和有效的标签-引用链接,这损害了编译可靠性和下游可用性。分析进一步揭示,带有可验证奖励的强化学习相比仅用监督微调能带来一致改进,尤其在结构和编译指标上。