Agents Week 2026 活动正式收官,期间密集发布了构建智能体云的完整产品矩阵,涵盖计算基础设施、安全架构、智能体工具箱、平台开发工具及新兴智能体网络等关键领域,全面覆盖从底层算力到上层应用的工具链,系统性推进智能体云生态建设。
深蓝S07华为乾崑激光版正式上市,限时优惠价15.99万元起,推出630Max+和630Ultra两款车型。新车升级搭载华为乾崑ADS 4 Pro辅助驾驶系统,配备27个传感器及全固态激光雷达。搭载77.94kWh金钟罩电池,CLTC纯电续航630公里,提供258马力和272马力后置电机可选,内饰配备15.6英寸向日葵屏及高通骁龙8295P芯片。
华为无线鼠标 3 标准版与轻音版日前上架预售,定价分别为 129 元和 149 元。新品支持星闪连接与双模连接,可实现靠近自动配对,并支持双击唤醒小艺进行 AI 互动。鼠标本体重约 66g,尺寸为 119.92×62.54×38.51mm,标准版提供黑白双色,轻音版额外增加绿色可选,其左右键及侧键采用轻音技术降低操作噪音。
瑞士法语电视台(RTS)披露,特斯拉涉嫌隐瞒数千起自动驾驶系统引发的致命事故,以继续维持其自动驾驶技术的测试许可。报道指出,该公司未向监管部门如实上报相关安全数据,涉及致命事故数量达数千起。这一爆料引发了对特斯拉自动驾驶测试合规性及安全透明度的严重质疑,相关监管机构可能就此展开调查。
中兴智慧家庭在问天BE7200 Pro+路由器上开启Co-Claw功能公测,首批限99个名额。Co-Claw是首款专为路由器设计的"龙虾"AI智能体,较OpenClaw更轻巧专注,用户添加"中兴小智"微信好友后,可查询修改WiFi密码、查看网络状态、管理接入设备、设置青少年家长控制、优化WiFi环境及获取天气股票信息。
岚图泰山黑武士正式启动交付,首批展车已进驻北京、上海、广州等全国20城46家门店。该车于今年3月上市,定位中国首款量产L3级SUV,搭载华为乾崑智驾ADS四激光方案及首发的896线双光路图像级激光雷达,售价50.99万元并采用限量发售模式。
当贝智能鱼缸 2S Ultra 上架京东,定价 599 元,将于 4 月 26 日开售。该产品主打 AI 智养系统,用户上传鱼类照片后,系统可自动调节喂食、灯光、水流及除菌参数。硬件配备 45 颗高亮度灯珠,提供至高 4300lx 光照度,内置矿化过滤与 AI 动态除菌系统,并采用鱼便隔离仓干湿分离设计。鱼缸尺寸为 505×295×318.5mm,可容纳 32L 水体。
美国国家安全局(NSA)被曝仍在使用Anthropic的人工智能产品Mythos,尽管该机构此前已将其列入黑名单。据路透社2026年4月19日报道,这一违规使用情况引发外界关注,目前具体使用范围和方式尚不明确,Anthropic方面尚未就此置评。该消息在技术社区Hacker News上获得105个点赞,显示业界对政府机构AI使用合规性的高度敏感。
华为于4月20日发布Pura 90系列旗舰手机及全场景新品。Pura 90系列搭载麒麟9030S处理器,图像理解能力提升200%,整机性能提升25%。Pro Max配备2亿像素超大底长焦传感器,Pro版搭载5000万像素十档可变光圈主摄,全系采用6.6-6.9英寸直屏并搭载HarmonyOS 6.1。同期推出行业首款横向阔折叠Pura X Max,以及WATCH FIT 5、AI眼镜、MateBook 14鸿蒙版等多款生态产品。
卡内基梅隆大学将在2026年4月23日至27日于巴西里约热内卢举行的ICLR 2026会议上展示194篇研究论文。其中,研究人员发布了EditBench基准测试,包含545个真实世界代码编辑任务,用于评估大语言模型根据用户指令编辑现有代码的能力。该基准考虑了周围代码和光标位置等实际上下文。测试结果显示,大多数AI模型在该任务上表现挣扎。
猛士汽车春季焕新发布会宣布战略转型,从"造最强新能源越野车"转向"造最懂用户新能源越野车",并与华为乾崑达成"全维共创"深度合作。新车首发八大智能越野黑科技,包括量产最高线束896线激光雷达、50+传感器融合感知系统、猛士磐石底盘2.0、华为乾崑智驾越野NCA、鸿蒙座舱越野版及越野生态等,通信信号强度较业界提升60%,打造"含华量"最高的智能越野车。
技术社区热议OpenClaw项目,其构建免费、安全、始终在线的本地AI代理的方案在Hacker News上获106个赞。帖子标题"OpenClaw可骗不了我。我还记得MS-DOS"将现代AI工具与MS-DOS时代的简洁性对比,表达对技术复杂性的警惕。该方案强调本地部署的隐私保护与持续可用性。
技术博客awesomeagents.ai发布针对GitHub平台虚假star现象的深度调查,揭露开发者通过购买虚假点赞人为提升项目可信度与曝光度的灰色产业链。该报道在Hacker News技术社区获得106个点赞关注。调查涉及虚假star的交易机制、对开源生态的影响及平台检测难题,但具体交易规模与涉案账号数量等详细数据需查阅原文完整报告获取。
华为发布Pura 90系列及Pura X Max等新机,余承东现场表示受内存价格上涨影响,新手机定价压力较大,成本上涨明显,后期可能涨价。此前OPPO、vivo、小米等安卓厂商已于3月至4月陆续调整部分产品价格。业内人士称,AI算力需求爆发叠加供应链控产等因素推动内存价格持续走高,苹果正高价扫货移动DRAM进一步挤压竞争对手备货空间。
三星晶圆代工合作伙伴GAONCHIPS宣布完成1ASIC+4HBM异构集成技术验证,采用三星I-Cube S 2.5D封装技术(硅中介层架构),计划于今年夏季量产首款相关产品。此次验证涵盖初始设计定义、封装实现及电气验证全流程,标志着三星I-Cube生态取得实质性进展,可在CoWoS产能紧缺背景下为客户提供可行的先进封装替代方案。
小米澎湃OS 3发布多项功能升级。超级小爱新增三指上滑触发"小爱记忆"及气泡上岛功能;CarWith支持经典桌面自定义布局、小米超级岛显示及Carlink极简小窗模式;文件管理新增桌面文件夹快捷方式及远程访问功能;小米智能卡支持接收iPhone分享的卡钥匙。此外,短信新增验证码轰炸拦截,时钟新增计时结束振动提醒。
台积电CoPoS先进封装量产时间推迟至2030年末,该工艺采用面板取代晶圆以提升封装面积和生产效率,但仍面临均匀性与翘曲等技术挑战。与此同时,台积电计划2027年将SoIC先进封装月产能从1万片大幅扩增至5万片,以应对英伟达的强劲需求,其中约10%产能将用于光电合封(CPO)技术。
全新华为MateBook 14 鸿蒙版亮相,搭载同档位少有的OLED云晰柔光屏,配备标志性波点圆键盘,并升级更聪明的AI助手小艺。该机型在续航、流畅度和智慧体验方面表现亮眼,主打"超有AI的鸿蒙小圆本"定位,通过软硬件协同优化,为用户带来兼具优质显示效果与智能交互的轻薄本使用体验。
西班牙巴塞罗那超级计算中心分拆企业 Openchip 计划其 AI 芯片于 2026~2027 年流片,目标 2028 年实现商业出货。该矢量加速器采用 Chiplet 设计与 RISC-V 指令集,支持无 CPU 运行模式,针对智能体推理场景优化,可在同等算力下节省 30% 功耗。公司正联合 imec、Kalray 及 NEC 等合作伙伴,推进全栈欧洲计算解决方案开发。
DR-Venus 是一个仅用1万条开放数据训练的40亿参数深度研究智能体,基于Qwen3-4B-Thinking-2507架构,支持200步工具调用和超20万tokens的上下文。它通过监督微调与强化学习两阶段训练,在BrowseComp、GAIA等多个深度研究基准上树立了小模型性能新标杆。其SFT版本已超越多数同类开源模型,而RL版本进一步将长程任务可靠性和工具使用校准度提升2-3个百分点。项目已全面开源模型、代码与训练流程。
华为在Pura系列发布会上推出Pura 90系列手机。其中Pro和Pro Max版本搭载全新麒麟9030S处理器,该芯片NPU图像理解能力提升200%,AI ISP色彩引擎提升43%,长焦视频清晰度提升110%,防抖精度提升30%。标准版则搭载麒麟9010S处理器,该芯片此前已用于nova 15 Ultra,相较上代产品整机性能提升18%。
华为 MateBook 14 鸿蒙版于4月20日发布,为首款全面搭载鸿蒙操作系统的轻薄本。该机配备14.2英寸2.8K OLED云晰柔光屏,支持120Hz刷新率与100% sRGB/P3广色域,可减少99%环境干扰光。机身采用波点圆键盘设计与追色工艺,提供原野绿、樱粉金、深空灰三色。接口涵盖双USB-A、USB-C及HDMI。内置智慧助手"小艺"支持慧记、深度解题等AI功能,针对办公与学习场景全面提效。
美国国家安全局(NSA)已部署Anthropic最强大的AI模型Mythos Preview。作为负责电子监控的美国情报机构,NSA将该模型应用于其情报工作流程。这标志着Anthropic的尖端AI技术已进入美国情报体系的核心应用场景,用于支持电子监控和情报分析任务。
开发者Simon Willison发布的Claude Token Counter工具新增模型对比功能,支持用户直观比较不同版本Claude模型的token计数差异。该更新于2026年4月20日发布,可帮助开发者精确计算和优化API调用的token消耗,在Hacker News社区获得100个积分关注。
国产AI推理GPU企业曦望完成新一轮超10亿元融资,估值突破百亿,成为首家纯推理GPU独角兽。该公司自2024年底从商汤分拆独立以来,一年多内已完成七轮融资,累计募资约40亿元。本轮为2026年AI推理落地潮以来国内GPU赛道最大单笔融资之一,资金将主要用于S3推理GPU规模化量产、软件生态建设及S4/S5芯片研发。
爱奇艺在世界大会公布"AI艺人库"计划,宣布于和伟、张若昀等100多名艺人入驻纳逗Pro艺人库,旨在为AIGC创作者提供规范合作平台。随后张若昀、王楚然等多位艺人否认签署AI授权协议。爱奇艺紧急澄清,入驻仅代表艺人有接洽AI影视项目意愿,但参与具体项目或出演角色仍需单独商谈授权,流程与传统真人影视合作一致。
华为AI眼镜正式发布,提供钛银灰、流光银、摩登黑三款配色及圆形、方形两种镜框,售价2499元起,将于4月25日开售。产品采用轻量化设计,镜架仅重35.5克,镜腿薄至6.25毫米,基于超30万亚洲头形数据构建平衡架构。内置自研AI芯片,支持语音唤醒、AI交互、第一人称视角拍摄及支付宝支付等功能,综合续航达12小时,支持连续8小时通话或9小时音乐播放。
GRASP是一种面向世界模型长程规划的梯度优化新方法。通过将轨迹映射至虚拟状态实现跨时间并行优化,引入状态迭代的随机噪声增强探索能力,并重塑梯度以避免高维视觉模型中的病态信号传播。该技术解决了长程规划中的优化病态、局部最优和高维潜在空间失效等问题,使基于学习动力学的复杂任务规划更加稳定高效。
NVIDIA 借国家机器人周契机,集中展示推动 AI 进入物理世界的最新技术突破,发布 Physical AI 领域研究成果与开发者资源。
开发者发布了一个基于 Gemma 4 和 E2B 的 Prompt-to-Excalidraw 浏览器演示,支持通过自然语言提示直接生成 Excalidraw 手绘图表。该方案将 3.1GB 的 Gemma 4 模型完全部署在浏览器端本地运行,借助 E2B 沙箱环境实现前端 AI 推理,无需后端服务器支持。项目在 Hacker News 获得 101 个赞。
一家已破产的人工智能公司前首席执行官及前首席财务官因涉嫌欺诈被正式起诉。据路透社4月17日报道,司法机关已对这两名前高管提起刑事指控,案件涉及该公司破产前的财务违规行为。这是该公司破产后的重大法律进展,具体涉案金额与欺诈细节仍有待司法程序进一步披露。
本研究探讨了稀疏自编码器(SAE)在增强大语言模型(LLMs)对抗越狱攻击鲁棒性中的作用。通过在推理时将预训练SAE集成到Transformer残差流中,不修改模型权重或阻断梯度。实验覆盖Gemma、LLaMA、Mistral和Qwen四个模型家族,针对GCG、BEAST等白盒攻击及三项黑盒基准测试,结果显示越狱成功率最高降低5倍,并减少了跨模型攻击的可迁移性。参数消融表明,L0稀疏度与攻击成功率呈单调剂量-反应关系,且中间层在防御效果和模型正常性能间达到最佳平衡。这些发现支持表征瓶颈假说,即稀疏投影重塑了越狱攻击所利用的优化几何结构。
研究团队提出了一种名为SIREN的轻量级防护模型,通过利用大型语言模型内部各层的安全相关特征来检测有害内容。该方法采用线性探测识别安全神经元,并通过自适应层加权策略整合信息,无需修改底层模型。评估显示,SIREN在多项基准测试中显著优于当前最优的开源防护模型,且可训练参数数量仅为后者的1/250。该模型对未见过的基准测试具有优异的泛化能力,支持实时流式检测,并比生成式防护模型大幅提升了推理效率。
Flash-SemiCRF 通过流式计算突破半马尔可夫条件随机场(semi-CRFs)的内存瓶颈,实现超长序列精确推理。该方法用前缀和数组即时计算替代存储边势张量,内存占用随片段长度与标签数量乘积大幅降低;采用流式前向-后向传递与检查点边界归一化,保持工作内存亚线性增长,可处理超过10万位置的基因组序列。方案融合为Triton内核,解决了传统方法在大状态空间下的不可行问题。
研究团队发布 AJ-Bench 基准测试,系统评估 Agent-as-a-Judge 在复杂环境中的验证能力。该基准涵盖搜索、数据系统和图形用户界面三大领域,包含155个任务与516条标注轨迹,全面测试评判智能体的信息获取、状态验证与过程验证能力。实验表明,Agent-as-a-Judge 相比 LLM-as-a-Judge 基线取得持续性能提升,但在基于智能体的验证中仍面临显著挑战。相关数据与代码已开源。
本文提出UDM-GRPO框架,首次实现均匀离散扩散模型与强化学习的稳定结合。针对训练不稳定问题,该方法将最终干净样本作为动作,并通过扩散前向过程重建轨迹以对齐预训练分布。此外,引入Reduced-Step和CFG-Free策略提升效率。实验表明,GenEval准确率从69%提升至96%,PickScore从20.46提升至23.81,OCR基准准确率从8%跃升至57%,在文本到图像任务中达到SOTA性能。
研究团队提出PSRD(分阶段自奖励解码)框架,在推理阶段动态缓解大型视觉语言模型(LVLMs)的视觉幻觉问题,无需外部监督。研究发现幻觉在每个语义阶段开始时达到峰值,据此将LVLMs的幻觉引导信号蒸馏为轻量级奖励模型,实现解码过程中的实时干预。实验显示,该方法使LLaVA-1.5-7B的幻觉率降低50.0%,并在五个幻觉评估基准上持续优于现有事后方法,同时实现了性能与推理效率的可控平衡。
研究团队提出了一种基于对比归因与 LRP 的 LLM 故障诊断框架,通过量化错误输出与正确候选间的 logit 差异,并将其归因至输入 token 及内部模型状态,同时支持长文本的跨层归因图构建。该研究在多个真实基准测试上开展系统实证,覆盖不同数据集、模型规模及训练阶段,结果显示 token 级对比归因虽能为部分失败案例提供有效诊断信号,但其适用性存在明显局限,尚无法通用于所有场景。
研究团队提出MM-JudgeBias基准,用于评估MLLM-as-a-Judge的组合偏见。该基准通过Query、Image、Response三维度受控扰动,结合Bias-Deviation与Bias-Conformity指标,对26个主流模型进行测试。数据集涵盖29个源基准的1800余个样本,可细粒度诊断9种偏见类型。实验揭示模型存在系统性模态忽视与不对称评估倾向,表明当前MLLM评判器在证据缺失或扰动下可靠性不足。
研究人员提出基于极性反转的双视角数据合成策略,通过提示 LLM 生成互补指令,使相关文档与违反指令的难负样本交换相关性标签,强制检索器依据指令而非固定主题线索重新评估候选集。在 305M 参数的编码器上,该方法在 FollowIR 基准测试中性能提升 45%,超越同等或更大规模的通用嵌入模型。实验表明数据多样性与指令监督具有互补作用,前者保持通用检索质量,后者提升指令敏感度。