Anthropic在Claude Opus 4.7版本中更新了分词器。通过对比4.6到4.7版本的实际使用数据,分析发现这一技术调整改变了文本转换为令牌的方式,直接影响API计价。相同的文本输入可能产生不同数量的令牌,从而导致用户的实际使用成本发生可量化的变化。这一调整虽不改变模型能力,但关乎运营开销,是开发者和企业用户需评估的关键因素。
Anthropic在Claude Opus 4.7版本中更新了分词器。通过对比4.6到4.7版本的实际使用数据,分析发现这一技术调整改变了文本转换为令牌的方式,直接影响API计价。相同的文本输入可能产生不同数量的令牌,从而导致用户的实际使用成本发生可量化的变化。这一调整虽不改变模型能力,但关乎运营开销,是开发者和企业用户需评估的关键因素。
本文提出GoClick,一个仅含2.3亿参数的轻量级视觉语言模型,用于图形用户界面元素定位。针对资源受限设备,模型采用编码器-解码器架构,在小参数量下优于仅解码器架构。通过渐进式数据精炼流程,从1080万原始数据中筛选出380万高质量样本进行训练,显著提升定位精度。实验表明,GoClick在多项基准测试中达到与大型模型相当的准确度,同时保持小体积和高推理速度。集成于设备-云端协作框架时,能有效协助云端任务规划器精确定位元素,提升任务成功率。
Mistral AI 宣布其产品 Workflows 进入公开预览阶段。这是该公司提供的一款用于构建、测试和运行AI智能体与应用的工具,面向需要执行业务工作流的用户。
Eden AI 作为 OpenRouter 的欧洲替代方案正式上线,该平台聚合了多家 AI 提供商的模型,旨在为欧洲用户提供符合本地数据法规的 AI 服务。其在 Hacker News 上获得 100 点赞,显示出社区对该替代方案的关注。此举为欧洲市场提供了更多元、合规的 AI 模型接入选择。
DeepSeek宣布全系API服务的输入缓存命中价格即日起降至原有价格的十分之一。其中,DeepSeek-V4-Pro模型的输入缓存命中价格从每百万tokens 1元降至0.025元,输入缓存未命中价格从12元降至3元,输出价格从24元降至6元。DeepSeek-V4-Flash模型的输入缓存命中价格从0.2元降至0.02元。此外,Pro模型在5月5日前还可叠加享受2.5折限时优惠。
在北京车展上,Momenta正式宣布其强化学习世界模型R7实现量产首发。该模型通过“World Model Prediction”预测物理世界未来状态与交互逻辑,旨在让AI理解物体物理属性、运动因果关系及交互可能性。其技术架构分为三层:基于海量驾驶数据的世界模型预训练、用于自动驾驶闭环仿真的世界模型仿真,以及在模型内进行的强化学习虚拟训练。目前,Momenta已交付超70款量产车型,累计定点车型超200款,本次车展有超过20个品牌的60余款车型搭载了其智驾方案。
英特尔第一季度营收达136亿美元,同比增长7%,远超预期,推动其股价盘后暴涨超22%。公司预计本季度营收将继续增长。CEO陈立武指出,市场焦点已从一年前担忧其生存,转向关注其如何快速扩大产能以满足需求。他强调,在AI时代,CPU正重新确立基石地位,特别是在模型推理环节,GPU与CPU的配比正从训练时的1:7-8向推理时的1:3-4转变。不过,公司仍面临英伟达、AMD及ARM架构的竞争,其晶圆代工业务与先进制程的前景也存在不确定性。
智能文档处理管道常因缺乏验证机制,导致提取错误无声传递至下游系统。RaV-IDP框架创新性地引入重建作为核心组件,在提取每个实体后,通过专用重建器将结果渲染回与原文档区域可比的形式,并由比较器评估重建与原始截图的保真度,生成无需标注的质量信号。若保真度低于实体类型阈值,系统触发基于GPT-4.1 Vision的结构化回退机制并重复验证循环,始终以原始文档区域为锚点,避免循环依赖。该框架还提供了每阶段评估方法,将管道组件与基准配对,相关代码已在GitHub开源供实验使用。
DeepSeek宣布为其旗舰模型DeepSeek-V4-Pro的API提供限时2.5折优惠,活动持续至2026年5月5日。调价后,输入价格(缓存命中)低至每百万tokens 0.25元,缓存未命中为3元,输出价格为6元。该模型采用混合专家架构,拥有1.6万亿总参数,支持百万级上下文。官方表示,受当前高端算力限制,服务吞吐有限,预计下半年昇腾950超节点批量上市后,Pro版本价格还将大幅下调。
中国科学技术大学在合肥发布“灵境造物”智能科研工具,面向全球科研人员、机构及企业开放。该系统基于昇腾、鲲鹏、华为云等全栈国产化软硬件生态构建,整合了科学大模型、科研机器人、自动计算与实验等能力,形成操作系统级入口。它依托千余台科研机器人和万余台智能工作站,深度整合千余个科研技能,旨在实现自主科研与物质创制,以破解传统科研成本高、周期长、转化难等痛点。此举标志着人工智能驱动的科学研究正向工程化、平台化与开放共享迈进。
开源项目Stash发布,为AI代理提供长期记忆与上下文管理能力。它通过独立存储和检索对话历史,使开发者无需依赖特定API即可为应用添加持久化记忆功能。该项目已在GitHub开源,并获Hacker News社区关注,降低了构建复杂AI代理的门槛。
项目“Wuphf”是一个受卡帕西风格启发的大语言模型维基系统,支持Markdown格式和Git版本控制。其核心特点是可由用户设定的AI代理自动维护和更新内容,实现了知识库的持续自主管理。该项目已在GitHub开源,并在Hacker News上获得了100点热度。
上海中紫星公司研发的智能原生芯片NEU将于今年第四季度流片。该芯片采用以存储为中心的创新设计,避免了传统架构中数据频繁搬运的能耗与带宽瓶颈,并直接在硬件拓扑上支持神经网络连接。实测数据显示,NEU在执行同等AI推理任务时,速度可达顶级GPU方案的近100倍,同时能耗降低90%。公司创始人翟四通拥有海思EDA框架建设背景,团队汇聚了来自英特尔、英伟达等企业的跨学科人才,实现了从架构到编译器的全体系自研。
在2026九峰山论坛上,新凯来旗下万里眼公司发布了65GHz采样示波器,旨在破解1.6T高速光模块的量产测试瓶颈。该产品面向AI算力驱动下光互连技术向1.6T演进的需求,实现了三大突破:500kHz采样率将测试效率提升100%;65GHz带宽支持单波200G测量,为1.6T通信奠定基础;12μW超低光功率噪声保障了高精度生产。此举贯通了1.6T研发与量产的全流程测试。
在2026北京车展上,元戎启行宣布其高级辅助驾驶系统已在国内超30万辆汽车上搭载,预计今年将新增100万辆。公司已与长城、吉利、Smart等品牌超过15款车型合作,覆盖15万至30万元主流价格区间。技术层面,公司已全面转向大模型自动驾驶路线,多模态大模型能力在2026年初取得突破,目标是实现千公里级MPCI。此外,公司正从多个小模型转向统一基座大模型架构,并将模型单次迭代周期从100余小时压缩至10余小时。
英伟达宣布其Blackwell平台已适配DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型。DeepSeek-V4-Pro拥有1.6T总参数量与49B激活参数,定位高级推理;DeepSeek-V4-Flash则为284B总参数量与13B激活参数,主打高效场景。两款模型均支持100万Token上下文窗口与最高38.4万Token输出长度。实测显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72上开箱性能超过150 tokens/sec/user。开发者可通过NVIDIA NIM微服务下载部署,或利用SGLang与vLLM框架进行定制化推理,vLLM支持扩展至100个以上GPU。
针对模拟电路设计中跨SPICE网表、原理图和功能描述等异构表示检索的难题,本研究提出了统一的三模态检索框架AnalogRetriever。该工作基于Masala-CHAI构建高质量数据集,并通过两阶段修复流程将网表编译率提升至100%。框架采用视觉语言模型编码原理图和描述,使用端口感知关系图卷积网络编码网表,并通过课程对比学习将三者映射到共享嵌入空间。实验表明,其在所有六个跨模态检索方向上的平均Recall@1达到75.2%,显著优于基线。集成至AnalogCoder智能体框架后,能持续提升功能通过率并完成此前无法解决的任务。代码与数据集将开源。
本研究针对联邦学习中的通信瓶颈与隐私风险,提出一种结合拉普拉斯差分隐私与自适应量化的方法。该方法采用基于轮次的余弦退火策略进行全局比特调度,并依据客户端数据集熵动态分配量化比特数。在CIFAR10、MNIST及医学影像数据集上的实验表明,相比32位浮点训练,该方法在保持模型精度的同时,将通信数据总量最高减少了52.64%(MNIST)、45.06%(CIFAR10)以及31%至37%(医学影像数据集),并通过差分隐私机制提供了严格的隐私保护。
为应对大语言模型和视觉语言模型数据估值中的计算瓶颈,研究团队提出了For-Value框架。该方法基于理论分析,利用预训练模型的表征能力,通过最终隐藏层表征与预测误差的对齐关系来捕获数据价值。For-Value采用封闭表达式计算,仅需单次前向传播即可完成估值,无需昂贵的反向传播,支持高效的大规模批量计算。实验表明,该方法在识别关键数据和错误标注数据方面达到或超越了基于梯度的基线方法,同时实现了显著的效率提升。
针对生成式AI模型评估成本高昂的问题,本文提出主动评估框架ProEval。该框架利用迁移学习与预训练高斯过程代理模型,将性能估计建模为贝叶斯积分,将故障发现建模为超水平集采样,从而主动选择高信息量的测试输入。理论证明其估计器具有无偏性与有界性。在推理、安全对齐和分类任务上的实验表明,ProEval仅需8-65倍更少的样本即可实现误差在1%以内的性能估计,同时在严格评估预算下能发现更多样化的故障案例,效率显著优于基线方法。
阿里云百炼平台宣布首发上线DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,其API定价与DeepSeek官网完全一致。其中,Flash版本输入价格低至每百万Tokens 1元,输出价格为每百万Tokens 2元。两款模型均支持100万Tokens的超长上下文,V4-Pro专为复杂任务设计,V4-Flash侧重高效经济。此次接入进一步丰富了百炼平台作为“AI模型超市”的生态,为开发者提供了一站式调用各类顶尖模型的灵活选择。
腾景科技发布2026年第一季度报告,营业总收入达1.71亿元,同比大幅增长51.17%;归母净利润为1443.38万元,同比增长10.74%。业绩增长主要受AI算力需求驱动,公司高速光通信元器件及新兴领域光学模组业务快速扩张。报告期内,公司综合毛利率提升至37.22%,研发投入大幅增长84.19%至2366.12万元。不过,因业务规模扩大导致备货及采购增加,经营现金流为-518.85万元,同比由正转负。
软银旗下SAIMEMORY与英特尔正合作开发面向AI的下一代内存技术ZAM。该技术采用垂直架构与非接触式层间互连,宣称相比传统HBM内存功耗降低约40%,并具备更高密度和带宽。项目已获得日本政府NEDO的研发补贴,计划在2027财年前投入约80亿日元开发原型,目标在2029年左右实现量产。若成功,ZAM有望与HBM竞争,降低AI数据中心成本并缓解供应瓶颈,但目前技术仍处早期原型阶段。
摩尔线程与智源FlagOS合作,成功为MTT S5000 GPU完成了DeepSeek-V4-Flash模型的Day-0适配。该模型采用混合专家架构,总参数量284B,并首次运用“FP4+FP8”混合精度策略。MTT S5000 GPU凭借原生FP8支持及内置硬件级FP8 Tensor Core,能将数据位宽减半,显著降低显存带宽压力并提升计算吞吐量。双方团队通过编译优化与自动调优,重点攻克了FP8算子与Sparse Attention算子,实现了高效适配。
腾讯正式发布面向汽车行业的“出行全场景智能体开放平台”。该平台围绕通勤、出游、娱乐等高频率场景,提供开箱即用的智能体产品,例如随行点单智能体可完成从选品、下单到取餐的全链路服务;随行向导智能体能化身专属AI导游,并新增车队协同管理功能。底层技术方面,平台升级了端云协同座舱大模型架构,端侧采用0.8B轻量化VLM模型确保毫秒级响应,云端则率先接入混元最新大模型Hy3 preview。目前腾讯已服务超过100家车企及出行科技公司。
硬件制造商MINIX于4月23日发布了两款基于英伟达Jetson Thor平台的GenAI迷你工作站T4000/T5000。该系列产品搭载Arm Neoverse-V3AE CPU和英伟达“Blackwell”GPU,配备最高128GB LPDDR5X统一内存,具备高达2070 TFLOPS的FP4稀疏算力,可支持70亿至700亿参数的大语言模型本地推理。主机尺寸紧凑,内置双涡轮风扇散热,预装1TB PCIe Gen4固态硬盘,并提供了双10GbE万兆网口、Wi-Fi 6E、蓝牙5.3、多个HDMI和USB接口等丰富的外部连接选项。
在2026北京车展上,小马智行宣布其2027版L4级Robotaxi整车总成本将降至23万元以内,低于入门级特斯拉Model 3,并计划推出海外版本以实现千台以上部署。公司预计到2026年,其Robotaxi将落地全球超20座城市,总规模突破3000台。同时,小马智行发布了全球首款全车规、全冗余的L4级无人驾驶轻卡,该车型单公里货运成本比人工降低40-50%,货箱容积是低速无人配送车的2.6倍。
DeepSeek-V4预览版正式上线并开源。华为云宣布首发适配,在其MaaS平台上为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。该服务通过适配分层注意力压缩机制、提供多种昇腾高性能融合算子等优化,支持原生100万Token长上下文的高性能推理。V4系列包含1.6万亿参数的旗舰版Pro和2840亿参数的经济型Flash两个MoE架构版本,均原生支持100万Token上下文。新技术大幅降低了长上下文下的计算和显存需求。官方表示V4-Pro体验优于Anthropic Sonnet 4.5,但仍落后于GPT-5.4等前沿闭源模型。
特斯拉宣布其AI驱动的无人驾驶电动车Cybercab在北美正式投产。该车型最大特点是完全取消了方向盘、踏板和后视镜,专为自动驾驶设计。首辆无方向盘版本已于今年2月下线,连续量产于本月启动,目前生产线同时制造无方向盘和带方向盘的两种版本。马斯克将其定位为特斯拉未来的核心走量车型。不过,完全无监督的自动驾驶技术尚未攻克,其FSD功能时间表曾多次延迟。
在北京车展上,火山引擎发布了基于Agentic AI架构的新一代汽车AI解决方案,包含AI座舱套件和豆包座舱助手两大方案。新方案通过一个AI大脑深度联动整车功能域,实现了感知、推理、执行、记忆、学习的一体化闭环,颠覆了上一代架构。其中,AI座舱套件支持车企灵活配置,豆包座舱助手则为完整产品级交付,将于年内量产。目前,搭载豆包大模型的智能汽车已超700万辆,覆盖50多个品牌,日均完成超3000万次座舱交互。
华为宣布其昇腾超节点全系列产品已全面支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术,实现了高吞吐、低时延的推理部署。具体性能上,DeepSeek V4-Pro模型在8K输入下,单卡解码吞吐达4700TPS,时延约20ms;V4-Flash模型单卡吞吐为1600TPS,时延约10ms。此外,昇腾A3超节点系列也全面适配,并提供训练参考实现;基于64卡配置,V4-Flash模型在8K/1K场景下单卡吞吐超过2000TPS。
英特尔CEO陈立武指出,AI工作负载正从训练转向推理,这显著提升了CPU的重要性。CPU与GPU的配比已从过去的1:8收紧至约1:4,未来有望进一步趋向1:1的平衡。在推理场景中,CPU在任务编排和控制调度方面更具优势。行业数据显示,AI智能体时代每吉瓦所需的CPU核心数可能从3000万激增至1.2亿,增长4倍。受此推动,英特尔第一季度数据中心与AI部门营收同比增长22%,达到51亿美元。
Infisical团队开源了Agent Vault,这是一个专为AI代理设计的凭证代理与存储库。该项目旨在安全地管理AI代理在运行时所使用的API密钥、数据库密码等敏感凭证,防止其直接暴露在代码或环境中。Agent Vault作为代理与外部服务之间的中间层,集中处理身份验证,从而提升安全性并简化凭证管理流程。该项目已在GitHub发布,并在Hacker News上获得了101点关注度。
小米澎湃OS开发者平台正式推出支付服务Skill能力,支持主流AI开发工具。该服务通过标准化接口,帮助商户快速对接收银台及支付功能,内置完整流程与适配方案,大幅简化开发周期。开发者仅需下载安装Skill、通过自然语言交互接入支付能力、自动联调测试三步即可完成接入,一次性支持小米支付、微信支付、支付宝等多种支付方式,并覆盖App/H5/小程序支付、拆单、退款等多项功能。
寒武纪宣布已完成对深度求索最新开源模型DeepSeek-V4的Day 0适配,模型发布当日即可稳定运行。适配针对其285B和1.6T两个版本,代码已开源。通过自研高性能算子库对模型新结构进行专项加速,并在vLLM推理框架中全面支持5D混合并行、低精度量化等技术,以优化词元吞吐和端到端推理效率。同时,深度挖掘硬件特性以最小化通信开销,提升分布式推理性能。DeepSeek-V4拥有百万字上下文,能力领先,现已开放体验和API调用。
谷歌发布了 TorchTPU,使 PyTorch 能够原生在 TPU 上运行,并实现谷歌级规模的计算。这一变化让开发者无需大幅修改代码即可利用 TPU 的高性能硬件,显著提升了 PyTorch 在大型模型训练和推理任务中的效率与可扩展性。此举标志着 PyTorch 与谷歌定制硬件生态的深度集成,为人工智能研究与开发提供了新的强大基础设施。
吉利汽车在北京车展发布中国首款原生开发Robotaxi原型车Eva Cab。该车基于全域AI 2.0技术体系打造,搭载全球首个量子级AI电子电气架构EEA 4.0,并采用量子加密技术保障安全。其核心亮点是全球首搭2160线数字化激光雷达,具备每秒2592万点的成像能力,最远探测距离达600米。车辆同时配备L4级自动驾驶软件方案千里浩瀚G-ASD。曹操出行深度定制版计划于2027年量产并投入商业化运营。
Simon Willison 发布了一个名为 Millisecond Converter 的在线工具,专门用于将 LLM 报告的提示持续时间从毫秒自动转换为更易读的秒和分钟单位。该工具解决了用户需要手动进行时间单位换算的不便,可通过特定网址直接访问,并被归类为实用工具类别。
TingIS 是一个面向企业级事件发现的端到端系统,旨在从高噪声、高吞吐的客户事件中提取可操作风险情报。其核心是多阶段事件链接引擎,结合高效索引与大型语言模型,仅依据少量多样描述即可稳定合并与提取事件。系统集成级联路由机制实现精准业务归属,并采用融合领域知识、统计模式和行为过滤的多维降噪管道。在生产环境中,TingIS 每分钟处理超 2000 条消息,P90 警报延迟为 3.5 分钟,高优先级事件发现率达 95%。真实数据基准测试表明,其在路由准确性、聚类质量与信噪比上均显著优于基线方法。
东风汽车与字节跳动旗下火山引擎签署战略合作协议,双方将围绕智能座舱、企业数智化升级及AI云平台建设展开深度合作,共同定义和打造下一代“AI Car”。合作重点包括整合东风汽车的整车研发制造经验与火山引擎在人工智能、云计算领域的技术优势,共同打造智能座舱的新一代AI交互体验,并持续推动豆包大模型及云计算技术在汽车全产业链的融合与创新应用。