4月25日
08:00
HuggingFace Daily Papers(社区热门论文)
54
For-Value:一种面向大模型微调的高效前向传播数据估值方法

为应对大语言模型和视觉语言模型数据估值中的计算瓶颈,研究团队提出了For-Value框架。该方法基于理论分析,利用预训练模型的表征能力,通过最终隐藏层表征与预测误差的对齐关系来捕获数据价值。For-Value采用封闭表达式计算,仅需单次前向传播即可完成估值,无需昂贵的反向传播,支持高效的大规模批量计算。实验表明,该方法在识别关键数据和错误标注数据方面达到或超越了基于梯度的基线方法,同时实现了显著的效率提升。

数据/训练论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
55
ProEval:面向生成式AI评估的主动故障发现与高效性能估计框架

针对生成式AI模型评估成本高昂的问题,本文提出主动评估框架ProEval。该框架利用迁移学习与预训练高斯过程代理模型,将性能估计建模为贝叶斯积分,将故障发现建模为超水平集采样,从而主动选择高信息量的测试输入。理论证明其估计器具有无偏性与有界性。在推理、安全对齐和分类任务上的实验表明,ProEval仅需8-65倍更少的样本即可实现误差在1%以内的性能估计,同时在严格评估预算下能发现更多样化的故障案例,效率显著优于基线方法。

论文/研究评测/基准部署/工程
4月24日
22:17
蚂蚁 inclusionAI:HuggingFace 新模型
49
inclusionAI/DR-Venus-4B-SFT-GGUF

该项目致力于通过开源与开放科学推动人工智能的发展与普及。团队正持续推进技术民主化进程,旨在让更广泛的群体能够接触并利用先进AI工具。其核心路径是依托开放协作模式,降低技术门槛,促进创新生态的构建。

开源/仓库模型发布端侧
21:19
21:08
IT之家(RSS)
49
阿里云百炼上线 DeepSeek-V4 模型,API 价格与官网一致

阿里云百炼平台宣布首发上线DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,其API定价与DeepSeek官网完全一致。其中,Flash版本输入价格低至每百万Tokens 1元,输出价格为每百万Tokens 2元。两款模型均支持100万Tokens的超长上下文,V4-Pro专为复杂任务设计,V4-Flash侧重高效经济。此次接入进一步丰富了百炼平台作为“AI模型超市”的生态,为开发者提供了一站式调用各类顶尖模型的灵活选择。

产品更新开源生态部署/工程
21:08
IT之家(RSS)
23
小米神秘折叠屏新机现身代码库:搭"玄戒 O3"芯片,有望为 MIX Fold 5

小米一款型号为“2608BPX34C”、代号“lhasa”的折叠屏新机近日现身代码库,该机有望被命名为MIX Fold 5或小米17 Fold。其最大亮点是搭载了“玄戒 O3”芯片,这意味着小米可能直接跳过了“玄戒 O2”的命名。此前有消息称,某厂折叠屏新机暂定7月发布,其镜头模组和物料将实现大面积国产化,外界普遍认为所指即为小米此款新机。

端侧行业动态
20:45
Hacker News 热门(buzzing.cc 中文翻译)
58
Show HN: 大型语言模型的工作原理--基于卡帕西(Karpathy)讲座的交互式图解指南

基于AI专家卡帕西讲座的交互式图解指南已发布,详细解析大型语言模型(LLMs)的工作原理。该指南以动态可视化形式呈现,简化了LLMs的架构、训练和推理过程等复杂概念,提升学习可访问性。在Hacker News社区获得103个赞,显示其受关注程度。用户可通过在线链接直接体验这一教育工具,深入了解LLMs内部机制。

教程/实践现象/趋势
20:15
Hacker News 热门(buzzing.cc 中文翻译)
49
韩国警方逮捕一名男子,因其制作的AI生成的逃跑狼图像误导了当局

韩国警方逮捕了一名男子,因其利用人工智能生成了一幅逃跑狼的虚假图像,并在网络上传播,误导执法当局启动了不必要的搜救行动。这起事件揭示了AI生成内容可能被滥用于制造虚假信息,对公共资源造成浪费,并引发社会恐慌。随着AI技术的普及,此类案件凸显了加强数字内容监管和公众辨识能力的紧迫性。警方此次行动表明了对技术滥用行为的法律追究态度,以防范类似风险。

安全/对齐行业动态
20:08
IT之家(RSS)
43
何小鹏:"陆地航母"飞行汽车已获 7000 台订单,预计今年与 IRON 人形机器人同样实现量产

在2026北京车展上,小鹏集团宣布其全球首款量产分体式飞行汽车“陆地航母”已获7000台预售订单,计划于2026年内启动规模化量产,售价控制在200万元以内。同时,最拟人的人形机器人IRON同步亮相,预计今年实现量产,它搭载自研AI芯片、全固态电池及720°鹰眼视觉系统。小鹏已完成至“小鹏集团”的升级,未来将聚焦AI汽车、飞行汽车和AI机器人三大方向。

具身智能行业动态
20:08
IT之家(RSS)
26
奕境汽车首款 9 系 SUV 今年三季度上市,已布局 80 座城市销售网络

在2026北京车展上,东风汽车与华为乾崑联合打造的奕境汽车首秀其旗舰车型奕境X9。这款大六座SUV车长超5.3米,预计售价50万元左右,计划今年第三季度上市。新车首发搭载华为乾崑智驾ADS 5系统及鸿蒙座舱Harmony Space 6,具备L3级软硬件冗余能力。品牌销售网络已在全国80座城市布局,80%门店由前BBA门店改造,规划开设超300家体验店。未来三年,奕境品牌计划推出5款新车。

其他行业动态
20:08
IT之家(RSS)
28
光学器件供应商腾景科技 2026 年一季度净利润 1443.38 万元,同比增长 10.74%

腾景科技发布2026年第一季度报告,营业总收入达1.71亿元,同比大幅增长51.17%;归母净利润为1443.38万元,同比增长10.74%。业绩增长主要受AI算力需求驱动,公司高速光通信元器件及新兴领域光学模组业务快速扩张。报告期内,公司综合毛利率提升至37.22%,研发投入大幅增长84.19%至2366.12万元。不过,因业务规模扩大导致备货及采购增加,经营现金流为-518.85万元,同比由正转负。

行业动态部署/工程
20:00
OpenRouter:Announcements(RSS)
精选55
Agent SDK:在 OpenRouter 上构建多轮智能体工作流

OpenRouter 发布 Agent SDK,其核心是 callModel 函数。该函数可将一次聊天完成转化为具备工具调用、停止条件与成本追踪功能的多步骤智能体工作流。这一工具兼容平台上的 300 多个模型,使开发者能够便捷地构建复杂的多轮交互智能体应用。

智能体MCP/工具产品更新

推荐理由:OpenRouter 把多轮 agent 编排封装成一个 callModel 函数,300+ 模型统一调用,做 agent 产品的人可以少写不少胶水代码,但本质上是工程封装而非技术突破。
20:00
OpenRouter:Announcements(RSS)
53
使用 Agent SDK 构建你自己的 Harness

Anthropic 发布了 Agent SDK,开发者可利用 `create-agent-tui` 和 `create-headless-agent` 技能,在几分钟内搭建个性化的编码智能体。该 SDK 支持两种模式:一是提供终端用户界面的交互式代理,二是无界面的“headless”代理,便于集成到自动化脚本和流水线中。这显著降低了为特定编码任务定制 AI 助手的门槛。

智能体产品更新编码
19:19
The Decoder:AI News(RSS)
49
Anthropic 确认 Claude Code 存在问题并承诺实施更严格的质量控制

Anthropic 确认其编程助手 Claude Code 出现质量问题,用户反馈其性能下降。公司已识别并修复了三个独立的错误源。为应对此次问题,Anthropic 承诺未来将执行更严格的质量控制措施,以保障产品输出的稳定性和可靠性。

Anthropic产品更新编码
19:17
HuggingFace Daily Papers(社区热门论文)
58
基于结构化运动描述的无编码器人体运动理解

本文提出结构化运动描述(SMD)方法,通过基于规则的确定性转换,将人体关节位置序列转化为描述关节角度、部位运动及整体轨迹的结构化文本。该表示使大型语言模型(LLM)能直接运用其预训练知识进行运动推理,无需学习专用的运动编码器或对齐模块。SMD在运动问答(BABEL-QA达66.7%,HuMMan-QA达90.1%)和运动描述(HumanML3D上R@1为0.584)任务上均超越现有最佳方法。其实用优势包括:同一文本输入经轻量级LoRA适配即可跨多种LLM使用,且其人类可读的表示支持可解释的注意力分析。

多模态数据/训练论文/研究
19:08
IT之家(RSS)
43
英特尔合作开发 ZAM 内存获日本政府补贴:号称功耗比传统 HBM 低约 40%,目标 2029 年左右实现量产

软银旗下SAIMEMORY与英特尔正合作开发面向AI的下一代内存技术ZAM。该技术采用垂直架构与非接触式层间互连,宣称相比传统HBM内存功耗降低约40%,并具备更高密度和带宽。项目已获得日本政府NEDO的研发补贴,计划在2027财年前投入约80亿日元开发原型,目标在2029年左右实现量产。若成功,ZAM有望与HBM竞争,降低AI数据中心成本并缓解供应瓶颈,但目前技术仍处早期原型阶段。

行业动态部署/工程
19:08
IT之家(RSS)
50
美团万亿级大模型 LongCat-2.0-Preview 开放测试,全程基于国产算力集群训练

美团新一代基础大模型LongCat-2.0-Preview已开放邀请测试,其总参数规模突破万亿,采用混合专家架构,整体能力被认为对标GPT-4。关键突破在于该模型完全基于国产化算力集群训练完成,标志着美团在此领域取得领先。此前,美团创始人王兴已披露公司持续投入数十亿美元保障算力供应。去年9月,美团曾开源基于相同架构、拥有5600亿参数的首款自研大模型LongCat-Flash。

开源生态数据/训练模型发布
19:08
IT之家(RSS)
39
Perplexity CEO 阿拉温德:AI 不会颠覆 iPhone,反而会强化其"数字护照"地位

Perplexity首席执行官阿拉温德·斯里尼瓦斯表示,AI不会颠覆iPhone,反而会随着AI能力增强,进一步强化iPhone作为用户“数字护照”的地位。他指出,苹果凭借其独有的生态系统、芯片与硬件优势,以及用户信任,构建了坚固的护城河。即使Siri改进缓慢,iPhone仍能持续成功,因为它整合了银行卡、通行证、健康记录、FaceTime、iCloud照片等众多核心生活功能。

大佬观点现象/趋势
19:08
IT之家(RSS)
44
消息称北京地区大疆门店将全面下架无人机产品,DJI Care 邮寄新机需市外收货地址

受北京市无人机新规影响,大疆在北京地区的门店将于5月1日前全面下架所有无人机产品,线上线下渠道均停止销售。消费者未来无法在京直接购买无人机,损坏后可通过DJI Care寄修服务维修,但修复后的无人机只能邮寄至北京市外的地址,需用户自行取回。此举引发消费者对携带与维修无人机的普遍担忧。

政策/监管行业动态
18:08
IT之家(RSS)
31
标致时隔三年重回北京车展,狮锐 & 琉明纯电概念车及雪铁龙 ELO 概念车首发亮相

标致在北京车展全球首发了Concept 6狮锐与Concept 8琉明两款纯电概念车。狮锐为猎装轿车,琉明为大型SUV,均基于全新纯电平台开发,搭载激光雷达与多摄像头系统以支持高阶智能驾驶,并采用发光狮标、线控方向盘等设计。两款车型将由武汉工厂生产,计划于2027年量产上市,将引领品牌下一代纯电设计。同属Stellantis集团的雪铁龙ELO概念车也在此次车展完成了亚洲首秀。

行业动态
18:08
IT之家(RSS)
39
摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配

摩尔线程与智源FlagOS合作,成功为MTT S5000 GPU完成了DeepSeek-V4-Flash模型的Day-0适配。该模型采用混合专家架构,总参数量284B,并首次运用“FP4+FP8”混合精度策略。MTT S5000 GPU凭借原生FP8支持及内置硬件级FP8 Tensor Core,能将数据位宽减半,显著降低显存带宽压力并提升计算吞吐量。双方团队通过编译优化与自动调优,重点攻克了FP8算子与Sparse Attention算子,实现了高效适配。

产品更新开源生态部署/工程
18:08
IT之家(RSS)
25
Zondision 发布 ZIMO1 裸眼 3D 显示器:光场原理,内置 3D 芯片

Zondision发布ZIMO1裸眼3D显示器,采用光场原理并内置专用3D处理芯片。该显示器配备27英寸4K面板,刷新率为60Hz,亮度达450nits,覆盖100% sRGB色域。其双眼追踪速率达120Hz,兼容OpenXR API及多数主流沉浸式输入设备,支持2D转3D内容工具,可与虚幻、Unity、Blender等软件及多平台游戏协同工作。

产品更新其他
18:08
IT之家(RSS)
33
阿维塔发布声明公开驳斥 AIGC 假图,保留追究法律责任权利

阿维塔科技法务部发布声明,驳斥近期网络流传的利用AIGC技术生成的虚假品牌图片,确认为虚假信息。公司强调从未制作或授权此类内容,虚假图片严重侵害品牌声誉并误导用户,保留对相关转载传播行为追究法律责任的权利。作为长安汽车、华为与宁德时代联合打造的高端智能电动汽车品牌,阿维塔呼吁用户及媒体以官方信息为准,不传谣、不信谣,共同维护清朗网络空间。

现象/趋势行业动态
17:08
IT之家(RSS)
37
腾讯面向汽车行业发布全场景智能体开放平台,可化身专属 AI 导游、提供选品下单取餐全链路服务等

腾讯正式发布面向汽车行业的“出行全场景智能体开放平台”。该平台围绕通勤、出游、娱乐等高频率场景,提供开箱即用的智能体产品,例如随行点单智能体可完成从选品、下单到取餐的全链路服务;随行向导智能体能化身专属AI导游,并新增车队协同管理功能。底层技术方面,平台升级了端云协同座舱大模型架构,端侧采用0.8B轻量化VLM模型确保毫秒级响应,云端则率先接入混元最新大模型Hy3 preview。目前腾讯已服务超过100家车企及出行科技公司。

智能体行业动态部署/工程
17:08
IT之家(RSS)
30
抖音持续治理色情低俗导流行为,配合有关部门再抓捕三名犯罪嫌疑人

抖音近期配合有关部门抓捕三名犯罪嫌疑人,持续打击色情低俗导流行为。平台发现两类突出违规:一是购买账号发布低俗内容,为第三方色情应用导流;二是利用隐晦暗语分享“AI制作大尺度内容”教程并进行违规导流。近两周已处置相关违规内容3000余条。今年以来,平台针对AI生成色情低俗内容已处置4.2万条,处罚账号1.4万个。抖音表示将持续升级技术识别能力,打击各类新型违规。

安全/对齐行业动态
17:08
IT之家(RSS)
37
MINIX 发布英伟达 Jetson Thor 平台 GenAI 迷你主机,搭载双万兆网口

硬件制造商MINIX于4月23日发布了两款基于英伟达Jetson Thor平台的GenAI迷你工作站T4000/T5000。该系列产品搭载Arm Neoverse-V3AE CPU和英伟达“Blackwell”GPU,配备最高128GB LPDDR5X统一内存,具备高达2070 TFLOPS的FP4稀疏算力,可支持70亿至700亿参数的大语言模型本地推理。主机尺寸紧凑,内置双涡轮风扇散热,预装1TB PCIe Gen4固态硬盘,并提供了双10GbE万兆网口、Wi-Fi 6E、蓝牙5.3、多个HDMI和USB接口等丰富的外部连接选项。

产品更新端侧部署/工程
16:08
IT之家(RSS)
63
超万名员工用上 GPT-5.5,黄仁勋敦促英伟达内部全员使用 OpenAI Codex

英伟达宣布内部已部署由 OpenAI GPT-5.5 驱动的 Codex 工具,运行于 GB200 NVL72 系统,超 10000 名员工在工程、营销等多个团队使用。该系统带来显著效率提升:每百万 token 成本降低 35 倍,每兆瓦每秒 token 输出量增加 50 倍。调试工作从几天缩短至几小时,复杂实验可一夜完成。CEO 黄仁勋敦促全员使用,称其标志着 AI 时代的到来。

OpenAI编码行业动态
16:08
IT之家(RSS)
32
宝马基于千问大模型推出座舱智能体,新世代 BMW iX3 长轴距版首搭

宝马在北京车展推出基于阿里巴巴千问大模型定制的座舱智能体,包括“用车专家”“出行伙伴”和“百科达人”三个AI智能体。这些智能体从传统语音助手的被动响应升级为主动决策,能精准处理复杂出行需求。首款搭载车型为新世代BMW iX3长轴距版,全新BMW 7系随后跟进。“出行伙伴”支持自然语言复合需求,即时生成个性化行程方案;“用车专家”深度集成20万条宝马专业知识库,提供真人顾问级解答。车展上,宝马集团展示16款新车型,其中4款全球首发、8款中国首发。

智能体端侧行业动态
16:08
IT之家(RSS)
43
Claude Code 产品负责人 Cat Wu:人们对 AI 高速发展感到焦虑

Anthropic 公司 Claude Code 产品负责人 Cat Wu 指出,AI 领域的激烈竞争导致各大公司以前所未有的速度发布新功能,功能领域也高度重叠,这使用户产生了焦虑和错失恐惧症,感觉必须每日关注更新才能跟上节奏。她透露,仅今年前三个月 Anthropic 就推出了超过 45 项新功能。然而,快速发布也引发了问题,例如近期用户抱怨 Claude Code 回应质量下降,公司否认故意降质并已发现三个潜在问题。Cat Wu 希望未来能打造更“减压”的产品,帮助用户轻松学习,而非在快速迭代中疲于追赶。

Anthropic大佬观点现象/趋势
16:08
IT之家(RSS)
28
英特尔副总裁:E 核游戏性能不弱,表现不如 AMD 只是因为软件未针对其 CPU 优化

英特尔副总裁罗伯特·霍尔洛克表示,英特尔与AMD在PC游戏性能上的差距主要源于软件优化不足,而非硬件缺陷。他指出,关闭能效核(E核)对游戏性能的影响微乎其微,仅约1%。部分游戏和引擎因未针对混合架构优化,导致核心调度出错,可能损失10%-30%的性能。他强调,若软件优化到位,英特尔CPU的游戏性能有望接近或超越AMD Ryzen X3D系列。

其他行业动态
16:08
IT之家(RSS)
51
小马智行宣布 Robotaxi 成本降至 23 万元内,2026 北京车展首发 L4 级无人轻卡

在2026北京车展上,小马智行宣布其2027版L4级Robotaxi整车总成本将降至23万元以内,低于入门级特斯拉Model 3,并计划推出海外版本以实现千台以上部署。公司预计到2026年,其Robotaxi将落地全球超20座城市,总规模突破3000台。同时,小马智行发布了全球首款全车规、全冗余的L4级无人驾驶轻卡,该车型单公里货运成本比人工降低40-50%,货箱容积是低速无人配送车的2.6倍。

具身智能行业动态部署/工程
16:08
IT之家(RSS)
55
华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务

DeepSeek-V4预览版正式上线并开源。华为云宣布首发适配,在其MaaS平台上为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。该服务通过适配分层注意力压缩机制、提供多种昇腾高性能融合算子等优化,支持原生100万Token长上下文的高性能推理。V4系列包含1.6万亿参数的旗舰版Pro和2840亿参数的经济型Flash两个MoE架构版本,均原生支持100万Token上下文。新技术大幅降低了长上下文下的计算和显存需求。官方表示V4-Pro体验优于Anthropic Sonnet 4.5,但仍落后于GPT-5.4等前沿闭源模型。

DeepSeek产品更新部署/工程
15:08
IT之家(RSS)
65
特斯拉赛博无人驾驶电动车 Cybercab 在北美投产:无需方向盘、踏板、后视镜

特斯拉宣布其AI驱动的无人驾驶电动车Cybercab在北美正式投产。该车型最大特点是完全取消了方向盘、踏板和后视镜,专为自动驾驶设计。首辆无方向盘版本已于今年2月下线,连续量产于本月启动,目前生产线同时制造无方向盘和带方向盘的两种版本。马斯克将其定位为特斯拉未来的核心走量车型。不过,完全无监督的自动驾驶技术尚未攻克,其FSD功能时间表曾多次延迟。

具身智能行业动态部署/工程
15:08
IT之家(RSS)
34
火山引擎发布新一代汽车 AI 解决方案,豆包大模型搭载超 700 万辆车

在北京车展上,火山引擎发布了基于Agentic AI架构的新一代汽车AI解决方案,包含AI座舱套件和豆包座舱助手两大方案。新方案通过一个AI大脑深度联动整车功能域,实现了感知、推理、执行、记忆、学习的一体化闭环,颠覆了上一代架构。其中,AI座舱套件支持车企灵活配置,豆包座舱助手则为完整产品级交付,将于年内量产。目前,搭载豆包大模型的智能汽车已超700万辆,覆盖50多个品牌,日均完成超3000万次座舱交互。

智能体产品更新部署/工程
15:08
IT之家(RSS)
57
华为:昇腾超节点系列产品全面支持 DeepSeek V4

华为宣布其昇腾超节点全系列产品已全面支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术,实现了高吞吐、低时延的推理部署。具体性能上,DeepSeek V4-Pro模型在8K输入下,单卡解码吞吐达4700TPS,时延约20ms;V4-Flash模型单卡吞吐为1600TPS,时延约10ms。此外,昇腾A3超节点系列也全面适配,并提供训练参考实现;基于64卡配置,V4-Flash模型在8K/1K场景下单卡吞吐超过2000TPS。

DeepSeek产品更新部署/工程
15:08
IT之家(RSS)
55
陈立武:AI 推理趋势利好英特尔,CPU 与 GPU 配比从 1:8 迈向 1:1

英特尔CEO陈立武指出,AI工作负载正从训练转向推理,这显著提升了CPU的重要性。CPU与GPU的配比已从过去的1:8收紧至约1:4,未来有望进一步趋向1:1的平衡。在推理场景中,CPU在任务编排和控制调度方面更具优势。行业数据显示,AI智能体时代每吉瓦所需的CPU核心数可能从3000万激增至1.2亿,增长4倍。受此推动,英特尔第一季度数据中心与AI部门营收同比增长22%,达到51亿美元。

行业动态部署/工程
15:08
IT之家(RSS)
31
北京现代艾尼氪金星全球首秀,全新 IONIQ V 首发亮相北京车展

在2026北京车展上,北京现代艾尼氪金星(IONIQ V)概念车全球首秀,标志着IONIQ品牌正式进入中国市场。该品牌未来在华车型均以行星命名,并由中国设计团队原创打造。IONIQ V基于E-GMP纯电平台,支持纯电/增程双动力,具备800V快充能力。其车身尺寸为长4900mm、宽1890mm、高1470mm,轴距2900mm,内饰配备27英寸超薄4K大屏。车辆在智能化层面融合了Momenta、高通芯片、宁德时代电池及文心大模型等技术。此外,现代汽车计划将中国生产的汽车出口至中东、英国等市场。

其他行业动态
14:45
Hacker News 热门(buzzing.cc 中文翻译)
56
Show HN: Agent Vault - 面向代理的开源凭证代理和存储库

Infisical团队开源了Agent Vault,这是一个专为AI代理设计的凭证代理与存储库。该项目旨在安全地管理AI代理在运行时所使用的API密钥、数据库密码等敏感凭证,防止其直接暴露在代码或环境中。Agent Vault作为代理与外部服务之间的中间层,集中处理身份验证,从而提升安全性并简化凭证管理流程。该项目已在GitHub发布,并在Hacker News上获得了101点关注度。

智能体开源/仓库部署/工程
14:08
IT之家(RSS)
47
小米支付服务 Skill 上线:开发者三步可完成接入,支持微信支付、支付宝等

小米澎湃OS开发者平台正式推出支付服务Skill能力,支持主流AI开发工具。该服务通过标准化接口,帮助商户快速对接收银台及支付功能,内置完整流程与适配方案,大幅简化开发周期。开发者仅需下载安装Skill、通过自然语言交互接入支付能力、自动联调测试三步即可完成接入,一次性支持小米支付、微信支付、支付宝等多种支付方式,并覆盖App/H5/小程序支付、拆单、退款等多项功能。

MCP/工具产品更新部署/工程
14:08
IT之家(RSS)
53
寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行

寒武纪宣布已完成对深度求索最新开源模型DeepSeek-V4的Day 0适配,模型发布当日即可稳定运行。适配针对其285B和1.6T两个版本,代码已开源。通过自研高性能算子库对模型新结构进行专项加速,并在vLLM推理框架中全面支持5D混合并行、低精度量化等技术,以优化词元吞吐和端到端推理效率。同时,深度挖掘硬件特性以最小化通信开销,提升分布式推理性能。DeepSeek-V4拥有百万字上下文,能力领先,现已开放体验和API调用。

DeepSeek开源生态行业动态部署/工程