AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 165 条
全部一手资讯X论文
标签「DeepSeek」清除
5月19日周二
15:51IT之家(RSS)52腾讯云智能体平台 Hy3 preview 与 DeepSeek-V4-Pro 模型结束免费公测转商用
11:45IT之家(RSS)16长安第四代逸动、CS75PLUS 蓝鲸超擎车型 5 月 23 日上市,百公里油耗 2.98L
5月17日周日
02:32Hacker News 热门(buzzing.cc 中文翻译)60DeepSeek-V4-Flash 意味着大型语言模型(LLM)的引导技术再次引起关注
01:32Nathan Lambert:Interconnects(RSS)53最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。
5月14日周四
15:40IT之家(RSS)46DeepSeek 专家模式已无法上传文件,官方提示资源紧张
08:00HuggingFace Daily Papers(社区热门论文)57GQLA:面向硬件自适应的大语言模型解码的分组查询潜在注意力
5月13日周三
07:39IT之家(RSS)27IT早报 0513:腾讯收购喜马拉雅获市监总局附条件批准;宇树发布全球首款载人机甲;微信不会开发已读功能
5月12日周二
15:36IT之家(RSS)46DeepSeek 回应上线聊天记录搜索功能:正在灰度测试中
5月10日周日
07:32IT之家(RSS)55IT早报 0510:SK海力士回应人均高额奖金传闻;多家车企辟谣锁电约谈;DeepSeek开放识图功能
5月9日周六
17:32IT之家(RSS)62市场人士回应"DeepSeek 和阿里谈崩了":阿里应该没有进行谈判
09:29IT之家(RSS)66DeepSeek 大范围开放"识图模式",正式跨入图文交互时代
07:29IT之家(RSS)14IT早报 0509:工信部批复 6G 技术试验频率;美团、淘宝闪购、京东已基本取消超时扣款;8 家新能源车企 OTA 锁电被约谈…
5月8日周五
20:22IT之家(RSS)67消息称 DeepSeek 寻求 500 亿元融资,下月将发布 V4.1 更新
18:20IT之家(RSS)56(已恢复)DeepSeek 服务大宕机,网页 / API 暂不可用
13:36Hacker News 热门(buzzing.cc 中文翻译)57ZAYA1-8B 在数学计算方面与 DeepSeek-R1 表现相当,且活跃参数少于 10 亿
03:06Hacker News 热门(buzzing.cc 中文翻译)74精选DeepSeek 4:适用于 Metal 的 Flash 本地推理引擎
5月7日周四
19:38The Decoder:AI News(RSS)56美国与中国正考虑就人工智能举行正式会谈
08:16IT之家(RSS)23漫步者 Lolli5 ANC 智能触控大圆屏耳机开售:50dB 降噪,539 元
08:16IT之家(RSS)54IT早报 0507:三星在中国大陆停销所有家电产品;DeepSeek获国家大基金领投磋商;安卓小机器人变透明形象;三星电子市值破万亿美元
5月6日周三
21:32The Decoder:AI News(RSS)63Deepseek 估值接近450亿美元,中国国家芯片基金领投本轮融资
20:16IT之家(RSS)53微软警告有黑客假借 DeepSeek V4 名义,在 GitHub 建立虚假仓库传播木马
15:16IT之家(RSS)64估值近 450 亿美元,DeepSeek 首轮融资获"国家大基金"领投磋商
5月3日周日
16:21The Decoder:AI News(RSS)54美国政府基准测试称中国在AI竞赛中落后,但独立数据并不支持
5月1日周五
08:10IT之家(RSS)45IT早报 0501:追觅 CEO 要求员工开通社媒账号;OPPO 将推四曲面手机;iPhone 18 Pro 相机大升级
4月30日周四
23:10IT之家(RSS)72精选DeepSeek 公布多模态模型技术报告
4月29日周三
17:33IT之家(RSS)52DeepSeek 终于能"看图"了!灰度"识图模式",图片理解功能内测
4月28日周二
13:33IT之家(RSS)46DeepSeek-V4-Pro 旗舰模型限时 2.5 折优惠官宣延期,活动持续至今年 5 月 31 日
10:25IT之家(RSS)65DeepSeek-V4 技术报告公开作者名单,多位核心骨干离职去大厂
4月27日周一
15:19IT之家(RSS)57中国信通院正式启动 DeepSeek V4 国产化适配测试工作
08:18IT之家(RSS)38IT早报 0427:追觅 CEO 炮轰小红书;苹果新CEO将主持折叠iPhone发布;华为尊界新车将达200万级
4月26日周日
23:17IT之家(RSS)63降至原有价格 1/10,DeepSeek API 输入缓存降价
14:20IT之家(RSS)53今天起,DeepSeek V4 成 OpenClaw 默认模型
12:20IT之家(RSS)49国家超算互联网推出 DeepSeek-V4 限时免费对话服务
4月25日周六
23:26IT之家(RSS)53DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前
18:14IT之家(RSS)30安卓首发:荣耀 YOYO 率先接入 DeepSeek-V4 大模型
16:14IT之家(RSS)63英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user
4月24日周五
16:08IT之家(RSS)55华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务
15:08IT之家(RSS)57华为:昇腾超节点系列产品全面支持 DeepSeek V4
14:08IT之家(RSS)53寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行
10:55公众号:DeepSeek(深度求索)59DeepSeek-V4 预览版:迈入百万上下文普惠时代
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月19日
15:51
IT之家(RSS)
52
腾讯云智能体平台 Hy3 preview 与 DeepSeek-V4-Pro 模型结束免费公测转商用

腾讯云宣布,其智能体开发平台提供的 Hy3 preview 与 DeepSeek-V4-Pro 模型,将于2026年5月27日10:00起结束限时免费公测,转为正式商用服务。后续将根据模型调用量按需计费。该平台采用“订阅+增购包”的收费模式,提供免费版及多款付费套餐(如专业版188元/月、企业版4880元/月),用户还可选购预付费资源包,年付套餐可享8.33折优惠。

DeepSeek行业动态部署/工程
11:45
IT之家(RSS)
16
长安第四代逸动、CS75PLUS 蓝鲸超擎车型 5 月 23 日上市,百公里油耗 2.98L

长安第四代逸动与CS75PLUS蓝鲸超擎车型将于5月23日全球同步上市。两款新车均搭载无需外插充电的蓝鲸超擎混动系统,热效率近45%,电机效率达98.1%。第四代逸动共三款车型,抢订价7.99万至9.49万元;第四代CS75PLUS抢订价11.69万至13.49万元,并推出10.99万元“真香型”。新车标配AI大模型语音系统与智能驾驶辅助功能,官方实测百公里城区油耗分别低至2.98L和3.98L。

DeepSeek其他
5月17日
02:32
Hacker News 热门(buzzing.cc 中文翻译)
60
DeepSeek-V4-Flash 意味着大型语言模型(LLM)的引导技术再次引起关注

DeepSeek-V4-Flash发布,这一大型语言模型新版本使得LLM引导技术重新成为关注焦点。引导技术涉及通过向量控制模型输出方向,此次更新引发科技界对模型可控性的讨论。在Hacker News上,相关帖子获得105点的高分,显示社区对此话题的热烈反响,标志着AI领域对定向优化技术的持续探索。

DeepSeek安全/对齐推理现象/趋势
01:32
Nathan Lambert:Interconnects(RSS)
53
最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

本月开源AI模型领域迎来密集发布,包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新,反映出开源社区当前高速迭代的竞争态势。

DeepSeekGoogle大佬观点开源生态
5月14日
15:40
IT之家(RSS)
46
DeepSeek 专家模式已无法上传文件,官方提示资源紧张

DeepSeek的“专家模式”目前已无法上传文件,官方提示原因为“资源紧张,不支持文件上传”。经测试,该功能在网页端和App中均已下线。不过,“快速模式”的文件和图片上传功能仍保持正常,但图片处理仅限于文字识别。此外,DeepSeek正在灰度测试历史聊天记录查询功能,部分用户已可在网页版和移动端App中通过关键词搜索历史对话内容。

DeepSeek产品更新
08:00
HuggingFace Daily Papers(社区热门论文)
57
GQLA:面向硬件自适应的大语言模型解码的分组查询潜在注意力

本研究提出分组查询潜在注意力(GQLA),对DeepSeek-V2/V3中的多头潜在注意力(MLA)进行最小修改,使其在一套权重上暴露两种等效解码路径:与MLA相同的MQA吸收路径,以及带有每组扩展缓存的GQA路径。运行时可根据硬件自动选择路径,无需重新训练。单一的GQLA权重能同时适配H100(采用MQA吸收)与H20(采用GQA及多令牌预测)的硬件性能上限,并在GQA路径上支持高达8路的零冗余张量并行。通过扩展TransMLA为TransGQLA,可将预训练的GQA模型转换为GQLA模型。在LLaMA-3-8B上的实验表明,其MQA吸收路径将每令牌的KV缓存压缩至GQA基线的28.125%,同时在分组路径上结构性保留了GQA级别的流量效率。

DeepSeek推理论文/研究部署/工程
5月13日
07:39
IT之家(RSS)
27
IT早报 0513:腾讯收购喜马拉雅获市监总局附条件批准;宇树发布全球首款载人机甲;微信不会开发已读功能

市场监管总局附条件批准腾讯收购喜马拉雅股权案,要求腾讯不得提价、降低免费内容比例或达成独家版权。宇树科技发布全球首款量产载人变形机甲GD01,售价390万元起。腾讯张军明确表示,微信不会开发已读功能和访客功能。此外,DeepSeek聊天记录搜索功能已开始灰度测试,理想汽车发布自研马赫M100芯片,华为鸿蒙新开发者版开始推送。

DeepSeek产品更新政策/监管行业动态
5月12日
15:36
IT之家(RSS)
46
DeepSeek 回应上线聊天记录搜索功能:正在灰度测试中

DeepSeek已上线聊天记录搜索功能,目前正处于灰度测试阶段。用户将DeepSeek App更新至2.1.0版本后,可在侧边栏顶部使用“搜索聊天内容”搜索框,输入关键词即可查找并定位到多条相关历史对话。网页版用户也可通过点击左上角的放大镜按钮进行搜索。该功能尚未全量推送,未被覆盖的用户需检查应用是否为最新版本。

DeepSeek产品更新搜索
5月10日
07:32
IT之家(RSS)
55
IT早报 0510:SK海力士回应人均高额奖金传闻;多家车企辟谣锁电约谈;DeepSeek开放识图功能

SK海力士回应“员工人均奖金610万元”传闻,称今明年度业绩未定,奖金规模无法预测。中国汽车工业协会辟谣“8家新能源车企因锁电被约谈”为不实信息。DeepSeek大范围开放“识图模式”,具备文物识别、逻辑题解答、截图转代码等多模态能力。此外,iPhone 18 Pro系列被曝灵动岛将缩小25%;张汝京指出全球超80%半导体需求来自成熟制程;比亚迪腾势N9闪充版等新车公布预售及发布信息。

DeepSeek多模态行业动态
5月9日
17:32
IT之家(RSS)
62
市场人士回应"DeepSeek 和阿里谈崩了":阿里应该没有进行谈判

市场人士回应“DeepSeek与阿里谈崩”传闻,称阿里巴巴应该并未参与相关谈判。近期,AI公司DeepSeek多次被曝正寻求首轮巨额外部融资。据《金融时报》报道,国家集成电路产业投资基金正洽谈领投其首轮融资,公司估值可能达到约450亿美元。另有消息称,DeepSeek此轮融资目标高达500亿元人民币,若成功落地,将是中国AI公司迄今规模最大的一轮融资。

DeepSeek行业动态
09:29
IT之家(RSS)
66
DeepSeek 大范围开放"识图模式",正式跨入图文交互时代

DeepSeek已广泛开放其“识图模式”供用户体验。该功能具备深度图片理解能力,不仅能识别文物、解答空间推理题、理解网络梗图,还能将截图中的代码或UI界面还原为可交互的HTML代码。其核心技术“以视觉原语思考”框架,通过融入点、边界框等视觉元素提升逻辑准确性,且处理效率高,单图token消耗远低于主流模型。目前该模式仍处内测,存在知识库更新滞后、处理反直觉图形不稳定等不足,且暂不支持图像生成或视频理解。

DeepSeek产品更新多模态
07:29
IT之家(RSS)
14
IT早报 0509:工信部批复 6G 技术试验频率;美团、淘宝闪购、京东已基本取消超时扣款;8 家新能源车企 OTA 锁电被约谈…

工信部批复6GHz频段用于6G技术试验。在算法治理方面,美团、淘宝闪购、京东等平台已基本取消超时扣款,取得初步成效。因OTA锁电投诉激增,8家新能源车企被约谈,其中3家被立案调查。此外,华为Pura X Max折叠屏手机首销10天激活超20万台,创历史纪录;任天堂宣布Switch 2游戏机将于9月起在欧美涨价50美元;滴滴出行将网约车订单抽成上限降至27%。苹果AI AirPods和DeepSeek大额融资的消息也备受关注。

DeepSeek其他
5月8日
20:22
IT之家(RSS)
67
消息称 DeepSeek 寻求 500 亿元融资,下月将发布 V4.1 更新

据知情人士消息,DeepSeek正寻求首轮融资,目标高达500亿元人民币,若成功将成中国AI公司迄今最大规模融资。创始人兼CEO梁文锋计划提供最大一笔资金。融资推动公司加快商业化节奏,计划提高模型发布频率以接近行业标准。同时,DeepSeek将于6月发布V4模型的更新版本V4.1。

DeepSeek开源生态模型发布行业动态
18:20
IT之家(RSS)
56
(已恢复)DeepSeek 服务大宕机,网页 / API 暂不可用

DeepSeek网页和API服务于5月8日下午发生重大中断,官方状态页面显示为“Major Outage”,服务暂不可用。用户尝试对话时收到“服务器繁忙,请稍后重试”的提示。官方随后确认已识别问题并实施修复。至18:06,官方宣布问题已修复,网页和API服务恢复可用,但经测试,网页端的“识图模式”功能仍未出现。

DeepSeek行业动态
13:36
Hacker News 热门(buzzing.cc 中文翻译)
57
ZAYA1-8B 在数学计算方面与 DeepSeek-R1 表现相当,且活跃参数少于 10 亿

ZAYA1-8B 是一个新发布的开源人工智能模型,在数学计算任务中性能与 DeepSeek-R1 相当。该模型的活跃参数数量少于10亿,突显了在保持高性能的同时实现更高参数效率的突破。这一进展意味着模型在计算资源和存储需求上更为高效,可能降低部署成本并加速推理过程,为资源受限环境提供实用解决方案。ZAYA1-8B 的开发展示了在AI模型优化领域的重要进步,其开源性质有望推动进一步研究和应用。

DeepSeek推理模型发布编码
03:06
Hacker News 热门(buzzing.cc 中文翻译)
精选74
DeepSeek 4:适用于 Metal 的 Flash 本地推理引擎

DeepSeek 4 Flash 本地推理引擎正式发布,这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型,实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能,降低了延迟与内存占用。该项目已在 GitHub 开源,并在 Hacker News 上获得了关注。

DeepSeek开源/仓库推理端侧

推荐理由:antirez 写的引擎让 DeepSeek 4 在 Mac 本地跑出近乎 Flash 的速度,而且代码极其精简,做本地推理的开发者应该立刻克隆下来跑一下。
5月7日
19:38
The Decoder:AI News(RSS)
56
美国与中国正考虑就人工智能举行正式会谈

据《华尔街日报》报道,美国与中国正在探索就人工智能领域举行官方会谈。此举表明两国在AI技术竞争日益激烈的背景下,可能寻求建立沟通渠道以讨论相关风险、标准或治理框架。目前会谈的具体议题与时间表尚未披露。

DeepSeekOpenAI政策/监管
08:16
IT之家(RSS)
23
漫步者 Lolli5 ANC 智能触控大圆屏耳机开售:50dB 降噪,539 元

漫步者 Lolli5 ANC 智能触控大圆屏耳机已上市,售价539元,提供沙滩白、礁石黑、落日橙三种配色。其最大亮点是充电盒配备智能触控屏,可显示时间并控制音乐、拍照。耳机支持50dB深度、5kHz宽度的ANC自适应降噪和3+3麦智能通话降噪,拥有双Hi-Res金标认证。采用13mm双复合LCP液晶振膜单元,支持蓝牙6.0、双设备连接和IP55级防尘防水。此外,还集成了豆包与DeepSeek双脑问答、会议录音及App实时互译等智能功能。

DeepSeek产品更新语音
08:16
IT之家(RSS)
54
IT早报 0507:三星在中国大陆停销所有家电产品;DeepSeek获国家大基金领投磋商;安卓小机器人变透明形象;三星电子市值破万亿美元

三星电子宣布在中国大陆市场停止销售所有家电产品,但售后服务照常提供。DeepSeek正与国家集成电路产业投资基金洽谈首轮融资,估值约450亿美元。安卓系统官宣将于5月13日揭晓新形象,小机器人变为彩色半透明设计。三星电子市值突破1万亿美元,成为亚洲第二家万亿美元市值企业。此外,华为发布HarmonyOS 6新功能及超薄平板,字节跳动推出全模态理解模型,携程否认大裁员传闻,星空卫视将暂停卫星传输服务。

DeepSeek行业动态
5月6日
21:32
The Decoder:AI News(RSS)
63
Deepseek 估值接近450亿美元,中国国家芯片基金领投本轮融资

据《金融时报》报道,中国人工智能实验室Deepseek正接近完成一轮新的融资,其估值可能达到约450亿美元。此轮融资由中国国家芯片基金领投,标志着国家级资本对本土前沿AI企业的大力支持。若融资完成,Deepseek的估值将跻身全球AI独角兽前列。

DeepSeek行业动态
20:16
IT之家(RSS)
53
微软警告有黑客假借 DeepSeek V4 名义,在 GitHub 建立虚假仓库传播木马

微软威胁情报团队发出警告,有黑客正冒充DeepSeek V4模型的名义在GitHub创建虚假仓库,诱骗用户下载实为Vidar、GhostSocks等木马的“模型文件”。此次属于“蹭热点”钓鱼攻击,DeepSeek官方并未被入侵。官方强调,DeepSeek V4仅通过API和Hugging Face发布,未在GitHub提供模型仓库。用户若搜索“DeepSeek v4 weights GitHub”等关键词,可能优先看到这些恶意仓库。目前GitHub已关闭部分恶意仓库并封禁账号,以阻止恶意软件进一步传播。

DeepSeek安全/对齐行业动态
15:16
IT之家(RSS)
64
估值近 450 亿美元,DeepSeek 首轮融资获"国家大基金"领投磋商

国家集成电路产业投资基金正洽谈领投DeepSeek首轮融资,公司估值有望达450亿美元。与数周前200亿美元估值相比,当前估值已翻倍。除国家大基金外,腾讯等机构也在潜在投资者名单中,创始人梁文锋也将以个人名义出资。若交易完成,这将是国家大基金首次公开投资本土大语言模型企业,该基金2024年募集约470亿美元,主要投向半导体设备与材料领域。

DeepSeek开源生态行业动态
5月3日
16:21
The Decoder:AI News(RSS)
54
美国政府基准测试称中国在AI竞赛中落后,但独立数据并不支持

美国政府机构评估称中国在人工智能竞赛中落后八个月,但独立数据并未证实这一差距。当前美国实验室持续追求更智能的模型,而中国玩家如深度求索(Deepseek)等提供的价格优势可能成为更关键的竞争筹码。这场竞赛的衡量标准正从单纯的技术指标扩展到包括成本效益在内的综合维度。

DeepSeek现象/趋势评测/基准
5月1日
08:10
IT之家(RSS)
45
IT早报 0501:追觅 CEO 要求员工开通社媒账号;OPPO 将推四曲面手机;iPhone 18 Pro 相机大升级

本期IT早报主要内容包括:追觅科技CEO要求全体员工开通社交媒体账号并发布视频;OPPO计划下半年推出效仿苹果风格的四曲面设计手机;iPhone 18 Pro系列或将迎来史上最大相机硬件升级。此外,极越汽车关联主体进入合并重整程序,DeepSeek发布多模态模型技术报告,央视曝光部分充电头功率虚标,宇树发布起售价2.69万元的双臂人形机器人,比亚迪与高德地图达成充电合作,支付宝等17家支付机构牌照获续展,华为鸿蒙新版本占比提升,以及小米大屏旗舰手机预计5月下旬发布。

DeepSeek多模态推理行业动态
4月30日
23:10
IT之家(RSS)
精选72
DeepSeek 公布多模态模型技术报告

DeepSeek发布了多模态大模型及技术报告,提出创新的“基于视觉原语的思考”框架。该框架将点、边界框等视觉元素作为推理的基本单元,旨在解决多模态模型在空间参照任务中存在的“参照鸿沟”核心问题,使模型能将抽象认知锚定到图像的具体坐标上。尽管模型规模紧凑且图像标记预算较低,其在多项挑战性计数和空间推理基准测试上的性能,可与GPT-5.4等前沿模型相媲美。

DeepSeek多模态推理论文/研究

推荐理由:DeepSeek 把视觉概念直接变成推理单元,绕开了语言描述空间的先天模糊,在空间推理上把自家紧凑模型拉到和 GPT-5.4 一个水平,做多模态应用的人值得细读。
4月29日
17:33
IT之家(RSS)
52
DeepSeek 终于能"看图"了!灰度"识图模式",图片理解功能内测

DeepSeek已灰度测试“识图模式”,新增多模态图片理解功能,用户可上传图片并获取描述。该模式与“快速模式”“专家模式”并列,并非简单OCR文字识别。部分测试用户反馈响应速度很快,类似flash;但亦有用户遇到“识图模式暂不可用”提示。网络响应内容显示该功能模型类型为“vision”,状态为“图片理解功能内测中”。

DeepSeek产品更新多模态
4月28日
13:33
IT之家(RSS)
46
DeepSeek-V4-Pro 旗舰模型限时 2.5 折优惠官宣延期,活动持续至今年 5 月 31 日

DeepSeek宣布将其旗舰模型DeepSeek-V4-Pro的API限时2.5折优惠活动延长至2026年5月31日。同时,公司进行了多项价格与模型调整:全系列模型的输入缓存命中价格降至首发价的十分之一;deepseek-chat与deepseek-reasoner两个模型名将被弃用,其功能分别由deepseek-v4-flash的非思考与思考模式承接。目前,DeepSeek-V4-Pro的缓存命中输入价格低至每百万tokens 0.025元。该模型采用混合专家架构,总参数量达1.6万亿,支持百万级上下文窗口。官方表示,受高端算力限制,当前Pro版本服务吞吐有限,预计下半年昇腾950超节点批量上市后,其价格还将大幅下调。

DeepSeek行业动态部署/工程
10:25
IT之家(RSS)
65
DeepSeek-V4 技术报告公开作者名单,多位核心骨干离职去大厂

DeepSeek近日公开了V4技术报告,近300人的作者名单显示有10人标注“已离职”,其中包括王炳宣、魏浩然等核心骨干。自2025年下半年以来,公司至少5名核心研发成员确认离职,分别加入腾讯、小米、字节跳动及元戎启行等企业,其离职方向覆盖了基座模型、推理、OCR和多模态四条核心技术主线。同期,DeepSeek-V4预览版正式上线并开源,该模型具备百万字上下文,在多项能力上处于领先地位。

DeepSeek现象/趋势行业动态
4月27日
15:19
IT之家(RSS)
57
中国信通院正式启动 DeepSeek V4 国产化适配测试工作

中国信通院宣布启动DeepSeek V4国产化适配测试,旨在推动该模型与国产软硬件的深度协同及产业应用。测试将依托重点实验室和AISHPerf基准体系,面向芯片、服务器、一体机、集群、开发框架及工具链等产品系统展开。评估覆盖模型全系列,聚焦推理、微调等流程,从适配易用性、功能完备性、性能及成本多维度进行,并新增长序列处理、代码生成与理解等测评方向,以构建立体化评测体系。此前,多家国产硬件厂商已在模型发布当日完成了“0day适配”。

DeepSeek行业动态部署/工程
08:18
IT之家(RSS)
38
IT早报 0427:追觅 CEO 炮轰小红书;苹果新CEO将主持折叠iPhone发布;华为尊界新车将达200万级

追觅科技创始人俞浩发文炮轰小红书价值观与盈利模式“有毒”。苹果新任CEO特努斯将于9月主持可折叠iPhone发布会,公司未来计划进入约10个新产品类别。华为余承东透露,尊界品牌一款高定新车价格将达200万元级别,计划6月底发布。此外,人类马拉松成绩首次突破2小时大关;砺算科技GPU通过微软WHQL认证,成为国内首家;DeepSeek宣布其API输入缓存命中价格大幅下调。

DeepSeek行业动态部署/工程
4月26日
23:17
IT之家(RSS)
63
降至原有价格 1/10,DeepSeek API 输入缓存降价

DeepSeek宣布全系API服务的输入缓存命中价格即日起降至原有价格的十分之一。其中,DeepSeek-V4-Pro模型的输入缓存命中价格从每百万tokens 1元降至0.025元,输入缓存未命中价格从12元降至3元,输出价格从24元降至6元。DeepSeek-V4-Flash模型的输入缓存命中价格从0.2元降至0.02元。此外,Pro模型在5月5日前还可叠加享受2.5折限时优惠。

DeepSeek行业动态部署/工程
14:20
IT之家(RSS)
53
今天起,DeepSeek V4 成 OpenClaw 默认模型

OpenClaw 2026.4.24版本发布,重磅接入DeepSeek V4模型。其中,DeepSeek V4 Flash被设为默认大模型,V4 Pro也已上线模型库。V4 Pro拥有1.6万亿总参数和49B激活参数,是全球最大的开源模型;V4 Flash总参数284B,激活参数13B。两者均采用MoE架构,支持100万token上下文,并以MIT协议开源。此次更新还深度整合了Google Meet作为内置插件,支持实时语音通话、会议记录处理与导出。同时,系统修复了多轮工具调用中的逻辑错误,增强了浏览器自动化的稳定性和坐标点击等兜底功能,并优化了插件与模型的架构以降低启动负担。

智能体DeepSeek产品更新
12:20
IT之家(RSS)
49
国家超算互联网推出 DeepSeek-V4 限时免费对话服务

4月26日,国家超算互联网上线DeepSeek-V4限时免费对话服务。用户登录官网即可体验其百万Token超长上下文实时对话能力。此举标志着百万上下文从高端选配变为基础标配,进入普惠时代。该能力可一次性处理如《三体》三部曲总字数的文本,支持全文分析与深度推理。通过国家级算力基础设施与顶级大模型的融合,此举大幅降低了大规模AI应用的门槛与成本,推动AI技术更广泛地赋能千行百业。

DeepSeek产品更新开源生态
4月25日
23:26
IT之家(RSS)
53
DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前

DeepSeek宣布为其旗舰模型DeepSeek-V4-Pro的API提供限时2.5折优惠,活动持续至2026年5月5日。调价后,输入价格(缓存命中)低至每百万tokens 0.25元,缓存未命中为3元,输出价格为6元。该模型采用混合专家架构,拥有1.6万亿总参数,支持百万级上下文。官方表示,受当前高端算力限制,服务吞吐有限,预计下半年昇腾950超节点批量上市后,Pro版本价格还将大幅下调。

DeepSeek行业动态部署/工程
18:14
IT之家(RSS)
30
安卓首发:荣耀 YOYO 率先接入 DeepSeek-V4 大模型

荣耀YOYO成为安卓阵营中首个接入DeepSeek-V4大模型的AI智能体。此次接入带来三大核心升级:模型性能更强、上下文处理长度更长、推理效率更高。用户需将YOYO智能体升级至90.10.28.041及以上版本,并在MagicOS 8.0及以上系统环境中即可抢先体验此次更新。

DeepSeek产品更新端侧
16:14
IT之家(RSS)
63
英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user

英伟达宣布其Blackwell平台已适配DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型。DeepSeek-V4-Pro拥有1.6T总参数量与49B激活参数,定位高级推理;DeepSeek-V4-Flash则为284B总参数量与13B激活参数,主打高效场景。两款模型均支持100万Token上下文窗口与最高38.4万Token输出长度。实测显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72上开箱性能超过150 tokens/sec/user。开发者可通过NVIDIA NIM微服务下载部署,或利用SGLang与vLLM框架进行定制化推理,vLLM支持扩展至100个以上GPU。

DeepSeek产品更新开源生态部署/工程
4月24日
16:08
IT之家(RSS)
55
华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务

DeepSeek-V4预览版正式上线并开源。华为云宣布首发适配,在其MaaS平台上为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。该服务通过适配分层注意力压缩机制、提供多种昇腾高性能融合算子等优化,支持原生100万Token长上下文的高性能推理。V4系列包含1.6万亿参数的旗舰版Pro和2840亿参数的经济型Flash两个MoE架构版本,均原生支持100万Token上下文。新技术大幅降低了长上下文下的计算和显存需求。官方表示V4-Pro体验优于Anthropic Sonnet 4.5,但仍落后于GPT-5.4等前沿闭源模型。

DeepSeek产品更新部署/工程
15:08
IT之家(RSS)
57
华为:昇腾超节点系列产品全面支持 DeepSeek V4

华为宣布其昇腾超节点全系列产品已全面支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术,实现了高吞吐、低时延的推理部署。具体性能上,DeepSeek V4-Pro模型在8K输入下,单卡解码吞吐达4700TPS,时延约20ms;V4-Flash模型单卡吞吐为1600TPS,时延约10ms。此外,昇腾A3超节点系列也全面适配,并提供训练参考实现;基于64卡配置,V4-Flash模型在8K/1K场景下单卡吞吐超过2000TPS。

DeepSeek产品更新部署/工程
14:08
IT之家(RSS)
53
寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行

寒武纪宣布已完成对深度求索最新开源模型DeepSeek-V4的Day 0适配,模型发布当日即可稳定运行。适配针对其285B和1.6T两个版本,代码已开源。通过自研高性能算子库对模型新结构进行专项加速,并在vLLM推理框架中全面支持5D混合并行、低精度量化等技术,以优化词元吞吐和端到端推理效率。同时,深度挖掘硬件特性以最小化通信开销,提升分布式推理性能。DeepSeek-V4拥有百万字上下文,能力领先,现已开放体验和API调用。

DeepSeek开源生态行业动态部署/工程
10:55
公众号:DeepSeek(深度求索)
59
DeepSeek-V4 预览版:迈入百万上下文普惠时代

DeepSeek-V4 预览版发布,支持百万级上下文窗口,提供顶级长文本记忆能力,模型配置选择更灵活。

DeepSeek模型发布
‹ 上一页
12345
下一页 ›