AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「DeepSeek」清除
4月30日周四
19:10阿绎 AYi64百度文心5.1 Preview登顶LMArena文本榜引思考
16:09SemiAnalysis53GB300 NVL72 在 DeepSeek-V4 Pro 上性能超 B200 6.5 倍
08:45向阳乔木67又快又便宜,海外的赞誉越来越多,不要只看Benchmark,看疗效。
04:12SemiAnalysis46DeepSeek v4 Pro发布后性能获显著提升
03:42swyx 🇸🇬64DeepSeek v4以技术自信展现顶尖开源实力
4月29日周三
23:40TestingCatalog News 🗞55DeepSeek发布图像理解测试版功能
22:37歸藏(guizang.ai)54Deepseek 的多模态模型全量了。 目前可以在网页版的识图模式尝试,看起来是一个单独的多模态模型
22:15向阳乔木38DeepSeek 的识图模式速度好快啊!这是新出的吗? 上传图片,让反推提示词,秒出~
22:15向阳乔木47DeepSeek识图速度与网页复刻表现突出
18:12向阳乔木29DeepSeek Web对话能力兼容主流API
17:33IT之家(RSS)52DeepSeek 终于能"看图"了!灰度"识图模式",图片理解功能内测
17:11小互44Deepseek内测多模态 图像识别助力Agent
10:37DeepSeek47DeepSeek-V4-Pro优惠延期至2026年5月
4月28日周二
23:35阿绎 AYi48DeepSeek V4 Pro质量是Claude的85%,价格只有七分之一。
22:10Orange AI43ColaOS产品负责人宣布免费开放DeepSeek V4至五一假期
16:06向阳乔木42一把手工程决定AI模型与应用成败
13:33IT之家(RSS)46DeepSeek-V4-Pro 旗舰模型限时 2.5 折优惠官宣延期,活动持续至今年 5 月 31 日
10:25IT之家(RSS)65DeepSeek-V4 技术报告公开作者名单,多位核心骨干离职去大厂
10:19向阳乔木54DeepSeek V4 Flash技能调用能力显著提升,接近实用
4月27日周一
20:27向阳乔木33模型翻译失误引热议,GOAT直译山羊欠妥
18:53Chubby♨️63谷歌TPU v8与华为昇腾平台:全球AI芯片竞赛开启新阶段
15:19IT之家(RSS)57中国信通院正式启动 DeepSeek V4 国产化适配测试工作
14:21karminski-牙医50DeepSeek-V4测试进度同步及新增大模型工程能力测试
09:19Berryxia.AI49本周AI论文大爆炸!精选Top 10硬核研究
08:18IT之家(RSS)38IT早报 0427:追觅 CEO 炮轰小红书;苹果新CEO将主持折叠iPhone发布;华为尊界新车将达200万级
07:56Rohan Paul45OpenAI发布GPT-5.5,DeepSeek V4开源模型突破长上下文成本瓶颈
00:53DeepSeek62精选DeepSeek输入缓存价格骤降 全系列降至原价1/10
4月26日周日
23:17IT之家(RSS)63降至原有价格 1/10,DeepSeek API 输入缓存降价
14:20IT之家(RSS)53今天起,DeepSeek V4 成 OpenClaw 默认模型
12:20IT之家(RSS)49国家超算互联网推出 DeepSeek-V4 限时免费对话服务
08:22Berryxia.AI57Deepseek V4 官方2.5折优惠,截止5月5日
03:51swyx 🇸🇬70精选DeepSeek-V4预览版正式发布,开启百万上下文高性价比时代
4月25日周六
23:59DeepSeek60精选DeepSeek-V4-Pro API限时75折优惠
23:26IT之家(RSS)53DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前
22:42小互53Deepseek V4限时2.5折促销引热议
21:36歸藏(guizang.ai)79精选DeepSeek V4模型限时2.5折优惠
18:14IT之家(RSS)30安卓首发:荣耀 YOYO 率先接入 DeepSeek-V4 大模型
16:14IT之家(RSS)63英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user
13:00阿绎 AYi54DeepSeek V4 Pro在ZenMux平台免费开放,实测可替代大部分Claude任务
09:09Berryxia.AI57Mac Studio 256G可运行DeepSeek4-Flash量化版
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月30日
19:10
阿绎 AYi@AYi_AInotes
64
LMArena文本榜显示,百度文心5.1 Preview以1476分位列国内第一、全球前十五,成为榜单中唯一国产模型,排名超过GPT-5.5等。尽管当前AI热点集中于Agent、多模态等领域,但DeepSeek V4与文心5.1 Preview仍以文本为核心。文章强调,文本能力是大模型的基础,代码、推理等多模态能力均从中"生长",文本差距直接决定上层能力水平,因此仍是衡量模型差距的关键分水岭。

Berryxia.AI: 今天看到一条容易被刷掉的消息,但越想越觉得有意思。 LMArena 文本榜最新更新,文心 5.1 Preview 拿下 1476 分,国内第一,全球前十五唯一国产模型,排在 GPT-5.5 和 DeepSeek-V4-Pro 前面。 这事本...

DeepSeek评测/基准
16:09
SemiAnalysis@SemiAnalysis_
53
GB300 NVL72 在 DeepSeek-V4 Pro 上性能超 B200 6.5 倍

在 DeepSeek-V4 Pro 1.6T 模型上,采用机架级解耦设计的 GB300 NVL72 系统性能达到 B200 的 6.5 倍。这一高吞吐配置得益于 DeepSeek-AI 的 MegaMoe 内核,该内核将专家分派、专家组合及 GEMM 运算完全融合并重叠至单一内核中。性能突破由 Radixark、LMSYS 和 NVIDIA AI 的工程师团队快速实现。CoreWeave 为此项开源性能优化贡献了临时的 GB300 NVL72 机架资源,使整个社区受益。

DeepSeek推理评测/基准
08:45
向阳乔木@vista8
67
DeepSeek V4 Flash模型因响应速度快、成本低,获海外用户好评。用户强调应重实际效果而非基准测试,例如建议沉浸式翻译改用该模型。有用户称其速度优势显著,已将非复杂推理API调用切换至V4 Flash,体验无感秒处理,成本比Claude Haiku省90%且质量更优。

明 盛: @vista8 Deepseek的速度绝对是一大未被完全发掘的优势. 试了v4flash之后我把所有不涉及复杂推理的llm api调用全切到flash了. 速度基本都是无感秒处, 价格比haiku省90% 质量比haiku强.

DeepSeek大佬观点推理
04:12
SemiAnalysis@SemiAnalysis_
46
德黑兰,2026年4月29日--在@deepseek_ai DeepSeek v4 Pro发布不到一周后,@vllm_project和@inferact的破解团队在GB200(Dynamo+vLLM)上取得了显著改进。这主要得益于vLLM 0.20.0版本的发布,该版本为DEP部署启用了MegaMoE内核!出色的工作--我们期待在未来几天重点介绍更多改进。
DeepSeek产品更新开源生态推理
03:42
swyx 🇸🇬@swyx
64
IMO DeepSeek v4 展现了十足的自信与能力,它没有进行基准刷分,没有关注某些无意义的最终运行成本,甚至没有投入推理最优的计算资源。 只是亮相,展示了SOTA的长上下文效率技术(CSA、HCA、mHC,以pro版本8%的成本实现flash,而pro版本成本仅为opus的14%),发布了全球最佳的开源基础模型,然后潇洒离场。 后续训练请自行处理。留给智能体实验室去收拾残局吧。喝彩。
DeepSeek大佬观点开源生态
4月29日
23:40
TestingCatalog News 🗞@testingcatalog
55
DeepSeek 发布了 DeepSeek Vision 测试版,这是 DeepSeek Chat 中专门用于图像理解任务的新模式。

testtm: Deepseek Vision 👀

DeepSeek产品更新多模态
22:37
歸藏(guizang.ai)@op7418
54
Deepseek 的多模态模型全量了。 目前可以在网页版的识图模式尝试,看起来是一个单独的多模态模型
DeepSeek多模态模型发布
22:15
向阳乔木@vista8
38
DeepSeek 的识图模式速度好快啊!这是新出的吗? 上传图片,让反推提示词,秒出~
DeepSeek产品更新多模态
22:15
向阳乔木@vista8
47
DeepSeek 的识图模式速度实在是太快了。 网页复刻还原度相当不错,这下前端开发就更好用了。 DeepSeek牛逼!
DeepSeek多模态大佬观点
18:12
向阳乔木@vista8
29
将 DeepSeek Web 对话能力转换为 OpenAI、Claude 与 Gemini 兼容 API。 厉害!但现在API这么便宜,直接用API也行吧…
DeepSeekMCP/工具开源/仓库
17:33
IT之家(RSS)
52
DeepSeek 终于能"看图"了!灰度"识图模式",图片理解功能内测

DeepSeek已灰度测试“识图模式”,新增多模态图片理解功能,用户可上传图片并获取描述。该模式与“快速模式”“专家模式”并列,并非简单OCR文字识别。部分测试用户反馈响应速度很快,类似flash;但亦有用户遇到“识图模式暂不可用”提示。网络响应内容显示该功能模型类型为“vision”,状态为“图片理解功能内测中”。

DeepSeek产品更新多模态
17:11
小互@xiaohu
44
Deepseek 内测多模态能力 现在可以识别图像 对于Agent执行能力提升有很大帮助… 【引用 @PKUCXK】:Now, we see you. 👀

Xiaokang Chen: Now, we see you. 👀

智能体DeepSeek多模态模型发布
10:37
DeepSeek@deepseek_ai
47
DeepSeek-V4-Pro 的优惠期限已延长至 2026 年 5 月 31 日 15:59(UTC)! 【引用 @deepseek_ai】:🔥DeepSeek-V4-Pro API 提供 75% 折扣,优惠截止至 2026 年 5 月 5 日 15:59(UTC 时间)!不要错过这次大幅优惠。 🛠️集成更新: 🔹Claude Code:将模型设置为 deepseek-v4-pro【1m】 以解锁 100 万上下文! 🔹OpenCode:更新至 v1.14.24+ 🔹OpenClaw:更新至 v2026.4.24+ 查看最新官方 API 文档获取完整详情:https://api-docs.deepseek.com/quick_start/pricing

DeepSeek: 🔥DeepSeek-V4-Pro API is 75% OFF until May 5th, 2026, 15:59 (UTC Time)! Don't miss out on this massive discount. 🛠️Inte...

DeepSeek行业动态部署/工程
4月28日
23:35
阿绎 AYi@AYi_AInotes
48
DeepSeek V4 Pro质量是Claude的85%,价格只有七分之一。

通过ZenMux平台的PK模式实测,DeepSeek V4 Pro在处理结构化任务(如马斯克思维模型分析)时,输出逻辑清晰、表达母语化,质量达到Claude的85%,但价格仅为其七分之一。作者建议将80%的日常工作(如写代码、调研)交由DeepSeek处理,20%需要顶级文笔的任务使用Claude,可节省70%以上API费用。ZenMux提供免费测试额度、PK对比模式、保险赔付和可观测性工具,帮助用户规避依赖单一API厂商的风险并提升选型效率。

阿绎 AYi: 兄弟们,DeepSeek V4 Pro在ZenMux上免费放开了,登录就能跑,实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4.7同时跑一个昨SaaS产品网站的任务,效果真的炸裂! 说个前情,老朋友都知道我...

DeepSeek现象/趋势编码评测/基准
22:10
Orange AI@oran_ge
43
ColaOS产品负责人宣布免费开放DeepSeek V4至五一假期

ColaOS产品负责人决定在ColaOS中免费提供DeepSeek V4模型,而非仅提供官方2.5折优惠。面对内部对高昂模型成本的担忧,负责人给出了一个“无法拒绝的理由”,最终团队达成妥协,将免费使用期限设定为五一假期结束前。推文同时提供了下载地址(目前仅支持Mac)和一个用户邀请码。

智能体DeepSeek产品更新
16:06
向阳乔木@vista8
42
一把手工程决定AI模型与应用成败

作者观察到,尽管DeepSeek v4在龙虾等agent场景表现未达预期,但小米的mimo v2.5却表现优异。这源于小米AI负责人罗福莉对claw类产品的高度重视和投入。由此得出结论,无论是模型训练适配还是企业AI应用落地,本质上都是“一把手工程”。企业一号位对agentic(智能体)的认知深度和投入决心,直接决定了最终成果的差异,越早认识到其重要性,获得的收益就越大。

智能体DeepSeek大佬观点
13:33
IT之家(RSS)
46
DeepSeek-V4-Pro 旗舰模型限时 2.5 折优惠官宣延期,活动持续至今年 5 月 31 日

DeepSeek宣布将其旗舰模型DeepSeek-V4-Pro的API限时2.5折优惠活动延长至2026年5月31日。同时,公司进行了多项价格与模型调整:全系列模型的输入缓存命中价格降至首发价的十分之一;deepseek-chat与deepseek-reasoner两个模型名将被弃用,其功能分别由deepseek-v4-flash的非思考与思考模式承接。目前,DeepSeek-V4-Pro的缓存命中输入价格低至每百万tokens 0.025元。该模型采用混合专家架构,总参数量达1.6万亿,支持百万级上下文窗口。官方表示,受高端算力限制,当前Pro版本服务吞吐有限,预计下半年昇腾950超节点批量上市后,其价格还将大幅下调。

DeepSeek行业动态部署/工程
10:25
IT之家(RSS)
65
DeepSeek-V4 技术报告公开作者名单,多位核心骨干离职去大厂

DeepSeek近日公开了V4技术报告,近300人的作者名单显示有10人标注“已离职”,其中包括王炳宣、魏浩然等核心骨干。自2025年下半年以来,公司至少5名核心研发成员确认离职,分别加入腾讯、小米、字节跳动及元戎启行等企业,其离职方向覆盖了基座模型、推理、OCR和多模态四条核心技术主线。同期,DeepSeek-V4预览版正式上线并开源,该模型具备百万字上下文,在多项能力上处于领先地位。

DeepSeek现象/趋势行业动态
10:19
向阳乔木@vista8
54
DeepSeek V4 Flash技能调用能力显著提升,接近实用

用户评估DeepSeek V4 Flash模型,认为其简单的技能调用功能已接近可用状态,且处理速度非常快。尽管发布时不如R1轰动,但实际能力有了切实提升。演示视频展示了其处理复杂工作流的能力:从根据一句话指令下载epub电子书、转换为txt格式、自动上传至Notebooklm进行提问,到最后根据指定Prompt撰写解读文章。整个过程体现了模型自动纠错能力的增强以及工具调用能力的显著进步。

DeepSeek大佬观点编码
4月27日
20:27
向阳乔木@vista8
33
DeepSeek 牛逼! 不过得吐槽下Grok的翻译,这个语境下的GOAT翻译成山羊… 不翻译就好啊 这应该是没用大模型翻译能力吧,再弱的模型都不应该犯这样的错误。

Arthur Zucker: Reading @deepseek_ai 's v4 paper.... absolute hats off. Every problem has a mathematical solution, nothing is left to ch...

DeepSeek大佬观点开源生态
18:53
Chubby♨️@kimmonismus
63
谷歌TPU v8与华为昇腾平台:全球AI芯片竞赛开启新阶段

谷歌在Cloud Next 2026上首次将TPU v8拆分为训练芯片TPU 8t和推理芯片TPU 8i,宣称训练速度提升2.8倍,推理性价比提高80%,并通过自研Arm架构Axion CPU实现全栈垂直控制。同时,DeepSeek V4-Pro成为首个在华为昇腾NPU平台上完成训练与推理验证的前沿大模型,其定价与昇腾950芯片量产计划挂钩,输出成本远低于主流西方模型。这标志着美国制裁试图阻止的硬件脱钩可能已不可逆转,全球AI芯片竞争进入新阶段。

DeepSeekGoogle现象/趋势行业动态
15:19
IT之家(RSS)
57
中国信通院正式启动 DeepSeek V4 国产化适配测试工作

中国信通院宣布启动DeepSeek V4国产化适配测试,旨在推动该模型与国产软硬件的深度协同及产业应用。测试将依托重点实验室和AISHPerf基准体系,面向芯片、服务器、一体机、集群、开发框架及工具链等产品系统展开。评估覆盖模型全系列,聚焦推理、微调等流程,从适配易用性、功能完备性、性能及成本多维度进行,并新增长序列处理、代码生成与理解等测评方向,以构建立体化评测体系。此前,多家国产硬件厂商已在模型发布当日完成了“0day适配”。

DeepSeek行业动态部署/工程
14:21
karminski-牙医@karminski3
50
DeepSeek-V4测试进度同步及新增大模型工程能力测试

作者同步了DeepSeek-V4的测试进度,并重点介绍了一项新设计的“大模型工程能力测试”。该测试以约20万行代码的SillyTavern项目为基础,要求大模型通过tool_call创建新的数值系统(如属性、状态),并能注入JS代码与现有系统交互。测试使用魔改的kimi-cli来监督实现过程、统计token与工具使用情况,并运行定制黑盒测试。此外,通过为酒馆增加CLI模式,测试还评估了大模型的Agent能力,使其能自行测试并迭代代码。目前测试仍在进行中。

智能体DeepSeek编码评测/基准
09:19
Berryxia.AI@berryxia
49
本周AI论文大爆炸!精选Top 10硬核研究

本周多项前沿AI研究取得突破。开源模型DeepSeek V4具备百万token上下文和1.6T参数,性能接近顶级闭源模型而成本更低。Autogenesis协议使AI Agent能自主发现能力缺口并自我进化。Apple Attention to Mamba提出将Transformer蒸馏至Mamba架构的新方法,实现线性推理加速。此外,Skill-RAG等研究也展示了领域的快速进展。

DAIR.AI: http://x.com/i/article/2048081731584933888

DeepSeek大佬观点推理
08:18
IT之家(RSS)
38
IT早报 0427:追觅 CEO 炮轰小红书;苹果新CEO将主持折叠iPhone发布;华为尊界新车将达200万级

追觅科技创始人俞浩发文炮轰小红书价值观与盈利模式“有毒”。苹果新任CEO特努斯将于9月主持可折叠iPhone发布会,公司未来计划进入约10个新产品类别。华为余承东透露,尊界品牌一款高定新车价格将达200万元级别,计划6月底发布。此外,人类马拉松成绩首次突破2小时大关;砺算科技GPU通过微软WHQL认证,成为国内首家;DeepSeek宣布其API输入缓存命中价格大幅下调。

DeepSeek行业动态部署/工程
07:56
Rohan Paul@rohanpaul_ai
45
OpenAI发布GPT-5.5,DeepSeek V4开源模型突破长上下文成本瓶颈

OpenAI在ChatGPT和Codex中推出了GPT-5.5。DeepSeek发布了开源模型V4,其性能在竞技编程任务上首次媲美闭源模型,并具备100万token的上下文窗口。该模型论文的核心创新在于提出了一种大幅降低长上下文LLM成本、同时几乎不损失能力的新方法。此外,Anthropic首次大规模揭示了AI使用、生产力提升与人类对工作被替代的恐惧之间的关联。

DeepSeekOpenAI现象/趋势
00:53
DeepSeek@deepseek_ai
精选62
🔥DeepSeek 输入缓存价格下调! 即刻起,整个 DeepSeek API 系列的输入缓存命中价格降至原价的十分之一!以更少成本,更高效地构建。 📌提醒:DeepSeek-V4-Pro 七五折优惠活动持续有效至 2026 年 5 月 5 日 15:59(UTC 时间)。
DeepSeek产品更新部署/工程

推荐理由:输入缓存命中价格直接打一折,对高频调用 API 的开发者来说是实打实的成本减负,配合 V4-Pro 的七五折促销,DeepSeek 在用价格战抢开发者心智。
4月26日
23:17
IT之家(RSS)
63
降至原有价格 1/10,DeepSeek API 输入缓存降价

DeepSeek宣布全系API服务的输入缓存命中价格即日起降至原有价格的十分之一。其中,DeepSeek-V4-Pro模型的输入缓存命中价格从每百万tokens 1元降至0.025元,输入缓存未命中价格从12元降至3元,输出价格从24元降至6元。DeepSeek-V4-Flash模型的输入缓存命中价格从0.2元降至0.02元。此外,Pro模型在5月5日前还可叠加享受2.5折限时优惠。

DeepSeek行业动态部署/工程
14:20
IT之家(RSS)
53
今天起,DeepSeek V4 成 OpenClaw 默认模型

OpenClaw 2026.4.24版本发布,重磅接入DeepSeek V4模型。其中,DeepSeek V4 Flash被设为默认大模型,V4 Pro也已上线模型库。V4 Pro拥有1.6万亿总参数和49B激活参数,是全球最大的开源模型;V4 Flash总参数284B,激活参数13B。两者均采用MoE架构,支持100万token上下文,并以MIT协议开源。此次更新还深度整合了Google Meet作为内置插件,支持实时语音通话、会议记录处理与导出。同时,系统修复了多轮工具调用中的逻辑错误,增强了浏览器自动化的稳定性和坐标点击等兜底功能,并优化了插件与模型的架构以降低启动负担。

智能体DeepSeek产品更新
12:20
IT之家(RSS)
49
国家超算互联网推出 DeepSeek-V4 限时免费对话服务

4月26日,国家超算互联网上线DeepSeek-V4限时免费对话服务。用户登录官网即可体验其百万Token超长上下文实时对话能力。此举标志着百万上下文从高端选配变为基础标配,进入普惠时代。该能力可一次性处理如《三体》三部曲总字数的文本,支持全文分析与深度推理。通过国家级算力基础设施与顶级大模型的融合,此举大幅降低了大规模AI应用的门槛与成本,推动AI技术更广泛地赋能千行百业。

DeepSeek产品更新开源生态
08:22
Berryxia.AI@berryxia
57
Deepseek V4 官方推出2.5折优惠活动,截止日期为5月5日,旨在鼓励用户积极使用该模型。官方同时提供了配置 Claude code 的指南,强调需注意模型选择(如 deepseek-v4-pro 和 deepseek-v4-flash)和思考级别设置(例如将 EFFORT_LEVEL 设为 max),以优化集成和使用体验。

岚叔: Deepseek V4 官方2.5折来了,优惠到5月5号,看来官方也希望大家狠狠用起来 附:官方推荐对claude code 配置如下,大家需额外注意模型、思考级别配置: export ANTHROPIC_BASE_URL=https://...

DeepSeek编码行业动态
03:51
swyx 🇸🇬@swyx
精选70
DeepSeek团队正式推出并开源了DeepSeek-V4预览版模型,标志着高性价比的百万上下文长度时代到来。该系列包含两个模型:DeepSeek-V4-Pro拥有1.6万亿总参数和490亿活跃参数,性能媲美顶级闭源模型;DeepSeek-V4-Flash则拥有2840亿总参数和130亿活跃参数,主打快速、高效与经济。模型现已在官方平台通过专家模式和即时模式开放试用,API也已同步更新。完整的技术报告和模型权重已在Hugging Face平台发布,供社区研究和应用。

DeepSeek: 🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length. 🔹 Dee...

DeepSeek开源生态模型发布

推荐理由:DeepSeek-V4 把 MoE 推到 1.6T 总参、49B 活跃,百万上下文 + 开源权重,这是开源阵营第一次在旗舰级闭源模型面前不落下风,做长上下文应用的团队该认真测一下了。
4月25日
23:59
DeepSeek@deepseek_ai
精选60
🔥DeepSeek-V4-Pro API 限时75折优惠,截止至2026年5月5日15:59(UTC时间)!切勿错过此次大幅折扣。 🛠️集成更新: 🔹Claude Code:将模型设置为 deepseek-v4-pro【1m】 即可解锁100万上下文! 🔹OpenCode:请更新至 v1.14.24+ 🔹OpenClaw:请更新至 v2026.4.24+ 查看最新官方API文档获取完整详情:https://api-docs.deepseek.com/quick_start/pricing
DeepSeek产品更新部署/工程

推荐理由:DeepSeek-V4-Pro 限时 75% off,配合 Claude Code 1M 上下文接入,对正在跑 coding agent 的开发者来说是真金白银的省钱窗口,错过这波下次不知道什么时候。
23:26
IT之家(RSS)
53
DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前

DeepSeek宣布为其旗舰模型DeepSeek-V4-Pro的API提供限时2.5折优惠,活动持续至2026年5月5日。调价后,输入价格(缓存命中)低至每百万tokens 0.25元,缓存未命中为3元,输出价格为6元。该模型采用混合专家架构,拥有1.6万亿总参数,支持百万级上下文。官方表示,受当前高端算力限制,服务吞吐有限,预计下半年昇腾950超节点批量上市后,Pro版本价格还将大幅下调。

DeepSeek行业动态部署/工程
22:42
小互@xiaohu
53
Deepseek V4 限时优惠 2.5折 100万输出6块钱 是算力太多还是用的人不及预期?上来就打折,还这么狠!
DeepSeek现象/趋势行业动态
21:36
歸藏(guizang.ai)@op7418
精选79
DeepSeek推出V4模型限时2.5折优惠,其Pro版百万Token输出成本仅6元。模型分为Pro版(总参数1.6T)和Flash版(总参数284B),预训练数据均为32T。在应用中,专家模式对应Pro版,快速模式对应Flash版。测评显示其性能与Claude Opus 4.6持平,Agent能力与世界知识显著增强,并采用新注意力机制以降低计算需求。

歸藏(guizang.ai): DeepSeek V4详细的官方公告也发了: 模型参数 (a) Pro 版本:总参数 1.6T,激活参数 49B (b) Flash 版本:总参数 284B,激活参数 13B (c) 预训练数据量:均为 32T 模式区分(网页端与 APP)...

DeepSeek推理模型发布

推荐理由:DeepSeek V4-Pro 百万 token 输出只要 6 块,这个定价直接把 Opus 4.6 级别的能力拉到了白菜价,做 Agent 和长上下文应用的产品人该重新算账了。
18:14
IT之家(RSS)
30
安卓首发:荣耀 YOYO 率先接入 DeepSeek-V4 大模型

荣耀YOYO成为安卓阵营中首个接入DeepSeek-V4大模型的AI智能体。此次接入带来三大核心升级:模型性能更强、上下文处理长度更长、推理效率更高。用户需将YOYO智能体升级至90.10.28.041及以上版本,并在MagicOS 8.0及以上系统环境中即可抢先体验此次更新。

DeepSeek产品更新端侧
16:14
IT之家(RSS)
63
英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user

英伟达宣布其Blackwell平台已适配DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型。DeepSeek-V4-Pro拥有1.6T总参数量与49B激活参数,定位高级推理;DeepSeek-V4-Flash则为284B总参数量与13B激活参数,主打高效场景。两款模型均支持100万Token上下文窗口与最高38.4万Token输出长度。实测显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72上开箱性能超过150 tokens/sec/user。开发者可通过NVIDIA NIM微服务下载部署,或利用SGLang与vLLM框架进行定制化推理,vLLM支持扩展至100个以上GPU。

DeepSeek产品更新开源生态部署/工程
13:00
阿绎 AYi@AYi_AInotes
54
DeepSeek V4 Pro在ZenMux平台免费开放,实测可替代大部分Claude任务

作者通过ZenMux平台的PK模式,将DeepSeek V4 Pro与GPT-5.4、Claude Opus 4.6进行同屏实测对比。结果显示,在日常项目中,V4 Pro能处理约80%的任务,且成本显著低于Claude Opus;剩余20%对稳定性要求极高的关键任务则仍由Claude兜底。作者认为模型分层策略至关重要,未来将是模型组合的时代。他推荐ZenMux平台,因其PK对比功能、输出异常保险赔付机制及细致的成本观测工具,能有效提升效率并规避单一API供应商风险。目前V4 Pro和Flash版均有免费测试额度。

DeepSeek教程/实践评测/基准
09:09
Berryxia.AI@berryxia
57
是时候让你的Mac Studio 256G 可以开始使用DeepSeek4-Flash-4bit 量化版版本了! 至于速度嘛… https://github.com/ml-explore/mlx-lm/pull/1192

Prince Canuma: You can now run DeepSeek4-Flash on 256GB Mac. Next up speed 🚀 PR: https://github.com/ml-explore/mlx-lm/pull/1192

DeepSeek开源生态教程/实践端侧
‹ 上一页
1…56789
下一页 ›