4月30日

19:10

阿绎 AYi@AYi_AInotes

LMArena文本榜显示，百度文心5.1 Preview以1476分位列国内第一、全球前十五，成为榜单中唯一国产模型，排名超过GPT-5.5等。尽管当前AI热点集中于Agent、多模态等领域，但DeepSeek V4与文心5.1 Preview仍以文本为核心。文章强调，文本能力是大模型的基础，代码、推理等多模态能力均从中"生长"，文本差距直接决定上层能力水平，因此仍是衡量模型差距的关键分水岭。

Berryxia.AI: 今天看到一条容易被刷掉的消息,但越想越觉得有意思。 LMArena 文本榜最新更新,文心 5.1 Preview 拿下 1476 分,国内第一,全球前十五唯一国产模型,排在 GPT-5.5 和 DeepSeek-V4-Pro 前面。这事本...

DeepSeek 评测/基准

16:09

SemiAnalysis@SemiAnalysis_

GB300 NVL72 在 DeepSeek-V4 Pro 上性能超 B200 6.5 倍

在 DeepSeek-V4 Pro 1.6T 模型上，采用机架级解耦设计的 GB300 NVL72 系统性能达到 B200 的 6.5 倍。这一高吞吐配置得益于 DeepSeek-AI 的 MegaMoe 内核，该内核将专家分派、专家组合及 GEMM 运算完全融合并重叠至单一内核中。性能突破由 Radixark、LMSYS 和 NVIDIA AI 的工程师团队快速实现。CoreWeave 为此项开源性能优化贡献了临时的 GB300 NVL72 机架资源，使整个社区受益。

DeepSeek 推理评测/基准

08:45

向阳乔木@vista8

DeepSeek V4 Flash模型因响应速度快、成本低，获海外用户好评。用户强调应重实际效果而非基准测试，例如建议沉浸式翻译改用该模型。有用户称其速度优势显著，已将非复杂推理API调用切换至V4 Flash，体验无感秒处理，成本比Claude Haiku省90%且质量更优。

明盛: @vista8 Deepseek的速度绝对是一大未被完全发掘的优势. 试了v4flash之后我把所有不涉及复杂推理的llm api调用全切到flash了. 速度基本都是无感秒处, 价格比haiku省90% 质量比haiku强.

DeepSeek 大佬观点推理

04:12

SemiAnalysis@SemiAnalysis_

德黑兰，2026年4月29日--在@deepseek_ai DeepSeek v4 Pro发布不到一周后，@vllm_project和@inferact的破解团队在GB200（Dynamo+vLLM）上取得了显著改进。这主要得益于vLLM 0.20.0版本的发布，该版本为DEP部署启用了MegaMoE内核！出色的工作--我们期待在未来几天重点介绍更多改进。

DeepSeek 产品更新开源生态推理

03:42

swyx 🇸🇬@swyx

IMO DeepSeek v4 展现了十足的自信与能力，它没有进行基准刷分，没有关注某些无意义的最终运行成本，甚至没有投入推理最优的计算资源。只是亮相，展示了SOTA的长上下文效率技术（CSA、HCA、mHC，以pro版本8%的成本实现flash，而pro版本成本仅为opus的14%），发布了全球最佳的开源基础模型，然后潇洒离场。后续训练请自行处理。留给智能体实验室去收拾残局吧。喝彩。

DeepSeek 大佬观点开源生态

4月29日

23:40

TestingCatalog News 🗞@testingcatalog

DeepSeek 发布了 DeepSeek Vision 测试版，这是 DeepSeek Chat 中专门用于图像理解任务的新模式。

testtm: Deepseek Vision 👀

DeepSeek 产品更新多模态