6月11日

09:30

IT之家（RSS）

随着2026高考在即，DeepSeek创始人梁文锋的高考往事被网友挖出。一张2002年广东省湛江市高考状元颁奖典礼照片显示，梁文锋以806分成为湛江市高考状元。父亲是教导副主任，母亲是教师。报道称梁文锋初中偏爱理科（尤其物理、数学），兴趣广泛，爱好足球、乒乓球、下棋，初中便学电脑。高考成绩超过清华录取分数线，但第一志愿选择了浙江大学电子信息工程专业。

DeepSeek 行业动态

6月9日

12:55

HuggingFace Daily Papers（社区热门论文）

FlashMemory-DeepSeek-V4：通过前瞻稀疏注意力实现闪电索引超长上下文

FlashMemory-DeepSeek-V4（FM-DS-V4）提出Lookahead Sparse Attention（LSA）推理范式，基于DeepSeek-V4架构构建神经记忆索引器，主动预测未来上下文需求，仅保留查询关键KV块。采用解耦训练策略，索引器作为独立双编码器训练，无需加载主干模型。在LongBench-v2、LongMemEval、RULER等长上下文基准上，平均物理KV缓存压缩至全上下文基线的13.5%，下游精度平均提升0.6%；在500K极端长度下，物理KV开销减少超过90%，且不损害主干模型的核心推理能力。

DeepSeek 推理论文/研究

08:21

IT之家（RSS）

IT早报 0609：华为余承东官宣尊界 V800；库克 WWDC 收官演讲苹果 iOS 27 发布；月之暗面寻求 20 亿美元融资；中国 AI 大模型周调用量连续六周超越美国

华为余承东官宣尊界 V800，定位超高端 MPV，轴距 3430mm，搭载 1.5T 增程器及前后双电机。苹果 WWDC26 发布 iOS 27 等新系统，库克完成 CEO 任内“最后一舞”，Siri AI 等智能功能在中国大陆暂不提供。月之暗面正寻求 20 亿美元新一轮融资，目标估值 300 亿美元，半年估值暴涨七倍。OpenRouter 数据显示中国 AI 大模型周调用量连续六周超越美国，6 月 9 日当周环比增长 27.49% 达 14.19 万亿 Token，DeepSeek-V4-Flash 蝉联榜首，MiniMax 新模型 M3 首周冲入前三。

DeepSeek 端侧行业动态

00:41

Tomer Tunguz 博客（VC 分析）

精选56

AI 替代浪潮：三大力量重塑成本结构

三大力量重塑 AI 成本：前沿闭源模型持续涨价，开源模型在多数场景已足够好，买家开始替代。Coinbase 将提示词路由至更便宜模型，成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4，节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%，超越 Opus 的 14%，同一 100 任务成本 $84 vs $954（约 11 倍价差）。Cursor 后训练 Kimi K2.5 得到 Composer 2.5，称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵，开源平价且性能接近，选择决定企业单位经济学的斜率。

Anthropic DeepSeek 开源生态推理

推荐理由：Tunguz 用 Coinbase、Lindy 等真实案例，把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了，做 AI 应用的人该重新算一下单位经济账。

6月8日