随着2026高考在即,DeepSeek创始人梁文锋的高考往事被网友挖出。一张2002年广东省湛江市高考状元颁奖典礼照片显示,梁文锋以806分成为湛江市高考状元。父亲是教导副主任,母亲是教师。报道称梁文锋初中偏爱理科(尤其物理、数学),兴趣广泛,爱好足球、乒乓球、下棋,初中便学电脑。高考成绩超过清华录取分数线,但第一志愿选择了浙江大学电子信息工程专业。
随着2026高考在即,DeepSeek创始人梁文锋的高考往事被网友挖出。一张2002年广东省湛江市高考状元颁奖典礼照片显示,梁文锋以806分成为湛江市高考状元。父亲是教导副主任,母亲是教师。报道称梁文锋初中偏爱理科(尤其物理、数学),兴趣广泛,爱好足球、乒乓球、下棋,初中便学电脑。高考成绩超过清华录取分数线,但第一志愿选择了浙江大学电子信息工程专业。
FlashMemory-DeepSeek-V4(FM-DS-V4)提出Lookahead Sparse Attention(LSA)推理范式,基于DeepSeek-V4架构构建神经记忆索引器,主动预测未来上下文需求,仅保留查询关键KV块。采用解耦训练策略,索引器作为独立双编码器训练,无需加载主干模型。在LongBench-v2、LongMemEval、RULER等长上下文基准上,平均物理KV缓存压缩至全上下文基线的13.5%,下游精度平均提升0.6%;在500K极端长度下,物理KV开销减少超过90%,且不损害主干模型的核心推理能力。
华为余承东官宣尊界 V800,定位超高端 MPV,轴距 3430mm,搭载 1.5T 增程器及前后双电机。苹果 WWDC26 发布 iOS 27 等新系统,库克完成 CEO 任内“最后一舞”,Siri AI 等智能功能在中国大陆暂不提供。月之暗面正寻求 20 亿美元新一轮融资,目标估值 300 亿美元,半年估值暴涨七倍。OpenRouter 数据显示中国 AI 大模型周调用量连续六周超越美国,6 月 9 日当周环比增长 27.49% 达 14.19 万亿 Token,DeepSeek-V4-Flash 蝉联榜首,MiniMax 新模型 M3 首周冲入前三。
三大力量重塑 AI 成本:前沿闭源模型持续涨价,开源模型在多数场景已足够好,买家开始替代。Coinbase 将提示词路由至更便宜模型,成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4,节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%,超越 Opus 的 14%,同一 100 任务成本 $84 vs $954(约 11 倍价差)。Cursor 后训练 Kimi K2.5 得到 Composer 2.5,称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵,开源平价且性能接近,选择决定企业单位经济学的斜率。
火山方舟Coding Plan与Agent Plan升级,集成MiniMax M3、DeepSeek V4系列、GLM-5.1等多款三方模型。即日起至2026年8月7日,新购/升级/续费40元、200元档位可享首两月2.5折(9.9元/月、49.9元/月)。MiniMax M3为新一代旗舰,支持100万token上下文窗口及原生多模态理解。Agent Plan为业界首个Agent套餐包,整合字节自研Seed系列模型与Harness工具,免费提供联网搜索和Embedding记忆能力,可配合Claude Code、OpenClaw、TRAE等工具使用。
13个大语言模型(GPT 5.5 Thinking、DeepSeek-v4 Pro、Gemini 3.1 Pro Thinking、Claude Opus 4.8 Max、Kimi 2.6 Thinking、Sonnet 4.6 Thinking、GLM 5.1、豆包 Thinking、Qwen 3.7 Plus Thinking、MiniMax M3、元宝 Thinking、Mimo-2.5-pro、Grok)用2026年全国一卷数学高考题进行测试,统一以LaTeX格式输入、关闭联网、不干扰作答。GPT 5.5、DeepSeek-v4 Pro、Gemini 3.1 Pro和Claude Opus 4.8并列第一,得分接近144分;Kimi 2.6以微小差距位居第二梯队;元宝118分;Mimo和Grok得分最低。大部分模型在多选题和长解答题上出现漏条件、读图错误、过度泛化等问题,甚至出现拒答或搜索答案的行为。
DeepSeek V4 Pro 在准确率(precision)指标上击败 GPT-5.5 Pro,具体分数和参数量未透露。该结果来自 runtimewire.com 的评测,在 Hacker News 获得 110 个点赞。
据OpenRouter监测,上周全球AI大模型总调用量36.1万亿Token,连续七周上涨。中国周调用量14.19万亿Token,环比增27.49%,连续六周超越美国(3.2万亿Token)。调用量前四均为中国模型:DeepSeek-V4-Flash榜首(3.69万亿Token),腾讯Hy3 preview第二(2.94万亿),新发布的MiniMaxM3首周即入前三(2.5万亿,具备1M上下文及原生多模态),小米MiMo-V2.5第四(2.19万亿)。Claude Sonnet 4.6和Claude Opus 4.7跌出前五。MiniMax总调用量3.05万亿Token超越小米、腾讯;DeepSeek以6.75万亿Token连续四周厂商榜首。
一篇题为“The OnlyFans Economy of American AI”的文章于6月7日在Hacker News上获得104点赞,探讨美国人工智能行业中的类似OnlyFans的订阅制经济现象。
DeepSeek 在 2026 年 6 月成为 Ramp 平台最热门的软件供应商,作为一项付费服务,美国公司直接向其发送数据。Ramp 首席经济学家 Ara Kharazian 指出成本意识是驱动因素,但警告使用中国模型存在安全风险。
美国企业 AI 累计投入突破 1 万亿美元,模型推理成本飙升,降本增效未达预期。Ramp 报告显示 DeepSeek 首次登上其软件趋势榜榜首。案例包括某企业一个月为 Claude 支付 5 亿美元,Uber 四个月内耗尽全年 Token 预算。DeepSeek 宣布 API 价格永久下调 75%,MiniMax 压至新低。Ramp 首席经济学家称这是美国企业寻找 OpenAI、Anthropic 低成本替代方案的最明确信号。部分企业已直接向 DeepSeek 付费。2025 年初 DeepSeek R1 模型曾登顶 App Store,但企业采用率一度达 0.3%,后回落至 0.1% 并维持到 2026 年 4 月。成本压力是再度受关注的主因。
深圳河套学院联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为及深智城,依托华为昇腾 910C 国产 AI 算力集群,完成 1.6 万亿参数大模型 DeepSeek-V4-Pro 的全参数后训练。项目实现模型算力利用率(MFU)超过 30%,关键训练算子效率提升 14%,各项指标均达到工业级运行标准。此次实践证实国产 AI 芯片可支撑世界级超大参数模型的训练任务,相关技术路径具备可行性。
豆包声明,针对专业人群推出豆包专业版,基础功能(搜索问答、写作生图、语音和视频对话)保持免费。阿里千问向第三方Agent、Skill全面开放,瑞幸咖啡、肯德基、蜜雪冰城、东方航空为首批接入测试企业。DeepSeek首轮融资拟筹集500亿元,腾讯、宁德时代等参投,投后估值或达4000亿元。腾讯人士称微信AI智能体上线时间暂未定,取决于监管审批。苹果MacBook Neo开售三周出货110万台。
一篇来自 fergusfinn.com 的博客文章,介绍了在 AMD MI300X GPU 上运行 DeepSeek-V4-Flash 模型的过程。
DeepSeek 计划在首轮融资中从腾讯、宁德时代等投资方处筹集约 500 亿元人民币。融资落地后,其投后估值预计在 3500 亿至 4000 亿元。创始人梁文峰将出资 200 亿元,腾讯和宁德时代分别拟投资 100 亿元和 50 亿元,成为最大外部投资者。DeepSeek 去年凭借 V3 大模型与 R1 推理模型获得广泛认可。此次融资凸显了中国正打造从大模型到算力能源基建的全链条 AI 产业。
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》微软在 Build 2026 发布专为 AI 智能体打造的操作系统“Project Solara”。该系统基于 Android 定制,旨在运行于小型低功耗设备。现场同步展示了桌面终端和可穿戴智能胸牌两款概念设备,作为硬件厂商的参考设计。
腾讯云智能体开发平台宣布,自2026年6月3日起下调DeepSeek-V4系列模型的调用价格,其中DeepSeek-V4-Pro模型的推理输入与输出价格降幅达75%,缓存命中价格降幅高达97.5%;DeepSeek-V4-Flash模型的缓存命中价格降幅达90%。DeepSeek-V4系列模型发布于2026年4月,采用混合专家架构,总参数达1.6万亿,支持100万Token上下文长度。本次降价是在DeepSeek官方此前已调价基础上的平台层面调整。
根据2026年5月29日发布的一则消息,一个名为 Hy3 的神秘大语言模型(LLM)在 OpenRouter 模型排行榜上取得了显著领先优势,位居榜首。OpenRouter 是一个 AI 模型聚合平台,其排行榜反映了不同模型的综合表现。该信息最初发布于 minimaxir.com,并获得了科技社区 HN 的关注。然而,关于该模型的具体技术细节、开发者信息以及性能评分,原文并未提供更多说明。
一篇新综述论文提出,自主AI智能体的真正瓶颈并非语言模型本身,而是工具、内存、测试与权限边界等构成的软件层。这一“约束层”将无状态模型转化为能行动的工作智能体。DeepSeek已在北京组建专门的Harness团队,其“模型加约束层等于AI智能体”的公式印证了该观点。
DeepSeek 获国家集成电路产业投资基金(国家大基金)领投的首轮融资,投前估值 450 亿美元。豆包官方就“新手父母听建议每顿只喂60ml奶”一事作出回应,称其建议符合国家喂养指南,指出原报道存在上下文缺失。微信 Win / Mac 4.1.10 正式版发布,新增“边写边译”功能。
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》DeepSeek 服务于 2026 年 5 月 28 日上午发生故障,网页对话和 API 均受影响。官方状态页面显示为“部分中断”,问题于 10:21 定位,10:50 修复,服务中断约半小时。这已是 DeepSeek 本月第五次出现服务问题,其中有两次为“完全中断”。
ESPO(Early-Stopping Proximal Policy Optimization)是一种强化学习算法,它能在生成过程中实时检测失败轨迹并提前终止,以节省计算资源。该方法通过计算代理后悔值,当平滑后的累积后悔值显著超过预期时便停止生成。被截断的轨迹被视为吸收失败状态。在针对DeepSeek-R1-Distill-Qwen-7B模型的数学推理训练中,ESPO在AIME 2024、AMC 2023和MATH-500等基准上的表现均优于PPO,并累计节省了超过20%的回滚token。
中国正在限制阿里巴巴、DeepSeek等私营企业顶尖AI研究人员的出境旅行,受影响人员需获得官方批准方可离境。此举是出于对数据泄露、技术窃取和人才流失的担忧,北京方面正加强对国内AI产业的管控。
DeepSeek reasonix是DeepSeek推出的本机编码代理,以高缓存效率和低成本为特点,在Hacker News获得102分。
神舟二十三号载人飞船瞄准5月24日23:08发射,朱杨柱任指令长,香港航天员黎家盈将首飞。苹果iPhone 17系列领跑2026年Q1全球畅销榜,前十机型贡献25%出货量。闻泰科技声明安世荷兰剥夺控制权并阻挠审计。全国首个人形机器人管理平台发布,已为超2.8万台机器人赋予唯一“身份证号”。DeepSeek API完成扩容,默认支持500并发。小米宣布冠名中国三大汽车赛事,其YU7 GT医疗车首次亮相赛道。
DeepSeek 将针对其旗舰模型 V4-Pro 的 75% 折扣调整为永久性降价。调整后,输入 token 的价格为每百万 0.435 美元,相比 GPT-5.5 至少便宜 11.5 倍;输出 token 的价格优势更为显著,至少低 34 倍。如此激进的定价策略,对于 token 消耗量巨大的智能体系统而言,将对西方人工智能服务商构成显著的价格压力。
DeepSeek 宣布其API完成输出提速与服务扩容,服务更加稳定,默认支持500个并发同时在线,企业用户可申请更高并发。同时,DeepSeek-V4-Pro模型API价格将于2026年5月31日优惠结束后调整为原定价的1/4,具体价格调整为:输入(缓存命中)0.025元/百万Tokens,输入(缓存未命中)3元/百万Tokens,输出6元/百万Tokens。
DeepSeek在2026年5月22日宣布,将其AI模型V4 Pro的价格优惠从临时调整为永久有效。这意味着该产品的定价将长期维持在更具吸引力的水平,具体的费用明细可通过其官方定价页面查询。
Deepseek 即将完成约100亿美元的融资,这将使这家中国AI初创公司的估值达到约450亿美元。创始人梁文峰向投资者明确表示,公司战略将优先推进AGI(通用人工智能)的研究,而非追求短期利润。这一举动凸显了在AI竞赛中,Deepseek 坚持长期技术投入,即使获得巨额资金支持,也选择以突破性研究为导向,而非立即商业化盈利。
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)X:X.PIN (@thexpin)The Decoder:AI News(RSS)DeepSeek 宣布其 V4-Pro 模型 API 将于 2026 年 5 月 31 日 2.5 折优惠结束后,永久调整为原定价的 1/4。原价为:输入(缓存命中)0.1 元/百万 Tokens、输入(缓存未命中)12 元/百万 Tokens、输出 24 元/百万 Tokens。此举意味着原计划的限时促销将变为长期固定价格。
全国网络安全标准化技术委员会发布了《人工智能应用伦理安全指引 1.0》。该指引明确了人工智能应用在开发、服务提供和使用等环节的安全指引,旨在引导人工智能应用坚持以人为本、智能向善,促进其在规范有序、安全可控的轨道上健康发展。清华大学、阿里巴巴、华为等多家产学研机构参与了文件的起草工作。
DeepSeek正推进700亿元人民币的巨额融资,估值约450亿美元。创始人梁文锋承诺将继续开源开发AI模型,不追求短期商业化,目标是技术升级与通用人工智能。腾讯、IDG资本等接近参投,梁文锋个人可能注资200亿元。若成功将创下中国科技初创公司首轮融资纪录。
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)X:X.PIN (@thexpin)The Decoder:AI News(RSS)火山引擎的Agent Plan和Coding Plan产品新增支持DeepSeek V4模型,用户可在相关计划中调用该模型进行开发与部署。
Deepseek正在北京组建团队,开发名为"Deepseek Code"的AI代码代理产品,直接对标Claude Code、Codex和Cursor。招聘要求表明,该岗位需要精通智能体循环、MCP协议和上下文工程,并深度使用现有编程工具。此举标志着Deepseek正式进军AI辅助编程领域,旨在与现有主流产品展开竞争。
DeepSeek在内部组建了全新的Harness团队,主攻代码智能体产品,内部对标Anthropic的Claude Code。该团队将负责研发DeepSeek Code Harness,并已开放Harness产品经理和研发工程师两个关键岗位,工作地点在北京。其核心目标是将前沿的模型能力转化为领先的Agent产品,并深度参与定义DeepSeek的桌面端Agent产品。
小米YU7 GT以7分34秒931刷新纽北SUV圈速纪录,车手任周灿成为首个获官方认证的中国车手。特斯拉宣布放弃在印度建厂的计划。谷歌发布Gemini 3.5 Flash模型,称其输出速度是GPT-5.5的4倍。DeepSeek就“”字符触发模型异常回应,称属于幻觉,不涉及安全或隐私。此外,月之暗面Kimi获国资机构入股,浙江联通将于6月15日全面退出3G服务。
DeepSeek就“”特殊字符触发模型异常回复的问题发布说明。官方技术团队排查后确认,该现象是特殊字符引发的模型“幻觉”,不存在安全漏洞或用户隐私泄露风险。后续将通过针对性训练,提升模型对此类字符的识别与处理能力,以修复已知问题并优化表现。