AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「DeepSeek」清除
6月16日周二
10:20Artificial Analysis60Artificial Analysis Intelligence Index v4.1 发布:转向智能体任务评测
6月14日周日
00:17OpenRouter:Announcements(RSS)73同事件精选OpenRouter融合预算模型面板超越GPT-5.5和Claude Opus 4.8同一事件,精选展示《OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7》
6月13日周六
21:30公众号:数字生命卡兹克59实测GLM-5.2,国产Coding模型的又一座新高峰。
06:34Artificial Analysis59Artificial Analysis 发布 AA-AgentPerf 基准,首批测试 DeepSeek V4 Pro 推理能效
02:07elvis69DAIR.AI创始人Elvis Saravia分享长期自主编码智能体运行经验
6月12日周五
10:37karminski-牙医50FlashMemory: 将DeepSeek-V4上下文显存压缩至1.3GB并提升准确率
6月11日周四
21:31IT之家(RSS)48DeepSeek API 缓存计费系统出故障后主动向用户退款,赠金已到账
12:25向阳乔木29Anthropic 让研究者后背发凉
11:21宝玉57DeepSeek 招聘 Agent Harness 研究员(实习/全职)
09:30IT之家(RSS)31DeepSeek梁文锋高考状元照片曝光:超过清华线选择浙大
01:25SemiAnalysis63DeepSeek 走向重资产自建基础设施
00:18向阳乔木32DeepSeek v4 Flash 月费几十元,创作者开源AI雷达网站
6月10日周三
22:17向阳乔木47DeepSeek访谈引争议:Vista反驳"安于落后美国6个月"说法
16:33OpenCode70DeepSeek V4 Pro 上线 OpenCode Zen
6月9日周二
22:50SemiAnalysis65DeepSeek V4 1.6T 43天性能追踪
16:39SiliconFlow61硅基流动联合CodeWhale推出DeepSeek V4终端最佳性价比组合
16:34X.PIN63DeepSeek招聘IDC工程师,计划自建数据中心
12:55HuggingFace Daily Papers(社区热门论文)68FlashMemory-DeepSeek-V4: 通过前瞻稀疏注意力实现闪电索引超长上下文
08:21IT之家(RSS)47IT早报 0609:华为余承东官宣尊界 V800;库克 WWDC 收官演讲苹果 iOS 27 发布;月之暗面寻求 20 亿美元融资;中国 AI 大模型周调用量连续六周超越美国
00:41Tomer Tunguz 博客(VC 分析)56精选AI 替代浪潮:三大力量重塑成本结构
00:27AYi37梁文锋DeepSeek颠覆了什么?
6月8日周一
19:12公众号:火山引擎28火山方舟Coding Plan与Agent Plan升级,限时2.5折
17:58X.PIN58DeepSeek首进美企市场,Ramp榜第一但采用率0.1%
12:44数字生命卡兹克6412个旗舰大模型参加高考语文数学测试,MiMo v2.5 Pro总分第一
11:55公众号:卡尔的AI沃茨3813个大语言模型参加2026数学高考,GPT 5.5等并列第一
11:29Hacker News 热门(buzzing.cc 中文翻译)38DeepSeek V4 Pro 在准确率方面超越 GPT-5.5 Pro
11:20IT之家(RSS)62中国AI大模型周调用量连续六周超越美国,前四名均为国产模型
00:58Hacker News 热门(buzzing.cc 中文翻译)61美国人工智能的OnlyFans经济
00:35The Decoder:AI News(RSS)59DeepSeek 在 2026 年 6 月登顶 Ramp 热门软件供应商,美国公司追逐更便宜的 AI
6月6日周六
17:17IT之家(RSS)65Ramp:美国企业 AI 成本飙升,DeepSeek 成为 B2B 市场新宠
6月5日周五
16:50SiliconFlow64DeepSeek连四周蝉联OpenRouter份额第一
11:14IT之家(RSS)67深圳团队依托华为昇腾 910C 成功训练 1.6 万亿参数 DeepSeek-V4-Pro 大模型
6月4日周四
22:34OpenRouter67精选DeepSeek连续四周登顶Token份额榜
08:10IT之家(RSS)62豆包宣布将推出专业版,基础功能保持免费;阿里千问向第三方Agent全面开放
00:45StepFun44阶跃星辰 Step 3.7 Flash 在物理编程对比中击败 DeepSeek V4-Flash
6月3日周三
18:05X.PIN66DeepSeek启动大规模首轮融资,目标募资约74亿美元
14:37Hacker News 热门(buzzing.cc 中文翻译)64在 AMD MI300X 上运行 DeepSeek-V4-Flash
13:09IT之家(RSS)70同事件精选消息称 DeepSeek 首轮融资拟筹集 500 亿元,腾讯、宁德时代等参投同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
08:09IT之家(RSS)46微软发布基于安卓的"Project Solara"智能体操作系统
00:29OpenRouter68精选DigitalOcean AI云服务上线OpenRouter
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月16日
10:20
Artificial Analysis@ArtificialAnlys
60
Artificial Analysis Intelligence Index v4.1 发布:转向智能体任务评测

Artificial Analysis 发布 Intelligence Index v4.1,转向智能体任务。升级 Terminal-Bench 2.1、τ³-Bench Banking、GDPval-AA v2(Elo 重基线、引入前沿模型评审、回合上限增至250),移除饱和的 IFBench。新增每任务成本、时间、输出 token 指标及缓存 token 影响。关键结果:Claude Fable 5(60分)领先但不可用;可用模型中 Claude Opus 4.8(max)56分居首,GPT-5.5(xhigh)55分。开源 DeepSeek V4 Pro 与 MiniMax M3 均44分。成本方面,Opus 4.8 每任务 $1.78,GPT-5.5 $0.99,DeepSeek V4 Pro 仅 $0.04。时间方面,Grok 4.3 最快(1.5分钟),Opus 4.8 需6.4分钟,GPT-5.5 需3.7分钟,Gemini 3.1 Pro Preview 以1.6分钟得46分。

智能体AnthropicDeepSeek推理
6月14日
00:17
OpenRouter:Announcements(RSS)
同事件精选73
OpenRouter融合预算模型面板超越GPT-5.5和Claude Opus 4.8

通过OpenRouter融合的一组预算模型,在100个复杂研究任务上得分超过GPT-5.5和Claude Opus 4.8。

AnthropicDeepSeekOpenAI产品更新
同一事件,精选展示《OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7》
推荐理由:OpenRouter 的 Fusion API 用多个模型合成输出,基准测试里预算模型组合能接近前沿,这个思路对有质量要求又在意成本的开发者挺实用。
6月13日
21:30
公众号:数字生命卡兹克
59
实测GLM-5.2,国产Coding模型的又一座新高峰。

在Anthropic的Fable 5因美国商务部要求全面关停当日,智谱发布GLM 5.2并宣布继续开源。该模型上下文长度增至1M,在编码和智能体任务上表现突出:10万行代码的监控BUG排查耗时21分钟,结果与Claude Opus 4.8一致(后者fast模式仅需6分钟);400-500k长上下文下准确性和指令遵循接近Claude。GLM 5.2为纯文本模型,无多模态能力,已通过Coding Plan订阅开放(限额需抢),下周将提供API并开源。

智能体AnthropicDeepSeek编码
06:34
Artificial Analysis@ArtificialAnlys
59
Artificial Analysis 发布 AA-AgentPerf 基准,首批测试 DeepSeek V4 Pro 推理能效

Artificial Analysis 发布新基准 AA-AgentPerf,首批结果覆盖 DeepSeek V4 Pro 在 NVIDIA Blackwell(GB300、B300)、Hopper(H200)及 AMD MI355X 上的推理能效。核心指标为每兆瓦承载的并发智能体数(要求 20 tokens/s 且 TTFT≤10s):GB300(机架级解耦)达 61,354,B300(单节点解耦)21,053,MI355X 3,551,H200 2,594。基准使用真实编码 agent 轨迹(最多 200 轮、序列超 100K tokens),允许 KV cache 复用、推测解码等生产优化并验证精度。测试显示 Blackwell 机架级比单节点能效高约 3 倍,且代际大幅领先 Hopper;MI355X 配置较早且未稳定启用推测解码,仍有优化空间。

DeepSeek推理评测/基准
02:07
elvis@omarsar0
69
DAIR.AI创始人Elvis Saravia分享长期自主编码智能体运行经验

DAIR.AI创始人Elvis Saravia分享如何有效运行长期自主编码智能体。他指出当前多数模型难以协调工作,会过早暂停、犯错或走捷径(reward hacking)。关键在于明确目标、消除假设,避免模型自行推断。他的实践公式:用Opus 4.8进行细致规划,GPT-5.5执行所有步骤,评估器(通过/goal)则使用Deepseek及Qwen、Kimi、MiniMax等最新模型。另一关键洞察是提供多模态视觉线索作为目标,比纯文本目标更强,能更好地约束智能体。完整讨论已录制并免费开放。

智能体AnthropicDeepSeekOpenAI
6月12日
10:37
karminski-牙医@karminski3
50
FlashMemory: 将DeepSeek-V4上下文显存压缩至1.3GB并提升准确率

DeepSeek-V4支持1M上下文,显存约10GB(对比DeepSeek-V3.2约84GB)。FlashMemory论文进一步将显存压至1.3GB,并在LongBench-v2等长文本评测上准确率平均提升0.6%。核心是神经内存索引器(小模型),通过预测所需历史片段按需加载,实现注意力降噪。训练采用解耦双编码器架构,无需加载DeepSeek-V4基座模型,训练成本大幅下降。论文:arxiv.org/abs/2606.09079;项目:github.com/libertywing/FlashMemory-Deepseek-V4。

DeepSeek推理教程/实践部署/工程
6月11日
21:31
IT之家(RSS)
48
DeepSeek API 缓存计费系统出故障后主动向用户退款,赠金已到账

2026年5月13日至6月9日期间,DeepSeek开放平台缓存计费系统出现数据错误,部分API用户计费受影响。DeepSeek团队将相应金额以赠金形式自动返还至受影响账户,并明确优先从赠金账户扣款。此前DeepSeek于4月24日发布DeepSeek-V4-Pro和V4-Flash两个版本,均支持1M超长上下文,后续推行了降价策略。

DeepSeek行业动态
12:25
向阳乔木@vista8
29
"Anthropic 最近干了一件让 AI 研究者们后背发凉的事" 这么快就被AI学到了流行语料?! Deepseek翻译重写居然用了这句。。。
AnthropicDeepSeek大佬观点
11:21
宝玉@dotey
57
DeepSeek 招聘 Agent Harness 研究员(实习/全职)

DeepSeek 开放 Agent Harness 研究员岗位(实习/全职),工作地点杭州/北京。团队使命为 “Model + Harness = Agent”,旨在将模型能力转化为 Agent 产品。职责涵盖:上下文管理、长期记忆、Subagent 与 Multi-Agent、自进化 Agent 等前沿创新;实现模型与 Harness 的深度适配;构建 Harness 领域评测基准;基于真实任务与用户反馈迭代 Agent 能力。要求硕士以上学历、2年科研经验、全栈开发能力、Agent 产品重度用户,熟悉 LLM 及 Agent 机制(KV Cache、Tool Use、Reasoning、MCP 等)。

智能体DeepSeek行业动态
09:30
IT之家(RSS)
31
DeepSeek梁文锋高考状元照片曝光:超过清华线选择浙大

随着2026高考在即,DeepSeek创始人梁文锋的高考往事被网友挖出。一张2002年广东省湛江市高考状元颁奖典礼照片显示,梁文锋以806分成为湛江市高考状元。父亲是教导副主任,母亲是教师。报道称梁文锋初中偏爱理科(尤其物理、数学),兴趣广泛,爱好足球、乒乓球、下棋,初中便学电脑。高考成绩超过清华录取分数线,但第一志愿选择了浙江大学电子信息工程专业。

DeepSeek行业动态
01:25
SemiAnalysis@SemiAnalysis_
63
DeepSeek 正走向重资产模式。 6 月 9 日,该公司发布了 IDC 规划工程师的招聘信息,该职位明确涉及兆瓦级到吉瓦级基础设施的设计与交付。这紧随其 4 月在内蒙古乌兰察布招聘数据中心运维工程师。综合来看,这是 DeepSeek 首次完全展露其自持算力基础设施而非仅租赁的意图。
DeepSeek现象/趋势部署/工程
00:18
向阳乔木@vista8
32
DeepSeek v4 Flash 月费几十元,创作者开源AI雷达网站

作者对比 Fable 5 后强调,把大模型变便宜至关重要。他称赞 DeepSeek 极低的成本——每月使用 v4 flash 翻译大量内容,账单仅几十元。作者将自己的 AI 雷达 Skill 做成网站,支持双语对照翻译和 AI 侧边栏对话。网站本周先上线(输入 DeepSeek API 即可使用 AI 功能,也可人工点评),下周将开源。

DeepSeek大佬观点开源生态
6月10日
22:17
向阳乔木@vista8
47
@NikoMcCarty 探访DeepSeek总部称,这家300人、2023年由梁文锋创立的公司脱胎于幻方,位于杭州无标识大楼,2025年1月发布R1模型,团队年轻,目前满足于落后美国约6个月,保持低调。Vista反驳:中国大模型公司并非安于落后,而是受限于显卡和技术条件。

Niko McCarty.: Notes on DeepSeek: We visited the company HQ last Tuesday. It was founded in 2023 by Liang Wenfeng and operated out of h...

DeepSeek大佬观点行业动态
16:33
OpenCode@opencode
70
DeepSeek V4 Pro 现已在 OpenCode Zen 上线。
DeepSeek产品更新编码
6月9日
22:50
SemiAnalysis@SemiAnalysis_
65
DeepSeek V4 1.6T 第0天至第43天性能随时间变化 - 华为, GB300 NVL72, MI355X, B200 第0天在InferenceX上的推理性能 26天内100倍性能提升 每百万Token成本 华为950DT推理追踪分析 https://semianalysis.substack.com/p/deepseekv4-16t-day-0-to-day-43-performance
DeepSeek推理评测/基准部署/工程
16:39
SiliconFlow@SiliconFlowAI
61
硅基流动联合CodeWhale推出DeepSeek V4终端最佳性价比组合

硅基流动宣布,通过V4-Pro(质量)与V4-Flash(速度)两行配置,即可在终端获得DeepSeek V4的最佳性价比组合。专为DeepSeek V4构建的终端编码智能体CodeWhale现已内置SiliconFlow。CodeWhale具备流式推理(显示思考过程)、自动路由(根据任务复杂度切换模型与思考深度)、零漂移(通过书面宪法为每轮排序权威,保持V4定向)以及自我改进(V4协助编写框架,框架提升后每个会话更强大)等特性。

智能体DeepSeek产品更新编码
16:34
X.PIN@thexpin
63
DeepSeek招聘IDC工程师,计划自建数据中心

DeepSeek 发布招聘,寻找 IDC 设计与规划工程师,负责数据中心全生命周期建设(选址、布局、施工图纸、支撑基础设施)。该职位是新建设施早期技术工作的核心角色,对候选人不设最低经验要求,另有 7 年以上高级岗。岗位描述将建设规模从 MW 级扩展到 GW 级。这意味着 DeepSeek 将像 OpenAI 一样自建数据中心。

DeepSeek数据/训练行业动态
12:55
HuggingFace Daily Papers(社区热门论文)
68
FlashMemory-DeepSeek-V4: 通过前瞻稀疏注意力实现闪电索引超长上下文

FlashMemory-DeepSeek-V4(FM-DS-V4)提出Lookahead Sparse Attention(LSA)推理范式,基于DeepSeek-V4架构构建神经记忆索引器,主动预测未来上下文需求,仅保留查询关键KV块。采用解耦训练策略,索引器作为独立双编码器训练,无需加载主干模型。在LongBench-v2、LongMemEval、RULER等长上下文基准上,平均物理KV缓存压缩至全上下文基线的13.5%,下游精度平均提升0.6%;在500K极端长度下,物理KV开销减少超过90%,且不损害主干模型的核心推理能力。

DeepSeek推理论文/研究
08:21
IT之家(RSS)
47
IT早报 0609:华为余承东官宣尊界 V800;库克 WWDC 收官演讲苹果 iOS 27 发布;月之暗面寻求 20 亿美元融资;中国 AI 大模型周调用量连续六周超越美国

华为余承东官宣尊界 V800,定位超高端 MPV,轴距 3430mm,搭载 1.5T 增程器及前后双电机。苹果 WWDC26 发布 iOS 27 等新系统,库克完成 CEO 任内“最后一舞”,Siri AI 等智能功能在中国大陆暂不提供。月之暗面正寻求 20 亿美元新一轮融资,目标估值 300 亿美元,半年估值暴涨七倍。OpenRouter 数据显示中国 AI 大模型周调用量连续六周超越美国,6 月 9 日当周环比增长 27.49% 达 14.19 万亿 Token,DeepSeek-V4-Flash 蝉联榜首,MiniMax 新模型 M3 首周冲入前三。

DeepSeek端侧行业动态
00:41
Tomer Tunguz 博客(VC 分析)
精选56
AI 替代浪潮:三大力量重塑成本结构

三大力量重塑 AI 成本:前沿闭源模型持续涨价,开源模型在多数场景已足够好,买家开始替代。Coinbase 将提示词路由至更便宜模型,成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4,节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%,超越 Opus 的 14%,同一 100 任务成本 $84 vs $954(约 11 倍价差)。Cursor 后训练 Kimi K2.5 得到 Composer 2.5,称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵,开源平价且性能接近,选择决定企业单位经济学的斜率。

AnthropicDeepSeek开源生态推理

推荐理由:Tunguz 用 Coinbase、Lindy 等真实案例,把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了,做 AI 应用的人该重新算一下单位经济账。
00:27
AYi@AYi_AInotes
37
梁文锋的DeepSeek的问世成功颠覆了什么?
DeepSeek开源生态现象/趋势
6月8日
19:12
公众号:火山引擎
28
火山方舟Coding Plan与Agent Plan升级,限时2.5折

火山方舟Coding Plan与Agent Plan升级,集成MiniMax M3、DeepSeek V4系列、GLM-5.1等多款三方模型。即日起至2026年8月7日,新购/升级/续费40元、200元档位可享首两月2.5折(9.9元/月、49.9元/月)。MiniMax M3为新一代旗舰,支持100万token上下文窗口及原生多模态理解。Agent Plan为业界首个Agent套餐包,整合字节自研Seed系列模型与Harness工具,免费提供联网搜索和Embedding记忆能力,可配合Claude Code、OpenClaw、TRAE等工具使用。

智能体DeepSeek产品更新多模态
17:58
X.PIN@thexpin
58
DeepSeek刚刚首次涉足美国企业市场,在Ramp针对首次企业买家的排行榜上登顶。 但为时尚早。截至4月,DeepSeek的采用率仅为0.1%。
DeepSeek行业动态
12:44
数字生命卡兹克@Khazix0918
64
12个旗舰大模型参加高考语文数学测试,MiMo v2.5 Pro总分第一

今年高考,12个国内外旗舰大模型(Claude Opus 4.8、GPT-5.5、Gemini 3.1 Pro、千问3.7 max、文心Ernie 5.1、星火Spark X2、智谱GLM5.1、Kimi k2.6、MiniMax M3、DeepSeek V4 Pro、小米MiMo v2.5 Pro、混元3)参加语文和数学全国一卷测试。采用API调用、禁止工具、LaTeX纯文本输入,4位高中老师盲评阅卷。总分第一:MiMo v2.5 Pro(256.3分),第二Kimi k2.6(256.29分),仅差0.01分。语文最高:GLM5.1和Gemini 3.1 Pro并列;数学最高:DeepSeek V4 Pro、MiMo、ERNIE 5.1并列。前九名模型总分差距仅2分,数学主观题正确率高,唯填空题最后一题全军覆没。作文评分看重结构清晰度与时代关联。

AnthropicDeepSeekOpenAI现象/趋势
11:55
公众号:卡尔的AI沃茨
38
13个大语言模型参加2026数学高考,GPT 5.5等并列第一

13个大语言模型(GPT 5.5 Thinking、DeepSeek-v4 Pro、Gemini 3.1 Pro Thinking、Claude Opus 4.8 Max、Kimi 2.6 Thinking、Sonnet 4.6 Thinking、GLM 5.1、豆包 Thinking、Qwen 3.7 Plus Thinking、MiniMax M3、元宝 Thinking、Mimo-2.5-pro、Grok)用2026年全国一卷数学高考题进行测试,统一以LaTeX格式输入、关闭联网、不干扰作答。GPT 5.5、DeepSeek-v4 Pro、Gemini 3.1 Pro和Claude Opus 4.8并列第一,得分接近144分;Kimi 2.6以微小差距位居第二梯队;元宝118分;Mimo和Grok得分最低。大部分模型在多选题和长解答题上出现漏条件、读图错误、过度泛化等问题,甚至出现拒答或搜索答案的行为。

DeepSeekOpenAI推理评测/基准
11:29
Hacker News 热门(buzzing.cc 中文翻译)
38
DeepSeek V4 Pro 在准确率方面超越 GPT-5.5 Pro

DeepSeek V4 Pro 在准确率(precision)指标上击败 GPT-5.5 Pro,具体分数和参数量未透露。该结果来自 runtimewire.com 的评测,在 Hacker News 获得 110 个点赞。

DeepSeekOpenAI推理评测/基准
11:20
IT之家(RSS)
62
中国AI大模型周调用量连续六周超越美国,前四名均为国产模型

据OpenRouter监测,上周全球AI大模型总调用量36.1万亿Token,连续七周上涨。中国周调用量14.19万亿Token,环比增27.49%,连续六周超越美国(3.2万亿Token)。调用量前四均为中国模型:DeepSeek-V4-Flash榜首(3.69万亿Token),腾讯Hy3 preview第二(2.94万亿),新发布的MiniMaxM3首周即入前三(2.5万亿,具备1M上下文及原生多模态),小米MiMo-V2.5第四(2.19万亿)。Claude Sonnet 4.6和Claude Opus 4.7跌出前五。MiniMax总调用量3.05万亿Token超越小米、腾讯;DeepSeek以6.75万亿Token连续四周厂商榜首。

DeepSeek行业动态
00:58
Hacker News 热门(buzzing.cc 中文翻译)
61
美国人工智能的OnlyFans经济

一篇题为“The OnlyFans Economy of American AI”的文章于6月7日在Hacker News上获得104点赞,探讨美国人工智能行业中的类似OnlyFans的订阅制经济现象。

AnthropicDeepSeekOpenAI开源生态
00:35
The Decoder:AI News(RSS)
59
DeepSeek 在 2026 年 6 月登顶 Ramp 热门软件供应商,美国公司追逐更便宜的 AI

DeepSeek 在 2026 年 6 月成为 Ramp 平台最热门的软件供应商,作为一项付费服务,美国公司直接向其发送数据。Ramp 首席经济学家 Ara Kharazian 指出成本意识是驱动因素,但警告使用中国模型存在安全风险。

DeepSeek行业动态
6月6日
17:17
IT之家(RSS)
65
Ramp:美国企业 AI 成本飙升,DeepSeek 成为 B2B 市场新宠

美国企业 AI 累计投入突破 1 万亿美元,模型推理成本飙升,降本增效未达预期。Ramp 报告显示 DeepSeek 首次登上其软件趋势榜榜首。案例包括某企业一个月为 Claude 支付 5 亿美元,Uber 四个月内耗尽全年 Token 预算。DeepSeek 宣布 API 价格永久下调 75%,MiniMax 压至新低。Ramp 首席经济学家称这是美国企业寻找 OpenAI、Anthropic 低成本替代方案的最明确信号。部分企业已直接向 DeepSeek 付费。2025 年初 DeepSeek R1 模型曾登顶 App Store,但企业采用率一度达 0.3%,后回落至 0.1% 并维持到 2026 年 4 月。成本压力是再度受关注的主因。

AnthropicDeepSeek开源生态推理
6月5日
16:50
SiliconFlow@SiliconFlowAI
64
DeepSeek 在 @OpenRouter 的 token 份额位列第一--已连续四周 我们很自豪为其提供了很大一部分支持 你可以在 @SiliconFlow 上找到完整的 @deepseek_ai 模型阵容: → V4 Pro & Flash(最佳性价比 🔥) → V3.2 · V3.2 Exp · V3.1 · V3.1 Terminus · V3 0324 · R1 0528

OpenRouter: DeepSeek has now topped our token share rankings 4 weeks in a row: https://openrouter.ai/rankings

DeepSeek推理行业动态
11:14
IT之家(RSS)
67
深圳团队依托华为昇腾 910C 成功训练 1.6 万亿参数 DeepSeek-V4-Pro 大模型

深圳河套学院联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为及深智城,依托华为昇腾 910C 国产 AI 算力集群,完成 1.6 万亿参数大模型 DeepSeek-V4-Pro 的全参数后训练。项目实现模型算力利用率(MFU)超过 30%,关键训练算子效率提升 14%,各项指标均达到工业级运行标准。此次实践证实国产 AI 芯片可支撑世界级超大参数模型的训练任务,相关技术路径具备可行性。

DeepSeek行业动态
6月4日
22:34
OpenRouter@OpenRouter
精选67
DeepSeek 现已连续四周在我们平台的 token 份额排行榜上位居第一: https://openrouter.ai/rankings
DeepSeek行业动态

推荐理由:OpenRouter 作为风向标级的 API 聚合器,这个四连冠的数据比任何 benchmark 都实在,对还在犹豫选哪个模型的产品人来说,是个明确的信号。
08:10
IT之家(RSS)
62
豆包宣布将推出专业版,基础功能保持免费;阿里千问向第三方Agent全面开放

豆包声明,针对专业人群推出豆包专业版,基础功能(搜索问答、写作生图、语音和视频对话)保持免费。阿里千问向第三方Agent、Skill全面开放,瑞幸咖啡、肯德基、蜜雪冰城、东方航空为首批接入测试企业。DeepSeek首轮融资拟筹集500亿元,腾讯、宁德时代等参投,投后估值或达4000亿元。腾讯人士称微信AI智能体上线时间暂未定,取决于监管审批。苹果MacBook Neo开售三周出货110万台。

智能体DeepSeek端侧行业动态
00:45
StepFun@StepFun_ai
44
阶跃星辰(StepFun)称其 Step 3.7 Flash 在与 DeepSeek V4-Flash 的物理编程测试中全面胜出。测试要求在不使用库的情况下,生成一个包含高尔顿板、旋转六边形弹球和同步节拍器三个场景的自包含 HTML5 canvas 动画,并实现真实物理。Step 3.7 Flash 输出 59.6k tokens(耗时 9分57秒),DeepSeek V4-Flash 输出 52.5k tokens(耗时 6分21秒)。尽管 DeepSeek 更快,但 StepFun 模型在物理模拟、视觉效果和逻辑渲染上均占优。主推文指出 Step 3.7 Flash 专为真实世界 agentic 编码任务设计,能保持复杂输出中逻辑、视觉和执行的一致性。

atomic.chat: StepFun Step 3.7 Flash smashed DeepSeek V4-Flash in a physics contest We gave two open-weight models the same task: writ...

DeepSeek编码评测/基准
6月3日
18:05
X.PIN@thexpin
66
DeepSeek启动大规模首轮融资,目标募资约74亿美元

DeepSeek启动首轮大规模融资,目标募资约74亿美元,投后估值520亿至590亿美元,创中国AI行业融资纪录。创始人梁文锋个人出资约30亿美元,腾讯投资约15亿美元,宁德时代投资约7亿美元(同时布局AI数据中心供电)。网易、京东、中国国家人工智能基金等也在洽谈中。交易预计两周内完成。长期自筹资金的DeepSeek首次接受外部资本,梁文锋仍是最大单一股东。(来源:Reuters报道)

DeepSeek开源生态行业动态
14:37
Hacker News 热门(buzzing.cc 中文翻译)
64
在 AMD MI300X 上运行 DeepSeek-V4-Flash

一篇来自 fergusfinn.com 的博客文章,介绍了在 AMD MI300X GPU 上运行 DeepSeek-V4-Flash 模型的过程。

DeepSeek教程/实践部署/工程
13:09
IT之家(RSS)
同事件精选70
消息称 DeepSeek 首轮融资拟筹集 500 亿元,腾讯、宁德时代等参投

DeepSeek 计划在首轮融资中从腾讯、宁德时代等投资方处筹集约 500 亿元人民币。融资落地后,其投后估值预计在 3500 亿至 4000 亿元。创始人梁文峰将出资 200 亿元,腾讯和宁德时代分别拟投资 100 亿元和 50 亿元,成为最大外部投资者。DeepSeek 去年凭借 V3 大模型与 R1 推理模型获得广泛认可。此次融资凸显了中国正打造从大模型到算力能源基建的全链条 AI 产业。

DeepSeek行业动态
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
推荐理由:DeepSeek 第一轮就 500 亿、估值直奔 4000 亿,腾讯和宁德时代入局,这已经不是一家公司的融资,而是中国 AI 产业链上下游的一次正式组队。
08:09
IT之家(RSS)
46
微软发布基于安卓的"Project Solara"智能体操作系统

微软在 Build 2026 发布专为 AI 智能体打造的操作系统“Project Solara”。该系统基于 Android 定制,旨在运行于小型低功耗设备。现场同步展示了桌面终端和可穿戴智能胸牌两款概念设备,作为硬件厂商的参考设计。

智能体DeepSeekMicrosoft具身智能
00:29
OpenRouter@OpenRouter
精选68
⚡ 新增服务商:DigitalOcean 的 AI-Native Cloud 现已在 OpenRouter 上线。 提供高性能推理,覆盖热门开源权重模型。在 DeepSeek V3.2 的输出速度和延迟方面排名第一(数据来自 @ArtificialAnlys)。 查看其数据并试用模型:https://openrouter.ai/provider/digitalocean
DeepSeek产品更新推理部署/工程

推荐理由:OpenRouter 新上线的 DigitalOcean 推理服务,把 DeepSeek V3.2 的延迟压到了全场最低,比官方还快,做实时应用的值得立刻切过去试一下。
‹ 上一页
12345…9
下一页 ›