AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「DeepSeek」清除
7月2日周四
23:39Deedy562020 年以来按网站流量排名的前 20 家初创公司
07:37SemiAnalysis57DeepSeek V4 在 InferenceX 部署与性能探讨
7月1日周三
18:03IT之家(RSS)59瑞银:约六成企业收紧 AI 开支,DeepSeek 等开源大模型有望受益
14:03IT之家(RSS)49英伟达刷新 DeepSeek V4 推理纪录:单 Token 成本降至 1/5,AI 吞吐量最高提升 20 倍
6月30日周二
16:38The Decoder:AI News(RSS)67Deepseek发布DSpark推理框架,AI响应速度最高提升85%
16:29Rohan Paul59花旗研究:中国模型token价格低至18美分,企业转向成本控制引AI定价压力
06:05karminski-牙医57DeepSeek DSpark:推测性解码技术详解
6月29日周一
18:10公众号:蚂蚁百灵(Ling)51如何优雅地给 MLA 加上 QK-Norm?
18:01IT之家(RSS)53DeepSeek V4 正式版 7 月中旬上线,API 引入峰谷定价
13:34karminski-牙医61Flash系列模型横评:Gemini-3.5-Flash、Step-3.7-Flash、DeepSeek-V4-Flash
08:24ginobefun50BestBlogs早报:OpenAI Codex谈品味策展、Cloudflare机器人流量超人类、陪伴机器人"小伴"、DSpark推测解码等
00:23Berryxia.AI50DeepSeek 开源 DSpark 投机解码框架
6月28日周日
23:40Chubby♨️45GLM-5.2 发布:AI 圈称第二个 DeepSeek 时刻,白宫负责人警告美国勿让模型"炼狱"
20:40The Decoder:AI News(RSS)65Coinbase 转向中国 AI 模型,西方实验室面临定价压力测试
08:00IT之家(RSS)30DeepSeek成美国企业AI账单失控下的"香饽饽",阿里千问输入法macOS版上线
05:56Rohan Paul69中国AI模型价格仅为美国1/50,UBS称60%企业转向更便宜模型
02:55Rohan Paul54DeepSeek 发布 DSpark:半并行推测解码推理优化方法
02:00Yuchen Jin38DeepSeek 发布 DSpark 推测解码并开源 DeepSpec
01:06MarkTechPost(RSS)79精选DeepSeek 开源 DSpark 投机解码框架,加速 DeepSeek-V4 生成速度 60-85%
6月27日周六
20:43凡人小北63DeepSeek V4 推出 DSpark,推理速度提升 80%
18:32Hacker News 热门(buzzing.cc 中文翻译)51DeepSeek 开源推理优化方案 DeepSpec,生成速度提升 60% 至 85%
16:59IT之家(RSS)70精选AI 账单失控后 DeepSeek 成"香饽饽",部分美国企业已 100% 切换
15:59IT之家(RSS)66DeepSeek 联合北大发布 DSpark 推理加速框架,速度提升 60% 至 85%
05:53Orange AI62GLM 5.2、DeepSeek v4 Pro、GPT 5.5 反直觉使用现状
6月26日周五
23:39The Decoder:AI News(RSS)51AI初创公司Lindy弃用Claude全面改用DeepSeek,节省数百万美元
23:23Rohan Paul55DeepSeek被Anthropic Mythos震慑,融资74亿并计划全员翻倍
22:35Chubby♨️61许多人尚未意识到一场格局性转变
21:35Chubby♨️68Anthropic Mythos 预览迫使 DeepSeek 融资 74 亿美元并计划翻倍团队
13:23Rohan Paul61DeepSeek 计划各部门招聘翻倍
12:23Rohan Paul64"UBS:60%企业转向便宜模型与中国开源模型"
01:21宝玉42DeepSeek 招聘多模态工程师与研究员
01:01Hacker News 热门(buzzing.cc 中文翻译)42开放权重模型的难以忍受的廉价感
6月25日周四
22:30公众号:DeepSeek(深度求索)38DeepSeek 寻找闪亮发光的你
17:07X.PIN61GLM-5.2 开源发布:百万上下文逼近 Claude Opus 4.8 和 GPT-5.5,美国公司收紧 AI 预算
15:58IT之家(RSS)69百度开源 Unlimited OCR 模型,基于 DeepSeek OCR 架构,30亿参数仅激活5亿
09:58IT之家(RSS)542025 中国开源年度报告:OpenHarmony 登顶全球,7 年后中国开发者贡献度有望超过美国
6月24日周三
09:48swyx 🔜 @aiDotEngineer41智谱GLM-5.2击败DeepSeek,登顶世界顶级开源模型
6月23日周二
15:55X.PIN62微信AI助手"小微"抢先体验:基于WeLM,部分由DeepSeek响应
15:25X.PIN38DeepSeek Harness团队负责人崔天毅发文称团队缺人并招聘
14:07IT之家(RSS)48DeepSeek Harness团队负责人回应"不招外国人"质疑:需能用中文工作,无此规定
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月2日
23:39
Deedy@deedydas
56
2020 年以来按网站流量排名的前 20 家初创公司

Deedy Das 列出 2020 年以来按网站流量排名前 20 的初创公司:DeepSeek、Perplexity、Suno 领衔。仅 25%(Polymarket、Supabase、Fanvue、ShopMy、Whop)非 AI;20% 已被收购;未上榜的知名公司包括 Kalshi(2018 年成立)、Mistral(1000 万月访问量)、OpenEvidence(1140 万)、Cognition;除 GPTZero 和 Fanvue 外均为独角兽,其中 7 家为十角兽,但流量与估值无明显关联。

DeepSeek现象/趋势
07:37
SemiAnalysis@SemiAnalysis_
57
本周 InferenceX 团队讨论了将 DeepSeek V4 部署到 InferenceX 所需的工作、模型架构的变化、什么是 MegaKernel,以及在包括华为昇腾 NPU 在内的各种加速器上的初始性能。
DeepSeek推理评测/基准部署/工程
7月1日
18:03
IT之家(RSS)
59
瑞银:约六成企业收紧 AI 开支,DeepSeek 等开源大模型有望受益

瑞银分析师调研十余家企业IT负责人后发现,约六成企业已出台管控措施收紧AI开支。token调用成本是核心顾虑,Uber运营总监坦言AI投入回报微薄。DeepSeek等开源模型与中国本土大模型有望受益,尤其适合非代码类业务。短期内OpenAI、Anthropic等闭源厂商承压最大。谷歌推出Gemini 3.5 Flash,Anthropic发布Claude Sonnet 5以降低成本。瑞银称这一趋势为“良性调整阵痛”,无企业彻底叫停AI落地。

DeepSeek开源生态现象/趋势
14:03
IT之家(RSS)
49
英伟达刷新 DeepSeek V4 推理纪录:单 Token 成本降至 1/5,AI 吞吐量最高提升 20 倍

英伟达 6 月 30 日发布博文,宣布在 Blackwell 平台上通过全栈推理优化,使 DeepSeek V4 模型的单 Token 成本降至 1 个月前的五分之一,达到行业最低水平。优化涵盖生产运营、应用加速和基础设施访问三层,采用分离式服务、大规模专家并行、NVLink 并行通信、NVFP4 精度及多 token 预测等技术,单 GPU 的 token 吞吐量最高提升 20 倍。

DeepSeek推理行业动态部署/工程
6月30日
16:38
The Decoder:AI News(RSS)
67
Deepseek发布DSpark推理框架,AI响应速度最高提升85%

Deepseek推出DSpark推理框架,采用推测解码技术,由小模型生成候选答案、大模型批量验证,并一次生成多个token而非单个,使每用户响应速度提升60–85%。系统基于置信度动态调整验证深度,减少无效计算。DSpark与Deepseek-V4-Pro模型(与北京大学联合开发)已在HuggingFace和GitHub以MIT许可证开源。高效推理降低对高端芯片需求,有助于中国与欧盟在芯片受限下获取更多AI性能,短期构成战略优势。

DeepSeek开源/仓库开源生态推理
16:29
Rohan Paul@rohanpaul_ai
59
花旗研究:中国模型token价格低至18美分,企业转向成本控制引AI定价压力

花旗研究数据显示,中国模型每百万token收费低至18美分,而顶级模型均价4美元。OpenRouter上开源模型处理占比从1月34%升至6月65%,DeepSeek等中国模型因低价受关注。Gartner预测AI编码成本2028年将超普通开发者薪资。按用量付费使企业从“选最强模型”转向成本控制,OpenAI和Anthropic面临逐任务比价压力。前Meta PM及Perplexity CEO指出,中国能更快建设数据中心,电力、许可、人力、专业能力均不成问题,进一步压低成本。

Rohan Paul: Opinion from a former Meta PM. And this is from Aravind Srinivas of Perplexity "China can build data centers a lot faste...

DeepSeek开源生态现象/趋势
06:05
karminski-牙医@karminski3
57
DeepSeek DSpark:推测性解码技术详解

DeepSeek推出的DSpark是一种推测性解码技术,通过在Final RMSNorm后接入3层MTP微型Transformer堆叠,让大模型在输出前并行猜5个token,经置信度头剪裁后,送回大模型用prefill验证,正确则一次性吐出多个token。相比外挂小模型更高效,不降智,速度提升60%-85%。目前SGLang已有相关PR(#29538),DeepSeek已在HuggingFace发布多款DSpark魔改版小模型。

DeepSeek推理教程/实践部署/工程
6月29日
18:10
公众号:蚂蚁百灵(Ling)
51
如何优雅地给 MLA 加上 QK-Norm?

DeepSeek 的 MLA 通过只缓存低维潜向量压缩 KV Cache,但 QK-Norm 需归一化高维 Key,若缓存归一化结果则打破低维优势。文章提出数学等效变换:将 QK-Norm 中动态逆 RMS 标量和静态仿射权重合并到 Query 侧,推理时每个 token 只需额外缓存一个逆 RMS 标量,即可严格等价实现 QK-Norm,不牺牲显存效率。在 400M/1B 模型训练 100B tokens 实验中,QK-Normed MLA 相比 QK-clipping loss 更低(1B 模型 gap ~0.02),训练更稳定且收敛更快。

DeepSeek推理教程/实践数据/训练
18:01
IT之家(RSS)
53
DeepSeek V4 正式版 7 月中旬上线,API 引入峰谷定价

DeepSeek 团队 6 月 29 日宣布,DeepSeek V4 正式版计划于 7 月中旬上线,届时 API 定价将引入峰谷机制,高峰时段(每日 9:00-12:00、14:00-18:00)价格为平时的 2 倍。此前 DeepSeek-V4 预览版已于 4 月 24 日上线并同步开源,拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上实现国内与开源领域领先,按大小分为两个版本。另外,DeepSeek-V4-Pro API 已永久降价至原定价的 1/4。

DeepSeek开源生态推理模型发布
13:34
karminski-牙医@karminski3
61
Flash系列模型横评:Gemini-3.5-Flash、Step-3.7-Flash、DeepSeek-V4-Flash

推文对三款Flash级模型(Gemini-3.5-Flash、Step-3.7-Flash、DeepSeek-V4-Flash)进行横评。这些模型定位为多智能体系统和RAG系统的驱动模型。评测维度包括Agent Loop迭代能力、Agent能力、前端/后端、空间理解、美学、性价比等。Gemini-3.5-Flash更适合前端页面、建模等“漂亮活”。Step-3.7-Flash极具性价比,在Agent测试中Token效率极高(用最少Token完成最多任务),适合作为OpenClaw、Hermes等Agent框架的驱动模型。DeepSeek-V4-Flash后端能力出色,适合写脚本或驱动ClaudeCode用于AI-Ops。

智能体DeepSeekGoogle评测/基准
08:24
ginobefun@hongming731
50
BestBlogs早报:OpenAI Codex谈品味策展、Cloudflare机器人流量超人类、陪伴机器人"小伴"、DSpark推测解码等

OpenAI Codex负责人称,代码实现成本趋近于零后,产品瓶颈转向品味与策展。Cloudflare CEO预测2026上半年机器人流量超人类,五年后或达千倍,广告模式难以为继,公司已裁20%团队并扩管理幅度至12:1。陪伴机器人“小伴”采用端侧1.7B+7B模型,延迟压至0.4秒。Grok 4.5在SpaceX/特斯拉私测,基于1.5T参数V9模型,性能接近Opus。DeepSeek发布DSpark推测解码框架,DeepSeek-V4单用户生成速度提升60-85%。路由层降AI成本60%但质量损失代价为节省额4-5倍。2000人次6000多次提示词注入攻击下,Claude Opus 4.6成功保护secrets.env文件。

ginobefun: http://x.com/i/article/2071376452755587072

DeepSeekOpenAI行业动态
00:23
Berryxia.AI@berryxia
50
DeepSeek 开源 DSpark 投机解码框架

DeepSeek 开源 DSpark,一个面向生产环境的投机解码框架。核心解决传统投机解码中 draft 模型猜测后期 token 错误率高、浪费算力的问题。DSpark 采用并行 backbone + 顺序 Markov head 混合架构,消除后缀衰减;并引入置信度 head 和负载感知调度器,动态控制验证数量。在 DeepSeek-V4 生产系统中,单用户生成速度比 MTP-1 基线快 60-85%,吞吐提升 1.5x 至 5x。开源内容包括基于 V4 权重的 DeepSeek-V4-Pro-DSpark/Flash-DSpark checkpoint,以及 MIT 协议的 DeepSpec 训练代码,与北京大学联合开发。

Dmytro Dzhulgakov: DSpark from @deepseek_ai ingeniously integrates many speculative decoding ideas to achieve 1.5x to 5x higher throughput ...

DeepSeek开源/仓库推理部署/工程
6月28日
23:40
Chubby♨️@kimmonismus
45
中国开源权重模型 GLM-5.2 发布,被评价为继 DeepSeek 之后的第二次"DeepSeek 时刻"。有评论指出,其性能已可与 OpenAI 和 Anthropic 当前可用模型媲美。白宫 AI 负责人 David Sacks 就此警告,美国若继续将自身模型置于"炼狱"(指过度监管或限制),世界将转向中国技术,美国公司将在竞赛中落后。该言论呼应了此前 DeepSeek 开源模型的全球影响,凸显中美 AI 开源竞争进入新阶段。

Innovation Council: "We now have a Chinese open-weight model that is as good as the currently available models from OpenAI and Anthropic." @...

DeepSeek大佬观点开源生态
20:40
The Decoder:AI News(RSS)
65
Coinbase 转向中国 AI 模型,西方实验室面临定价压力测试

Coinbase CEO Brian Armstrong 已将公司迁移至中国 AI 模型,采用智谱 GLM 5.2 和月之暗面 Kimi 2.7,token 用量攀升但支出减半。91% 的开发者从未触及旧用量上限。初创公司 Lindy 近期转向 DeepSeek V4,Snowflake 也在测试中国模型作为廉价替代品。Coinbase 部署自动路由系统,根据任务、价格和缓存潜力选择模型,缓存命中率从 5% 提升至 60%。开发者被要求保持上下文精简并开启新会话。公司让每位开发者用量透明但不设上限,Armstrong 表示“AI 支出越多,预期影响越大”。这些举措使 AI 总支出减半。同时,OpenAI 的 GPT-5.6-Sol 与 GPT-5.5 定价相同但更省 token,并推出两个廉价变体,加剧与 Anthropic 的价格战。

DeepSeekOpenAI行业动态部署/工程
08:00
IT之家(RSS)
30
DeepSeek成美国企业AI账单失控下的"香饽饽",阿里千问输入法macOS版上线

AI账单失控背景下,越来越多的美国企业转向Tokenminimizing策略,部分企业已100%切换使用DeepSeek以降低Token消耗。阿里千问输入法macOS版正式上线,主打最快300字/分的语音输入和AI自动润色功能,支持9种方言且无广告;官方预告iOS、Android、Windows版将于近日发布。

DeepSeek开源生态推理行业动态
05:56
Rohan Paul@rohanpaul_ai
69
中国AI模型价格仅为美国1/50,UBS称60%企业转向更便宜模型

J.P. Morgan报告显示,中国AI模型每token比美国便宜50倍,Qwen、DeepSeek、Kimi施压OpenAI和Anthropic定价。到2026年4月,中国公司在OpenRouter流量占比将从不足2%升至超45%。报告还指出企业AI token将商品化,多数任务无需前沿模型;AI已驱动标普500回报的65%-80%;NVIDIA仍主导AI加速器,但定制芯片可降总成本30%-40%;中国GPU自给率提升。UBS调查发现,60%监控AI预算的企业已转向更便宜模型,通过模型路由将简单任务分流至Qwen、DeepSeek、MiniMax等开源模型,以应对最高$35K/月账单及团队超配额200%的压力。

Rohan Paul: UBS says 60% of companies now watching AI budgets are moving to cheaper models and open-source Chinese models The pressu...

DeepSeek开源生态现象/趋势
02:55
Rohan Paul@rohanpaul_ai
54
DeepSeek 发布 DSpark:半并行推测解码推理优化方法

DeepSeek 提出 DSpark,一种半并行推测解码系统,使 DeepSeek-V4 在相同吞吐量下每用户生成速度提升约 60% 至 85%。核心创新在于选择性验证:草稿模型并行生成多个候选 token,再由一个小型马尔可夫头根据前一个 token 微调每个猜测,弥补纯并行推测后段 token 组合质量下降的缺陷。置信度调度器基于接受概率和 GPU 负载,动态决定每个请求需验证的 token 数量,避免无效计算。

DeepSeek推理论文/研究
02:00
Yuchen Jin@Yuchenj_UW
38
DeepSeek 是 GOAT。🐳 他们刚刚发布了 DSpark,一种新的推测解码方法,将吞吐量提升 51% 到 400%。 他们还开源了背后的训练框架 DeepSpec。 这才是真正的开放 AI。
DeepSeekGitHub开源生态推理
01:06
MarkTechPost(RSS)
精选79
DeepSeek 开源 DSpark 投机解码框架,加速 DeepSeek-V4 生成速度 60-85%

DeepSeek 发布 DSpark 投机解码框架并开源检查点与训练代码。该框架不是新模型,而是在 DeepSeek-V4 权重上附加草稿模块,通过半自回归生成(并行骨干 + 轻量级顺序头)实现无损加速。生产环境下,DeepSeek-V4-Flash 和 V4-Pro 每用户生成速度较 MTP-1 基线分别提升 60–85% 和 57–78%。离线测试中,接受长度比 Eagle3 高 26–31%,比 DFlash 高 16–18%。配套 DeepSpec 训练代码库采用 MIT 许可证。

DeepSeek推理论文/研究部署/工程

推荐理由:DeepSeek 开源的这个投机解码框架让 V4 生成提速 60% 以上,关键在于不换模型就能加速,对用 API 做产品的人是立即可用的性能提升。代码和权重都给了,值得一试。
6月27日
20:43
凡人小北@frxiaobei
63
DeepSeek V4 进行了一次更新。 新推出了投机解码(Speculative Decoding)框架 DSpark,推理速度提升 80%。 DSpark 已被部署在 DeepSeek-V4(Flash 和 Pro)的真实线上流量中。 报告:《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》 https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
DeepSeek产品更新推理论文/研究
18:32
Hacker News 热门(buzzing.cc 中文翻译)
51
DeepSeek 开源推理优化方案 DeepSpec,生成速度提升 60% 至 85%

DeepSeek 在 GitHub 上开源了推理优化方案 DeepSpec,并发布了配套论文 DSparkpaper.pdf。该方案可将模型生成速度提升 60% 至 85%,具体实现细节见论文。

DeepSeek开源生态推理论文/研究
16:59
IT之家(RSS)
精选70
AI 账单失控后 DeepSeek 成"香饽饽",部分美国企业已 100% 切换

美国企业面临 AI 账单失控,开始转向 Token 最小化策略。旧金山公司 Lindy 此前主要调用 Anthropic 的 Claude 模型,每月 AI 账单超支甚至超过员工工资。该公司 CEO 弗洛·克里维洛表示,本月初已将 100% 流量切换到 DeepSeek,预计未来几个月可节省数百万美元。企业开始采用按任务匹配模型的“模型路由”,不再将最贵的前沿模型用于所有场景。部分客户已决定暂停 AI 投入,待证明投资回报率后再继续。

DeepSeek开源生态现象/趋势

推荐理由:一家初创把AI调用从Claude全切到DeepSeek,省下的钱超过工资总额,企业客户开始用模型路由压成本,这个趋势比任何benchmark都更能说明价格战的影响。
15:59
IT之家(RSS)
66
DeepSeek 联合北大发布 DSpark 推理加速框架,速度提升 60% 至 85%

DeepSeek 联合北京大学发布 DSpark 推理加速框架,已部署于 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 预览版。DSpark 采用半自回归架构与置信度调度验证机制,在同等吞吐量下将单用户生成速度提升 60% 至 85%。在 Qwen3 系列和 Gemma4-12B 的离线测试中,DSpark 平均每轮接受长度优于 Eagle3 和 DFlash。生产环境下,V4-Flash 引擎在 80 token/s SLA 下吞吐量提升 51%,120 token/s 时提升 661%。相关论文、训练代码已在 GitHub 开源。

DeepSeek开源/仓库推理部署/工程
05:53
Orange AI@oran_ge
62
GLM 5.2、DeepSeek v4 Pro、GPT 5.5 反直觉使用现状

推文分享了三个反直觉的模型观察:GLM 5.2 正在取代 Claude Sonnet 和 Opus 成为付费用户最爱;DeepSeek v4 Pro 仍是大众最受欢迎模型;GPT 5.5 虽然强大但几乎无人使用。数据来源为 cola 的 token 消耗统计,侧面说明 cola 和 codex(GPT 5.5 用户)画像完全不同。

DeepSeekOpenAI大佬观点开源生态
6月26日
23:39
The Decoder:AI News(RSS)
51
AI初创公司Lindy弃用Claude全面改用DeepSeek,节省数百万美元

AI初创公司Lindy已完全弃用Anthropic的Claude,转而使用中国公司DeepSeek的模型(在美国境内托管)。CEO Flo Crivello向CNBC表示,其25人公司的AI成本此前“不可持续”,甚至超过人员开支;切换后成本曲线“直接跌到地面”,节省了数百万美元。Crivello称若Anthropic降价会考虑换回,因为“这关乎企业生存”。Snowflake CTO分析显示,GLM-5.2等中国模型虽未完全达到Claude水平,但在性价比上具有竞争力。OpenAI CEO Sam Altman也指出,AI成本已成为企业的“巨大问题”。

AnthropicDeepSeek行业动态
23:23
Rohan Paul@rohanpaul_ai
55
DeepSeek被Anthropic Mythos震慑,融资74亿并计划全员翻倍

The Information报道,Anthropic的Mythos预览版让DeepSeek感到震惊,CEO梁文峰意识到需要更大现金储备来竞争。DeepSeek随即启动74亿美元融资,并计划将所有部门员工数量翻倍,招聘覆盖AI核心研发、算法、深度学习、全栈开发和产品岗位,表明DeepSeek正从仅调模型转向构建完整系统。AI竞争已变为计算储备、人才密度、基础设施、产品表面积和现金储备的综合较量。

Rohan Paul: Reuters: DeepSeek is going on a hiring sprint, aiming to double every department. The hiring spans AI core R&D, algorith...

AnthropicDeepSeek行业动态
22:35
Chubby♨️@kimmonismus
61
许多人尚未意识到一场格局性转变

Kim 指出,美国政府限制前沿AI能力(阻止SOTA被使用),反而让开源模型更吸引自有应用和整体市场,欧盟等国家也可受益。这吸引新投资与理想主义人才,OpenAI 和 Anthropic 将最受监管反噬,间接助推开源(尤其来自中国)。引用称,Anthropic 4月预览 Mythos 后,DeepSeek 因无法竞争而融资74亿美元;此前该实验室靠 CEO 梁文锋个人财富,现有约300人,计划至少翻倍。

Chubby♨️: Anthropic's Mythos preview reportedly pushed DeepSeek into a $7.4B fundraising - because they could not compete with Myt...

AnthropicDeepSeek开源生态现象/趋势
21:35
Chubby♨️@kimmonismus
68
Anthropic Mythos 预览迫使 DeepSeek 融资 74 亿美元并计划翻倍团队

Anthropic 4 月预览的 Mythos 模型据报迫使 DeepSeek 转向外部融资,筹集 74 亿美元。此前这家成立三年的中国 AI 实验室一直靠 CEO 梁文锋个人财富运营。The Information 报道称,梁文锋认为 DeepSeek 若无更大资金储备将无法与 Mythos 竞争。DeepSeek 正激进扩张:当前约 300 名员工,计划在 AI 系统、基础设施、产品和研究部门至少翻倍人员规模。

AnthropicDeepSeek行业动态
13:23
Rohan Paul@rohanpaul_ai
61
路透社:DeepSeek 正进行招聘冲刺,目标是每个部门人员翻倍。 招聘涵盖AI核心研发、算法、深度学习研究、全栈开发和产品岗位,这意味着DeepSeek不再只是调模型,而是围绕模型构建整个系统。
DeepSeek行业动态
12:23
Rohan Paul@rohanpaul_ai
64
"UBS:60%企业转向便宜模型与中国开源模型"

"UBS报告称,60%关注AI预算的企业正转向更便宜的模型和中国开源模型。用户月花费高达$35K,团队超配额200%,公司内部AI工具从5个削减至2个。企业采用模型路由策略,将简单任务分配给低成本模型,将复杂推理、编码和长上下文任务保留给高端模型。中国开源模型如Qwen、DeepSeek、MiniMax、GLM、Kimi因可本地部署或通过云目录使用,符合企业成本曲线。"

DeepSeek开源生态现象/趋势
01:21
宝玉@dotey
42
DeepSeek 正在招聘多模态方向的全职/实习岗位,包括多模态数据工程师(预训练数据工程师)以及多模态理解数据/算法研究员(图像与视频方向)。应聘者可通过私信或发送简历至 talent@deepseek.com 联系。

Xingchao Liu: 🚀 我们组在招(全职/实习都可以): -多模态数据工程师(属于预训练数据工程师) -多模态理解数据/算法研究员(图像 & 视频方向) DM 已开,直接带CV发消息给我,或者带CV发邮件到 talent@deepseek.com

DeepSeek多模态行业动态
01:01
Hacker News 热门(buzzing.cc 中文翻译)
42
开放权重模型的难以忍受的廉价感

DeepSeek V4 定价极低,仅基于 token 费用就比 Anthropic 和 OpenAI 的前沿模型便宜近 50 倍,未计入思考类模型额外 token 消耗。文章指出对方陷入高成本困境,难以降价 20–50 倍竞争。开放权重模型低成本源于硬件压力测试还是亏本引流,尚存争议。担忧美国可能借“中国恐惧”推动限制开放权重模型。Google 于 2026 年 4 月发布 Gemma 4,Meta Llama 无新版本,OpenAI 最后开放权重停留在 2025 年 GTP,Anthropic 从未发布。真正开源(含训练数据管道)模型正流行,但数据截止 2024 年 12 月。美国 NSF 与 Nvidia 合作支持 Allen AI 开发完全开源 AI。

AnthropicDeepSeekOpenAI开源生态
6月25日
22:30
公众号:DeepSeek(深度求索)
38
DeepSeek 寻找闪亮发光的你
DeepSeek行业动态
17:07
X.PIN@thexpin
61
GLM-5.2 开源发布:百万上下文逼近 Claude Opus 4.8 和 GPT-5.5,美国公司收紧 AI 预算

中国公司 z.AI 以 MIT 许可证开源 GLM-5.2 模型,拥有百万 token 上下文窗口,基于华为昇腾芯片训练,性能接近 Claude Opus 4.8 和 GPT-5.5。与此同时,Amazon、Meta、Uber 等美国公司因工程师过度消耗 token 而开始限制 AI 预算(Uber 每员工上限 1500 美元),推动开源模型需求。GLM 团队源自学术项目,长期适配国产芯片;DeepSeek 投入 28 亿美元,共同成为“Tokenmaxxing”趋势的替代方案。

AnthropicDeepSeek开源生态推理
15:58
IT之家(RSS)
69
百度开源 Unlimited OCR 模型,基于 DeepSeek OCR 架构,30亿参数仅激活5亿

百度于6月22日开源 Unlimited OCR 模型,总参数量30亿,推理时仅激活5亿。模型延续 DeepSeek OCR 架构,编码端采用两级视觉编码并执行16倍 token 压缩,将1024×1024 PDF 图像压缩为256个视觉 token,缓解长文档解析越生成越慢问题。训练基于 DeepSeek OCR 检查点,冻结 DeepEncoder 后继续4000步,使用约200万份文档在8×16 A800 GPU上完成,单页与多页数据配比约9:1。在 OmniDocBench v1.5 上整体得分93.23(DeepSeek OCR 87.01,DeepSeek OCR 2 89.17),文本编辑距离0.038,公式 CDM 92.61,表格 TEDS 90.93,读序编辑距离0.045;v1.6 得分93.92。GitHub 已获 6.8K Star。

DeepSeek多模态开源生态模型发布
09:58
IT之家(RSS)
54
2025 中国开源年度报告:OpenHarmony 登顶全球,7 年后中国开发者贡献度有望超过美国

开源社发布《2025中国开源年度报告》。GitHub平台中国活跃开发者超210万,全球第三。OpenHarmony以60089 OpenRank值登顶全球开源项目影响力榜首。中美贡献度增速差超10%,按当前态势7年后中国开发者贡献度有望超过美国。中国OpenRank贡献度254963,全球第二。AI大模型相关仓库年均增长率超210%,vLLM进入全球项目Top15。10亿以上参数模型中Meta下载量占23.2%,阿里Qwen系列占20%,DeepSeek占3.8%,其R1训练成本仅550万美元。开源企业影响力微软居首,华为第二。

DeepSeekGitHub开源生态行业动态
6月24日
09:48
swyx 🔜 @aiDotEngineer@swyx
41
智谱AI(Zai)1月以每股120港元在港IPO。其GLM-5.2模型击败DeepSeek,成为全球公认的最佳开源模型,并在部分基准上整体表现领先。团队首次现身硅谷,参加AI Engineer World's Fair,将分享最新工作进展。

Lou: Made it to SF! The love for GLM-5.2 has been incredible. We are bringing team out for the AI Engineer World's Fair, wher...

DeepSeek大佬观点开源生态模型发布
6月23日
15:55
X.PIN@thexpin
62
微信AI助手"小微"抢先体验:基于WeLM,部分由DeepSeek响应

作者抢先体验了微信AI助手“小微”。小微基于腾讯自研中文大模型WeLM,部分响应由DeepSeek处理。用户手动激活后,可设置日程、发消息、打电话、生成歌单、启动小程序,并能唤醒美团外卖和京东购物,但转账、红包等最终支付需手动确认。隐私方面:聊天信息仅当前会话读取,不保存、不用于训练,上下文记忆可手动关闭。微信拥有超10亿用户,而腾讯在大模型领域落后于字节和阿里,因此微信成为其最重要的AI落地窗口。支付宝也已在测试具备车辆预约和外卖配送能力的AI智能体。

智能体DeepSeek产品更新
15:25
X.PIN@thexpin
38
DeepSeek Harness团队负责人崔天毅发文称团队缺人并招聘

DeepSeek Harness团队负责人崔天毅在社交媒体发文称,团队处于初创阶段且严重缺人,他本人每天面试候选人,并在各大平台发布招聘广告。开放三个岗位:Harness Researcher、Harness Engineer、Harness PM。有网友询问是否招聘外国人,崔回应称公司没有禁止雇佣非中国籍员工,但要求所有员工使用中文工作,因此外国人可以申请,前提是能够以普通话作为工作语言。

DeepSeek行业动态
14:07
IT之家(RSS)
48
DeepSeek Harness团队负责人回应"不招外国人"质疑:需能用中文工作,无此规定

DeepSeek Harness团队负责人崔添翼6月21日发文称,新成立的Harness团队目标宏大、工作繁重,人员紧缺,正招聘Harness研究员、工程师、产品经理三个岗位。针对网友“不招外国人”的评论,崔添翼回应称,公司招人需要能用中文工作,如同美国公司要求能用英语,并无不招外国人的规定。知情人士透露,DeepSeek已在内部组建Harness团队,主攻代码智能体产品,内部对标Anthropic的Claude Code。

智能体DeepSeek编码行业动态
‹ 上一页
123…9
下一页 ›