AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「DeepSeek」清除
6月23日周二
13:13HuggingFace Daily Papers(社区热门论文)60Unlimited OCR:长序列OCR显存与速度问题的解决方案
11:14Berryxia.AI63百度开源 Unlimited OCR:单次解析多页 PDF,疑似挖角 DeepSeek 技术骨干
04:10Artificial Analysis60AA-Briefcase基准测试:开放权重模型主导成本-性能帕累托前沿
01:12Berryxia.AI66百度开源Unlimited-OCR:可一次性处理数百页文档
6月22日周一
21:08AYi49DeepSeek V4 Flash 限时全免费
00:06向阳乔木53DeepSeek Harness组面向三岗位招聘
6月21日周日
22:35宝玉45DeepSeek Harness 招聘研究员/工程师/产品经理
21:35meng shao44DeepSeek Harness 组研究员/工程师/产品经理急聘
20:09Berryxia.AI41DeepSeek-V4-Flash免费至6月28日
20:05AYi31GLM 5.2被赞国产Fable 5,或接棒DeepSeek
6月20日周六
20:30The Decoder:AI News(RSS)56NYU教授Damodaran:AI回调冲击或超互联网泡沫
16:27Hacker News 热门(buzzing.cc 中文翻译)72同事件精选GPT-5.5幻觉率达86%,GLM-5.2仅28%--大模型越大越不可靠同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
16:01AYi65微软两头通吃:GPT卖中国,DeepSeek卖西方
15:01AYi75精选微软双向转售GPT与DeepSeek成全球最大AI中间商
6月19日周五
19:19Chubby♨️47DeepSeek API打造1800机器人WoW私服
12:19AYi76精选DeepSeek研究员开源AutoResearch:AI自主跑通285B模型RL研究闭环
08:16IT之家(RSS)39IT早报 0619:宁德时代利润超7家车企总和;首部L3/L4自动驾驶国标公示;DeepSeek识图模式上线
08:00OpenRouter:Announcements(RSS)73精选DeepSeek V4 智能体 token 份额持续增长
6月18日周四
23:20🚨 AI News | TestingCatalog67微软评估多款开源模型用于Copilot Cowork,考虑托管DeepSeek V4
22:14IT之家(RSS)59DeepSeek 首次融资估值超 500 亿美元,传创始人向投资人提"不挖人"要求
20:14IT之家(RSS)63DeepSeek 识图模式正式上线,无法识别创始人梁文锋
16:49X.PIN61中美AI角色悄然互换
16:14IT之家(RSS)72精选DeepSeek 识图模式正式上线 App 和网页端
03:06Hacker News 热门(buzzing.cc 中文翻译)67美国暂未将DeepSeek列入黑名单,逾100家企业被认定为安全风险
6月17日周三
23:07IT之家(RSS)74同事件精选DeepSeek 以 4000 亿元估值完成首轮外部融资:510 亿元到账,投资方含梁文锋、腾讯、宁德时代等同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
16:38X.PIN35微软用自托管DeepSeek-V4驱动Copilot智能体
13:09SemiAnalysis65OhnePixel 获 DeepSeek V4 部署平台
11:03IT之家(RSS)57Anthropic 和 OpenAI 模型太贵,微软智能体考虑使用 DeepSeek V4 微调版
09:06meng shao66微软 Copilot Cowork 全球可用,拟引入 Azure 托管 DeepSeek V4 降本
08:03IT之家(RSS)29IT早报:DeepSeek完成超70亿美元融资,英伟达员工考公上岸,央视关注运营商不同权
05:05Rohan Paul70DeepSeek获74亿美元融资,估值500亿美元成中国AI第一
03:35The Decoder:AI News(RSS)50微软 Copilot Cowork 转向按用量计费,考虑采用 DeepSeek V4
02:24Chubby♨️75精选微软考虑为 Copilot Cowork 集成 DeepSeek V4
6月16日周二
22:01Nathan Lambert:Interconnects(RSS)52前沿大模型后训练配方回顾:与 Finbarr Timbers 对谈
21:51Nathan Lambert53Nathan Lambert联合Finbarr Timbers发布新播客,调研GLM 5.1等模型后训练配方
18:00IT之家(RSS)43腾讯云 DeepSeek-V3.2 模型 7 月 16 日下线,官方建议迁移至 V4 系列
17:57The Decoder:AI News(RSS)72同事件精选DeepSeek 完成首轮外部融资,估值超 500 亿美元同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
16:00IT之家(RSS)69OpenRouter 发布 Fusion API,多模型协同以一半成本接近 Claude Fable 5 性能
15:00IT之家(RSS)68DeepSeek 完成超 70 亿美元融资,腾讯、宁德时代等参投但无投票权
13:00IT之家(RSS)66谷歌更新Android Bench榜单:Gemini 3.5 Flash成本最贵,约为DeepSeek V4 Flash的17.5倍
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月23日
13:13
HuggingFace Daily Papers(社区热门论文)
60
Unlimited OCR:长序列OCR显存与速度问题的解决方案

针对长序列转录中KV缓存累积导致显存增加和速度下降的问题,研究团队提出Unlimited OCR。该模型以DeepSeek OCR为基线,用提出的Reference Sliding Window Attention(R-SWA)替换解码器所有注意力层,在保持恒定KV缓存的同时降低注意力计算成本。结合DeepSeek OCR编码器的高压缩率,Unlimited OCR在32K标准最大长度下单次前向可转录数十页文档。R-SWA是一种通用解析注意力机制,同样适用于ASR、翻译等任务。代码和模型权重已开源。

DeepSeek多模态论文/研究
11:14
Berryxia.AI@berryxia
63
百度开源 Unlimited OCR:单次解析多页 PDF,疑似挖角 DeepSeek 技术骨干

百度在 HuggingFace 开源 Unlimited OCR 模型,核心卖点为 One-Shot Long-Horizon Parsing(单次长时解析),一次前向推理即可转录几十页 PDF 或图像。其创新机制 R-SWA(参考滑动窗口注意力)模拟人类抄写时的注意力模式——每个 token 看到完整图像,输出端只维护前 128 个状态,32K 上下文,KV Cache 大小恒定不随文档长度增长。技术报告披露灵感与 DeepSeek-OCR 架构有密切联系,核心贡献者中技术总监 YY 疑为近期从 DeepSeek 离职的研究者。模型已在 GitHub 和 HuggingFace 开放。

DeepSeek多模态开源/仓库模型发布
04:10
Artificial Analysis@ArtificialAnlys
60
AA-Briefcase基准测试:开放权重模型主导成本-性能帕累托前沿

Artificial Analysis发布AA-Briefcase智能体知识工作基准测试,评估模型在长期任务中的表现。任务成本差异超700倍,最高性能模型Claude Fable 5每任务超$20。成本-性能帕累托前沿上,除Anthropic两个最高分模型外,其余大部分由开放权重模型占据。关键性价比:GLM 5.2 (max)每任务$2.40,得分仅比Claude Opus 4.8低90 Elo,成本低65%;DeepSeek V4 Pro (max)每任务$0.08,得分比Gemini 3.5 Flash高约60 Elo,成本低98%以上。

智能体AnthropicDeepSeek推理
01:12
Berryxia.AI@berryxia
66
百度开源Unlimited-OCR:可一次性处理数百页文档

百度PaddlePaddle在HuggingFace发布Unlimited-OCR,核心创新R-SWA(Reference Sliding Window Attention)使解码时KV Cache保持恒定,避免随页数爆炸。该模型可一次性处理数百页文档,速度和稳定性优于逐页处理。在OmniDocBench上得分93%,比DeepSeek-OCR高出6个百分点。这使长文档OCR从“分块+拼接”变为端到端一镜到底,直接理解整篇文档结构与布局。

Adina Yakup: Unlimited-OCR 🔥New OCR from @PaddlePaddle It can parse hundreds of pages in a single pass while maintaining stable spee...

DeepSeekHugging Face多模态开源/仓库
6月22日
21:08
AYi@AYi_AInotes
49
DeepSeek V4 Flash 限时全免费

DeepSeek V4 Flash 登陆 OpenModel 平台,开启限时免费活动。该模型为 284B MoE 架构,支持 1M 超长上下文,编码与智能体能力突出。活动期间输入输出均为 $0.00/M,无任何调用门槛。平台其他模型同步享受 20%–80% 折扣。免费窗口期至 6 月 28 日截止。

OpenModel: DeepSeek-V4-Flash is FREE until June 28! OpenModel Limited-Time Event: → Input: $0.00 / M → Output: $0.00 / M Powerful 2...

智能体DeepSeek编码行业动态
00:06
向阳乔木@vista8
53
DeepSeek Harness组(新成立部门)仍在大量招聘,共开放三种职位:Harness研究员(实习/全职)、Harness工程师(实习/全职)、Harness产品经理(仅全职)。候选人大致需通过一轮笔试和三轮面试,终面由部门负责人@tianyi主持。职位空缺较大,招聘门槛与DeepSeek其他组一致。投递链接及私信渠道已附。

Tianyi Cui: 作为新成立的部门,DeepSeek Harness 组的目标远大、工作繁重,仍然非常缺人。我每天都在面试,以及各种地方张贴小广告......一共有三种职位: Harness 研究员(实习全职均可):https://app.mokahr.co...

DeepSeek行业动态
6月21日
22:35
宝玉@dotey
45
DeepSeek Harness 新部门正在招人,共三种职位:Harness 研究员(实习/全职均可)、Harness 工程师(实习/全职均可)、Harness 产品经理(限全职)。招聘门槛与 DeepSeek 其他组一致,流程为一轮笔试加三轮面试,终面由 @tianyi 负责。有意者可私信投递简历,具体链接详见推文。

Tianyi Cui: 作为新成立的部门,DeepSeek Harness 组的目标远大、工作繁重,仍然非常缺人。我每天都在面试,以及各种地方张贴小广告......一共有三种职位: Harness 研究员(实习全职均可):https://app.mokahr.co...

DeepSeek行业动态
21:35
meng shao@shao__meng
44
DeepSeek Harness 组(新成立部门)仍在大量招聘。职位包括:Harness 研究员(实习/全职)、Harness 工程师(实习/全职)、Harness 产品经理(仅全职)。招聘流程与 DeepSeek 其他组一致:一轮笔试加三轮面试,终面由 @tianyi 负责。可私信投递简历。

Tianyi Cui: 作为新成立的部门,DeepSeek Harness 组的目标远大、工作繁重,仍然非常缺人。我每天都在面试,以及各种地方张贴小广告......一共有三种职位: Harness 研究员(实习全职均可):https://app.mokahr.co...

智能体DeepSeek行业动态
20:09
Berryxia.AI@berryxia
41
DeepSeek-V4-Flash免费至6月28日

兄弟们,喜大普奔哈哈! DeepSeek-V4-Flash 免费到6月28号,直接冲啊! 284B MoE,1M上下文,编码和Agent能力都不错,直接可以用起来,截止日期到6月28号。 链接:https://www.openmodel.ai

OpenModel: DeepSeek-V4-Flash is FREE until June 28! OpenModel Limited-Time Event: → Input: $0.00 / M → Output: $0.00 / M Powerful 2...

智能体DeepSeek编码行业动态
20:05
AYi@AYi_AInotes
31
感觉GLM 5.2太强了,有点国产Fable 5的感觉了, 会不会是下一个DeepSeek时刻, 然后接棒DeepSeek成为中国大模型的新一代大哥和门店担当
DeepSeek开源生态现象/趋势
6月20日
20:30
The Decoder:AI News(RSS)
56
NYU教授Damodaran:AI回调冲击或超互联网泡沫

纽约大学金融教授Aswath Damodaran在播客中警告,AI行业若发生回调,冲击可能比2000年互联网泡沫破裂更痛苦。他指出AI需巨额物理基础设施投资且多依赖债务融资,损失将波及社会。Damodaran质疑AI商业模式能否规模化,因AI每次使用都消耗算力,规模经济弱于Netflix、更像Spotify;中国Deepseek等对手带来价格侵蚀,利润率本已很低。他还警告,若AI实现替代整个岗位的愿景,将导致一半白领失业,带来巨大社会成本。科技巨头因重注AI进入不熟悉的资本密集型领域,苹果的谨慎态度在他看来更明智。

DeepSeek现象/趋势
16:27
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选72
GPT-5.5幻觉率达86%,GLM-5.2仅28%--大模型越大越不可靠

GLM-5.2(MIT开源,753B参数,约40B活跃)在AA Intelligence Index上仅比GPT-5.5低4分、比Claude Fable 5低9分,但其幻觉率仅28%,远低于GPT-5.5的86%和DeepSeek V4 Pro(1.6T参数,49B活跃)的94%。后者在AA-Omniscience基准上仅6%的问题会承认不知道。实际代码测试中,GLM-5.2用12秒和800个推理token识别出技术悖论,而DeepSeek V4 Pro耗费3分26秒和近10倍推理token后仍给出错误答案。模型规模增长正导致幻觉率飙升而非智力提升。

DeepSeekOpenAI数据/训练现象/趋势
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
推荐理由:这篇实测对比揭示了大型模型的致命幻觉问题,GPT-5.5 幻觉率高达 86% 远超 GLM-5.2 的 28%,模型选型不能只看 Benchmark 排名,「会不会不懂装懂」才是真分水岭。
16:01
AYi@AYi_AInotes
65
微软两头通吃:GPT卖中国,DeepSeek卖西方

微软凭借与OpenAI的特殊合同获得全球自由转售权,将OpenAI模型卖给中国客户(最大客户字节跳动每年在Azure和AI服务上投入超10亿美元),模型通过新加坡数据中心访问,同时监控防蒸馏。另一边,微软正在测试DeepSeek-R1和DeepSeek-V4,准备反向卖给西方客户。这一“双向AI模型贸易网络”凸显中美地缘壁垒下商业套利空间巨大。

AYi: 还得是微软会闷声发大财啊,它现在已经成为全球最大的 AI 中间商,oh no ,是最大的中转站, 不仅把ChatGPT卖给中国企业,也把DeepSeek 反向卖给西方客户😁 以上来自彭博社的最新报道,绝对权威可信,看完让我意外的不仅仅是微...

DeepSeekMicrosoftOpenAI现象/趋势
15:01
AYi@AYi_AInotes
精选75
微软双向转售GPT与DeepSeek成全球最大AI中间商

彭博社报道,微软已成为全球最大AI模型中转站,既将ChatGPT卖给中国企业,也反向将DeepSeek模型卖给西方客户。报道称微软正在测试DeepSeek-R1和DeepSeek-V4,计划向西方客户提供这些中国模型。这一模式构建起跨中美AI模型的双向贸易网络。

DeepSeekMicrosoft开源生态行业动态

推荐理由:微软做起了跨中美模型的双向经销商,这事比表面看起来意义大——它可能绕过限制,把最先进的模型分发到原本接触不到的市场,全球 AI 供应链要改写了。
6月19日
19:19
Chubby♨️@kimmonismus
47
某人在Reddit上搭建了一个WoW私服,包含1800个机器人,并通过DeepSeek API实现AI聊天。 死互联网理论,但可玩。 一个没有真实玩家的MMORPG,却不知何故仍然感觉像人类。
智能体DeepSeek现象/趋势
12:19
AYi@AYi_AInotes
精选76
DeepSeek研究员开源AutoResearch:AI自主跑通285B模型RL研究闭环

DeepSeek研究员Deli Chen将AutoResearch协议开源,并发布Self-play综述论文。其AI智能体首次完全自主地在DeepSeek 285B模型上完成完整RL研究闭环——从实验设计、写代码、提交GPU任务、debug到结论总结,全程零人工干预。系统调用了GRPO工具,被视为持续学习研究的开端。

Deli Chen: 🧵 Deli AutoResearch SKILL is now officially open source! 🎉 https://victorchen96.github.io/auto_research/framework.html...

智能体DeepSeek开源/仓库

推荐理由:Deli Chen 开源的不是模型,是能让 AI 自己跑通 RL 研究全流程的「后厨系统」,从实验设计到 debug 全自动,五个工程思路可以直接抄作业。
08:16
IT之家(RSS)
39
IT早报 0619:宁德时代利润超7家车企总和;首部L3/L4自动驾驶国标公示;DeepSeek识图模式上线

DeepSeek识图模式在网页和App端正式上线。阿里千问团队将推出“千问输入法”独立App。宁德时代单季净利润207亿元,超过奇瑞、吉利、比亚迪等7家车企利润总和(约175亿元)。工信部公示我国首部L3/L4自动驾驶强制性国标,要求从证明能力转向论证安全,2027年7月起实施。此外,开发者测试发现一句“你好”消耗约5万Token(约0.125元),15元套餐不到1小时见底;DeepSeek向投资人提出“不挖人”要求;市场监管总局督导货拉拉整改,退还不合理费用1.2亿元。

DeepSeek行业动态
08:00
OpenRouter:Announcements(RSS)
精选73
DeepSeek V4 智能体 token 份额持续增长

DeepSeek 于4月24日发布新一代旗舰模型 V4 系列。OpenRouter 数据显示,V4 发布后其 token 份额从年初的9%增长至6月初的18%,自5月中旬起成为 OpenRouter 最受欢迎模型。V4 是首个足以胜任智能体工作负载的 DeepSeek 模型,到5月底 V4-Flash 已占 DeepSeek 智能体 token 流量的70%。V4-Flash 最便宜端点价格为每百万 token 输入 $0.09、输出 $0.18,远低于 GPT-5.5 的 $5/$30。中国模型整体 token 份额于6月初超过美国模型,DeepSeek 是主要驱动力。

智能体DeepSeek开源生态现象/趋势

推荐理由:OpenRouter 独家数据展示了代际转折:DeepSeek V4 靠性价比吃下代理负载,中国模型 token 份额首次超过美国,这个信号比任何 benchmark 排名都真实,做应用选型的人该重新算账了。
6月18日
23:20
🚨 AI News | TestingCatalog@testingcatalog
67
微软正评估GLM、MiniMax、Kimi等多款开源模型用于Copilot Cowork,旨在降低推理成本。据Axios报道,微软考虑托管DeepSeek V4作为更便宜选项,同时将Copilot Cowork从无限定价转为按使用量计费。微软称用户每周执行数百任务,成本可能很高。若采用DeepSeek,模型将是可选、经微调和安全防护,并完全托管在Azure上。微软推动模型"可互换"策略,未来部分任务可能移至本地执行。

Chubby♨️: Axios reports that Microsoft is considering a Microsoft-hosted version of DeepSeek V4 as a cheaper model option for Copi...

DeepSeekMicrosoft开源生态行业动态
22:14
IT之家(RSS)
59
DeepSeek 首次融资估值超 500 亿美元,传创始人向投资人提"不挖人"要求

DeepSeek 本周完成首次外部融资,估值超 500 亿美元。公司此前拒绝外部融资,因部分核心人才流失后启动融资。有传闻称,创始人梁文锋今年 5 月在投资者线上会议中向潜在资方提出要求:投资 DeepSeek 的前提之一是承诺不挖走其员工、不鼓励另起炉灶。该消息尚未核实。去年底,开发 DeepSeek V3 的罗福莉转投小米负责 MiMo AI 团队,该团队后续 AI 模型在基准测试中已超越 DeepSeek。此外,腾讯挖来曾在 OpenAI 工作的姚顺雨担任首席 AI 科学家。

DeepSeek行业动态
20:14
IT之家(RSS)
63
DeepSeek 识图模式正式上线,无法识别创始人梁文锋

DeepSeek 识图模式于 6 月 18 日在 App 和网页端上线。IT之家测试发现,该模式无法正确识别创始人梁文锋的照片,多次将其识别为董宇辉、张雪峰或雷军;而雷军照片可正常上传并准确识别。原因可能是梁文锋网络公开照片和信息较少,模型难以形成稳定识别特征,说明 DeepSeek 未针对自家老板做特殊识别优化。

DeepSeek产品更新多模态
16:49
X.PIN@thexpin
61
中美AI角色悄然互换

微软向字节跳动出售OpenAI服务(每年超10亿美元),蚂蚁、美团、腾讯使用Azure。截至2025年6月财年,Azure中国AI收入增长约3倍。同时,美国开发者转向中国模型降本:Cursor(马斯克据称想收购的AI编程工具)使用Qwen和Kimi;Claude一小时编码约10美元,DeepSeek不到50美分。

DeepSeekMicrosoftOpenAI现象/趋势
16:14
IT之家(RSS)
精选72
DeepSeek 识图模式正式上线 App 和网页端

DeepSeek 识图模式于6月18日在网页和 App 端正式上线,与快速模式、专家模式并列。开启后用户可直接上传图片让 DeepSeek 识别图像,能力超越简单文字提取。目前 App 端仍显示“图片理解功能内测中”,网页端无此提示。该模式背后的多模态模型技术细节于今年4月公开,核心框架为“Thinking with Visual Primitives(以视觉原语思考)”。

DeepSeek产品更新多模态

推荐理由:DeepSeek的识图模式终于从内测进了正式版,虽然是补课而非破圈,但对中文用户来说,让AI直接看图比打字描述常用太多,日常工作和内容处理都更顺手了。
03:06
Hacker News 热门(buzzing.cc 中文翻译)
67
美国暂未将DeepSeek列入黑名单,逾100家企业被认定为安全风险

据路透社报道,美国政府目前未将中国AI公司DeepSeek列入黑名单,但同时有超过100家企业被认定构成安全风险。这一决定显示了美方在出口管制上的谨慎态度,但目前仍保留了其他企业的大量限制措施。

DeepSeek政策/监管
6月17日
23:07
IT之家(RSS)
同事件精选74
DeepSeek 以 4000 亿元估值完成首轮外部融资:510 亿元到账,投资方含梁文锋、腾讯、宁德时代等

企查查数据显示,DeepSeek 于 2026 年 6 月 16 日完成首轮外部融资,规模约 510 亿元,估值近 4000 亿元。投资方包括创始人梁文锋、腾讯、宁德时代、网易、京东、Monolith 砺思资本、IDG 资本、正心谷投资、拾象科技及国家人工智能产业投资基金。DeepSeek 成立于 2023 年 7 月,主营大语言模型及多模态 AI 技术研发,此前由幻方量化全资支持。本轮融资将用于扩展 AI 基础设施、加强研发、提供股权激励及加快商业化。国家人工智能产业投资基金直接入股并享有投票权,其余投资者均不享有投票权且设有五年锁定期。

DeepSeek开源生态行业动态
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
推荐理由:DeepSeek 首轮融资估值 4000 亿,腾讯、宁德时代、京东及国资等入局,但梁文锋设了五年锁定期且不给投票权,这种资本条款在头部 AI 公司里很少见,值得一看。
16:38
X.PIN@thexpin
35
显然,微软再也用不起商业API了。他们正在考虑使用自托管的DeepSeek-V4版本来驱动Copilot的智能体AI。 我想我们都还记得,特朗普政府曾威胁要封禁DeepSeek。此外,Anthropic刚刚阻止了外国用户使用Fable 5和Mythos 5。在这一切发生之际,我很好奇美国人是如何看待的。
DeepSeek行业动态
13:09
SemiAnalysis@SemiAnalysis_
65
POV: @ohnePixel 为 DeepSeek V4 首日部署获得一个平台。 了解更多:https://semianalysis.substack.com/p/deepseekv4-16t-day-0-to-day-43-performance
DeepSeek推理评测/基准
11:03
IT之家(RSS)
57
Anthropic 和 OpenAI 模型太贵,微软智能体考虑使用 DeepSeek V4 微调版

微软将 Copilot Cowork 智能体转为基于使用量的定价,并考虑使用 DeepSeek V4 微调版或另一种开源模型,作为 Anthropic 和 OpenAI 模型的更低成本替代方案。该模型完全托管在 Azure 上,客户数据留在微软云端,受企业级安全与合规控制。价格方面,Anthropic Fable 5 输出定价 50 美元/百万 token,DeepSeek V4 Pro 输出定价 0.87 美元/百万 token(永久 25 折后),价差约 57 倍。微软预计未来几周内推出更低成本模型。

智能体DeepSeekMicrosoft行业动态
09:06
meng shao@shao__meng
66
微软 Copilot Cowork 全球可用,拟引入 Azure 托管 DeepSeek V4 降本

微软 Copilot Cowork 正式全球可用,支持多模型。为控制成本,正评估引入微调版 DeepSeek V4 作为 Anthropic/OpenAI 模型的低成本替代,按算力/用量计费。模型完全托管于 Azure,数据不出微软云,已加入安全层,数周内公布。同时指出,Agent 任务反复调用模型致 token 消耗大幅增加,包月无限用模式已不可行。

Satya Nadella: Copilot Cowork is now generally available worldwide, now with multi-model support! Every organization can put long-runni...

智能体DeepSeekMicrosoft产品更新
08:03
IT之家(RSS)
29
IT早报:DeepSeek完成超70亿美元融资,英伟达员工考公上岸,央视关注运营商不同权

DeepSeek完成超70亿美元融资,投资方包括腾讯、宁德时代、京东、网易,但无投票权,梁文峰仍掌控公司。英伟达上海员工考公上岸引热议。央视关注三大运营商新老用户不同权问题,更换套餐困难。中国移动将陆续上线通话字幕、可视菜单等升级。鸿蒙智行引入中创新航、国轩高科作为电池二供。宁德时代曾毓群称2030年前固态电池百万级装车可能性很小。

DeepSeek行业动态
05:05
Rohan Paul@rohanpaul_ai
70
DeepSeek获74亿美元融资,估值500亿美元成中国AI第一

DeepSeek完成74亿美元融资,估值达500亿美元,成为中国估值最高的AI初创公司。创始人梁文峰在融资前持股近90%,并以约30亿美元个人出资成为最大投资方。本轮主要投资者包括腾讯(约15亿美元)、宁德时代(约7.4亿美元)以及国家人工智能产业投资基金(约1.5亿美元)。DeepSeek计划继续推进开源模型和AGI研究,同时帮助华为等国内芯片制造商在美国芯片限制下运行强大模型。

DeepSeek开源生态行业动态
03:35
The Decoder:AI News(RSS)
50
微软 Copilot Cowork 转向按用量计费,考虑采用 DeepSeek V4

微软正考虑采用自托管微调版 DeepSeek V4 作为 Copilot Cowork 的更廉价模型选项,同时将 Cowork 改为按使用量计费。Cowork 基于 Anthropic 的 Claude 技术。Copilot EVP Charles Lamanna 表示固定费率因高频用户推高成本而不可持续。微软已在 GitHub Copilot 上实施类似调整。DeepSeek 将作为可选模型,完全托管于 Azure 并配备偏见防护,客户数据不出微软云。最终决定预计数周内做出。CEO Satya Nadella 此前发文支持企业可挑选并微调的多模型生态。

DeepSeekMicrosoft产品更新部署/工程
02:24
Chubby♨️@kimmonismus
精选75
微软考虑为 Copilot Cowork 集成 DeepSeek V4

微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本,作为更便宜的模型选项。Copilot Cowork 将放弃无限定价,转向按使用量计费,原因是成本过高(用户每周执行数百项任务导致费用激增)。若采用 DeepSeek,该模型将是可选的、经过微调与安全防护,并完全托管于 Azure。Axios 报道称微软已微调了一个可用模型,最终决定待定。

Ina Fried: New @axios: Microsoft eyes DeepSeek for Copilot Cowork as it also joins the shift to usage based pricing. Says final dec...

DeepSeekMicrosoft开源生态行业动态

推荐理由:微软考虑在 Copilot Cowork 中引入 DeepSeek V4 作为便宜选项,同时转向按用量计价。如果落地,这不仅是成本策略的转向,更可能打破企业 AI 对开源模型的信任壁垒,定价变革也会给全行业施加压力。
6月16日
22:01
Nathan Lambert:Interconnects(RSS)
52
前沿大模型后训练配方回顾:与 Finbarr Timbers 对谈

Interconnects 播客邀请 Finbarr Timbers 回顾后训练配方的演变:从 InstructGPT 的 SFT→奖励模型→RL 三阶段,到 Llama 3 / Tülu 3 的 SFT→DPO→可验证奖励 RL,再至 DeepSeek R1 以大规模 RL 为核心。2026 年配方分化为多个领域专家模型再合并回统一模型。新出现模式为 Multi-teacher On-Policy Distillation(MOPD):训练 N 个领域专家(经 SFT 和领域 RL),再通过在线采样、逐 token 最小化反向 KL 散度训练通用学生模型。MiMo Flash V2 率先引入,DeepSeek V4 与 Nemotron 3 Ultra 扩展至超过 10 个教师。MOPD 兴起源于单一 RL 流程在多领域间产生能力冲突,而专家模型易于并行训练,在线蒸馏技术日趋成熟。

DeepSeek大佬观点开源生态推理
21:51
Nathan Lambert@natolambert
53
Nathan Lambert联合Finbarr Timbers发布新播客,调研GLM 5.1等模型后训练配方

Nathan Lambert与Finbarr Timbers合作推出新播客,系统调研GLM 5.1、Kimi K2.6、DeepSeek V4、Xiaomi MiMo V2.5、Nemotron Ultra等模型的最新后训练方法。核心讨论包括:行业转向多教师在线策略蒸馏(MOPD)的原因;Olmo风格配方需改进的方向;后训练如何适配大型组织;以及在AGI早期阶段的职业建议。播客章节涵盖历史回顾、2026年模型配方(MiMo Flash、DeepSeek V4、GLM 5、Kimi K2.6等)及开放式后训练讨论。

DeepSeek大佬观点数据/训练
18:00
IT之家(RSS)
43
腾讯云 DeepSeek-V3.2 模型 7 月 16 日下线,官方建议迁移至 V4 系列

腾讯云今日公告,DeepSeek-V3.2 模型将于 2026 年 7 月 16 日 00:00 正式下线,届时不再提供接入服务,推荐迁移至能力更优的 DeepSeek-V4 系列。未完成迁移的用户,系统将自动切换至最新模型。此前 6 月 3 日,腾讯云对 DeepSeek-V4 系列大幅降价:V4-Pro 推理输入与输出价格降幅达 75%,缓存命中价格降幅高达 97.5%;V4-Flash 缓存命中价格降幅达 90%。

DeepSeek行业动态
17:57
The Decoder:AI News(RSS)
同事件精选72
DeepSeek 完成首轮外部融资,估值超 500 亿美元

中国 AI 初创公司 DeepSeek 完成首轮外部融资,募资超 500 亿元人民币(约 74 亿美元),估值超 500 亿美元。投资结构特殊:多数投资者将资金投入 CEO 梁文锋管理的有限合伙企业,无投票权且锁定期五年;仅国资 AI 基金直接投资并保留投票权。创始人梁文锋个人投入约 200 亿元,腾讯和宁德时代为主要外部投资者。梁文锋表示优先基础 AI 研究与 AGI 开发,将继续开源。DeepSeek 去年初凭 V3、R1 模型获全球关注,今年 4 月发布运行于华为芯片的最大开源权重模型 V4,并将 V4 Pro 永久折扣 75%,输入价格约为 OpenAI GPT-5.5 的 1/11,输出价格约为 1/35。

DeepSeek开源生态行业动态
同一事件,精选展示《DeepSeek 推进 700 亿元融资,梁文锋承诺坚持开发开源 AI 模型而非追求短期商业化目标》
推荐理由:DeepSeek 首次外部融资估值冲到 500 亿美元,交易结构却排除了投资人话语权,看得出梁文锋仍把控制权抓得很紧,开源路线和极致性价比是最大的筹码。
16:00
IT之家(RSS)
69
OpenRouter 发布 Fusion API,多模型协同以一半成本接近 Claude Fable 5 性能

AI 模型 API 聚合平台 OpenRouter 于 6 月 14 日推出 Fusion API,将用户请求并行发送至多个模型,经审查模型分析后由调用模型生成统一回答。官方测试显示,Claude Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro 组合得分 68.3%,超过单独 Claude Fable 5 的 65.3%;双 Claude Opus 4.8 组合得 65.5% 同样高于 Fable 5。低成本组合 Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro 得分 64.7%,以约 Claude Fable 5 一半的成本将分数差距控制在 1% 以内。

DeepSeekOpenAI产品更新推理
15:00
IT之家(RSS)
68
DeepSeek 完成超 70 亿美元融资,腾讯、宁德时代等参投但无投票权

DeepSeek 完成超 70 亿美元(约 474 亿元)融资,估值超 500 亿美元,创中国 AI 行业单轮融资纪录。投资者获经济权益但无投票权,面临五年锁定期且不获董事会席位;国家人工智能产业投资基金例外,直接注资 10 亿元并享投票权。腾讯、宁德时代、京东、网易及 IDG 资本参与。据路透社此前报道,创始人梁文峰自掏 200 亿元,腾讯拟投 100 亿元,宁德时代拟出资 50 亿元。DeepSeek 凭 V3 与 R1 模型成中国 AI 标杆。

DeepSeek行业动态
13:00
IT之家(RSS)
66
谷歌更新Android Bench榜单:Gemini 3.5 Flash成本最贵,约为DeepSeek V4 Flash的17.5倍

谷歌更新Android Bench榜单,GPT-5.5以74分居首,GPT-5.4与Gemini 3.1 Pro Preview并列第二(72.4分),Claude Opus 4.7(68.7分)和Opus 4.6(66.6分)分列第四、第五。谷歌自家Gemini 3.5 Flash仅获63.7分排第六,平均Token消耗3.559亿,单次运行成本147.1美元,为榜单最贵模型。成本仅为其约1/3的Gemini 3.1 Pro Preview性价比更高。DeepSeek V4 Flash以52.7分排第12,单次运行成本仅8.4美元,后者成本仅为前者的1/17.5。

DeepSeekGoogle编码评测/基准
‹ 上一页
1234…9
下一页 ›