We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
The DeepSeek-V4-Pro discount has been extended until May 31, 2026, 15:59 UTC!
我所在的 DeepSeek Harness 团队招人啦!目前开放的职位包括研发工程师和产品经理,可以在官网投递。如果想做 Harness 方向的前沿研究,也可以投递研究员职位。全职实习均可。地点限北京。 申请链接: https://app....
DeepSeek 宣布其 V4-Pro 模型 API 将于 2026 年 5 月 31 日 2.5 折优惠结束后,永久调整为原定价的 1/4。原价为:输入(缓存命中)0.1 元/百万 Tokens、输入(缓存未命中)12 元/百万 Tokens、输出 24 元/百万 Tokens。此举意味着原计划的限时促销将变为长期固定价格。
全国网络安全标准化技术委员会发布了《人工智能应用伦理安全指引 1.0》。该指引明确了人工智能应用在开发、服务提供和使用等环节的安全指引,旨在引导人工智能应用坚持以人为本、智能向善,促进其在规范有序、安全可控的轨道上健康发展。清华大学、阿里巴巴、华为等多家产学研机构参与了文件的起草工作。
DeepSeek V4 Flash has topped the weekly leaderboard
DeepSeek正推进700亿元人民币的巨额融资,估值约450亿美元。创始人梁文锋承诺将继续开源开发AI模型,不追求短期商业化,目标是技术升级与通用人工智能。腾讯、IDG资本等接近参投,梁文锋个人可能注资200亿元。若成功将创下中国科技初创公司首轮融资纪录。
关联讨论 4 条X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)X:X.PIN (@thexpin)The Decoder:AI News(RSS)火山引擎的Agent Plan和Coding Plan产品新增支持DeepSeek V4模型,用户可在相关计划中调用该模型进行开发与部署。
Deepseek正在北京组建团队,开发名为"Deepseek Code"的AI代码代理产品,直接对标Claude Code、Codex和Cursor。招聘要求表明,该岗位需要精通智能体循环、MCP协议和上下文工程,并深度使用现有编程工具。此举标志着Deepseek正式进军AI辅助编程领域,旨在与现有主流产品展开竞争。
🚀 We're hiring! DeepSeek is forming a new Harness team to build Code Harness from the ground up-may be you can call it ...
🚀 We're hiring! DeepSeek is forming a new Harness team to build Code Harness from the ground up-may be you can call it ...
DeepSeek在内部组建了全新的Harness团队,主攻代码智能体产品,内部对标Anthropic的Claude Code。该团队将负责研发DeepSeek Code Harness,并已开放Harness产品经理和研发工程师两个关键岗位,工作地点在北京。其核心目标是将前沿的模型能力转化为领先的Agent产品,并深度参与定义DeepSeek的桌面端Agent产品。
小米YU7 GT以7分34秒931刷新纽北SUV圈速纪录,车手任周灿成为首个获官方认证的中国车手。特斯拉宣布放弃在印度建厂的计划。谷歌发布Gemini 3.5 Flash模型,称其输出速度是GPT-5.5的4倍。DeepSeek就“”字符触发模型异常回应,称属于幻觉,不涉及安全或隐私。此外,月之暗面Kimi获国资机构入股,浙江联通将于6月15日全面退出3G服务。
DeepSeek就“”特殊字符触发模型异常回复的问题发布说明。官方技术团队排查后确认,该现象是特殊字符引发的模型“幻觉”,不存在安全漏洞或用户隐私泄露风险。后续将通过针对性训练,提升模型对此类字符的识别与处理能力,以修复已知问题并优化表现。
腾讯云宣布,其智能体开发平台提供的 Hy3 preview 与 DeepSeek-V4-Pro 模型,将于2026年5月27日10:00起结束限时免费公测,转为正式商用服务。后续将根据模型调用量按需计费。该平台采用“订阅+增购包”的收费模式,提供免费版及多款付费套餐(如专业版188元/月、企业版4880元/月),用户还可选购预付费资源包,年付套餐可享8.33折优惠。
长安第四代逸动与CS75PLUS蓝鲸超擎车型将于5月23日全球同步上市。两款新车均搭载无需外插充电的蓝鲸超擎混动系统,热效率近45%,电机效率达98.1%。第四代逸动共三款车型,抢订价7.99万至9.49万元;第四代CS75PLUS抢订价11.69万至13.49万元,并推出10.99万元“真香型”。新车标配AI大模型语音系统与智能驾驶辅助功能,官方实测百公里城区油耗分别低至2.98L和3.98L。
Hermes 支持配置多种国内外主流 AI 模型,包括 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini 系列、DeepSeek V4 系列、智谱 GLM-5 系列、Kimi K2.6 以及小米 Mimo V2.5-pro。用户需通过相应服务的订阅或 API 进行配置,完成后可使用 /model 指令指定模型及提供者来切换对话模型,例如输入“/model gpt-5.5 --provider openai-codex”即可切换至对应模型。该功能方便用户根据需求灵活调用不同模型的优势。
DeepSeek-V4-Flash发布,这一大型语言模型新版本使得LLM引导技术重新成为关注焦点。引导技术涉及通过向量控制模型输出方向,此次更新引发科技界对模型可控性的讨论。在Hacker News上,相关帖子获得105点的高分,显示社区对此话题的热烈反响,标志着AI领域对定向优化技术的持续探索。
本月开源AI模型领域迎来密集发布,包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新,反映出开源社区当前高速迭代的竞争态势。
DeepSeek招聘Agent Harness产品经理,旨在将其前沿模型能力转化为领先的Agent产品。该职位需规划产品路线图,连接研究员、工程师与社区,定义并衡量Agent帮助用户的核心指标,推动模型与Harness共同进化。候选人需是Agent产品高强度用户,熟悉Claude Code、GitHub Copilot等工具,理解LLM与Agent技术原理,并具备数据分析和产品设计能力。
DeepSeek的“专家模式”目前已无法上传文件,官方提示原因为“资源紧张,不支持文件上传”。经测试,该功能在网页端和App中均已下线。不过,“快速模式”的文件和图片上传功能仍保持正常,但图片处理仅限于文字识别。此外,DeepSeek正在灰度测试历史聊天记录查询功能,部分用户已可在网页版和移动端App中通过关键词搜索历史对话内容。
本研究提出分组查询潜在注意力(GQLA),对DeepSeek-V2/V3中的多头潜在注意力(MLA)进行最小修改,使其在一套权重上暴露两种等效解码路径:与MLA相同的MQA吸收路径,以及带有每组扩展缓存的GQA路径。运行时可根据硬件自动选择路径,无需重新训练。单一的GQLA权重能同时适配H100(采用MQA吸收)与H20(采用GQA及多令牌预测)的硬件性能上限,并在GQA路径上支持高达8路的零冗余张量并行。通过扩展TransMLA为TransGQLA,可将预训练的GQA模型转换为GQLA模型。在LLaMA-3-8B上的实验表明,其MQA吸收路径将每令牌的KV缓存压缩至GQA基线的28.125%,同时在分组路径上结构性保留了GQA级别的流量效率。
市场监管总局附条件批准腾讯收购喜马拉雅股权案,要求腾讯不得提价、降低免费内容比例或达成独家版权。宇树科技发布全球首款量产载人变形机甲GD01,售价390万元起。腾讯张军明确表示,微信不会开发已读功能和访客功能。此外,DeepSeek聊天记录搜索功能已开始灰度测试,理想汽车发布自研马赫M100芯片,华为鸿蒙新开发者版开始推送。
DeepSeek已上线聊天记录搜索功能,目前正处于灰度测试阶段。用户将DeepSeek App更新至2.1.0版本后,可在侧边栏顶部使用“搜索聊天内容”搜索框,输入关键词即可查找并定位到多条相关历史对话。网页版用户也可通过点击左上角的放大镜按钮进行搜索。该功能尚未全量推送,未被覆盖的用户需检查应用是否为最新版本。
人工智能分析发布编码代理基准指数,评估不同模型与执行框架组合在三大编码基准中的表现。Opus 4.7在Cursor CLI中以61分领先,GPT-5.5与Opus 4.7在其它框架中得分60紧随其后。开源模型GLM-5.1在Claude Code中获得53分,表现竞争但仍显著落后顶尖闭源模型。经济性差异悬殊:每任务成本从Composer 2的0.07美元到GLM-5.1的2.26美元不等,后者因任务循环令牌使用高达480万;任务耗时差异超7倍,Opus 4.7仅需6分钟而Kimi K2.6需40分钟。缓存命中率普遍较高,影响实际运行成本。
SK海力士回应“员工人均奖金610万元”传闻,称今明年度业绩未定,奖金规模无法预测。中国汽车工业协会辟谣“8家新能源车企因锁电被约谈”为不实信息。DeepSeek大范围开放“识图模式”,具备文物识别、逻辑题解答、截图转代码等多模态能力。此外,iPhone 18 Pro系列被曝灵动岛将缩小25%;张汝京指出全球超80%半导体需求来自成熟制程;比亚迪腾势N9闪充版等新车公布预售及发布信息。
Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码,通过三项关键技术:对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化,成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型,实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力,通过极致工程优化 democratize 至个人设备,展现了开源社区推动技术平民化的强大潜力。
Downloading now... 1M token context window with supposedly usable coding agent capability all on a 128GB Macbook Pro is ...
市场人士回应“DeepSeek与阿里谈崩”传闻,称阿里巴巴应该并未参与相关谈判。近期,AI公司DeepSeek多次被曝正寻求首轮巨额外部融资。据《金融时报》报道,国家集成电路产业投资基金正洽谈领投其首轮融资,公司估值可能达到约450亿美元。另有消息称,DeepSeek此轮融资目标高达500亿元人民币,若成功落地,将是中国AI公司迄今规模最大的一轮融资。
作者因被孙宇晨回关而引发讨论,指出其AI中转站项目B.AI并非简单的低价API竞争。该项目上线一个月注册用户破160万,提供大幅折扣的DeepSeek-V4等模型,并支持加密钱包支付。核心观点认为,孙宇晨的战略目标是通过低价策略抢占入口,最终旨在成为未来AI Agent时代的“中央银行”,而非仅赚取API差价。
http://x.com/i/article/2051958484304891904
卧槽,说个颠覆我认知的事, 现在AI 把算命这件事,已经干到了全球大赛接近人类顶尖的水平,直接把通用大模型都甩开了一大截! 说实话,我一开始看到这个消息, 第一反应是又来个蹭玄学流量的 AI 噱头, 直到翻完它的完整技术报告和大赛数据, 才...