AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
11月28日周五
02:07Saining Xie今天看似平常,却可能成为同行评审和开放科学史上最奇怪的时刻 请、请、请善待我们的社区。它已经很脆弱了。不要让它消亡。 【引用 @iclr_conf】:
11月23日周日
00:00LMSYS:Blog(Chatbot Arena 团队)LMSYS 启动奖学金计划
11月20日周四
08:00Hugging Face:Blog(RSS)83精选介绍 AnyLanguageModel:为苹果平台提供本地与云端大语言模型的统一 API
11月17日周一
08:00Hugging Face:Blog(RSS)73精选使用Hugging Face轻松构建和共享ROCm内核
11月13日周四
08:00Hugging Face:Blog(RSS)88精选共建开放未来:Hugging Face与Google Cloud达成新合作
10月26日周日
02:02Google DeepMind:Blog(RSS)精选MedGemma:健康 AI 开发领域最强的开源多模态模型
10月24日周五
15:16蚂蚁 inclusionAI:GitHub 新仓库47inclusionAI/TwinFlow
02:50Google DeepMind:Blog(RSS)精选Gemma 3 270M 发布:专为超高效 AI 打造的轻量模型
02:22Google DeepMind:Blog(RSS)Gemma 模型助力发现潜在癌症治疗新途径
10月23日周四
17:42美团 LongCat:HuggingFace 新模型美团 LongCat 发布 Flash-Omni 模型
10月17日周五
11:09美团 LongCat:HuggingFace 新模型meituan-longcat 发布 LongCat-Audio-Codec
9月29日周一
11:23蚂蚁 inclusionAI:GitHub 新仓库51inclusionAI/Ming-UniAudio
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang 发布首日支持 DeepSeek-V3.2:集成稀疏注意力机制
9月22日周一
23:49蚂蚁 inclusionAI:GitHub 新仓库49InclusionAI/Ring-V2
9月16日周二
05:02Jeff Dean芝加哥大学基于 Google Research 开源的 NeuralGcM 模型,助力印度 3800 万农民预测季风
9月9日周二
00:00Mistral AI:News(网页)76Mistral AI 融资17亿欧元以加速AI推动技术进步
8月21日周四
14:25公众号:DeepSeek(深度求索)63精选DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
8月13日周三
04:00EleutherAI:Blog面向开放权重 AI 安全的预训练数据过滤
8月6日周三
01:06Noam Brown精选我们的新 @OpenAI 开放模型
8月5日周二
05:25Hao AI Lab67精选FastWan视频生成模型实现70倍加速,5秒出片
04:53Hao AI Lab(1/n) 🚀 借助 FastVideo,你现在可以在单张 H200 GPU 上用 5 秒生成一段 5 秒视频!
7月30日周三
00:00Mistral AI:News(网页)54发布 Codestral 25.08 及 Mistral 完整企业编程方案栈
7月25日周五
00:00LMSYS:Blog(Chatbot Arena 团队)SGLang开源SpecForge:加速Eagle3投机解码训练
7月20日周日
00:00LMSYS:Blog(Chatbot Arena 团队)基于PD分离与大规模专家并行在128张H200 GPU上部署Kimi K2
7月15日周二
00:00Mistral AI:News(网页)62Mistral AI 发布 Voxtral 开源语音理解模型
7月10日周四
00:00Mistral AI:News(网页)61Mistral AI 与 All Hands AI 合作发布新款 Devstral 模型
7月8日周二
00:00LMSYS:Blog(Chatbot Arena 团队)OME:以模型驱动架构革新 LLM 基础设施
7月3日周四
00:00Mistral AI:News(网页)55发布AI for Citizens计划
7月2日周三
21:23Yann LeCun精选拥抱开放
6月10日周二
00:00Mistral AI:News(网页)67Mistral AI 发布首个推理模型 Magistral
6月4日周三
00:00Mistral AI:News(网页)44Mistral Code 发布:企业级 AI 编程助手
5月29日周四
20:11DeepSeek68精选DeepSeek-R1-0528发布 性能全面升级
5月21日周三
00:00Mistral AI:News(网页)63Devstral 面向软件工程的智能体大语言模型发布
5月7日周三
00:00Mistral AI:News(网页)54Medium is the new large.
5月5日周一
00:00LMSYS:Blog(Chatbot Arena 团队)技术博客:在96块H100 GPU上通过PD分离与大规模专家并行部署DeepSeek
3月21日周五
01:01Jim Fan精选GR00T N1 开源获社区热烈反馈,欢迎前往 GitHub 点星、Fork 与贡献
3月17日周一
00:00Mistral AI:News(网页)58Mistral AI 发布 Mistral Small 3.1 开源模型
2月21日周五
12:00DeepSeekDeepSeek 启动开源周:将开源 5 个 AGI 探索代码库
2月19日周三
02:48Lilian Weng这是我们过去几个月一直在筹备的项目,今天我非常兴奋地宣布它。
2月4日周二
08:00OpenRouter:Announcements(RSS)18OpenRouter 新增 Cloudflare 作为模型提供商,上线 Gemma 与 Llama 模型
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
11月28日
02:07
Saining Xie@sainingxie
今天看似平常,却可能成为同行评审和开放科学史上最奇怪的时刻 请、请、请善待我们的社区。它已经很脆弱了。不要让它消亡。 【引用 @iclr_conf】:
大佬观点开源生态论文/研究
11月23日
00:00
LMSYS:Blog(Chatbot Arena 团队)
LMSYS 启动奖学金计划

LMSYS 宣布设立奖学金计划,资助对美国开源 AI 基础设施社区有重大贡献的全日制博士生。获奖者将在未来两年内获得最高 50,000 美元用于支付学费,申请窗口为 2025 年 11 月 23 日至 12 月 7 日。评选将基于研究影响力、开源贡献及与 LMSYS 兴趣领域的契合度,申请者需邮件提交申请陈述与简历。该项目由 Ying and Lianmin Giving Fund 捐赠支持。

开源生态行业动态
11月20日
08:00
Hugging Face:Blog(RSS)
精选83
介绍 AnyLanguageModel:为苹果平台提供本地与云端大语言模型的统一 API

AnyLanguageModel 是一个 Swift 包,旨在为苹果平台上的大语言模型集成提供统一解决方案。它作为苹果原生 Foundation Models 框架的替代品,允许开发者通过相同的 API 接口,灵活调用本地模型(如通过 Core ML、MLX、llama.cpp 运行)与云端服务(如 OpenAI、Anthropic)。该方案复用苹果精心设计的 API 作为基础,大幅降低了在不同模型提供商之间切换的代码修改成本,并利用 Swift 的包特性功能避免依赖膨胀,从而简化开发流程,鼓励对本地开源模型的探索。

开源/仓库开源生态部署/工程

推荐理由:Apple开发者可一键切换本地与云端模型,大幅降低AI应用开发门槛。
11月17日
08:00
Hugging Face:Blog(RSS)
精选73
使用Hugging Face轻松构建和共享ROCm内核

Hugging Face的kernels库简化了高性能深度学习内核的构建与共享,支持CUDA、ROCm等多种后端。本文以ROCm兼容内核为例,展示如何利用kernel-builder工具构建、测试并共享内核。以RadeonFlow的GEMM内核为具体案例,该内核是针对AMD Instinct MI300X GPU优化的FP8块状矩阵乘法实现,采用e4m3fnuz浮点格式和每块缩放因子以保持低精度计算准确性,并在2025年AMD开发者挑战赛中获最高奖。指南涵盖项目设置、构建配置及通过kernels社区分享的完整步骤。

Hugging Face开源生态教程/实践部署/工程

推荐理由:AMD GPU开发者可快速上手构建高性能AI内核,提升部署效率。
11月13日
08:00
Hugging Face:Blog(RSS)
精选88
共建开放未来:Hugging Face与Google Cloud达成新合作

Hugging Face与Google Cloud宣布建立深度战略合作,旨在将Google Cloud打造为使用开放模型的最佳平台。双方将合作构建CDN网关,把Hugging Face上的模型和数据集直接缓存在Google Cloud上,显著提升下载速度并增强供应链稳定性。Google Cloud客户在Vertex AI、GKE等服务中部署模型时将获得更快的首次响应。同时,Hugging Face的1000万开发者将受益于更多新型计算实例、价格下降以及通过Google安全技术强化的模型安全性。此次合作还将推动TPU在开放模型开发中的普及应用。

GoogleHugging Face开源生态行业动态

推荐理由:开发者将享受更快的模型下载、TPU 原生支持和增强安全,简化 AI 部署流程。
10月26日
02:02
Google DeepMind:Blog(RSS)
精选
MedGemma:健康 AI 开发领域最强的开源多模态模型

谷歌 MedGemma 系列新增多模态模型,专为健康 AI 开发设计。作为该系列迄今最强的开源版本,新模型具备更强大的医疗场景理解能力,为开发者提供先进的医疗人工智能技术支持,助力构建更精准的健康医疗解决方案。

DeepMind多模态开源生态模型发布

推荐理由:DeepMind发布最强开放医疗多模态模型,支持开发者微调构建健康AI应用
10月24日
15:16
蚂蚁 inclusionAI:GitHub 新仓库
47
inclusionAI/TwinFlow

该研究提出了一种名为“自对抗流”的新方法,旨在驯化大规模少步训练。该方法通过引入一种内部对抗机制来优化流模型在有限训练步数下的性能,有望解决大模型训练中计算成本高昂的挑战。相关工作已被顶级机器学习会议ICLR 2026接收。

开源生态数据/训练论文/研究
02:50
Google DeepMind:Blog(RSS)
精选
Gemma 3 270M 发布:专为超高效 AI 打造的轻量模型

Gemma 3 系列新增 270M 参数模型,仅 2.7 亿参数,定位紧凑型超高效 AI 专业工具。

DeepMind开源生态模型发布端侧

推荐理由:Google 发布 270M 超小参数开源模型,端侧部署新选择
02:22
Google DeepMind:Blog(RSS)
Gemma 模型助力发现潜在癌症治疗新途径

发布基于 Gemma 的 270 亿参数单细胞分析基础模型,该模型此前已协助发现潜在癌症治疗新通路。

DeepMindGoogle开源生态模型发布
10月23日
17:42
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 Flash-Omni 模型

美团 LongCat 团队发布 LongCat-Flash-Omni 开源项目,致力于通过开源和开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 技术应用门槛,打破技术壁垒,但目前尚未披露具体模型架构、性能基准、参数规模及应用场景等详细技术规格。

Hugging Face多模态开源生态模型发布
10月17日
11:09
美团 LongCat:HuggingFace 新模型
meituan-longcat 发布 LongCat-Audio-Codec

meituan-longcat 发布开源项目 LongCat-Audio-Codec,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在促进音频编解码技术的开放获取,推动行业技术进步与开放生态建设。

Hugging Face开源生态模型发布语音
9月29日
11:23
蚂蚁 inclusionAI:GitHub 新仓库
51
inclusionAI/Ming-UniAudio

研究团队发布了Ming-UniAudio,这是一个基于统一表示的大语言模型,专门用于语音任务。该模型能够联合处理语音的理解、生成与编辑,实现了多种语音功能的集成。它通过统一的框架,将传统上分离的语音识别、合成和修改任务整合进单一系统,提升了处理效率与协同能力。

开源生态模型发布语音
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang 发布首日支持 DeepSeek-V3.2:集成稀疏注意力机制

SGLang 在发布首日即支持 DeepSeek-V3.2,该模型基于 DeepSeek-V3.1-Terminus 引入 DeepSeek Sparse Attention (DSA) 机制。DSA 通过 Lightning Indexer 和 Top-k Token Selection 将注意力复杂度从 O(L²) 降至 O(Lk),在 128K 长上下文下实现训练与推理效率大幅提升且质量损失可忽略。SGLang 实现了专用缓存与 Native Sparse Attention 后端,并提供了面向 NVIDIA、AMD MI350X/MI355X 及 NPU 的部署方案与容器镜像。

DeepSeek开源/仓库开源生态部署/工程
9月22日
23:49
蚂蚁 inclusionAI:GitHub 新仓库
49
InclusionAI/Ring-V2

InclusionAI 发布并开源了 Ring-V2,这是一个基于混合专家架构的推理大语言模型。该模型采用 MoE 设计,旨在提升复杂推理任务的性能。作为开源项目,Ring-V2 可供研究者和开发者直接使用与进一步探索。

开源生态推理模型发布
9月16日
05:02
Jeff Dean@JeffDean
芝加哥大学基于 Google Research 开发并开源的 AI 天气模型 NeuralGcM,建立更精准的印度季风预测系统,为 3800 万农民提供种植决策支持。
Google开源生态现象/趋势
9月9日
00:00
Mistral AI:News(网页)
76
Mistral AI 融资17亿欧元以加速AI推动技术进步

Mistral AI宣布完成1.7亿欧元C轮融资,投后估值达117亿欧元。本轮融资由半导体设备制造商ASML领投,DST Global、Andreessen Horowitz、NVIDIA等现有投资方参与。公司将利用这笔资金加速AI前沿研究,为战略行业提供定制化的分布式前沿AI解决方案,以解决复杂的工程和工业问题。此轮融资重申了公司的独立性。

开源生态行业动态
8月21日
14:25
公众号:DeepSeek(深度求索)
精选63
DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

DeepSeek-V3.1 以混合推理模型形式开源,用户可一键切换思考模式,同时 Agent 智能体支持性能得到增强。

智能体DeepSeek开源生态推理

推荐理由:DeepSeek V3.1 不是小修小补,混合推理和 Agent 支持让它从‘对话模型’转向‘行动模型’,开源这一步让 Agent 开发有了新底座。
8月13日
04:00
EleutherAI:Blog
面向开放权重 AI 安全的预训练数据过滤

Deep Ignorance 技术通过预训练数据过滤为开放权重 LLM 构建内置式防篡改安全防护。该方法在训练阶段筛选数据,将安全能力深度集成于模型权重,使其难以被后续微调或提示注入绕过。这一方案针对开放权重模型易被恶意修改的痛点,提供了从预训练源头建立安全屏障的新路径,在保障模型开放性的同时增强安全性。

安全/对齐开源生态数据/训练
8月6日
01:06
Noam Brown@polynoamial
精选
OpenAI 发布两款新的开放模型(open models),官方推文称"Both of them"已上线,详见 openai.com/open-models。

OpenAI: Our open models are here. Both of them. http://openai.com/open-models

OpenAI开源生态模型发布

推荐理由:OpenAI罕见发布开放权重模型,标志策略重大转变
8月5日
05:25
Hao AI Lab@haoailab
精选67
FastVideo团队推出FastWan系列快速视频生成模型。该模型采用名为"稀疏蒸馏"的新训练方法,能将视频去噪速度提升70倍。在单块H200 GPU上,仅需5秒即可生成一段5秒的视频。团队提供了在线演示,并依据Apache-2.0许可证完全开源了模型、代码和数据。

Hao AI Lab: (1/n) 🚀 With FastVideo, you can now generate a 5-second video in 5 seconds on a single H200 GPU! Introducing FastWan se...

开源生态模型发布视频部署/工程

推荐理由:视频生成终于从「等一分钟」进化到「实时出片」,FastWan 用稀疏蒸馏把去噪压了 70 倍,单卡 H200 五秒出五秒视频,做短视频工具和实时交互产品的团队该认真看看这个开源方案。
04:53
Hao AI Lab@haoailab
(1/n) 🚀 借助 FastVideo,你现在可以在单张 H200 GPU 上用 5 秒生成一段 5 秒视频!
开源生态模型发布视频部署/工程
7月30日
00:00
Mistral AI:News(网页)
54
发布 Codestral 25.08 及 Mistral 完整企业编程方案栈

Mistral AI 发布了 Codestral 25.08 及其完整的企业编码解决方案栈。该方案旨在通过一个集成的系统,解决企业在采用 AI 编程工具时遇到的核心障碍,如部署限制、定制化不足和架构分散。新版 Codestral 25.08 的性能有所提升,其代码接受完成率提高30%,保留代码增加10%,失控生成减少50%。方案中的 Codestral Embed 是专为代码设计的嵌入向量模型,在代码检索基准测试中性能优于其他模型。整个解决方案支持部署在云端、VPC 或本地环境。

开源生态模型发布编码
7月25日
00:00
LMSYS:Blog(Chatbot Arena 团队)
SGLang开源SpecForge:加速Eagle3投机解码训练

SGLang团队开源SpecForge训练框架,专为Eagle3投机解码设计,原生集成SGLang推理引擎实现训推无缝衔接。框架内置Training-Time Test支持,提供Online与Offline双模式,分别适配低存储多GPU与高存储低GPU场景。基于ShareGPT和UltraChat 32万样本的实验显示,Llama 4 Maverick与Scout draft模型在MT-Bench上分别实现2.18倍与2.0倍推理加速。

开源/仓库开源生态部署/工程
7月20日
00:00
LMSYS:Blog(Chatbot Arena 团队)
基于PD分离与大规模专家并行在128张H200 GPU上部署Kimi K2

Mooncake团队基于OME和SGLang框架,在128张H200 GPU集群上完成了Moonshot AI 1万亿参数开源MoE模型Kimi K2的大规模部署。该方案采用PD分离与大规模专家并行技术,针对模型384个专家和每token 320亿激活参数的设计进行优化,通过跨节点通信优化与负载均衡策略,显著提升了trillion-scale模型的推理吞吐与并发处理能力。

开源生态教程/实践部署/工程
7月15日
00:00
Mistral AI:News(网页)
62
Mistral AI 发布 Voxtral 开源语音理解模型

Mistral AI 发布了开源语音理解模型 Voxtral,提供 24B 和 3B 两个参数版本,均基于 Apache 2.0 协议开放。模型支持 32k token 上下文窗口,可处理最长 30 分钟的音频转录或 40 分钟的内容理解。其 API 提供了针对转录优化的 Voxtral Mini Transcribe 版本,在成本和延迟效率上表现突出。根据基准测试,Voxtral 在英语短文本及 Mozilla Common Voice 等多项指标上超越了 OpenAI Whisper 与 ElevenLabs Scribe,实现了同等性能下价格不到同类闭源 API 一半的优势。

开源生态模型发布语音
7月10日
00:00
Mistral AI:News(网页)
61
Mistral AI 与 All Hands AI 合作发布新款 Devstral 模型

Mistral AI 与 All Hands AI 合作发布了新的 Devstral 模型,旨在增强 AI 智能体的编程能力。其中,Devstral Small 1.1 是一款开源模型(Apache 2.0 许可),仅有 24B 参数,在 SWE-Bench Verified 基准测试中达到 53.6% 的成绩,成为同类开源模型的新标杆。Devstral Medium 则通过 API 提供,在相同基准上取得 61.6% 的高分,性能超越 Gemini 2.5 Pro 和 GPT 4.1,且价格更具竞争力。两款模型均提供公共 API 访问。

智能体开源生态模型发布编码
7月8日
00:00
LMSYS:Blog(Chatbot Arena 团队)
OME:以模型驱动架构革新 LLM 基础设施

Oracle Cloud Infrastructure 推出 OME(Open Model Engine),一款 Kubernetes-native 的模型服务框架。该系统采用模型驱动架构,通过 BaseModel、ServingRuntime 等自定义资源将模型视为一等公民,有效弥合 ML 工程师与生产团队之间的鸿沟。OME 将模型上线周期从数月压缩至数天,显著减少配置错误,并原生支持多节点推理、Prefill-decode 分离、Serverless 自动扩缩容及 Multi-LoRA 等企业级特性,集成 SGLang 运行时,实现复杂部署策略的编码复用与一键部署。

开源/仓库开源生态部署/工程
7月3日
00:00
Mistral AI:News(网页)
55
发布AI for Citizens计划

Mistral AI发布“AI for Citizens”计划,旨在帮助各国政府及公共机构本土化应用人工智能,以改善公共服务。该计划基于开放、协作、选择与自主的原则,旨在对抗当前主导的、由封闭系统主导的“一刀切”模式。它提供涵盖前沿模型的全套技术,并支持自托管、本地化数据中心部署或SaaS/API调用等多种部署方式,以确保数据主权,同时可与客户共同研发针对特定语言和文化的定制模型。Mistral AI已与法国、新加坡、荷兰等多国政府及公共机构开展合作。

开源生态行业动态
7月2日
21:23
Yann LeCun@ylecun
精选
DeepSeek 时刻后,AI 人才正从封闭的 OpenAI、Anthropic 流向拥抱开放科学与开源的 META。这种「拥抱开放」的趋势有利于行业透明度、科学进步与安全监管。OpenAI 承诺今夏发布开放权重模型,或将改变这一格局。

Nirit Weiss-Blatt, PhD: In the current AI talent war, everyone is focused on the big numbers (alleged compensation packages). It misses the bigg...

MetaOpenAI大佬观点开源生态

推荐理由:LeCun 谈 DeepSeek 时刻后 AI 人才流向 Meta 与开源文化的关系
6月10日
00:00
Mistral AI:News(网页)
67
Mistral AI 发布首个推理模型 Magistral

Mistral AI 发布了其首个推理模型 Magistral,包含开源版 Magistral Small(24B 参数)和企业版 Magistral Medium。在 AIME2024 上,Magistral Medium 得分为 73.6%,Magistral Small 为 70.7%。该模型核心特点是支持透明的多步推理,并能在 Le Chat 中以 10 倍于多数竞品的速度运行。Magistral 原生支持包括英语、法语、简体中文在内的多语言推理。开源版 Magistral Small 以 Apache 2.0 许可证发布。

开源生态推理模型发布
6月4日
00:00
Mistral AI:News(网页)
44
Mistral Code 发布:企业级 AI 编程助手

Mistral AI 推出企业级 AI 编程助手 Mistral Code。该产品基于开源项目 Continue 构建,集成了 Codestral、Codestral Embed、Devstral 和 Mistral Medium 四个模型,分别用于代码补全、代码搜索、智能体编码和对话辅助。Mistral Code 支持 80 多种编程语言,并提供私有化部署、模型微调及企业级管控功能。目前,包括 Abanca、SNCF 和 Capgemini 在内的多家企业已在混合云或本地环境中部署该产品。目前该产品已开放私有测试。

产品更新开源生态编码部署/工程
5月29日
20:11
DeepSeek@deepseek_ai
精选68
🚀 DeepSeek-R1-0528 现已发布! 🔹 基准测试性能提升 🔹 前端能力增强 🔹 减少幻觉现象 🔹 支持 JSON 输出与函数调用 ✅ 立即试用:https://chat.deepseek.com/ 🔌 API 使用方式不变 - 文档在此:https://api-docs.deepseek.com/guides/reasoning_model 🔗 开源权重:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
DeepSeek开源生态推理模型发布
关联讨论 1 条X:DeepSeek (@deepseek_ai)
推荐理由:DeepSeek-R1 的常规迭代,幻觉降低和 JSON 输出是实用改进,但距离代际跃迁还差得远。开源权重直接可用,做推理链产品的团队值得花半小时跑一下。
5月21日
00:00
Mistral AI:News(网页)
63
Devstral 面向软件工程的智能体大语言模型发布

Mistral AI 与 All Hands AI 合作推出 Devstral,一款专注于解决真实世界 GitHub 问题的智能体大语言模型。该模型需在 OpenHands 或 SWE-Agent 等代码智能体框架中运行。在 SWE-Bench Verified 基准测试中,Devstral 获得 46.8% 的分数,超越此前的开源最先进模型超过 6 个百分点。在相同测试框架下,其表现优于 DeepSeek-V3-0324 和 Qwen3 232B-A22B,并且比闭源的 GPT-4.1-mini 高出超过 20%。Devstral 以 Apache 2.0 许可证开源,可在单张 RTX 4090 或配备 32GB 内存的 Mac 上本地部署,亦可通过 API 调用。

智能体开源生态模型发布编码
5月7日
00:00
Mistral AI:News(网页)
54
Medium is the new large.

Mistral AI 发布 Mistral Medium 3 模型,主打顶尖性能与高性价比。该模型在各项基准测试中达到或超过 Claude Sonnet 3.7 表现的90%,但成本显著更低(API 定价为 $0.4 / 百万输入 token 和 $2 / 百万输出 token)。其性能超越 Llama 4 Maverick 等开源模型及 Cohere Command A 等企业模型,成本也优于 DeepSeek v3。该模型擅长编码和多模态理解等专业任务,并支持混合或本地部署、定制微调及集成企业系统,现已可通过多个平台调用。

开源生态模型发布
5月5日
00:00
LMSYS:Blog(Chatbot Arena 团队)
技术博客:在96块H100 GPU上通过PD分离与大规模专家并行部署DeepSeek

SGLang团队开源了基于96块H100 GPU(12节点×8卡)的DeepSeek推理系统实现,采用PD分离(Prefill-Decode Disaggregation)与大规模专家并行(EP)架构,集成DeepEP、DeepGEMM和EPLB完整功能,在2000 token输入序列下达成每节点每秒52.3k输入token和22.3k输出token的吞吐量。该方案较传统张量并行提升输出吞吐量5倍,将成本压缩至每百万输出token仅0.20美元,约为官方API价格的五分之一,是首个在开源实现中接近官方DeepSeek报告性能的大规模部署方案。

开源/仓库开源生态部署/工程
3月21日
01:01
Jim Fan@DrJimFan
精选
NVIDIA 发布世界首个开源人形机器人基础模型 GR00T N1,仅 2B 参数,采用 VLM 加 Diffusion Transformer 架构实现端到端控制。模型基于真实遥操作、30 万+仿真轨迹及合成神经轨迹训练,在 GR1、1X Neo 等机器人上任务性能提升 30%,并可跨具身部署至百元级开源机械臂。

Jim Fan: Excited to announce GR00T N1, the world's first open foundation model for humanoid robots! We are on a mission to democr...

具身智能开源生态模型发布

推荐理由:NVIDIA开源首个通用人形机器人基础模型GR00T N1,2B参数可部署于百元级机械臂
3月17日
00:00
Mistral AI:News(网页)
58
Mistral AI 发布 Mistral Small 3.1 开源模型

Mistral AI 于2025年3月17日发布 Mistral Small 3.1。该模型在 Mistral Small 3 基础上改进,支持最高 128k tokens 上下文窗口,推理速度达 150 tokens/秒,并支持多模态理解。官方称其性能超越了 Gemma 3 和 GPT-4o Mini 等同量级模型。Mistral Small 3.1 以 Apache 2.0 许可开源,基础模型与指令微调模型均已发布。模型轻量化,可在单张 RTX 4090 或配备 32GB RAM 的 Mac 上运行,适用于对话助手、函数调用、专业领域微调及构建推理模型等多种场景。

开源生态模型发布端侧
2月21日
12:00
DeepSeek@deepseek_ai
DeepSeek 启动开源周:将开源 5 个 AGI 探索代码库

DeepSeek AI 预告开源周活动,将于下周起陆续开源 5 个代码仓库。作为探索 AGI 的小团队,他们计划透明分享那些已在生产环境中实战验证的代码模块。团队相信开源社区的集体力量能加速行业进步,强调此次发布将摒弃象牙塔式的封闭开发,以"车库能量"和社区驱动创新的形式呈现。

DeepSeek开源/仓库开源生态部署/工程
2月19日
02:48
Lilian Weng@lilianweng
这是我们过去几个月一直在筹备的项目,今天我非常兴奋地宣布它。

Thinking Machines: Today, we are excited to announce Thinking Machines Lab (https://thinkingmachines.ai/), an artificial intelligence resea...

开源生态行业动态
2月4日
08:00
OpenRouter:Announcements(RSS)
18
OpenRouter 新增 Cloudflare 作为模型提供商,上线 Gemma 与 Llama 模型

OpenRouter 新增 Cloudflare 作为模型提供商,即日起提供 Google 的 Gemma 模型及多个流行的 Llama 系列模型。

产品更新开源生态部署/工程
‹ 上一页
1…33343536
下一页 ›