AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 398 条
全部一手资讯X论文
标签「模型发布」清除
4月28日周二
17:51蚂蚁 inclusionAI:HuggingFace 新模型49inclusionAI发布Ling-2.6-flash-int4模型
11:50蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/Ling-2.6-flash-fp8
11:27蚂蚁 inclusionAI:HuggingFace 新模型55精选inclusionAI/Ling-2.6-flash
01:27公众号:小米 MiMo45小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动
4月24日周五
22:17蚂蚁 inclusionAI:HuggingFace 新模型49inclusionAI/DR-Venus-4B-SFT-GGUF
10:55公众号:DeepSeek(深度求索)59DeepSeek-V4 预览版:迈入百万上下文普惠时代
09:00公众号:蚂蚁百灵(Ling)51Ling-2.6-1T 发布:万亿旗舰"快思考"模型,对标 GPT-5.4
08:00Hugging Face:Blog(RSS)78精选DeepSeek-V4:智能体可实际使用的百万token上下文
01:53公众号:小米 MiMo52MiMo-V2.5-TTS-Series + ASR 正式发布
4月23日周四
17:50公众号:腾讯混元67精选Hy3 preview发布并开源:混元重建后首个模型,Agent能力大幅提升
08:00蚂蚁百灵:Developer Blog(网页)67精选Ling-2.6-flash 发布:更快响应、更强执行、更高 Token Efficiency
01:10蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/LLaDA2.0-Uni
00:05公众号:小米 MiMo54Xiaomi MiMo-V2.5 系列大模型开启公测
4月22日周三
21:00公众号:通义实验室(千问)59Qwen3.6-27B 开源发布:270亿稠密参数,编程能力超越前代MoE旗舰
09:00公众号:蚂蚁百灵(Ling)40Ling-2.6-flash 发布:更快响应、更强执行、更高 Token Efficiency
4月21日周二
16:25蚂蚁 inclusionAI:HuggingFace 新模型37inclusionAI/DR-Venus-4B-RL-GGUF
16:05蚂蚁 inclusionAI:HuggingFace 新模型39inclusionAI/DR-Venus-4B-RL 发布
15:29蚂蚁 inclusionAI:HuggingFace 新模型39inclusionAI/DR-Venus-4B-SFT模型
4月20日周一
23:40公众号:月之暗面(Kimi)57Kimi K2.6 发布并开源,全面精进代码和 Agent 集群能力
17:31蚂蚁 inclusionAI:GitHub 新仓库69精选DR-Venus:基于开放数据的边缘级深度研究智能体
15:40公众号:通义实验室(千问)59通义千问发布 Qwen3.6-Max-Preview
4月17日周五
16:48蚂蚁 inclusionAI:GitHub 新仓库56精选inclusionAI发布LLaDA2.0-Uni模型
4月16日周四
21:22公众号:通义实验室(千问)62精选Qwen3.6-35B-A3B 开源!
10:30公众号:腾讯混元53腾讯混元3D世界模型2.0发布:无缝对接游戏工作流
4月13日周一
08:56公众号:MiniMax(稀宇科技)54MiniMax M2.7 × Hermes Agent:开启自我进化的 Agent 工作流
4月12日周日
21:30公众号:MiniMax(稀宇科技)57MiniMax M2.7开源,携手全球伙伴加速AI生态繁荣
4月10日周五
21:30公众号:MiniMax(稀宇科技)30MiniMax Music 2.6:我们想讲四个人的故事
17:14公众号:智谱(GLM)59GLM-5.1获LMArena代码榜开源第一、全球第三
4月9日周四
17:01公众号:腾讯混元51腾讯Robotics X实验室联合混元推出2B具身模型:22项评测16项最佳
4月8日周三
14:06蚂蚁 inclusionAI:HuggingFace 新模型34inclusionAI/TC-AE
10:41公众号:智谱(GLM)62精选GLM-5.1开源:一个独立工作8小时的模型
4月7日周二
19:32公众号:蚂蚁百灵(Ling)52Ming-flash-omni:从看图到发文,打通全模态创作闭环
4月4日周六
00:57Nathan Lambert:Interconnects(RSS)精选Gemma 4 与开放模型成功之道
4月2日周四
19:58公众号:龙猫LongCat(美团)37LongCat-Flash-Prover:AI 攻克数学定理证明,不仅要"算得对",更要"证得严"
19:58公众号:龙猫LongCat(美团)53美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语
13:46公众号:阶跃星辰(Step)42阶跃 Step 3.5 Flash 系列上新,Step Plan 用户现可体验
12:32公众号:通义实验室(千问)54Qwen3.6-Plus:编码智能体能力全面跃升!
08:05公众号:智谱(GLM)45智谱发布GLM-5V-Turbo多模态Coding基座模型
08:00Google Developers Blog(RSS)81精选通过 Gemma 4 将先进的智能体能力引入边缘
08:00Hugging Face:Blog(RSS)88精选Welcome Gemma 4: 设备端的 Frontier 多模态智能
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月28日
17:51
蚂蚁 inclusionAI:HuggingFace 新模型
49
inclusionAI发布Ling-2.6-flash-int4模型

inclusionAI团队宣布推出Ling-2.6-flash-int4模型,作为其通过开源与开放科学推动人工智能技术进步与普及的重要举措。该版本延续了团队降低AI应用门槛、促进技术民主化的核心使命,以轻量化技术方案进一步优化模型性能与部署效率。

开源/仓库模型发布端侧
11:50
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-flash-fp8

inclusionAI 团队发布了 Ling-2.6-flash-fp8 模型,致力于通过开源与开放科学推动人工智能的发展与普及。该版本采用 FP8 精度优化,显著提升了推理效率并降低了计算资源消耗,是其在推进技术民主化进程中的最新实践。

开源/仓库模型发布端侧
11:27
蚂蚁 inclusionAI:HuggingFace 新模型
精选55
inclusionAI/Ling-2.6-flash

inclusionAI发布了Ling-2.6-flash模型。该模型是其开源语言模型系列的最新成员,旨在通过开源与开放科学推动人工智能的进步与民主化。此次发布延续了团队降低AI技术使用门槛、促进更广泛社区参与开发的使命。

开源/仓库模型发布端侧

推荐理由:蚂蚁 inclusionAI 的 Ling-2.6-flash 上线 HuggingFace,名字带 flash 大概率是轻量推理模型,但官方描述几乎空白,没有 benchmark 也没有用例,建议等社区实测再决定是否投入精力。
01:27
公众号:小米 MiMo
45
小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动

小米开源 MiMo-V2.5 系列模型,同时启动 Orbit 百万亿 Token 计划,携手全球开发者与 Agent 框架共建开源繁荣生态。

智能体开源生态模型发布
4月24日
22:17
蚂蚁 inclusionAI:HuggingFace 新模型
49
inclusionAI/DR-Venus-4B-SFT-GGUF

该项目致力于通过开源与开放科学推动人工智能的发展与普及。团队正持续推进技术民主化进程,旨在让更广泛的群体能够接触并利用先进AI工具。其核心路径是依托开放协作模式,降低技术门槛,促进创新生态的构建。

开源/仓库模型发布端侧
10:55
公众号:DeepSeek(深度求索)
59
DeepSeek-V4 预览版:迈入百万上下文普惠时代

DeepSeek-V4 预览版发布,支持百万级上下文窗口,提供顶级长文本记忆能力,模型配置选择更灵活。

DeepSeek模型发布
09:00
公众号:蚂蚁百灵(Ling)
51
Ling-2.6-1T 发布:万亿旗舰"快思考"模型,对标 GPT-5.4

蚂蚁百灵发布万亿参数旗舰 Ling-2.6-1T,采用 MLA 与 Linear Attention Hybrid 架构,以“快思考”机制实现低 Token 开销高效推理。综合智能对标 GPT-5.4 (Non-Reasoning),在 AIME26 上显著领先其他非思考模型;在 SWE-bench Verified、TAU2-Bench、BFCL-V4 等 Agent 基准上达到开源 SOTA。支持 256K 超长上下文(MRCR 高分)并表现优异的 IFBench。现已通过 OpenRouter 和官方平台提供一周免费 API 调用,将于近期正式开源。

智能体开源生态推理模型发布
08:00
Hugging Face:Blog(RSS)
精选78
DeepSeek-V4:智能体可实际使用的百万token上下文

DeepSeek发布新一代模型DeepSeek-V4,其核心突破在于实现了长达百万token的上下文窗口,并确保智能体能够有效利用这一扩展的上下文能力。该模型延续了通过开源与开放科学推动人工智能发展与普及的使命,标志着大模型在长上下文理解和实际应用方面迈出重要一步。

智能体DeepSeek开源生态模型发布
关联讨论 3 条Simon Willison 博客Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
推荐理由:DeepSeek 把上下文窗口推到百万 token 不稀奇,关键是「agent 能实际用」这六个字。如果实测成立,RAG 的很多工程妥协可以扔掉了,做长文档和复杂 agent 的人该第一时间跑一遍。
01:53
公众号:小米 MiMo
52
MiMo-V2.5-TTS-Series + ASR 正式发布
模型发布语音
4月23日
17:50
公众号:腾讯混元
精选67
Hy3 preview发布并开源:混元重建后首个模型,Agent能力大幅提升
智能体开源/仓库模型发布

推荐理由:混元重建后的第一枪,Agent能力大幅提升且直接开源,虽然已过首发热度,但对关注国产模型Agent能力的人还是个值得拉下来跑的repo。
08:00
蚂蚁百灵:Developer Blog(网页)
精选67
Ling-2.6-flash 发布:更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题,Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化,旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s,在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平,保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程

推荐理由:蚂蚁百灵这次打的是「省 token」这张牌,104B 总参但只激活 7.4B,Agent 场景评测对齐同尺寸 SOTA,输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。
01:10
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/LLaDA2.0-Uni

inclusionAI团队发布了LLaDA2.0-Uni模型。该版本在统一的多模态理解与生成能力上取得显著进展,支持图像、文本、音频等多种输入与输出模态。模型参数量达到约70B,在多项基准测试中,其综合性能较前代提升超过15%。此次发布延续了通过开源与开放科学来推动人工智能民主化的核心使命。

开源/仓库模型发布端侧
00:05
公众号:小米 MiMo
54
Xiaomi MiMo-V2.5 系列大模型开启公测
智能体多模态模型发布
4月22日
21:00
公众号:通义实验室(千问)
59
Qwen3.6-27B 开源发布:270亿稠密参数,编程能力超越前代MoE旗舰

Qwen3.6-27B 开源发布,采用270亿稠密参数,无需MoE路由,部署门槛更低。编程能力全面超越前代旗舰Qwen3.5-397B-A17B MoE,在SWE-bench Verified(77.2)、SWE-bench Pro(53.5)、Terminal-Bench 2.0(59.3)、SkillsBench(48.2)等基准上领先,深度思考能力媲美超大参数模型。原生支持多模态,可处理图像、视频与文本,支持视觉推理、文档理解和视觉问答,具备视觉语言思考与非思考模式。开源权重已上线Hugging Face与ModelScope,API即将在阿里云百炼上线,兼容OpenAI与Anthropic协议,即时对话可通过Qwen Studio体验。

多模态推理模型发布编码
09:00
公众号:蚂蚁百灵(Ling)
40
Ling-2.6-flash 发布:更快响应、更强执行、更高 Token Efficiency
模型发布部署/工程
4月21日
16:25
蚂蚁 inclusionAI:HuggingFace 新模型
37
inclusionAI/DR-Venus-4B-RL-GGUF

该模型由 inclusionAI 发布,属于 DR-Venus 系列,参数量为 40 亿,采用强化学习训练并已转换为 GGUF 格式,便于在本地设备高效运行。其推出延续了通过开源与开放科学推动人工智能技术发展与普及的使命,旨在降低先进 AI 技术的使用门槛,促进更广泛的社区参与和创新应用。

开源/仓库模型发布端侧
16:05
蚂蚁 inclusionAI:HuggingFace 新模型
39
inclusionAI/DR-Venus-4B-RL 发布

inclusionAI 团队开源了 DR-Venus-4B-RL 模型。这是一个基于强化学习技术微调的 40 亿参数语言模型,旨在通过开源与开放科学的方式推动人工智能的发展与普及。该模型的发布为研究社区提供了一个中等规模、经过指令与人类偏好对齐的可用模型,延续了其促进 AI 民主化的目标。

开源/仓库模型发布端侧
15:29
蚂蚁 inclusionAI:HuggingFace 新模型
39
inclusionAI/DR-Venus-4B-SFT模型

该团队正致力于通过开源与开放科学的方式,推动人工智能技术的进步与民主化。其核心目标是降低AI技术的门槛,促进更广泛的参与和创新,使先进AI工具能够被更多开发者和研究者所使用。这一举措旨在构建一个开放、协作的AI生态系统。

开源/仓库模型发布端侧
4月20日
23:40
公众号:月之暗面(Kimi)
57
Kimi K2.6 发布并开源,全面精进代码和 Agent 集群能力
智能体开源/仓库模型发布编码
17:31
蚂蚁 inclusionAI:GitHub 新仓库
精选69
DR-Venus:基于开放数据的边缘级深度研究智能体

DR-Venus 是一个仅用1万条开放数据训练的40亿参数深度研究智能体,基于Qwen3-4B-Thinking-2507架构,支持200步工具调用和超20万tokens的上下文。它通过监督微调与强化学习两阶段训练,在BrowseComp、GAIA等多个深度研究基准上树立了小模型性能新标杆。其SFT版本已超越多数同类开源模型,而RL版本进一步将长程任务可靠性和工具使用校准度提升2-3个百分点。项目已全面开源模型、代码与训练流程。

智能体开源/仓库推理模型发布

推荐理由:4B 参数、仅用 1 万条公开数据就能在多个 deep research benchmark 上碾压 8B 对手,蚂蚁 inclusionAI 这次证明了小模型做 Agent 的关键不在参数量而在数据管线,做端侧 Agent 的团队值得拆一下它的 SFT+RL 流程。
15:40
公众号:通义实验室(千问)
59
通义千问发布 Qwen3.6-Max-Preview

通义千问发布 Qwen3.6-Max-Preview 预览版,相比 Qwen3.6-Plus 在多项基准上显著提升:智能体编程(SkillsBench +9.9、SciCode +6.3、NL2Repo +5.0、Terminal-Bench 2.0 +3.8)、世界知识(SuperGPQA +2.3、QwenChineseBench +5.3)、指令遵循(ToolcallFormatIFBench +2.8)。新版本支持 preserve_thinking,可在消息中保留前序轮次思维内容,避免多步任务上下文丢失,官方推荐用于智能体开发。用户可登录 Qwen Studio 直接对话,或通过阿里云百炼(即将上线)调用 API。

智能体推理模型发布编码
4月17日
16:48
蚂蚁 inclusionAI:GitHub 新仓库
精选56
inclusionAI发布LLaDA2.0-Uni模型

LLaDA2.0-Uni是一个统一的多模态模型,具备对世界的理解与生成能力。该模型通过整合视觉、语言等多模态信息,实现了跨模态的语义理解和内容生成。其架构支持从图像理解到文本生成、跨模态检索等复杂任务,标志着多模态人工智能向更通用、统一的方向演进。

多模态开源生态模型发布

推荐理由:蚂蚁 inclusionAI 推出 LLaDA2.0-Uni,主打理解与生成统一架构,但距发布已过两周且信息极少,建议等官方技术报告出来再决定是否跟进。
4月16日
21:22
公众号:通义实验室(千问)
精选62
Qwen3.6-35B-A3B 开源!
开源/仓库模型发布

推荐理由:千问又推轻量 MoE 模型,35B 总参激活仅 3B,小团队能跑,但正文就一句宣传语,缺技术细节,先观望。
10:30
公众号:腾讯混元
53
腾讯混元3D世界模型2.0发布:无缝对接游戏工作流
多模态开源生态模型发布
4月13日
08:56
公众号:MiniMax(稀宇科技)
54
MiniMax M2.7 × Hermes Agent:开启自我进化的 Agent 工作流

MiniMax M2.7 与 Hermes Agent 结合,构建可自我进化的 AI 智能体工作流。

智能体模型发布
4月12日
21:30
公众号:MiniMax(稀宇科技)
57
MiniMax M2.7开源,携手全球伙伴加速AI生态繁荣

MiniMax 正式开源 M2.7 模型,并联合全球合作伙伴共同加速人工智能生态的繁荣发展。

开源生态模型发布
4月10日
21:30
公众号:MiniMax(稀宇科技)
30
MiniMax Music 2.6:我们想讲四个人的故事

MiniMax Music 2.6 版本发布,以“四个人的故事”为主题。

多模态模型发布
17:14
公众号:智谱(GLM)
59
GLM-5.1获LMArena代码榜开源第一、全球第三

GLM-5.1在LMArena Code Arena登顶开源第一、全球第三。它继承上一代的SOTA编码能力,并在长程任务突破:8小时构建Linux桌面、655次迭代优化向量数据库、1000轮工具调用优化机器学习模型。METR榜下,它是唯一达8小时级持续工作的开源模型(除Claude Opus 4.6外)。

开源生态模型发布编码
4月9日
17:01
公众号:腾讯混元
51
腾讯Robotics X实验室联合混元推出2B具身模型:22项评测16项最佳

腾讯Robotics X实验室与混元联合推出2B参数规模的具身模型,在22项评测中取得16项最佳成绩。该模型旨在为真实世界AI智能体提供基础支撑。

具身智能模型发布
4月8日
14:06
蚂蚁 inclusionAI:HuggingFace 新模型
34
inclusionAI/TC-AE

inclusionAI团队发布了TC-AE项目,旨在通过开源与开放科学推动人工智能技术的进步与民主化。该项目致力于降低AI技术的使用门槛,促进更广泛的社区参与和创新。核心变化在于构建了一个可访问的AI开发框架,强调协作与知识共享。此举预期将加速AI工具在多元领域的应用,并推动技术发展的透明性与包容性。

开源/仓库模型发布
10:41
公众号:智谱(GLM)
精选62
GLM-5.1开源:一个独立工作8小时的模型

智谱推出开源模型GLM-5.1,支持独立工作长达8小时。模型可直接部署使用,无需人工频繁干预,适用于长周期自动化任务场景。

智能体开源生态模型发布
关联讨论 2 条公众号:智谱(GLM)IT之家(RSS)
推荐理由:智谱把 GLM-5.1 开源,并且主打 8 小时独立工作,这个定位切中了 agent 场景下长任务执行的痛点,想做自动化流程的可以跑起来试试。
4月7日
19:32
公众号:蚂蚁百灵(Ling)
52
Ming-flash-omni:从看图到发文,打通全模态创作闭环

Ming-flash-omni 模型具备全模态创作能力,能够同时完成照片中路人干扰的识别、自动修图、修图效果自评,并最终生成一段社交媒体推文,实现从视觉理解到内容发布的完整闭环。

多模态模型发布
4月4日
00:57
Nathan Lambert:Interconnects(RSS)
精选
Gemma 4 与开放模型成功之道

Gemma 4 的发布揭示了开放模型成功的真正标准。文章指出,决定模型成败的关键并非基准测试分数(benchmark scores),而是其他因素。当前 AI 领域过度关注 leaderboard 排名,但高分数不等于实际应用价值与社区采用率。真正的成功取决于模型解决真实场景需求的能力、开发者友好度以及生态建设,而非单纯的技术指标领先。这一观点挑战了以 benchmark 为导向的行业评估范式。

Google大佬观点开源生态模型发布
关联讨论 1 条X:Francois Chollet (@fchollet)
推荐理由:开源模型成败不只看榜单分数,Hugging Face 大佬揭秘真实胜负手
4月2日
19:58
公众号:龙猫LongCat(美团)
37
LongCat-Flash-Prover:AI 攻克数学定理证明,不仅要"算得对",更要"证得严"
推理模型发布
19:58
公众号:龙猫LongCat(美团)
53
美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

美团发布原生多模态模型 LongCat-Next,将视觉与语音作为模型的固有输入输出模态,而非传统语言模型的外部插件。该模型旨在构建能够直接感知、理解并作用于真实世界的 AI 系统,强调多模态能力在底层架构中的原生融合,而非后期拼接。

多模态模型发布
13:46
公众号:阶跃星辰(Step)
42
阶跃 Step 3.5 Flash 系列上新,Step Plan 用户现可体验

阶跃星辰发布 Step 3.5 Flash 系列,主打更快、更好用、更加 Agent-native,面向所有 Step Plan 用户开放体验。

智能体模型发布
12:32
公众号:通义实验室(千问)
54
Qwen3.6-Plus:编码智能体能力全面跃升!
智能体模型发布编码
08:05
公众号:智谱(GLM)
45
智谱发布GLM-5V-Turbo多模态Coding基座模型

智谱今日发布GLM-5V-Turbo,这是一款多模态Coding基座模型,专注于编程场景下的多模态任务处理。

多模态模型发布
08:00
Google Developers Blog(RSS)
精选81
通过 Gemma 4 将先进的智能体能力引入边缘

Google DeepMind 发布了 Gemma 4 系列开源模型,旨在直接在设备端实现多步骤规划和自主智能体工作流。该版本包含用于实验“智能体技能”的 Google AI Edge Gallery,以及为开发者提供显著速度提升和结构化输出的 LiteRT-LM 库。Gemma 4 采用 Apache 2.0 许可,支持超过 140 种语言,并兼容移动设备、台式机及树莓派等多种物联网硬件平台。

智能体Google模型发布端侧

推荐理由:开源 agentic 模型支持端侧运行,开发者可快速构建本地智能应用。
08:00
Hugging Face:Blog(RSS)
精选88
Welcome Gemma 4: 设备端的 Frontier 多模态智能

Google 正式发布了 Gemma 4,这是一款前沿的多模态人工智能模型,其核心特点是能够在设备端本地运行。该模型通过开源方式发布,旨在推动人工智能技术的进步与民主化。Gemma 4 的“在设备端”能力意味着数据处理可在本地完成,无需持续连接云端,这有望提升响应速度、增强隐私保护并实现离线使用。此举是 Google 通过开源和开放科学来普及人工智能的持续努力的一部分。

Google多模态模型发布端侧

推荐理由:前沿多模态模型开源,设备端可运行,降低AI部署门槛。
‹ 上一页
123456…10
下一页 ›