AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「模型发布」清除
2月12日周四
16:52蚂蚁 inclusionAI:HuggingFace 新模型34inclusionAI/ZwZ-7B
16:52蚂蚁 inclusionAI:HuggingFace 新模型39inclusionAI/ZwZ-8B
12:18公众号:豆包(字节)41豆包视频生成模型Seedance 2.0上线
00:00MiniMax:Blog(网页)67精选MiniMax 发布 MiniMax M2.5 模型,专为现实世界生产力打造
00:00字节 Seed:Research Feed(网页内嵌数据)精选Seedance 2.0 正式发布
00:00智谱:研究(网页内嵌数据)精选GLM-5开源:从代码到工程,Agentic Engineering时代最好的开源模型
2月11日周三
20:18蚂蚁 inclusionAI:GitHub 新仓库51inclusionAI/Ming-omni-tts
19:00公众号:蚂蚁百灵(Ling)33百灵全模态 Ming-flash-omni-2.0 发布:感知无界,创造有形
18:52蚂蚁 inclusionAI:GitHub 新仓库65精选inclusionAI发布新一代即时大模型Ling-2.5-1T
18:52蚂蚁 inclusionAI:GitHub 新仓库78精选inclusionAI发布全球首个开源万亿参数思维模型Ring-2.5-1T
11:12蚂蚁 inclusionAI:HuggingFace 新模型32inclusionAI/Ming-omni-tts-tokenizer-12Hz
11:10蚂蚁 inclusionAI:HuggingFace 新模型39inclusionAI/Ming-omni-tts-0.5B
10:49蚂蚁 inclusionAI:HuggingFace 新模型37inclusionAI/Ming-omni-tts-16.8B-A3B
08:00蚂蚁百灵:Developer Blog(网页)83精选感知无界·创造有形:百灵全模态 Ming-flash-omni-2.0 焕新生活想象
2月10日周二
20:45蚂蚁 inclusionAI:HuggingFace 新模型42inclusionAI/Ring-2.5-1T
14:57蚂蚁 inclusionAI:HuggingFace 新模型41inclusionAI/Ming-flash-omni-2.0
13:08Qwen:Blog Retrieval(API)Qwen-Image-2.0:专业信息图表与精美照片级真实感
11:39公众号:腾讯混元59首个产业级2Bit量化新突破,腾讯混元开源0.3B端侧模型
2月9日周一
18:47蚂蚁 inclusionAI:HuggingFace 新模型39inclusionAI/LLaDA2.1-flash
15:55蚂蚁 inclusionAI:HuggingFace 新模型36inclusionAI/UI-Venus-1.5-30B-A3B 发布
2月6日周五
18:00公众号:生数科技(Vidu·视频)48生数科技携手清华大学开源统一世界模型Motus,性能全面超越Pi0.5 40%
15:32美团 LongCat:HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型
2月4日周三
01:40Hugging Face:Blog(RSS)73精选H公司新模型Holo2在UI本地化领域取得领先
00:00Mistral AI:News(网页)82Mistral AI 发布 Voxtral Transcribe 2 系列语音转文本模型及音频游乐场
2月3日周二
17:46美团 LongCat:HuggingFace 新模型美团-longcat/LongCat-Image-Edit-Turbo
04:00Qwen:Blog Retrieval(API)Qwen3-Coder-Next:推进小型混合模型在智能体编程中的应用
00:00智谱:研究(网页内嵌数据)GLM-OCR发布:性能SOTA,搞定复杂文档
1月28日周三
15:51公众号:腾讯混元5710亿红包后,我们打算开源这个800亿的模型
06:47Nathan Lambert:Interconnects(RSS)精选Arcee AI 全力投入在美国构建的开放模型
1月27日周二
19:11公众号:月之暗面(Kimi)61精选Kimi 发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力
16:03美团 LongCat:HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite
00:00MiniMax:Blog(网页)50MiniMax-M2-her 技术解析:专为角色扮演打造的 AI 智能体
1月23日周五
10:50美团 LongCat:HuggingFace 新模型美团 LongCat 发布 Flash-Thinking-ZigZag 模型
00:00MiniMax:Blog(网页)精选MiniMax Speech 2.8 语音模型
1月20日周二
11:20Hugging Face:Blog(RSS)83精选差分Transformer V2
08:00Hugging Face:Blog(RSS)73精选Overworld发布实时交互式视频扩散模型Waypoint-1
00:00智谱:研究(网页内嵌数据)精选GLM-4.7-Flash开源、免费
1月14日周三
18:44美团 LongCat:HuggingFace 新模型精选美团LongCat发布重思考模式总结模型
00:00智谱:研究(网页内嵌数据)精选智谱联合华为开源首个国产芯片训练的多模态SOTA模型
1月10日周六
07:20Midjourney:Updates(RSS)精选Niji V7 正式发布!
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
2月12日
16:52
蚂蚁 inclusionAI:HuggingFace 新模型
34
inclusionAI/ZwZ-7B

inclusionAI 发布了 ZwZ-7B 模型,这是一个拥有70亿参数的开源大语言模型。该模型基于先进的 Transformer 架构,在多项基准测试中性能显著提升,尤其在代码生成和数学推理任务上表现突出。其上下文窗口扩展至 128K 令牌,并采用了分组查询注意力等高效技术。模型权重已完全开源,旨在通过开放科学推动人工智能技术的民主化与普及。

开源生态模型发布
16:52
蚂蚁 inclusionAI:HuggingFace 新模型
39
inclusionAI/ZwZ-8B

inclusionAI发布了ZwZ-8B模型,这是一个拥有80亿参数的开源人工智能模型。该模型旨在通过开源和开放科学的方式,推动人工智能技术的进步与普及。此举是inclusionAI推进AI民主化进程的一部分,致力于让更广泛的社区能够访问和利用先进的AI技术。

开源/仓库模型发布端侧
12:18
公众号:豆包(字节)
41
豆包视频生成模型Seedance 2.0上线

字节跳动旗下豆包推出视频生成模型Seedance 2.0,该模型已上线。

多模态模型发布视频
00:00
MiniMax:Blog(网页)
精选67
MiniMax 发布 MiniMax M2.5 模型,专为现实世界生产力打造

MiniMax 最新发布的大语言模型 M2.5,通过在数十万个复杂现实环境中进行强化学习训练,在编码、智能体工具调用、搜索和办公工作等多项任务上达到 SOTA。模型推理效率高,完成 SWE-Bench Verified 评估的速度比前代 M2.1 快 37%,与 Claude Opus 4.6 相当。定价方面,以 100 tokens/秒运行时每小时成本仅 1 美元。M2.5 在超过 10 种编程语言和 20 多万个真实环境中训练,具备从系统设计到测试的全流程能力。

智能体搜索模型发布编码

推荐理由:MiniMax M2.5 把 SWE-bench 拉到 80.2%,成本只有 Claude Opus 4.6 的十分之一,速度还翻倍,对做 agent 的团队来说是个高性价比选择。
00:00
字节 Seed:Research Feed(网页内嵌数据)
精选
Seedance 2.0 正式发布

Seedance 2.0 视频生成模型正式发布,综合性能达业界 SOTA 水平。新版本支持多模态输入,可同时参考 9 张图片、3 段视频、3 段音频及文本指令,精准迁移构图、动作、运镜与音效。模型支持 15 秒高质量多镜头生成,集成双声道立体声技术,并新增视频延长与编辑功能,可定向修改片段、角色及剧情。目前已在即梦 AI、豆包及火山方舟平台上线,适用于影视、广告、电商等工业级内容创作场景。

多模态模型发布视频
关联讨论 1 条字节 Seed:Research Papers(网页内嵌数据)
推荐理由:字节Seedance 2.0发布,支持多模态输入与物理稳定生成,已上线豆包即梦
00:00
智谱:研究(网页内嵌数据)
精选
GLM-5开源:从代码到工程,Agentic Engineering时代最好的开源模型

GLM-5 开源,参数规模达 744B(激活 40B),预训练数据 28.5T,集成 DeepSeek Sparse Attention 降低部署成本。Coding 能力对齐 Claude Opus 4.5,Agent 能力支持 SOTA 级长程任务执行,兼容国产芯片。同步推出 OpenClaw、AutoGLM、Z Code 及 Excel 插件等工具链,覆盖端到端开发、办公自动化等场景。

智能体模型发布编码

推荐理由:智谱开源744B参数GLM-5,主打Agentic Engineering与编码能力,支持国产芯片推理
2月11日
20:18
蚂蚁 inclusionAI:GitHub 新仓库
51
inclusionAI/Ming-omni-tts

inclusionAI 发布了 Ming-omni-tts,这是一个能够统一生成语音、音乐和声音的模型。该模型的核心特点是结构简单高效,并实现了对生成内容的精确控制。它通过一个统一的框架处理多种音频模态,简化了传统上需要不同模型分别处理语音、音乐和音效的流程。这一进展为跨模态音频内容的创作与编辑提供了更便捷、可控的工具。

开源生态模型发布语音
19:00
公众号:蚂蚁百灵(Ling)
33
百灵全模态 Ming-flash-omni-2.0 发布:感知无界,创造有形

蚂蚁百灵推出全模态模型 Ming-flash-omni-2.0,融合感知与创造能力,旨在通过多模态交互焕新生活体验。具体技术参数和性能数据暂未披露。

多模态模型发布
18:52
蚂蚁 inclusionAI:GitHub 新仓库
精选65
inclusionAI发布新一代即时大模型Ling-2.5-1T

inclusionAI推出新一代旗舰即时模型Ling-2.5-1T,其总参数量达1T,活跃参数为63B,预训练语料扩展至29T tokens。该模型采用混合线性注意力架构,支持1M tokens上下文长度,并通过结合“正确性”与“过程冗余”的复合奖励机制,在相近的token效率下,其推理能力显著超越前代,接近前沿思维模型水平。经双向RL反馈和智能体验证等对齐策略优化,模型在创意写作和指令遵循任务上表现提升。它已兼容主流智能体平台,并在通用工具调用基准BFCL-V4上取得领先的开源性能。

开源/仓库推理模型发布部署/工程

推荐理由:蚂蚁把 1T 参数的即时模型开源了,63B 活跃参数加 1M 上下文,主打效率而非堆算力,对国内做开源推理模型的团队来说是个值得对标的基线。
18:52
蚂蚁 inclusionAI:GitHub 新仓库
精选78
inclusionAI发布全球首个开源万亿参数思维模型Ring-2.5-1T

inclusionAI发布了全球首个基于混合线性注意力架构的开源万亿参数思维模型Ring-2.5-1T。该模型通过高效的1:7 MLA与闪电线性注意力提升了推理速度与探索能力,并借助扩展的强化学习训练增强了深度思考和长程任务执行能力。其在IMO 2025和CMO 2025数学竞赛中均达到了金牌级别的性能。模型支持128K上下文长度,并可通过YaRN技术扩展至256K,现已于Hugging Face和ModelScope平台开源。部署方面,已支持SGLang,并提供了多GPU节点的服务器启动示例。

开源/仓库推理模型发布部署/工程

推荐理由:蚂蚁把万亿参数的开源 thinking model 放出来了,混合线性注意力架构是真新路线而非换皮,IMO/CMO 金牌级数学推理说明这不是纯堆参数。做开源大模型部署的团队值得认真看看它的架构选择。
11:12
蚂蚁 inclusionAI:HuggingFace 新模型
32
inclusionAI/Ming-omni-tts-tokenizer-12Hz

inclusionAI团队发布了Ming-omni-tts-tokenizer-12Hz开源项目,这是一个面向文本转语音(TTS)的通用分词器。该模型支持12Hz的高采样率,旨在提升语音合成的自然度与表现力。项目基于开源与开放科学的理念推进,致力于让人工智能技术更加普及和易得。

开源生态模型发布语音
11:10
蚂蚁 inclusionAI:HuggingFace 新模型
39
inclusionAI/Ming-omni-tts-0.5B

inclusionAI 发布了 Ming-omni-tts-0.5B,这是一个参数规模为 0.5B(5亿)的文本转语音模型。该模型旨在通过开源和开放科学的方式,推动人工智能技术的进步与普及。发布标志着在语音合成领域,一个中等规模、可公开访问的模型正式加入开源生态。

开源生态模型发布语音
10:49
蚂蚁 inclusionAI:HuggingFace 新模型
37
inclusionAI/Ming-omni-tts-16.8B-A3B

inclusionAI发布了开源文本转语音模型Ming-omni-tts-16.8B-A3B,参数量达168亿。该模型采用创新的A3B混合专家架构,在语音自然度、多语言支持和情感表现方面实现显著提升。项目遵循开源开放科学理念,旨在推动人工智能技术的民主化进程。

开源生态模型发布语音
08:00
蚂蚁百灵:Developer Blog(网页)
精选83
感知无界·创造有形:百灵全模态 Ming-flash-omni-2.0 焕新生活想象

百灵全模态大模型Ming-flash-omni-2.0正式发布。该模型基于MoE架构,在视觉、语音、图像等全模态能力上实现代际跃迁,其核心突破在于一个统一模型同时具备了强大的通用泛化能力和特定模态的专家级表现。具体特色包括:视觉百科能精准识别万物并关联知识;语音生成可控制情绪、方言,提供百种音色,并能统一生成语音、音效与背景音乐;图像创作可实现氛围重构、场景合成与智能擦除。技术层面通过亿级数据细粒度感知、知识对齐及超低帧率音频表征等创新实现性能飞跃。模型已在多个平台开源。

图像生成多模态模型发布
关联讨论 1 条蚂蚁百灵:Developer Blog(网页)
推荐理由:国产全模态模型开源,多模态能力达领先水准,开发者可直接体验或集成。
2月10日
20:45
蚂蚁 inclusionAI:HuggingFace 新模型
42
inclusionAI/Ring-2.5-1T

inclusionAI 发布了 Ring-2.5-1T,这是一个拥有 1 万亿参数规模的大型语言模型。该模型旨在通过开源和开放科学的方式,推动人工智能技术的进步与普及。此次发布标志着在构建超大规模、可访问的 AI 模型方面取得了重要进展,为更广泛的研究社区提供了强大的基础工具。

开源生态推理模型发布
14:57
蚂蚁 inclusionAI:HuggingFace 新模型
41
inclusionAI/Ming-flash-omni-2.0

inclusionAI 发布了 Ming-flash-omni 2.0 版本。该项目致力于通过开源与开放科学的方式,推动人工智能技术的进步与民主化。新版本意味着模型能力、效率或应用范围的进一步升级,延续了其降低AI技术门槛、促进广泛可及性与协作创新的核心目标。

多模态开源生态模型发布
13:08
Qwen:Blog Retrieval(API)
Qwen-Image-2.0:专业信息图表与精美照片级真实感

Qwen-Image-2.0 发布,主打专业信息图表与照片级真实感图像生成。Qwen Studio 平台同步集成聊天、多模态理解、文档处理、网页搜索及工具调用等综合能力。

图像生成多模态模型发布
11:39
公众号:腾讯混元
59
首个产业级2Bit量化新突破,腾讯混元开源0.3B端侧模型

腾讯混元开源0.3B端侧模型,实现首个产业级2Bit量化突破。在真实端侧设备上,相比原始精度模型,生成速度提升2—3倍。

开源/仓库模型发布端侧
2月9日
18:47
蚂蚁 inclusionAI:HuggingFace 新模型
39
inclusionAI/LLaDA2.1-flash

inclusionAI 团队发布了 LLaDA2.1-flash 模型,致力于通过开源与开放科学推动人工智能的进步与民主化。该版本在推理速度与内存效率上显著提升,响应延迟降低约40%,同时保持与前一版本相当的准确率。模型参数规模为70亿,支持多模态输入,并优化了边缘设备部署能力。这一进展旨在降低AI技术应用门槛,促进更广泛的研究与产业落地。

开源/仓库模型发布端侧
15:55
蚂蚁 inclusionAI:HuggingFace 新模型
36
inclusionAI/UI-Venus-1.5-30B-A3B 发布

inclusionAI 团队发布了 UI-Venus-1.5-30B-A3B 模型。该模型参数量达到 300亿(30B),是 Venus 系列的最新版本。此次发布延续了通过开源和开放科学来推进人工智能民主化的核心目标,旨在让先进AI技术更广泛可及。新版本预计在模型性能或效率上有所提升,具体技术细节和基准测试结果有待进一步公布。

开源/仓库模型发布端侧
2月6日
18:00
公众号:生数科技(Vidu·视频)
48
生数科技携手清华大学开源统一世界模型Motus,性能全面超越Pi0.5 40%

生数科技与清华大学联合开源统一世界模型Motus,该模型在性能上全面超越Pi0.5,提升幅度达40%。

具身智能开源生态模型发布
15:32
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 LongCat-Flash-Lite-FP8 模型

美团 LongCat 团队发布 LongCat-Flash-Lite-FP8 模型。该版本采用 FP8(8位浮点)精度格式,属于 Flash-Lite 轻量化系列,旨在提升推理效率并降低显存占用。目前公开信息仅包含平台默认标语,具体参数规模、基准测试成绩及技术细节有待进一步披露。

Hugging Face模型发布端侧部署/工程
2月4日
01:40
Hugging Face:Blog(RSS)
精选73
H公司新模型Holo2在UI本地化领域取得领先

H公司在Hugging Face发布博客,正式推出新一代模型Holo2。该模型在用户界面本地化任务上表现突出,实现了技术领先。其核心改进在于显著提升了多语言UI元素的识别与适配能力,能够更精准地处理图标、布局、文本标签等组件的文化适配与翻译。这一进展有望帮助全球应用和软件更高效地实现界面本地化,降低跨区域运营成本。

Hugging Face多模态模型发布

推荐理由:UI本地化领域新标杆,开发者可关注其多模态能力。
00:00
Mistral AI:News(网页)
82
Mistral AI 发布 Voxtral Transcribe 2 系列语音转文本模型及音频游乐场

Mistral AI 发布 Voxtral Transcribe 2 系列两款新一代语音转文本模型。Voxtral Mini Transcribe V2 支持13种语言的批量转录,具备说话人日志、上下文偏置和词级时间戳功能,在 FLEURS 基准测试中词错率约4%,性价比领先。Voxtral Realtime 专为实时应用设计,采用流式架构,延迟可配置至200毫秒以下,支持13种语言,并以 Apache 2.0 协议开源。同时,Mistral Studio 上线了由该系列模型驱动的音频游乐场,供用户即时测试转录功能。

模型发布端侧语音
2月3日
17:46
美团 LongCat:HuggingFace 新模型
美团-longcat/LongCat-Image-Edit-Turbo

美团-longcat发布LongCat-Image-Edit-Turbo图像编辑模型,秉持开源与开放科学理念推进人工智能技术的普及。该项目专注于图像编辑领域,旨在提供高效的图像处理能力。目前公开信息主要阐述项目愿景与使命,具体技术参数、性能指标及版本更新细节有待进一步披露。

Hugging Face图像生成模型发布
04:00
Qwen:Blog Retrieval(API)
Qwen3-Coder-Next:推进小型混合模型在智能体编程中的应用

Qwen Studio 提供全栈功能,涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具调用及 Artifacts 等模块。

智能体模型发布编码
00:00
智谱:研究(网页内嵌数据)
GLM-OCR发布:性能SOTA,搞定复杂文档

GLM-OCR 开源发布,0.9B 参数规模在 OmniDocBench V1.5 以 94.6 分取得 SOTA,擅长手写体、复杂表格、印章等场景结构化识别。兼容 vLLM、SGLang 和 Ollama 部署,推理延迟低,适合高并发与边缘计算,提供完整 SDK 支持一行命令调用。

多模态开源生态模型发布端侧
1月28日
15:51
公众号:腾讯混元
57
10亿红包后,我们打算开源这个800亿的模型
图像生成开源生态模型发布
06:47
Nathan Lambert:Interconnects(RSS)
精选
Arcee AI 全力投入在美国构建的开放模型

Arcee AI 发布开源大模型 Trinity Large,标志着其全面投入在美国本土构建开放模型的战略布局。该发布作为 Interconnects 第16期访谈的核心内容,彰显该公司对开源生态与数据主权的承诺。Trinity Large 的推出代表 Arcee AI 在本土 AI 基础设施建设上的关键进展,强调模型训练与开发的地理合规性及技术自主性。

开源生态模型发布

推荐理由:开源模型Trinity Large发布,美国本土训练的企业级合规新选择
1月27日
19:11
公众号:月之暗面(Kimi)
精选61
Kimi 发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力
智能体多模态开源/仓库模型发布

推荐理由:Kimi K2.5把视觉理解和Agent集群能力打包开源,国内模型里比较早做这个组合的,虽然参数规模争议不小,但对想搭多模态Agent的团队是个可用的起点。
16:03
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 LongCat-Flash-Lite

美团 LongCat 团队发布开源模型 LongCat-Flash-Lite,致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 应用门槛,为开发者社区提供轻量级技术基础设施,助力先进人工智能能力的广泛获取与开放协作。

Hugging Face开源生态模型发布端侧
00:00
MiniMax:Blog(网页)
50
MiniMax-M2-her 技术解析:专为角色扮演打造的 AI 智能体

MiniMax 基于产品 Talkie/Xingye 三年的观察,推出了专为角色扮演场景优化的模型 MiniMax-M2-her。团队发现,深度角色扮演的核心是“叙事精度”和“情感连接”。该模型旨在解决三大挑战:保留每个角色与世界观的“灵魂”、维持故事随时间推进的叙事活力、以及解读用户的隐式意图。其目标是提供高保真的世界体验,能主动推动故事发展以赋予张力,并动态适应用户的长期习惯,实现直觉性的偏好对齐。

智能体模型发布评测/基准
1月23日
10:50
美团 LongCat:HuggingFace 新模型
美团 LongCat 发布 Flash-Thinking-ZigZag 模型

美团 LongCat 团队发布 Flash-Thinking-ZigZag 模型,延续通过开源与开放科学推进人工智能民主化的技术路线。该项目致力于降低 AI 应用门槛,以开源方式使先进技术更广泛地惠及开发者社区,推动 AI 技术的普及与可持续发展。

Hugging Face开源生态推理模型发布
00:00
MiniMax:Blog(网页)
精选
MiniMax Speech 2.8 语音模型

MiniMax 发布新一代语音模型 MiniMax Speech 2.8,通过原生声音标签技术模拟人类口语中的"嗯"、"啊"等填充词及呼吸停顿,显著提升对话自然度。该模型支持10秒样本高保真声音克隆,精准还原音色与语速,同时消除背景噪音与数字伪影,输出录音室级纯净音质。此外,模型优化了跨语言表现,从普通话-日语对开始解决口音渗透问题,实现更接近母语者的发音效果。

模型发布语音

推荐理由:10秒样本克隆真人声线,AI说话带'嗯啊'呼吸声,MiniMax语音模型上新
1月20日
11:20
Hugging Face:Blog(RSS)
精选83
差分Transformer V2

差分Transformer V2发布,其核心是改进的差分注意力机制。相较于V1,V2将查询头数量翻倍而保持键值头不变,差分操作后将维度缩减,从而在解码时能达到与标准Transformer相当的速度,且无需定制内核。新版本还解决了V1中因注意力分布均匀化导致的数值不稳定问题,特别是消除了RMSNorm层所需的巨大缩放因子(如在长序列下),从而避免了梯度爆炸,旨在实现更稳定的大规模预训练。

Microsoft推理模型发布

推荐理由:新注意力架构提升解码效率与训练稳定性,开发者可低成本集成优化模型。
08:00
Hugging Face:Blog(RSS)
精选73
Overworld发布实时交互式视频扩散模型Waypoint-1

Overworld推出实时交互式视频扩散模型Waypoint-1,用户可通过文本、鼠标和键盘实时控制生成可步入的虚拟世界。该模型基于帧因果校正流变换器架构,在1万小时游戏视频及对应控制数据上训练,从一开始就专注于交互体验,支持零延迟的自由操控。其配套的高性能推理库WorldEngine在消费级硬件上可实现流畅运行,例如Waypoint-1-Small在RTX 5090上能以30 FPS(4步去噪)或60 FPS(2步去噪)生成画面。模型采用扩散强制预训练和自我强制后训练来确保生成长序列的稳定性。

智能体Hugging Face模型发布视频

推荐理由:零延迟交互式视频生成,游戏和创意应用开发者的福音。
00:00
智谱:研究(网页内嵌数据)
精选
GLM-4.7-Flash开源、免费

GLM-4.7-Flash 开源并免费开放 API,支持通过 Hugging Face 和魔搭社区部署。上一代 GLM-4.5-Flash 将于 2026 年 1 月 30 日下线,届时相关请求将自动路由至新版。

开源生态模型发布端侧

推荐理由:智谱开源轻量模型GLM-4.7-Flash,免费API助力个人开发者快速上手
1月14日
18:44
美团 LongCat:HuggingFace 新模型
精选
美团LongCat发布重思考模式总结模型

美团LongCat推出基于5600亿参数MoE架构大模型LongCat-Flash-Thinking-2601的重思考模式(Heavy Thinking Mode),并发布LongCat-HeavyModel-Summary模型。该模式通过并行思考与总结两阶段协同扩展推理能力:前者以高温度并行生成多路径扩展宽度,后者将精炼轨迹递归反馈形成迭代循环延伸深度。模型经额外强化学习优化总结能力,已在Longcat AI平台上线。

Hugging Face推理模型发布
关联讨论 1 条美团 LongCat:HuggingFace 新模型
推荐理由:美团开源 560B 参数 MoE 推理模型,Heavy Thinking 模式支持并行多路径探索,已上线可体验
00:00
智谱:研究(网页内嵌数据)
精选
智谱联合华为开源首个国产芯片训练的多模态SOTA模型

智谱联合华为开源多模态生成模型GLM-Image,为首款基于国产昇腾芯片与MindSpore框架全流程训练的SOTA模型。采用9B自回归与7B扩散解码器混合架构,在CVTG-2K复杂视觉文字生成和LongText-Bench长文本渲染榜单均位列开源第一,支持1024×1024至2048×2048多分辨率生成。API调用成本0.1元/张,代码已开源至GitHub、Hugging Face及魔搭社区。

图像生成开源生态模型发布部署/工程

推荐理由:首个国产昇腾芯片训练的SOTA多模态模型开源,文字渲染能力开源第一,生成一张图仅需0.1元
1月10日
07:20
Midjourney:Updates(RSS)
精选
Niji V7 正式发布!

Niji V7 图像模型正式上线。该版本专为亚洲及动漫场景优化,改进了动漫连贯性、提示词理解能力、文字渲染效果及 sref 性能。

图像生成模型发布

推荐理由:Midjourney 动漫专用模型 Niji V7 发布,生成质量再升级
‹ 上一页
1…3738394041…43
下一页 ›