AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「模型发布」清除
4月29日周三
15:33IT之家(RSS)53科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文
14:49Alibaba Cloud64精选HappyHorse 1.0 在 fal 平台上线
14:40Ant Ling58高效服务大语言模型需工程智慧与品味
11:25公众号:阶跃星辰(Step)53阶跃 Step Image Edit 2 上线!小身材、大能力、快响应
11:19蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/Ling-2.6-1T
10:37Chubby♨️40欧洲AI公司Mistral即将发布新模型
09:38ginobefun49NVIDIA发布多模态模型Nemotron 3 Nano Omni
09:33IT之家(RSS)60蚂蚁集团百灵大模型开源 Ling-2.6-flash,提供 BF16、FP8、INT4 等版本
09:00公众号:蚂蚁百灵(Ling)57Ling-2.6-flash 正式开源
08:38Berryxia.AI65🚀 OpenBMB 重磅发布!MiniCPM-o 4.5 技术报告来了!
08:33IT之家(RSS)65英伟达推出 Nemotron 3 Nano Omni 模型:采用 30B-A3B 混合 MoE 架构,吞吐量最高提升 9.2 倍
07:38Berryxia.AI67Poolside AI开源Laguna XS.2模型,专为智能编码设计
07:38Berryxia.AI60NVIDIA发布高效开源多模态模型Nemotron 3 Nano Omni
02:09Epoch AI59GPT-5.5 Pro创ECI指数新高分159
02:07Chubby♨️54NVIDIA发布Nemotron 3 Nano Omni,专为智能体感知层设计
01:38Ant Ling57感谢Hugging Face开源平台,Ling-2.6-flash以超高token效率登场
01:35阿绎 AYi66蚂蚁发布Ling-2.6-1T模型,以token效率革新生产级AI
01:08AK44SenseNova U1模型于Hugging Face发布
01:03Ant Ling59AntLingAGI正式开源Ling-2.6-flash模型,此前曾以Elephant Alpha名提供API
00:53Ant Ling59vLLM团队为Ling-2.6-flash模型提供首发支持,彰显开源协同高效
00:37Hugging Face:Blog(RSS)70精选介绍 NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频智能体的长上下文多模态模型
4月28日周二
23:51Ant Ling62精选AntLingAGI与SGLang团队合作推出Ling-2.6-flash即时指令模型
23:19Ant Ling59灵码2.6-flash模型正式开源,专为高效智能体工作流打造
23:15OpenRouter64精选Poolside发布首款公共基础模型
20:36Chubby♨️59微软开源4B参数图像转3D模型
20:25SenseTime59SenseNova U1 Lite系列开源,统一多模态理解与生成
18:36Berryxia.AI56商汤开源多模态大模型SenseNova-U1,推动本地化部署
17:51蚂蚁 inclusionAI:HuggingFace 新模型49inclusionAI发布Ling-2.6-flash-int4模型
13:33Alibaba Cloud53面向所有人的智能体AI!期待社区在NetMind上用Qwen3.6构建的成果。
11:50蚂蚁 inclusionAI:HuggingFace 新模型51inclusionAI/Ling-2.6-flash-fp8
11:27蚂蚁 inclusionAI:HuggingFace 新模型55精选inclusionAI/Ling-2.6-flash
10:47Simon Willison 博客65介绍 talkie:一个源自1930年的130亿参数复古语言模型
10:47Hacker News 热门(buzzing.cc 中文翻译)51Talkie:一款诞生于1930年的13B复古语言模型
10:45歸藏(guizang.ai)60小米MiMo开源激励计划,作者欲为Codepilot用户争Token补贴
10:42歸藏(guizang.ai)74精选小米 MiMo-V2.5 系列模型全部开源
09:45meng shao75精选小米开源MiMo-V2.5系列大模型
07:23Berryxia.AI69小米开源MiMo-V2.5系列模型,支持百万token上下文
04:26AK51小米MiMo-V2.5模型上线Hugging Face
03:45Fuli Luo76精选小米开源MiMo-V2.5双模型,并提供百亿免费代币
01:48Xiaomi MiMo71精选小米开源MiMo-V2.5双模型,支持百万上下文与商用
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月29日
15:33
IT之家(RSS)
53
科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文

科大讯飞正式发布星火 X2-Flash 模型并开放API。该模型采用MoE架构,总参数300亿,支持256K上下文,基于华为昇腾910B集群训练。其在智能体、代码等能力上大幅提升,在深度研究报告、Skill管理等多项任务上效果接近业界万亿参数模型,而整体token消耗不到主流大尺寸模型的三分之一。通过结合DSA与MTP技术,模型在国产芯片上的训练效率从同规模A800集群的20%提升至90%,并解决了长交互场景采样效率低的问题,为大规模强化学习训练扫清障碍。AstronClaw、Loomy等已率先接入。

MCP/工具推理模型发布
14:49
Alibaba Cloud@alibaba_cloud
精选64
HappyHorse 1.0 现已在 @fal 上线。去构建吧。 【引用 @fal】:Happy Horse 1.0 is live on fal, day 0 🐎 🎬 一流的运动质量 🎧 原生1080p,音频同步一步完成 🔗 音视频联合生成,非拼接 🔓 限制更少,商业用途更广 ⚡ 为生产规模而构建

fal: Happy Horse 1.0 is live on fal, day 0 🐎 🎬 Best-in-class motion quality 🎧 Native 1080p with synced audio in one pass �...

多模态模型发布视频

推荐理由:阿里云不声不响丢了个跟 Sora 对标的视频生成模型,音画同步一镜出片,直播带货团队可以立刻试试。
14:40
Ant Ling@AntLingAGI
58
服务好LLM是一项具有挑战性的任务,它需要工程智慧和良好的品味。感谢@Modular团队高水平的工程师们让这次合作成为现实。生态系统必胜!🤠👏

Modular: Ling-2.6-flash from @AntLingAGI is now open source, with day zero support on Modular Cloud! Fast MoE for agent workflows...

智能体开源生态模型发布
11:25
公众号:阶跃星辰(Step)
53
阶跃 Step Image Edit 2 上线!小身材、大能力、快响应
图像生成模型发布
11:19
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-1T

inclusionAI 发布了 Ling-2.6-1T 模型,这是一个包含 1 万亿参数的大型语言模型。该模型基于开源与开放科学理念构建,旨在推动人工智能技术的进步与民主化。新模型在多项基准测试中展现出更强的语言理解与生成能力,同时提供了更高效的推理性能。这一发布标志着开源社区在规模化 AI 模型开发上的重要进展,为研究者和开发者提供了可访问的高性能工具。

Hugging Face开源生态模型发布
10:37
Chubby♨️@kimmonismus
40
Mistral Medium 即将到来。唯一相关的欧洲AI公司将发布另一个模型。
开源生态模型发布
09:38
ginobefun@hongming731
49
NVIDIA发布多模态模型Nemotron 3 Nano Omni

NVIDIA发布了多模态模型Nemotron 3 Nano Omni,专为处理长上下文设计,能够同时理解文本、图像、音频和视频。该模型在文档分析、自动语音识别、音视频理解以及智能体计算机使用等实际应用场景中表现优异。在多项基准测试中,Nemotron 3 Nano Omni均展现出领先的准确性和效率。

多模态模型发布端侧
09:33
IT之家(RSS)
60
蚂蚁集团百灵大模型开源 Ling-2.6-flash,提供 BF16、FP8、INT4 等版本

蚂蚁集团百灵大模型宣布开源Ling-2.6-flash,提供BF16、FP8、INT4等多个版本供开发者灵活选用。该模型总参数量104B,激活参数7.4B,是一款Instruct模型。官方基于开发者反馈优化了中英文切换及主流编程框架适配效果。其核心优势包括:采用混合线性架构,在4卡H20上推理速度最快达340 tokens/s;通过Token效率优化,在评测中消耗的tokens仅为同类模型的约1/10;针对Agent场景增强了工具调用与任务执行能力,在多项评测中达到先进水平。模型已在Hugging Face和ModelScope平台开源。

智能体开源生态模型发布
09:00
公众号:蚂蚁百灵(Ling)
57
Ling-2.6-flash 正式开源

Ling-2.6-flash 今日正式开源,同步提供 BF16、FP8、INT4 等多个版本。该模型两周前以匿名身份登陆 OpenRouter,一周前正式发布并开放为期一周的免费 API 调用服务。过去两周内,团队基于开发者反馈进行多轮优化,改善了中英文自然切换能力,并提升了主流 Coding 框架的适配效果。开发者可通过 Hugging Face 和 ModelScope 获取模型。

开源/仓库开源生态模型发布
08:38
Berryxia.AI@berryxia
65
OpenBMB发布的MiniCPM-o 4.5是一个仅90亿参数的多模态模型,实现了从传统轮询交互到实时、原生全双工流式交互的范式突破。其Omni-Flow框架能在统一时间线上毫秒级同步处理视频、音频和文本流,无需外部语音检测即可同时感知与响应。该模型在多模态基准测试中表现接近Gemini 2.5 Flash,并专为边缘AI设计,支持完全离线运行,提供Windows/macOS一键安装(仅需12G显存),保障100%数据隐私,同时开源权重并提供免费社区API。

OpenBMB: 🚀 🚀Excited to announce the technical report of MiniCPM-o 4.5! MiniCPM-o 4.5 transitions #AI interaction from tradition...

GitHub多模态开源生态模型发布
08:33
IT之家(RSS)
65
英伟达推出 Nemotron 3 Nano Omni 模型:采用 30B-A3B 混合 MoE 架构,吞吐量最高提升 9.2 倍

英伟达发布开源全模态推理模型Nemotron 3 Nano Omni,采用30B‑A3B混合MoE架构,集视频、音频、图像和文本处理于一体。该模型旨在替代多模型链,降低推理成本与编排复杂度。在多项基准测试中表现领先,尤其在视频推理任务中,其系统吞吐量相比其他开放式全模态模型最高提升约9.2倍,文档推理任务最高提升约7.4倍。模型权重、训练配方及数据集已完全开放,支持开发者在各类环境中定制部署。

智能体多模态推理模型发布
07:38
Berryxia.AI@berryxia
67
由前GitHub CTO Jason Warner创立的Poolside AI团队开源了其首个权重模型Laguna XS.2。该模型采用33B总参数、3B激活参数的MoE架构,专为Agentic Coding和长时序任务设计,可在单张GPU上运行,并采用Apache 2.0开源协议。团队同时发布了当前最强版模型Laguna M.1以及Agent Harness,标志着其在智能编码代理赛道成为新的竞争者。

poolside: Today we're releasing Laguna XS.2, Poolside's first open-weight model. It's a 33B total / 3B active MoE model built for ...

智能体开源生态模型发布编码
07:38
Berryxia.AI@berryxia
60
NVIDIA发布高效开源多模态模型Nemotron 3 Nano Omni

NVIDIA 重磅发布!🚀 Nemotron 3 Nano Omni 多模态开源模型来了! 🔥 30B 参数 🔥 256K 超长上下文 🔥 最高效开放多模态模型(语言+视觉+语音+视频+音频一体化) 🔥 专为 subagents / Agentic 任务设计 🔥 完全开源(权重 + 数据 + 配方),领跑多项榜单 可通过 NVIDIA NIM API 免费试用!完美驱动多代理工作流。

NVIDIA AI: Meet Nemotron 3 Nano Omni 👋 Our latest addition to the Nemotron family is the highest efficiency, open multimodal model...

智能体多模态开源生态模型发布
02:09
Epoch AI@EpochAIResearch
59
GPT-5.5 Pro 在 Epoch Capabilities Index 上创下 159 分的新高分!ECI 是我们的统计工具,它将多个基准测试整合到一个统一的量表中。
OpenAI模型发布评测/基准
02:07
Chubby♨️@kimmonismus
54
NVIDIA发布Nemotron 3 Nano Omni,专为智能体感知层设计

NVIDIA推出Nemotron 3 Nano Omni模型,其定位并非通用聊天机器人,而是作为智能体系统中的轻量级感知模块。该模型采用30B-3B混合专家架构,在处理视觉、音频和文本多模态输入时,吞吐量可比同类开源全模态模型提升高达9倍。它旨在充当多智能体栈中的“眼睛和耳朵”,负责感知屏幕、文档和音频等信息,并将结构化上下文传递给如Nemotron Super(执行)和Ultra(规划)等推理层,从而优化大规模、高频率调用的智能体工作流。模型完全开源,现已登陆Hugging Face。

智能体开源生态模型发布
01:38
Ant Ling@AntLingAGI
57
推文感谢Hugging Face为开源模型的持续发展提供了重要平台。文中强调,token效率是构建实用、可持续协作系统的关键。AntLingAGI最新发布的Ling-2.6-flash模型已加入这场效率竞争,该模型采用MIT许可,具备104B/7.4B激活参数,并创新性地结合了1:7 MLA与Lightning Linear混合注意力机制。其性能表现突出:推理速度高达340 tok/s,并且仅需约1500万tokens即可完成完整的Artificial Analysis评测套件。这一效率显著高于通常需要5000万至1亿tokens的前沿模型,展现出其作为高效协作伙伴的潜力。

Adina Yakup: Token efficiency has become a major battleground, Ling-2.6-flash released by @AntLingAGI just enters the race 🔥 ✨ 104B/...

开源生态推理模型发布
01:35
阿绎 AYi@AYi_AInotes
66
蚂蚁发布Ling-2.6-1T模型,以token效率革新生产级AI

蚂蚁集团AGI团队发布Ling-2.6-1T模型,其核心创新在于聚焦token效率而非参数规模。该模型采用MoE架构,每次推理仅激活7.4B参数,结合Linear Attention与Multi-Token Prediction技术,在保持接近GPT-5.4非推理水平的高智能同时,将token成本降至可比模型的四分之一。在Artificial Analysis评测中以极低消耗获得高分,并在SWE-bench等硬核Agent场景领先。该模型专为处理海量真实生产请求设计,旨在为高频Agent应用提供高效、低成本的解决方案,并通过免费API策略加速生态布局,预示AI竞赛重心正向真实生产成本效率转移。

阿绎 AYi: 后续来了兄弟们,卧槽真的太炸了,同样的任务,同样的配置,速度比Claude Sonnet 4.6还快 6 倍,成本低约 50 倍, openrouter 和 官方 API 均限时免费 1 周使用时间,白嫖的机会,冲啊兄弟们! 我上周那条讲E...

智能体模型发布部署/工程
01:08
AK@_akhaliq
44
SenseNova U1 已在 Hugging Face 发布 https://huggingface.co/collections/sensenova/sensenova-u1
Hugging Face开源生态模型发布
01:03
Ant Ling@AntLingAGI
59
AntLingAGI宣布将其模型Ling-2.6-flash正式开源,该模型此前在OpenRouter平台上曾以"Elephant Alpha"为名提供API服务。目前,模型已在Hugging Face和ModelScope平台全面开放,供公众自由使用与构建。模型关键参数为总参数量1040亿,激活参数量74亿,在Artificial Analysis基准测试中输出速度约为每秒215个token,并支持BF16、FP8和INT4多种精度格式。此次开源得到了合作伙伴Novita Labs,以及lmsysorg的SGLang团队和vllm项目的技术支持。

Novita AI: Ling-2.6-flash is now officially open-sourced 🚀 (from @AntLingAGI) Was "Elephant Alpha" on OpenRouter. Now fully open f...

开源/仓库模型发布端侧
00:53
Ant Ling@AntLingAGI
59
vLLM项目团队宣布对Ling-2.6-flash模型提供Day-0首发支持,体现了开源生态系统构建者之间的高效协同。Ling-2.6-flash是一个专为需要快速响应和强大执行力的现实世界智能体设计的即时指令MoE模型。其核心特点包括:1040亿总参数与74亿激活参数的高度稀疏混合专家架构,结合了1:7 MLA与Lightning Linear注意力机制,支持262K上下文长度,并具备原生工具调用能力,可无缝接入Claude Code、Kilo Code、Qwen Code、Hermes、OpenClaw等主流框架。

vLLM: 🎉 Day-0 vLLM support for Ling-2.6-flash from @AntLingAGI! Ling-2.6-flash is an instant (instruct) MoE model built for r...

智能体开源生态模型发布
00:37
Hugging Face:Blog(RSS)
精选70
介绍 NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频智能体的长上下文多模态模型

NVIDIA 发布了 Nemotron 3 Nano Omni 模型,这是一个专为处理长上下文多模态任务设计的轻量级模型。该模型能够同时理解并处理文档、音频和视频数据,旨在赋能新一代多模态智能体。其核心变化在于将长上下文能力与多模态理解结合到一个小型化模型中,提升了在复杂跨模态场景下的处理效率与应用灵活性。

多模态模型发布端侧

推荐理由:NVIDIA 把多模态长上下文塞进 Nano 级别模型,文档、音频、视频 Agent 通吃,做端侧多模态应用的团队值得认真看看这个架构思路。
4月28日
23:51
Ant Ling@AntLingAGI
精选62
AntLingAGI与SGLang团队合作,正式推出Ling-2.6-flash(亦称Elephant-alpha)即时指令模型,并在SGLang平台上实现了首发支持。该模型总参数量达104B,但活跃参数仅7.4B,专为低延迟的智能体工作流优化,能够实现即时响应。它在编码、文档处理和智能体任务中展现出极高的token效率,所用token数量显著减少。尽管活跃参数较少,其模型质量仍与当前SOTA水平相当,兼具速度与执行力,适合需要快速响应的生产级智能体应用。团队强调,快速且稳定的推理是提升用户体验的关键。

LMSYS Org: 🎉 Meet Ling-2.6-flash from @AntLingAGI, an instant instruct model with 104B total params (7.4B active). Day-0 support i...

智能体模型发布部署/工程

推荐理由:104B 总参但只激活 7.4B,蚂蚁这步棋是冲着 Agent 场景的低延迟去的,做 Agent 产品的人值得跑一下看看实际体感。
23:19
Ant Ling@AntLingAGI
59
灵码2.6-flash模型正式开源,专为高效智能体工作流打造

灵码2.6-flash模型现已开源,这是一个专为现实世界智能体工作流构建的快速、高效的指令模型。该模型总参数量达1040亿,激活参数量为74亿,并提供BF16、FP8和INT4多种量化版本以适应不同部署需求。其核心优势包括:生成速度高达每秒215个token,在完整评估中仅消耗1500万token,效率突出;在代码、文档处理和轻量级智能体工作流等实际任务中表现强劲;同时,其中英文切换能力及与主流编程框架的兼容性也得到了进一步改善。

智能体开源/仓库模型发布编码
23:15
OpenRouter@OpenRouter
精选64
@poolsideai 的首批公开基础模型刚刚在 OpenRouter 上发布! Laguna M.1 和 Laguna XS.2。专为智能体编码和长周期工作从头构建。限时免费 ⬇️
智能体模型发布编码

推荐理由:Poolside 终于把自家模型放出来了,主打长上下文 agentic coding,免费期是薅羊毛窗口。做 coding agent 的团队值得拿 Laguna 跑一轮自己的 benchmark,看看和 Claude、Codex 的真实差距。
20:36
Chubby♨️@kimmonismus
59
Microsoft 推出 "TRELLIS.2":一个开源的、40亿参数的图像转3D模型,可生成高达15363的PBR纹理资产。 基于原生3D VAES,具有16倍空间压缩能力,提供高效、可扩展、高保真的资产生成。 说实话,相当酷!
Microsoft多模态开源生态模型发布
20:25
SenseTime@SenseTime_AI
59
SenseNova U1 Lite系列开源,统一多模态理解与生成

SenseNova宣布开源其U1 Lite系列模型。该系列基于NEO-unify架构,原生统一了多模态理解与生成能力。其核心优势包括:在开源模型中具备领先的效率,紧凑的8B和A3B模型在保持商业级性能的同时实现了优异的成本效益;支持原生的图像-文本交织生成,单一模型即可在单次流程中生成连贯交织的图文内容,适用于制作指南等实用场景;并拥有高密度信息渲染能力,擅长为知识图解、海报、PPT、漫画等信息密集型格式生成结构丰富的版式。模型已在Hugging Face、GitHub等平台发布。

图像生成多模态开源/仓库模型发布
18:36
Berryxia.AI@berryxia
56
商汤开源多模态大模型SenseNova-U1,推动本地化部署

商汤发布开源可商用的多模态大模型SenseNova-U1,采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版,适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度,并即将推出办公场景应用功能。

图像生成多模态开源生态模型发布
17:51
蚂蚁 inclusionAI:HuggingFace 新模型
49
inclusionAI发布Ling-2.6-flash-int4模型

inclusionAI团队宣布推出Ling-2.6-flash-int4模型,作为其通过开源与开放科学推动人工智能技术进步与普及的重要举措。该版本延续了团队降低AI应用门槛、促进技术民主化的核心使命,以轻量化技术方案进一步优化模型性能与部署效率。

开源/仓库模型发布端侧
13:33
Alibaba Cloud@alibaba_cloud
53
Qwen3.6全系列模型已在NetMind平台上线,专为不同生产场景的智能体应用设计。该系列包含三个模型:Qwen3.6-Plus专注于前沿推理和长上下文,适用于复杂编码任务;Qwen3.6-Flash强调速度、规模和成本效益,适合大规模实时编码辅助;Qwen3.6-35B-A3B提供开源权重和Apache 2.0许可,支持自主托管和微调。所有模型共享高效的混合架构,具备函数调用和推理能力,并运行在NetMind的低延迟基础设施上,提供统一的OpenAI兼容端点。平台还提供即用代码,便于开发者快速集成和使用。

NetMind.AI: We're thrilled to announce that the full Qwen3.6 family, built for real-world agents at every scale with benchmark-toppi...

智能体模型发布编码
11:50
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/Ling-2.6-flash-fp8

inclusionAI 团队发布了 Ling-2.6-flash-fp8 模型,致力于通过开源与开放科学推动人工智能的发展与普及。该版本采用 FP8 精度优化,显著提升了推理效率并降低了计算资源消耗,是其在推进技术民主化进程中的最新实践。

开源/仓库模型发布端侧
11:27
蚂蚁 inclusionAI:HuggingFace 新模型
精选55
inclusionAI/Ling-2.6-flash

inclusionAI发布了Ling-2.6-flash模型。该模型是其开源语言模型系列的最新成员,旨在通过开源与开放科学推动人工智能的进步与民主化。此次发布延续了团队降低AI技术使用门槛、促进更广泛社区参与开发的使命。

开源/仓库模型发布端侧

推荐理由:蚂蚁 inclusionAI 的 Ling-2.6-flash 上线 HuggingFace,名字带 flash 大概率是轻量推理模型,但官方描述几乎空白,没有 benchmark 也没有用例,建议等社区实测再决定是否投入精力。
10:47
Simon Willison 博客
65
介绍 talkie:一个源自1930年的130亿参数复古语言模型

Nick Levine、David Duvenaud 和 Alec Radford 发布了 talkie,这是一个基于1931年前历史英文文本训练的130亿参数语言模型。其基础版本在2600亿token的已过版权数据上训练,而指令微调版本则用于驱动聊天界面。该版本借助Claude等现代模型生成合成数据进行训练,可能导致年代错位的知识污染。项目旨在探索此类模型预测未来、超越知识截止点进行发明等能力,并希望最终构建一个完全由复古模型自举的训练流程。模型采用Apache 2.0许可。

开源/仓库数据/训练模型发布端侧
10:47
Hacker News 热门(buzzing.cc 中文翻译)
51
Talkie:一款诞生于1930年的13B复古语言模型

Talkie是一款参数规模为130亿的复古风格语言模型,其设计灵感源于1930年代的语言特征与表达方式。该模型通过模拟特定历史时期的语料与文风,在文本生成中呈现出独特的复古韵味。项目已在官网发布,并在Hacker News社区获得102点热度关注。这一尝试展示了语言模型在风格化与历史语境模拟方面的技术拓展。

开源/仓库数据/训练模型发布
10:45
歸藏(guizang.ai)@op7418
60
作者表示将尝试为Codepilot用户争取免费的Token补贴。这一考虑基于小米MiMo -V2.5系列模型的开源动态,该模型采用MIT协议,允许自由商用、二次训练与微调。同时,小米推出了Orbit 100T Token计划,包含面向AI builder的"百万亿Token创造者激励计划"和面向Agent框架团队的"Agent生态共建计划"。激励计划为通过申请的用户提供Token支持,如最高16亿Credits。作者意图借鉴此机制为Codepilot社区谋取福利。

歸藏(guizang.ai): 小米 MiMo -V2.5 系列模型全部开源 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。 同时他们还推出了Orbit 100T Token 计划。 这个太牛批了!如果你有自己 Vibe Coding 一些东西可以...

开源/仓库模型发布
10:42
歸藏(guizang.ai)@op7418
精选74
小米 MiMo-V2.5 系列模型全部开源

小米正式开源MiMo-V2.5系列模型,采用宽松的MIT协议,允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型:专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro,以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时,小米推出Orbit 100T Token计划,包含面向AI开发者的“百万亿Token创造者激励计划”,提供最高价值659元的Credits,以及面向Agent框架团队的“Agent生态共建计划”,为其用户提供MiMo token限免支持。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布端侧

推荐理由:小米把 MiMo-V2.5 全线 MIT 开源,Pro 版在 agent 和编码榜单冲到开源第一,百万亿 Token 激励计划更是直接送钱让你用,做 Vibe Coding 的人没理由不去薅一把。
09:45
meng shao@shao__meng
精选75
小米开源MiMo-V2.5系列大模型

小米正式开源MiMo-V2.5系列模型,包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro,以及支持多模态代理的310B参数MoE模型MiMo-V2.5,两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术,以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式,通过多教师策略蒸馏提升模型综合能力。同时,小米推出100T Token的创造者激励计划,为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。

Fuli Luo: Just dropped two open-source models: MiMo-V2.5-Pro (Code Agent, 1T total) and MiMo-V2.5 (Multimodal Agent, 310B total). ...

智能体开源/仓库模型发布端侧

推荐理由:小米把万亿参数 MoE 做到开源且百万上下文,MTP 三层原生集成让推理速度翻三倍,这在国内大厂开源里是第一个真正敢放权重的万亿级模型,做 Agent 的值得认真看看。
07:23
Berryxia.AI@berryxia
69
小米开源MiMo-V2.5系列模型,支持百万token上下文

小米正式开源MiMo-V2.5系列模型,采用MIT许可证,允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口:MiMo-V2.5-Pro专为复杂Agent和编码任务设计,在开源模型的GDPVal-AA和ClawEval基准测试中排名第一;MiMo-V2.5是原生多模态模型,具备强大的Agent能力。小米强调,模型的价值不应仅由排行榜衡量,而应取决于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码
04:26
AK@_akhaliq
51
小米 MiMo-V2.5 已在 Hugging Face 发布 https://huggingface.co/collections/XiaomiMiMo/mimo-v25
多模态开源/仓库模型发布
03:45
Fuli Luo@_LuoFuli
精选76
小米宣布开源两个大模型:专攻复杂智能体和编码任务的MiMo-V2.5-Pro,以及原生全模态模型MiMo-V2.5。两者均支持100万token的上下文长度,并采用允许商业部署和微调的MIT许可证。同时,小米为开发者和创作者提供了100万亿token的免费额度,鼓励基于此构建应用。模型的价值不仅在于其在GDPVal-AA和ClawEval等基准测试中的排名,更在于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码

推荐理由:小米这次把 1T 参数的 Code Agent 模型直接 MIT 开源,还送 100T 免费 token,诚意拉满。做 coding agent 的团队值得认真看看,这可能是目前开源阵营里最强的代码智能体基座。
01:48
Xiaomi MiMo@XiaomiMiMo
精选71
小米开源MiMo-V2.5双模型,支持百万上下文与商用

小米正式开源MiMo-V2.5系列模型,采用MIT许可,支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型:MiMo-V2.5-Pro专为复杂智能体和编码任务设计,在GDPVal-AA和ClawEval基准测试中位列开源模型第一;MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调,模型的价值不仅在于排名,更在于其解决实际问题的能力,并已公开模型权重与技术博客。

智能体开源生态模型发布编码

推荐理由:小米把 MiMo-V2.5 直接 MIT 开源且支持商用,1M 上下文 + Agent 能力在开源阵营里确实能打,做 Agent 产品的团队值得花半小时跑一下 benchmark 看看真实水平。
‹ 上一页
1…3132333435…43
下一页 ›