AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「模型发布」清除
4月30日周四
23:13OpenRouter59新型隐身模型Owl Alpha发布
22:11Artificial Analysis56腾讯发布开源推理模型Hy3-preview,综合评分42分落后于近期同类模型
20:42The Decoder:AI News(RSS)49Tencent 发布 440 MB AI 模型,可在手机上离线翻译 33 种语言
20:42Hacker News 热门(buzzing.cc 中文翻译)57Granite 4.1:IBM 的 8 位模型与 32 位 MoE 相媲美
20:10IT之家(RSS)40OpenAI 将推出前沿网络安全模型 GPT-5.5-Cyber,暂不向公众开放
18:10Berryxia.AI55文心5.1 Preview登顶国内文本榜,揭示文本能力仍是AI模型关键分水岭
14:52Alibaba Cloud68精选阿里云发布HappyHorse,实现秒级AI视频生成
14:52Alibaba Cloud65精选Qwen3.6-Plus上线Together AI平台
13:45宝玉54OpenAI将推出GPT-5.5-Cyber网络安全模型
13:09Sam Altman69GPT-5.5-Cyber即将向关键网络防御者推出
10:57Baidu Inc.65精选ERNIE 5.1 Preview发布,架构更轻性能更强
09:34IT之家(RSS)64万亿级综合旗舰模型:蚂蚁集团百灵大模型开源 Ling-2.6-1T
09:00公众号:蚂蚁百灵(Ling)62同事件精选Ling-2.6-1T 正式开源:面向复杂任务的万亿级综合旗舰模型同一事件,精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》
08:00HuggingFace Daily Papers(社区热门论文)62MiniCPM-o 4.5:迈向实时全双工全模态交互
08:00OpenRouter:Announcements(RSS)54April Release Spotlight
01:42Ant Ling55Ling-2.6-1T开源:结合工具展示强大生产级模型
01:42Ant Ling53高效利用Token推动AI可持续发展
01:42Ant Ling72精选旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
01:42Ant Ling61精选Ling-2.6-1T 发布并获 vLLM 即时支持
00:42Hacker News 热门(buzzing.cc 中文翻译)63Mistral Medium 3.5
00:41Deedy50研究通过知识问题估算LLM参数规模
00:40Mistral AI:News(网页)76Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
4月29日周三
23:42Ant Ling71精选Ling-2.6-1T万亿参数模型开源,主打令牌高效
23:40TestingCatalog News 🗞63Mistral AI发布128B参数模型Mistral Medium 3.5
23:10Artificial Analysis63IBM发布三款高效非推理模型Granite 4.1,采用Apache 2.0开源许可
22:42Ant Ling59Ling-2.6-flash 模型正式开源,专为高效智能体工作流设计
22:37歸藏(guizang.ai)54Deepseek 的多模态模型全量了。 目前可以在网页版的识图模式尝试,看起来是一个单独的多模态模型
22:17Tencent Hy67精选腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型,440MB体积支持手机离线运行
22:10TestingCatalog News 🗞54SenseTime开源多模态图像生成模型SenseNova-U1,基于NEO-Unify架构
21:49Xiaomi MiMo60精选小米MiMo-V2.5-Pro在最新Arena排行榜中实现多项突破
20:40公众号:生数科技(Vidu·视频)54生数科技发布通用世界行动模型 MotuBrain
17:41The Decoder:AI News(RSS)55通过 Nemotron 3 Nano Omni,Nvidia 揭示了现代多模态模型的真实构成
17:33IT之家(RSS)65腾讯混元开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,仅 440MB
17:16SenseTime56SenseNova U1原生多模态模型开源
17:11小互44Deepseek内测多模态 图像识别助力Agent
17:08Chubby♨️44Xiami mimo模型开源超越Opus 4.5
17:08Chubby♨️63GPT-5.5非专业版超越GPT-5.4专业版
16:46SenseTime65精选SenseNova U1上线Hugging Face与GitHub
16:33IT之家(RSS)59腾讯多款 Agent 智能体亮相 2026 数字中国建设峰会,混元 Hy3 preview 语言模型同步迎来展会首秀
16:30公众号:腾讯混元46出国必备+1!腾讯混元开源手机端离线翻译模型,仅0.4G,支持33种语言
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月30日
23:13
OpenRouter@OpenRouter
59
全新隐形模型:Owl Alpha! Owl 是一款专为智能体工作负载设计的高性能基础模型。具备强大的工具使用能力和 100 万上下文窗口,可随时用于您喜爱的所有生产力应用。 立即试用并分享反馈以改进模型!
智能体模型发布
22:11
Artificial Analysis@ArtificialAnlys
56
腾讯发布开源推理模型Hy3-preview,综合评分42分落后于近期同类模型

腾讯发布开源混合专家模型Hy3-preview,总参数量2950亿,激活参数量210亿。其在Artificial Analysis综合智能指数上得分42,落后于近期开源的GLM-5.1、DeepSeek V4 Flash及Qwen3.6 27B等推理模型。具体评测表现不均衡:在真实世界任务基准GDPval-AA上落后于主要竞品,但在研究级物理评测CritPt上与高分模型GLM-5.1持平;其相对弱项在于AA-Omniscience指数,幻觉率较高。模型采用Tencent HY社区许可协议,商业使用受限,已在Hugging Face和SiliconFlowAI平台提供。

开源/仓库推理模型发布评测/基准
20:42
The Decoder:AI News(RSS)
49
Tencent 发布 440 MB AI 模型,可在手机上离线翻译 33 种语言

腾讯发布了一款紧凑型开源 AI 翻译模型,其大小仅为 440 MB。该模型支持 33 种语言的互译,并能在智能手机上完全离线运行。腾讯声称,其性能超越了谷歌翻译。这一轻量化设计使得高质量的神经机器翻译无需依赖网络连接即可在移动设备上实现。

开源生态模型发布端侧
20:42
Hacker News 热门(buzzing.cc 中文翻译)
57
Granite 4.1:IBM 的 8 位模型与 32 位 MoE 相媲美

IBM开源了Granite 4.1系列模型,其80亿参数版本在性能上可与320亿参数的混合专家模型相媲美。这一突破表明,通过优化架构与训练方法,较小规模的模型也能达到更大模型的效能水平,为高效部署提供了新选择。该模型家族已开源,在开发者社区中获得关注,相关讨论在Hacker News上获得了超过100点热度。

开源生态模型发布
20:10
IT之家(RSS)
40
OpenAI 将推出前沿网络安全模型 GPT-5.5-Cyber,暂不向公众开放

OpenAI宣布将推出基于GPT-5.5定制的网络安全模型GPT-5.5-Cyber。该模型不会向公众开放,将在未来数日内限量定向开放给经过筛选的网络安全防护人员,以协助强化网络防御。具体技术细节尚未披露,OpenAI表示将联合行业与政府制定可信准入机制。这种分阶段限量推出高风险顶级模型的模式,已成为人工智能行业的普遍趋势。

OpenAI安全/对齐模型发布
18:10
Berryxia.AI@berryxia
55
文心5.1 Preview登顶国内文本榜,揭示文本能力仍是AI模型关键分水岭

文心5.1 Preview在LMArena文本榜以1476分位列国内第一,是全球前十五名中唯一的国产模型,排名超越GPT-5.5与DeepSeek-V4-Pro。尽管AI领域热点转向Agent与多模态,但DeepSeek V4与文心5.1等旗舰模型仍以文本为核心。作者强调文本能力是大模型的地基,代码、推理等多维度能力均由此衍生,地基差异直接影响上层性能,因此文本仍是模型拉开差距的关键分水岭。引用推文显示,文心5.1在数学、法律与政府、商业管理及软件服务等类别表现突出。

Arena.ai: Ernie-5.1 from @ErnieforDevs lands at #13 in Text Arena - now the #1 highest-ranked model from a Chinese lab. Strongest ...

大佬观点推理模型发布
14:52
Alibaba Cloud@alibaba_cloud
精选68
阿里云发布HappyHorse,实现秒级AI视频生成

阿里云推出最新AI视频生成模型HappyHorse。该模型具备多项突破性功能:可生成影院级1080p高清画质;原生实现精准的音画同步,确保口型与声音对齐;在复杂场景和镜头切换中保持多镜头角色一致性;支持从文本提示到视频成片的秒级即时生成。用户现可免费试用。

多模态模型发布视频

推荐理由:阿里云终于放出视频生成模型,1080p+音频同步+秒级生成,功能直指 Sora 的短板。如果 demo 没修图,国产视频工具又多一个靠谱选择。
14:52
Alibaba Cloud@alibaba_cloud
精选65
Qwen3.6-Plus 现已在 @togethercompute 上线。快来使用吧。

Together AI: Introducing Qwen3.6-Plus from @Alibaba_Qwen, a 1M-context model built for real-world agents, agentic coding, and multimo...

智能体模型发布编码

推荐理由:Qwen 这次步子不小,直接把百万上下文、多模态推理和 agent 能力整合进一个模型,做 coding agent 的终于不用再拼拼凑凑了。
13:45
宝玉@dotey
54
OpenAI将推出GPT-5.5-Cyber网络安全模型

Sam Altman 刚宣布,OpenAI 将在未来几天向“关键网络安全防御者”推送 GPT-5.5-Cyber,一个专门为网络安全打造的前沿模型。他说 OpenAI 会和整个行业生态及政府合作,建立可信的访问机制,目标是尽快帮助保护企业和基础设施。

Sam Altman: we're starting rollout of GPT-5.5-Cyber, a frontier cybersecurity model, to critical cyber defenders in the next few day...

OpenAI模型发布
13:09
Sam Altman@sama
69
我们即将在未来几天内向关键网络安全防御者推出GPT-5.5-Cyber,这是一个前沿网络安全模型。 我们将与整个生态系统及政府合作,为网络安全领域探索可信访问机制;我们希望迅速帮助企业和基础设施提升安全防护。
OpenAI安全/对齐模型发布
10:57
Baidu Inc.@Baidu_Inc
精选65
百度ERNIE 5.1 Preview模型正式上线。该模型采用更轻量高效的架构,在总参数量压缩至前代约1/3、激活参数量约1/2的同时,仅消耗可比模型约6%的预训练成本,实现了在其规模下的领先基础性能。根据@arena的Text Arena榜单,ERNIE 5.1 Preview在全球总排名第13位,并位列中国实验室第一。其在多个细分领域进入全球前十,特别是在法律与政府领域排名第一。百度预告将在2026年的Baidu Create大会上发布更多ERNIE模型更新。

ERNIE for Developers: Introducing ERNIE 5.1 Preview - now live! 🚀 Ranked #13 globally and #1 among Chinese labs on @arena 's Text Arena. Top-...

推理模型发布

推荐理由:ERNIE 5.1 Preview 把参数量砍到前代的 1/3,性能还稳住了,6% 的训练成本近乎白嫖,国产模型打榜的意义不大,但这效率提升对做应用落地的人来说是实打实的好处。
09:34
IT之家(RSS)
64
万亿级综合旗舰模型:蚂蚁集团百灵大模型开源 Ling-2.6-1T

蚂蚁集团正式开源百灵大模型万亿级综合旗舰模型 Ling-2.6-1T。该模型不单纯追求参数规模,而是通过MLA与Linear Attention混合架构等创新,系统性优化智效比与复杂任务执行能力。其核心是在更低Token开销下实现强综合智能,减少对冗长思考链的依赖,并在AIME26、SWE-bench Verified等多个执行类基准测试中达到开源SOTA水平。模型具备完整的工程落地能力,并与主流Agent框架兼容,旨在成为可部署于真实业务系统的底座。为方便体验,其在OpenRouter平台的免费API调用服务将延期一周。

开源生态推理模型发布编码
09:00
公众号:蚂蚁百灵(Ling)
同事件精选62
Ling-2.6-1T 正式开源:面向复杂任务的万亿级综合旗舰模型

Ling-2.6-1T 于上周发布,今日正式开源。该模型定位为面向复杂任务的万亿级综合旗舰模型。

开源生态模型发布
同一事件,精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》
推荐理由:蚂蚁开源万亿参数模型 Ling-2.6-1T,虽然一个多月后才看到,但这是目前国内参数最大的综合性基座,做复杂多模态 agent 的团队可以直接拿来用,省去从头训练的麻烦。
08:00
HuggingFace Daily Papers(社区热门论文)
62
MiniCPM-o 4.5:迈向实时全双工全模态交互

当前多模态大语言模型在交互范式上存在瓶颈,感知与响应分离且缺乏主动性。MiniCPM-o 4.5 通过 Omni-Flow 统一流式框架,将多模态输入输出对齐到共享时间轴,实现实时全双工全模态交互,支持同时感知与响应,并能基于对动态场景的连续理解主动发出提醒或评论。该模型参数量为 90 亿,在视觉语言能力上接近 Gemini 2.5 Flash,在全模态理解上超越 Qwen3-Omni-30B-A3B,且语音生成更优、计算效率显著更高。得益于高效的架构设计和推理优化,模型可在内存小于 12GB 的边缘设备上实现实时全双工全模态交互。

多模态模型发布端侧论文/研究
08:00
OpenRouter:Announcements(RSS)
54
April Release Spotlight

本月发布聚焦视频生成、工作空间、智能体SDK与重排序模型。多家公司推出前沿大模型,包括GPT、Claude和LLaMA系列的新版本。核心变化体现在模型多模态能力增强,特别是视频生成功能成为竞争焦点。部分新模型在标准基准测试中性能提升超过15%,同时上下文窗口扩展至百万token级别。开发者工具方面,新的智能体SDK支持更复杂的任务编排,而重排序模型显著提升了检索精度。

智能体产品更新多模态模型发布
01:42
Ant Ling@AntLingAGI
55
Ling-2.6-1T正式开源,来自@AntLingAGI。该模型拥有1T总参数和63B活跃参数,专为实际生产设计,具有token高效性,便于开发者测试、部署和定制。从Ling-2.6-flash升级到1T规模,实现了从快速推理到更强推理的跨越。主推文强调,结合@opencode等工具展示了酷炫演示,体现了模型与现有工具的兼容性和实用性,并对@novita_labs的合作发布表示感谢。

Novita AI: Today, Ling-2.6-1T is officially open-sourced (from @AntLingAGI) 1T total parameters · 63B active parameters Built for r...

开源/仓库推理模型发布
01:42
Ant Ling@AntLingAGI
53
谢谢Adina~ Token效率是引领下一阶段的关键特性。我们需要明智且高效地消耗token,才能使整个行业可持续发展。🤗🤗

Adina Yakup: Ling-2.6-1T just dropped by @AntLingAGI , one day after Ling 2.6 Flash. Both optimized for the same goal: usable intelli...

开源/仓库推理模型发布
01:42
Ant Ling@AntLingAGI
精选72
SGLang团队(隶属于LMSYS Org)揭示了其旗舰指令模型实现快速、高效、大规模执行的关键在于可靠的基础设施与针对性优化。团队宣布对AntLingAGI发布的Ling-2.6-1T万亿参数模型提供Day-0支持。该模型采用快速思考方法,在保持质量的同时,成本可比同类模型降低约4倍,并在AIME26和SWE-bench基准测试中达到SOTA水平。它专为高级编码、复杂推理和大规模智能体工作流设计,具备万亿参数能力与即时模型延迟。团队正持续进行优化,以进一步提升性能。

LMSYS Org: 👏 Meet Ling-2.6-1T from @AntLingAGI, the trillion-parameter flagship instant instruct model built for fast execution & ...

智能体推理模型发布编码

推荐理由:万亿参数做到即时延迟和4倍成本优势,还有SWE-bench SOTA,这份承诺如果兑现,会改变大规模Agent部署的性价比计算。值得去cookbook跑一下验证。
01:42
Ant Ling@AntLingAGI
精选61
AntLingAGI 开源了 Ling-2.6-1T 模型,这是一个面向现实世界智能体工作流程的新旗舰模型。作为 1T 参数规模模型的先驱,团队强调了硬件、软件与 LLM 协同设计的重要性。vLLM 项目从发布首日(Day-0)起即提供支持,体现了顶尖工程生态系统的协作。这种合作旨在实现最佳的优化效果与用户体验,共同推动技术进步。

vLLM: Congrats to @AntLingAGI on the open release of Ling-2.6-1T! 🎉 A new flagship for real-world agentic workflows - Day-0 v...

智能体开源生态模型发布

推荐理由:vLLM 对 1T 模型的 Day-0 适配,说明开源推理栈对大尺寸模型的跟进速度越来越快,做私有化部署的可以直接参考官配 recipe 跑起来。
00:42
Hacker News 热门(buzzing.cc 中文翻译)
63
Mistral Medium 3.5

Mistral 发布了其最新模型 Mistral Medium 3.5。该模型在 Hacker News 社区获得了显著关注,收获了 125 个投票。发布信息通过官方新闻页面公布,标志着 Mistral 在模型迭代上的又一次更新。

智能体模型发布
00:41
Deedy@deedydas
50
研究通过知识问题估算LLM参数规模

研究人员通过询问不同难度知识问题,估计大型语言模型参数大小。结果显示,GPT 5.5约10T参数,Claude Opus 4.x约4-5T,Grok 4约3T。事实性知识容量与模型规模呈对数线性关系。论文提出7个知识层级,最高层级T7对所有模型接近零,表明预训练仍有显著提升空间。Gemini 3.1 Pro可能超过10T参数。此方法有助于推断模型训练成本及后训练在非事实性任务上的性能。

AnthropicOpenAI数据/训练模型发布
00:40
Mistral AI:News(网页)
76
Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体

Mistral AI推出旗舰模型Mistral Medium 3.5,这是一个128B参数的密集模型,拥有256K上下文窗口,在SWE-Bench Verified上获得77.6%的分数。该模型现作为Vibe和Le Chat的默认引擎,并驱动两项新功能:Vibe远程编程智能体可将编码任务移至云端异步并行执行,用户可通过CLI或Le Chat启动并在完成后接收通知;Le Chat的新工作模式则是一个由该模型驱动的智能体,能处理研究、分析和跨工具操作等多步骤复杂任务。这些更新旨在将开发者从本地线性任务中解放出来,提升工作效率。

智能体开源生态模型发布编码
4月29日
23:42
Ant Ling@AntLingAGI
精选71
Ling-2.6-1T万亿参数模型开源,主打令牌高效

AntLingAGI正式开源其万亿参数旗舰模型Ling-2.6-1T。该模型采用总参数1万亿、激活参数630亿的架构,核心设计理念是“令牌高效”,旨在以极低的令牌开销实现顶尖智能。它通过“快速思考”机制优化,具备可靠的多步骤执行能力,在指令遵循、工具使用和上下文控制方面表现优异。模型为实际生产需求优化,部署便捷,兼容广泛的智能体框架,适用于从代码生成到错误修复等多种任务。

Ant Ling: 🚀 Today, we are launching Ling-2.6-1T, a trillion-parameter flagship model designed for precise instruct task execution...

开源/仓库推理模型发布部署/工程

推荐理由:蚂蚁把万亿参数模型开源了,但强调的不是大,而是省 token,这对成本敏感的生产环境是真正的性价比之选,做 agent 的可以上手测测。
23:40
TestingCatalog News 🗞@testingcatalog
63
MISTRAL 🚨: Mistral AI 发布了 Mistral Medium 3.5,这是一个拥有 256k 上下文窗口和可配置推理算力的 128B 密集开放权重模型。 Mistral Medium 3.5 现已在 Mistral Vibe 和 Le Chat 上可用。

Mistral Vibe: Introducing remote agents in Vibe and Mistral Medium 3.5. You can now launch remote agents in the cloud, including from ...

开源生态推理模型发布
23:10
Artificial Analysis@ArtificialAnlys
63
IBM发布三款高效非推理模型Granite 4.1,采用Apache 2.0开源许可

IBM发布了三款采用Apache 2.0许可的Granite 4.1开源模型(30B、8B、3B)。其核心特点是极高的令牌效率,例如8B模型运行智能指数仅需4M输出令牌,远低于同类模型。在开放性指数上,三款模型均获得61分,领先多数同行。但高效率也带来了智能指数的相对折衷,其得分低于Qwen3.5、Gemma 4等竞品。不过,与上一代Granite 4.0系列相比,新模型的智能表现仍有提升。该系列模型拥有128K令牌的上下文窗口,主要面向企业和边缘部署,可通过WandB、Replicate和Hugging Face获取。

Hugging Face开源生态模型发布
22:42
Ant Ling@AntLingAGI
59
此前在OpenRouter上备受喜爱的快速模型"elephant-alpha"现已永久保留并正式开源,命名为Ling-2.6-flash。该模型由novita_labs驱动,旨在提供稳健且高性价比的性能。它专为现实世界智能体工作流打造,拥有1040亿总参数和74亿活跃参数,并提供多种精度版本以适应不同部署需求。其核心优势包括高达每秒215个令牌的生成速度、仅需1500万令牌即可完成完整智能评估的高效令牌利用率,以及在编码、文档处理和轻量级智能体任务中的强大执行能力。同时,模型在中文切换和主流编码框架兼容性方面体验更佳。为庆祝发布,现提供20%的折扣。

Ant Ling: Ling-2.6-flash is now officially open-sourced! A fast, token-efficient Instruct model built for real-world agent workflo...

智能体开源生态模型发布
22:37
歸藏(guizang.ai)@op7418
54
Deepseek 的多模态模型全量了。 目前可以在网页版的识图模式尝试,看起来是一个单独的多模态模型
DeepSeek多模态模型发布
22:17
Tencent Hy@TencentHunyuan
精选67
腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型,440MB体积支持手机离线运行

腾讯开源了Hy-MT1.5-1.8B-1.25bit翻译模型,其参数量为18亿,经量化后仅440MB,可在手机上完全离线运行。该模型支持33种语言、5种方言及1056个翻译方向,包括藏语、蒙古语等少数语言。在标准测试中,其性能媲美商业翻译API和2350亿参数的大模型。通过量化至1.25比特,模型内存占用从FP16格式的3.3GB大幅降低,比之前的1.67比特方法体积缩小25%、速度提升约10%,且无精度损失。该模型已在国际机器翻译竞赛中获得30项第一,并部署于腾讯多个产品中。

Hugging Face开源生态模型发布端侧

推荐理由:440MB的模型能在手机上跑33种语言翻译,还宣称比谷歌翻译强,这个量化技术让离线翻译不再是‘能看不能用’,出差党可以试试看。
22:10
TestingCatalog News 🗞@testingcatalog
54
SenseTime开源了基于NEO-Unify架构的多模态图像生成模型SenseNova-U1。该架构完全摒弃了传统视觉编码器和VAE,原生地将理解、推理和生成统一为一个系统。该系列模型(8B和A3B参数)在开源模型中效率领先,以紧凑尺寸提供商业级性能与出色成本效益。其特色功能包括原生生成图文交织内容,适用于制作指南等实用场景;并擅长高密度信息渲染,能生成知识插图、海报、PPT和漫画等丰富结构的布局。模型已在Hugging Face和GitHub等平台开源。

SenseTime: SenseNova U1 Lite Series is now open source! Built on the NEO-unify architecture, it natively unifies multimodal underst...

图像生成多模态开源生态模型发布
21:49
Xiaomi MiMo@XiaomiMiMo
精选60
小米MiMo-V2.5-Pro在最新Arena排行榜中实现多项突破

小米MiMo-V2.5-Pro模型在最新Arena排行榜中表现卓越。在Text Arena(Expert)榜单中,它位列全球第六,同时是开源模型与中文模型的双料第一,其所属实验室全球排名第三。该模型在Text Arena(Overall)总榜中排名开源全球第二,在Code Arena(WebDev)前端开发榜单中位列开源全球第三。此外,它在Text Arena的四个关键子类别(Hard Prompts、英文Hard Prompts、指令遵循与长查询)中均获得开源全球第一。这些成绩均基于真实用户偏好与社区盲投评估,体现了模型在复杂任务上的强大综合能力。

开源生态推理模型发布

推荐理由:小米MiMo-V2.5-Pro冲到Arena开源第一,虽然排名更新晚了几天,但这是国产模型在硬核评测里最好的成绩,做选型的现在该认真看看小米。
20:40
公众号:生数科技(Vidu·视频)
54
生数科技发布通用世界行动模型 MotuBrain

生数科技发布通用世界行动模型 MotuBrain,主打“为行动而生”,旨在推动智能体在物理世界中的感知与交互能力。

具身智能模型发布
17:41
The Decoder:AI News(RSS)
55
通过 Nemotron 3 Nano Omni,Nvidia 揭示了现代多模态模型的真实构成

Nvidia 发布了开源多模态模型 Nemotron 3 Nano Omni,该模型能够处理文本、图像、视频和音频。其引人关注之处不仅在于性能表现,更在于其训练数据的构成。模型的部分训练数据来源于 Qwen、GPT-OSS、Kimi 和 DeepSeek OCR 等多个知名项目,这揭示了构建现代多模态模型所需数据集的多样性与复杂性。

多模态开源生态模型发布
17:33
IT之家(RSS)
65
腾讯混元开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,仅 440MB

腾讯混元开源了手机端离线翻译模型Hy-MT1.5-1.8B-1.25bit,其体积仅440MB,可在手机本地离线运行。该模型支持33种语言及1056个翻译方向,基于1.8B参数原型通过极致量化压缩实现。其1.25-bit版本采用稀疏高效三值量化技术,将原始3.3GB模型大幅缩减。官方称其翻译质量优于谷歌翻译等主流系统,并提供了2-bit和1.25-bit两种量化方案以适配不同机型。模型完全离线工作,不收集用户数据,相关资源已全面开源。

arXivHugging Face模型发布端侧
17:16
SenseTime@SenseTime_AI
56
感谢 @liuziwei7 与我们共同创造 #多模态智能 的未来!

Ziwei Liu: 🔥Native Unified Multimodal Model Open Sourced🔥 🚀SenseNova U1🚀 is the first native multimodal model that unifies mult...

Hugging Face多模态开源生态模型发布
17:11
小互@xiaohu
44
Deepseek 内测多模态能力 现在可以识别图像 对于Agent执行能力提升有很大帮助… 【引用 @PKUCXK】:Now, we see you. 👀

Xiaokang Chen: Now, we see you. 👀

智能体DeepSeek多模态模型发布
17:08
Chubby♨️@kimmonismus
44
Xiami mimo-v2.5 pro MIT许可证在竞技场上超越了Opus 4.5 了不起的成就。
开源/仓库模型发布评测/基准
17:08
Chubby♨️@kimmonismus
63
GPT-5.5 pro 在 Epoch 基准测试中实现了显著飞跃。然而更令人兴奋的是,GPT-5.5(非 pro 版)超越了 GPT-5.4 pro。 【引用 @EpochAIResearch】:GPT-5.5 Pro 在 Epoch 能力指数上创下 159 分的新高分!ECI 是我们的统计工具,它将多个基准测试整合到一个统一的量表中。

Epoch AI: GPT-5.5 Pro achieves a new high score of 159 on the Epoch Capabilities Index! ECI is our statistical tool that combines ...

OpenAI推理模型发布评测/基准
16:46
SenseTime@SenseTime_AI
精选65
是的,SenseNova U1 现已在 Hugging Face 和 GitHub 上发布! 探索它如何以语义精确性和像素级保真度实现复杂的 #信息图 创作。 Hugging Face: https://huggingface.co/collections/sensenova/sensenova-u1 GitHub: https://github.com/OpenSenseNova/SenseNova-U1 Discord: https://discord.gg/cxkwXWjp

AK: SenseNova U1 is out on Hugging Face https://huggingface.co/collections/sensenova/sensenova-u1

Hugging Face图像生成多模态模型发布

推荐理由:SenseNova U1 开源了,能生成像素级精准的信息图,对于做电商和可视化的人是个直接可用的工具,值得跑一下看看实际表现。
16:33
IT之家(RSS)
59
腾讯多款 Agent 智能体亮相 2026 数字中国建设峰会,混元 Hy3 preview 语言模型同步迎来展会首秀

在2026数字中国建设峰会上,腾讯展示了其Agent智能体生态。其中,WorkBuddy桌面智能体工作台可根据一句话描述自动完成任务;专为中国用户优化的AI技能社区“SkillHub”已集成腾讯核心产品能力,并收录超3.5万个技能。最新发布的混元Hy3 preview语言模型首次亮相,该模型为混合专家模型,总参数295B,支持256K上下文,在复杂推理、代码等能力上大幅提升,旨在助力中小企业低成本快速搭建AI应用,并已在腾讯云、元宝等多款产品中上线。

智能体推理模型发布
16:30
公众号:腾讯混元
46
出国必备+1!腾讯混元开源手机端离线翻译模型,仅0.4G,支持33种语言
开源生态模型发布端侧
‹ 上一页
1…3031323334…43
下一页 ›