AIHOT

5月1日

07:14

Artificial Analysis@ArtificialAnlys

xAI推出Grok 4.3模型，其在Artificial Analysis智能指数得分达53，超越Muse Spark等模型，较前代提升4分。模型在显著降低成本的同时保持智能水平，输入与输出价格分别降低约40%和60%。在真实世界智能体任务上表现突出，GDPval-AA基准得分大幅提升至1500 ELO，超越Gemini 3.1 Pro Preview等多款模型，但仍落后于GPT-5.5 (xhigh)。其在指令遵循和客服任务上表现强劲，但AA-Omniscience非幻觉率略有下降。

智能体xAI推理模型发布

关联讨论 2 条

03:14

Artificial Analysis@ArtificialAnlys

蚂蚁集团开源Ling 2.6 1T模型，性价比与智能取得平衡

蚂蚁集团InclusionAI实验室发布开源非推理模型Ling 2.6 1T。该模型拥有1万亿参数，在Artificial Analysis Intelligence Index上得分为34分，较前代Ling-1T提升15分，智能水平接近DeepSeek V3.2等同类模型。其在科学推理与知识任务上表现扎实，GPQA得分达75%。模型运行效率较高，执行该指数仅需约1600万输出tokens，成本效益突出，通过官方API运行全套指数成本约95美元。但其事实可靠性较弱，在AA-Omniscience基准上得分为-51分，主要因幻觉率高达92%。模型权重已在Hugging Face公开。

开源生态评测/基准

关联讨论 1 条

02:13

Ant Ling@AntLingAGI

精选76

AntLingAGI团队宣布Ling-2.6-1T模型正式开源，已登陆Hugging Face平台，并通过Novita Labs提供官方推理体验。该模型采用混合专家架构，总参数1万亿、激活参数630亿，核心优化方向为"令牌效率"以满足真实生产需求。具体表现为：低令牌开销，能在无需冗长推理链的情况下保持强大智能；可靠的多步执行能力，提升指令、工具、上下文和工作流的控制水平；生产就绪的部署特性，覆盖从代码生成到错误修复的任务，并广泛兼容各类智能体框架。团队旨在通过降低测试、部署、定制和构建的难度，为开发者创造价值。

智能体Hugging Face模型发布部署/工程

关联讨论 1 条

推荐理由：1T参数开源模型不是天天有，蚂蚁这个Ling-2.6-1T强调token效率和Agent能力，做Agent的可以直接去Hugging Face上跑一下，看看是不是真的在生产环境省token。

01:45

Google AI@GoogleAI

精选69

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

谷歌上周正式向公众发布了其首个原生多模态嵌入模型Gemini Embedding 2。该模型如同“通用翻译器”，能将文本、图像、视频和音频数据转化为独特的数字向量。其核心突破在于不再依赖关键词匹配，而是基于语义将不同模态的数据映射到同一空间，从而理解内容间的深层联系。开发者已利用该模型构建视频分析工具、视觉购物助手等应用，实现通过拍照或描述场景进行智能搜索的功能。模型现可通过Gemini API或Gemini Enterprise Agent平台使用。

Google多模态搜索模型发布

关联讨论 1 条

推荐理由：Google 第一个原生多模态嵌入模型，把文本、图像、视频拉到同一个向量空间，做跨模态搜索的开发者可以不用再手动打标签了，但离「无感理解」还有距离。

01:44

TestingCatalog News 🗞@testingcatalog

苹果 🍎： "AFM Plus 150B Instruct" Apple Foundation Model 在内部的 AFM Playground 应用中被发现。这个应用正在被苹果员工内部使用，以测试 Apple Foundation 模型。 WWDC26 将会很火爆 🔥

端侧行业动态

01:14

TestingCatalog News 🗞@testingcatalog

ANTHROPIC 🚨： Anthropic 已开始与红队测试新的 "claude-jupiter-v1-p" 模型。下一个会是谁？👀

Anthropic安全/对齐行业动态

4月30日

23:13

SenseTime@SenseTime_AI

SenseNova U1 Lite系列：小规模多模态模型开源发布

SenseNova U1 Lite Series是新一代原生统一的多模态模型，在紧凑的8B/A3B规模下提供商业级性能。其核心能力包括复杂信息图生成，具备强语义完整性和像素级精度；高布局一致性，实现准确可靠的文本渲染；以及行业首创的连续图像-文本生成，支持统一推理和一致视觉风格。该模型现已完全开源，相关代码和资源可通过GitHub、Hugging Face等平台获取。

图像生成多模态模型发布

23:13

OpenRouter@OpenRouter

全新隐形模型：Owl Alpha！ Owl 是一款专为智能体工作负载设计的高性能基础模型。具备强大的工具使用能力和 100 万上下文窗口，可随时用于您喜爱的所有生产力应用。立即试用并分享反馈以改进模型！

智能体模型发布

14:52

Alibaba Cloud@alibaba_cloud

精选65

Qwen3.6-Plus 现已在 @togethercompute 上线。快来使用吧。

智能体模型发布编码

推荐理由：Qwen 这次步子不小，直接把百万上下文、多模态推理和 agent 能力整合进一个模型，做 coding agent 的终于不用再拼拼凑凑了。

13:45

宝玉@dotey

OpenAI将推出GPT-5.5-Cyber网络安全模型

Sam Altman 刚宣布，OpenAI 将在未来几天向“关键网络安全防御者”推送 GPT-5.5-Cyber，一个专门为网络安全打造的前沿模型。他说 OpenAI 会和整个行业生态及政府合作，建立可信的访问机制，目标是尽快帮助保护企业和基础设施。

OpenAI模型发布

13:13

Yuchen Jin@Yuchenj_UW

OpenAI 构建 GPT-5.5-Cyber 模型是因为 Anthropic 构建了 Mythos。白帽与黑帽能量。

AnthropicOpenAI大佬观点安全/对齐

13:09

Sam Altman@sama

我们即将在未来几天内向关键网络安全防御者推出GPT-5.5-Cyber，这是一个前沿网络安全模型。我们将与整个生态系统及政府合作，为网络安全领域探索可信访问机制；我们希望迅速帮助企业和基础设施提升安全防护。

OpenAI安全/对齐模型发布

10:57

Baidu Inc.@Baidu_Inc

精选65

百度ERNIE 5.1 Preview模型正式上线。该模型采用更轻量高效的架构，在总参数量压缩至前代约1/3、激活参数量约1/2的同时，仅消耗可比模型约6%的预训练成本，实现了在其规模下的领先基础性能。根据@arena的Text Arena榜单，ERNIE 5.1 Preview在全球总排名第13位，并位列中国实验室第一。其在多个细分领域进入全球前十，特别是在法律与政府领域排名第一。百度预告将在2026年的Baidu Create大会上发布更多ERNIE模型更新。

推理模型发布

推荐理由：ERNIE 5.1 Preview 把参数量砍到前代的 1/3，性能还稳住了，6% 的训练成本近乎白嫖，国产模型打榜的意义不大，但这效率提升对做应用落地的人来说是实打实的好处。

09:39

Greg Brockman@gdb

GPT-5.5将于5月5日举办派对：【引用 @sama】：GPT-5.5要为自己办个派对。它选了5月5日下午5：55作为日期和时间。如果想参加，请在此告知：https：//luma.com/5.5 Codex将协助团队从回复中挑选参与者。5.5对派对提了些不错的想法/要求，我们会落实。

OpenAI行业动态

01:42

Ant Ling@AntLingAGI

Ling-2.6-1T正式开源，来自@AntLingAGI。该模型拥有1T总参数和63B活跃参数，专为实际生产设计，具有token高效性，便于开发者测试、部署和定制。从Ling-2.6-flash升级到1T规模，实现了从快速推理到更强推理的跨越。主推文强调，结合@opencode等工具展示了酷炫演示，体现了模型与现有工具的兼容性和实用性，并对@novita_labs的合作发布表示感谢。

开源/仓库推理模型发布

01:42

Ant Ling@AntLingAGI

谢谢Adina~ Token效率是引领下一阶段的关键特性。我们需要明智且高效地消耗token，才能使整个行业可持续发展。🤗🤗

开源/仓库推理模型发布

01:42

Ant Ling@AntLingAGI

精选72

SGLang团队（隶属于LMSYS Org）揭示了其旗舰指令模型实现快速、高效、大规模执行的关键在于可靠的基础设施与针对性优化。团队宣布对AntLingAGI发布的Ling-2.6-1T万亿参数模型提供Day-0支持。该模型采用快速思考方法，在保持质量的同时，成本可比同类模型降低约4倍，并在AIME26和SWE-bench基准测试中达到SOTA水平。它专为高级编码、复杂推理和大规模智能体工作流设计，具备万亿参数能力与即时模型延迟。团队正持续进行优化，以进一步提升性能。

智能体推理模型发布编码

推荐理由：万亿参数做到即时延迟和4倍成本优势，还有SWE-bench SOTA，这份承诺如果兑现，会改变大规模Agent部署的性价比计算。值得去cookbook跑一下验证。

4月29日

23:42

Ant Ling@AntLingAGI

精选71

Ling-2.6-1T万亿参数模型开源，主打令牌高效

AntLingAGI正式开源其万亿参数旗舰模型Ling-2.6-1T。该模型采用总参数1万亿、激活参数630亿的架构，核心设计理念是“令牌高效”，旨在以极低的令牌开销实现顶尖智能。它通过“快速思考”机制优化，具备可靠的多步骤执行能力，在指令遵循、工具使用和上下文控制方面表现优异。模型为实际生产需求优化，部署便捷，兼容广泛的智能体框架，适用于从代码生成到错误修复等多种任务。

开源/仓库推理模型发布部署/工程

关联讨论 1 条

推荐理由：蚂蚁把万亿参数模型开源了，但强调的不是大，而是省 token，这对成本敏感的生产环境是真正的性价比之选，做 agent 的可以上手测测。

23:40

TestingCatalog News 🗞@testingcatalog

MISTRAL 🚨： Mistral AI 发布了 Mistral Medium 3.5，这是一个拥有 256k 上下文窗口和可配置推理算力的 128B 密集开放权重模型。 Mistral Medium 3.5 现已在 Mistral Vibe 和 Le Chat 上可用。

开源生态推理模型发布

关联讨论 2 条

23:10

Artificial Analysis@ArtificialAnlys

IBM发布三款高效非推理模型Granite 4.1，采用Apache 2.0开源许可

IBM发布了三款采用Apache 2.0许可的Granite 4.1开源模型（30B、8B、3B）。其核心特点是极高的令牌效率，例如8B模型运行智能指数仅需4M输出令牌，远低于同类模型。在开放性指数上，三款模型均获得61分，领先多数同行。但高效率也带来了智能指数的相对折衷，其得分低于Qwen3.5、Gemma 4等竞品。不过，与上一代Granite 4.0系列相比，新模型的智能表现仍有提升。该系列模型拥有128K令牌的上下文窗口，主要面向企业和边缘部署，可通过WandB、Replicate和Hugging Face获取。

Hugging Face开源生态模型发布

关联讨论 1 条

22:42

Ant Ling@AntLingAGI

此前在OpenRouter上备受喜爱的快速模型"elephant-alpha"现已永久保留并正式开源，命名为Ling-2.6-flash。该模型由novita_labs驱动，旨在提供稳健且高性价比的性能。它专为现实世界智能体工作流打造，拥有1040亿总参数和74亿活跃参数，并提供多种精度版本以适应不同部署需求。其核心优势包括高达每秒215个令牌的生成速度、仅需1500万令牌即可完成完整智能评估的高效令牌利用率，以及在编码、文档处理和轻量级智能体任务中的强大执行能力。同时，模型在中文切换和主流编码框架兼容性方面体验更佳。为庆祝发布，现提供20%的折扣。

智能体开源生态模型发布

22:37

歸藏(guizang.ai)@op7418

Deepseek 的多模态模型全量了。目前可以在网页版的识图模式尝试，看起来是一个单独的多模态模型

DeepSeek多模态模型发布

22:17

Tencent Hy@TencentHunyuan

精选67

腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型，440MB体积支持手机离线运行

腾讯开源了Hy-MT1.5-1.8B-1.25bit翻译模型，其参数量为18亿，经量化后仅440MB，可在手机上完全离线运行。该模型支持33种语言、5种方言及1056个翻译方向，包括藏语、蒙古语等少数语言。在标准测试中，其性能媲美商业翻译API和2350亿参数的大模型。通过量化至1.25比特，模型内存占用从FP16格式的3.3GB大幅降低，比之前的1.67比特方法体积缩小25%、速度提升约10%，且无精度损失。该模型已在国际机器翻译竞赛中获得30项第一，并部署于腾讯多个产品中。

Hugging Face开源生态模型发布端侧

推荐理由：440MB的模型能在手机上跑33种语言翻译，还宣称比谷歌翻译强，这个量化技术让离线翻译不再是‘能看不能用’，出差党可以试试看。

22:10

TestingCatalog News 🗞@testingcatalog

SenseTime开源了基于NEO-Unify架构的多模态图像生成模型SenseNova-U1。该架构完全摒弃了传统视觉编码器和VAE，原生地将理解、推理和生成统一为一个系统。该系列模型（8B和A3B参数）在开源模型中效率领先，以紧凑尺寸提供商业级性能与出色成本效益。其特色功能包括原生生成图文交织内容，适用于制作指南等实用场景；并擅长高密度信息渲染，能生成知识插图、海报、PPT和漫画等丰富结构的布局。模型已在Hugging Face和GitHub等平台开源。

图像生成多模态开源生态模型发布

17:16

SenseTime@SenseTime_AI

感谢 @liuziwei7 与我们共同创造 #多模态智能的未来！

Hugging Face多模态开源生态模型发布

16:46

SenseTime@SenseTime_AI

精选65

是的，SenseNova U1 现已在 Hugging Face 和 GitHub 上发布！探索它如何以语义精确性和像素级保真度实现复杂的 #信息图创作。 Hugging Face： https：//huggingface.co/collections/sensenova/sensenova-u1 GitHub： https：//github.com/OpenSenseNova/SenseNova-U1 Discord： https：//discord.gg/cxkwXWjp

Hugging Face图像生成多模态模型发布

推荐理由：SenseNova U1 开源了，能生成像素级精准的信息图，对于做电商和可视化的人是个直接可用的工具，值得跑一下看看实际表现。

14:49

Alibaba Cloud@alibaba_cloud

精选64

HappyHorse 1.0 现已在 @fal 上线。去构建吧。【引用 @fal】：Happy Horse 1.0 is live on fal， day 0 🐎 🎬 一流的运动质量 🎧 原生1080p，音频同步一步完成 🔗 音视频联合生成，非拼接 🔓 限制更少，商业用途更广 ⚡ 为生产规模而构建

多模态模型发布视频

关联讨论 1 条

推荐理由：阿里云不声不响丢了个跟 Sora 对标的视频生成模型，音画同步一镜出片，直播带货团队可以立刻试试。

14:40

Ant Ling@AntLingAGI

服务好LLM是一项具有挑战性的任务，它需要工程智慧和良好的品味。感谢@Modular团队高水平的工程师们让这次合作成为现实。生态系统必胜！🤠👏

智能体开源生态模型发布

10:37

Chubby♨️@kimmonismus

Mistral Medium 即将到来。唯一相关的欧洲AI公司将发布另一个模型。

开源生态模型发布

09:38

ginobefun@hongming731

NVIDIA发布多模态模型Nemotron 3 Nano Omni

NVIDIA发布了多模态模型Nemotron 3 Nano Omni，专为处理长上下文设计，能够同时理解文本、图像、音频和视频。该模型在文档分析、自动语音识别、音视频理解以及智能体计算机使用等实际应用场景中表现优异。在多项基准测试中，Nemotron 3 Nano Omni均展现出领先的准确性和效率。

多模态模型发布端侧

09:35

阿绎 AYi@AYi_AInotes

精选76

蚂蚁发布Ling-2.6系列模型，以极致token效率推动AI生产落地竞赛

蚂蚁集团发布Ling-2.6系列模型，通过MoE架构与Fast-Thinking机制，将推理激活率降至7%，在实现接近GPT-5.4非推理水平综合智能的同时，大幅降低token成本。该模型在SWE-bench Verified等真实Agent场景测试中表现领先，旨在解决Agent规模化应用的成本痛点。目前已在OpenRouter提供免费API并即将开源，推动行业焦点从刷榜转向生产落地。其高效率特性尤其适合高频任务，在部分任务中速度比Claude Sonnet 4.6快6倍、成本低50倍。

阿绎 AYi：后续来了兄弟们，卧槽真的太炸了，同样的任务，同样的配置，速度比Claude Sonnet 4.6还快 6 倍，成本低约 50 倍， openrouter 和官…

智能体推理评测/基准

关联讨论 1 条

推荐理由：把 token 成本砍到对手四分之一而智能分不降，Agent 规模化终于有了真正的成本解决方案，做 Agent 的必看。

08:38

Berryxia.AI@berryxia

OpenBMB发布的MiniCPM-o 4.5是一个仅90亿参数的多模态模型，实现了从传统轮询交互到实时、原生全双工流式交互的范式突破。其Omni-Flow框架能在统一时间线上毫秒级同步处理视频、音频和文本流，无需外部语音检测即可同时感知与响应。该模型在多模态基准测试中表现接近Gemini 2.5 Flash，并专为边缘AI设计，支持完全离线运行，提供Windows/macOS一键安装（仅需12G显存），保障100%数据隐私，同时开源权重并提供免费社区API。

GitHub多模态开源生态模型发布

07:38

Berryxia.AI@berryxia

由前GitHub CTO Jason Warner创立的Poolside AI团队开源了其首个权重模型Laguna XS.2。该模型采用33B总参数、3B激活参数的MoE架构，专为Agentic Coding和长时序任务设计，可在单张GPU上运行，并采用Apache 2.0开源协议。团队同时发布了当前最强版模型Laguna M.1以及Agent Harness，标志着其在智能编码代理赛道成为新的竞争者。

智能体开源生态模型发布编码

07:38

Berryxia.AI@berryxia

NVIDIA发布高效开源多模态模型Nemotron 3 Nano Omni

NVIDIA 重磅发布！🚀 Nemotron 3 Nano Omni 多模态开源模型来了！ 🔥 30B 参数 🔥 256K 超长上下文 🔥 最高效开放多模态模型（语言+视觉+语音+视频+音频一体化） 🔥 专为 subagents / Agentic 任务设计 🔥 完全开源（权重 + 数据 + 配方），领跑多项榜单可通过 NVIDIA NIM API 免费试用！完美驱动多代理工作流。

智能体多模态开源生态模型发布

关联讨论 3 条

05:39

AK@_akhaliq

Nvidia发布了Nemotron 3 Nano Omni 在Hugging Face上为其制作了一个gradio应用

多模态开源/仓库端侧

01:38

Ant Ling@AntLingAGI

推文感谢Hugging Face为开源模型的持续发展提供了重要平台。文中强调，token效率是构建实用、可持续协作系统的关键。AntLingAGI最新发布的Ling-2.6-flash模型已加入这场效率竞争，该模型采用MIT许可，具备104B/7.4B激活参数，并创新性地结合了1：7 MLA与Lightning Linear混合注意力机制。其性能表现突出：推理速度高达340 tok/s，并且仅需约1500万tokens即可完成完整的Artificial Analysis评测套件。这一效率显著高于通常需要5000万至1亿tokens的前沿模型，展现出其作为高效协作伙伴的潜力。

开源生态推理模型发布

01:35

阿绎 AYi@AYi_AInotes

蚂蚁发布Ling-2.6-1T模型，以token效率革新生产级AI

蚂蚁集团AGI团队发布Ling-2.6-1T模型，其核心创新在于聚焦token效率而非参数规模。该模型采用MoE架构，每次推理仅激活7.4B参数，结合Linear Attention与Multi-Token Prediction技术，在保持接近GPT-5.4非推理水平的高智能同时，将token成本降至可比模型的四分之一。在Artificial Analysis评测中以极低消耗获得高分，并在SWE-bench等硬核Agent场景领先。该模型专为处理海量真实生产请求设计，旨在为高频Agent应用提供高效、低成本的解决方案，并通过免费API策略加速生态布局，预示AI竞赛重心正向真实生产成本效率转移。

阿绎 AYi：后续来了兄弟们，卧槽真的太炸了，同样的任务，同样的配置，速度比Claude Sonnet 4.6还快 6 倍，成本低约 50 倍， openrouter 和官…

智能体模型发布部署/工程

01:08

AK@_akhaliq

SenseNova U1 已在 Hugging Face 发布 https：//huggingface.co/collections/sensenova/sensenova-u1

Hugging Face开源生态模型发布

01:03

Ant Ling@AntLingAGI

AntLingAGI宣布将其模型Ling-2.6-flash正式开源，该模型此前在OpenRouter平台上曾以"Elephant Alpha"为名提供API服务。目前，模型已在Hugging Face和ModelScope平台全面开放，供公众自由使用与构建。模型关键参数为总参数量1040亿，激活参数量74亿，在Artificial Analysis基准测试中输出速度约为每秒215个token，并支持BF16、FP8和INT4多种精度格式。此次开源得到了合作伙伴Novita Labs，以及lmsysorg的SGLang团队和vllm项目的技术支持。

开源/仓库模型发布端侧

00:53

Ant Ling@AntLingAGI

vLLM项目团队宣布对Ling-2.6-flash模型提供Day-0首发支持，体现了开源生态系统构建者之间的高效协同。Ling-2.6-flash是一个专为需要快速响应和强大执行力的现实世界智能体设计的即时指令MoE模型。其核心特点包括：1040亿总参数与74亿激活参数的高度稀疏混合专家架构，结合了1：7 MLA与Lightning Linear注意力机制，支持262K上下文长度，并具备原生工具调用能力，可无缝接入Claude Code、Kilo Code、Qwen Code、Hermes、OpenClaw等主流框架。

智能体开源生态模型发布