4月30日

23:13

OpenRouter@OpenRouter

全新隐形模型：Owl Alpha！ Owl 是一款专为智能体工作负载设计的高性能基础模型。具备强大的工具使用能力和 100 万上下文窗口，可随时用于您喜爱的所有生产力应用。立即试用并分享反馈以改进模型！

智能体模型发布

22:11

Artificial Analysis@ArtificialAnlys

腾讯发布开源推理模型Hy3-preview，综合评分42分落后于近期同类模型

腾讯发布开源混合专家模型Hy3-preview，总参数量2950亿，激活参数量210亿。其在Artificial Analysis综合智能指数上得分42，落后于近期开源的GLM-5.1、DeepSeek V4 Flash及Qwen3.6 27B等推理模型。具体评测表现不均衡：在真实世界任务基准GDPval-AA上落后于主要竞品，但在研究级物理评测CritPt上与高分模型GLM-5.1持平；其相对弱项在于AA-Omniscience指数，幻觉率较高。模型采用Tencent HY社区许可协议，商业使用受限，已在Hugging Face和SiliconFlowAI平台提供。

开源/仓库推理模型发布评测/基准

20:42

The Decoder：AI News（RSS）

Tencent 发布 440 MB AI 模型，可在手机上离线翻译 33 种语言

腾讯发布了一款紧凑型开源 AI 翻译模型，其大小仅为 440 MB。该模型支持 33 种语言的互译，并能在智能手机上完全离线运行。腾讯声称，其性能超越了谷歌翻译。这一轻量化设计使得高质量的神经机器翻译无需依赖网络连接即可在移动设备上实现。

开源生态模型发布端侧

20:42

Hacker News 热门（buzzing.cc 中文翻译）

Granite 4.1：IBM 的 8 位模型与 32 位 MoE 相媲美

IBM开源了Granite 4.1系列模型，其80亿参数版本在性能上可与320亿参数的混合专家模型相媲美。这一突破表明，通过优化架构与训练方法，较小规模的模型也能达到更大模型的效能水平，为高效部署提供了新选择。该模型家族已开源，在开发者社区中获得关注，相关讨论在Hacker News上获得了超过100点热度。

开源生态模型发布

20:10

IT之家（RSS）

OpenAI 将推出前沿网络安全模型 GPT-5.5-Cyber，暂不向公众开放

OpenAI宣布将推出基于GPT-5.5定制的网络安全模型GPT-5.5-Cyber。该模型不会向公众开放，将在未来数日内限量定向开放给经过筛选的网络安全防护人员，以协助强化网络防御。具体技术细节尚未披露，OpenAI表示将联合行业与政府制定可信准入机制。这种分阶段限量推出高风险顶级模型的模式，已成为人工智能行业的普遍趋势。

OpenAI 安全/对齐模型发布

18:10

Berryxia.AI@berryxia

文心5.1 Preview登顶国内文本榜，揭示文本能力仍是AI模型关键分水岭

文心5.1 Preview在LMArena文本榜以1476分位列国内第一，是全球前十五名中唯一的国产模型，排名超越GPT-5.5与DeepSeek-V4-Pro。尽管AI领域热点转向Agent与多模态，但DeepSeek V4与文心5.1等旗舰模型仍以文本为核心。作者强调文本能力是大模型的地基，代码、推理等多维度能力均由此衍生，地基差异直接影响上层性能，因此文本仍是模型拉开差距的关键分水岭。引用推文显示，文心5.1在数学、法律与政府、商业管理及软件服务等类别表现突出。

Arena.ai: Ernie-5.1 from @ErnieforDevs lands at #13 in Text Arena - now the #1 highest-ranked model from a Chinese lab. Strongest ...

大佬观点推理模型发布

14:52

Alibaba Cloud@alibaba_cloud

精选68

阿里云发布HappyHorse，实现秒级AI视频生成

阿里云推出最新AI视频生成模型HappyHorse。该模型具备多项突破性功能：可生成影院级1080p高清画质；原生实现精准的音画同步，确保口型与声音对齐；在复杂场景和镜头切换中保持多镜头角色一致性；支持从文本提示到视频成片的秒级即时生成。用户现可免费试用。

多模态模型发布视频

推荐理由：阿里云终于放出视频生成模型，1080p+音频同步+秒级生成，功能直指 Sora 的短板。如果 demo 没修图，国产视频工具又多一个靠谱选择。

14:52

Alibaba Cloud@alibaba_cloud

精选65

Qwen3.6-Plus 现已在 @togethercompute 上线。快来使用吧。

Together AI: Introducing Qwen3.6-Plus from @Alibaba_Qwen, a 1M-context model built for real-world agents, agentic coding, and multimo...

智能体模型发布编码

推荐理由：Qwen 这次步子不小，直接把百万上下文、多模态推理和 agent 能力整合进一个模型，做 coding agent 的终于不用再拼拼凑凑了。

13:45

宝玉@dotey

OpenAI将推出GPT-5.5-Cyber网络安全模型

Sam Altman 刚宣布，OpenAI 将在未来几天向“关键网络安全防御者”推送 GPT-5.5-Cyber，一个专门为网络安全打造的前沿模型。他说 OpenAI 会和整个行业生态及政府合作，建立可信的访问机制，目标是尽快帮助保护企业和基础设施。

Sam Altman: we're starting rollout of GPT-5.5-Cyber, a frontier cybersecurity model, to critical cyber defenders in the next few day...

OpenAI 模型发布

13:09

Sam Altman@sama

我们即将在未来几天内向关键网络安全防御者推出GPT-5.5-Cyber，这是一个前沿网络安全模型。我们将与整个生态系统及政府合作，为网络安全领域探索可信访问机制；我们希望迅速帮助企业和基础设施提升安全防护。

OpenAI 安全/对齐模型发布

10:57

Baidu Inc.@Baidu_Inc

精选65

百度ERNIE 5.1 Preview模型正式上线。该模型采用更轻量高效的架构，在总参数量压缩至前代约1/3、激活参数量约1/2的同时，仅消耗可比模型约6%的预训练成本，实现了在其规模下的领先基础性能。根据@arena的Text Arena榜单，ERNIE 5.1 Preview在全球总排名第13位，并位列中国实验室第一。其在多个细分领域进入全球前十，特别是在法律与政府领域排名第一。百度预告将在2026年的Baidu Create大会上发布更多ERNIE模型更新。

ERNIE for Developers: Introducing ERNIE 5.1 Preview - now live! 🚀 Ranked #13 globally and #1 among Chinese labs on @arena 's Text Arena. Top-...

推理模型发布

推荐理由：ERNIE 5.1 Preview 把参数量砍到前代的 1/3，性能还稳住了，6% 的训练成本近乎白嫖，国产模型打榜的意义不大，但这效率提升对做应用落地的人来说是实打实的好处。

09:34

IT之家（RSS）

万亿级综合旗舰模型：蚂蚁集团百灵大模型开源 Ling-2.6-1T

蚂蚁集团正式开源百灵大模型万亿级综合旗舰模型 Ling-2.6-1T。该模型不单纯追求参数规模，而是通过MLA与Linear Attention混合架构等创新，系统性优化智效比与复杂任务执行能力。其核心是在更低Token开销下实现强综合智能，减少对冗长思考链的依赖，并在AIME26、SWE-bench Verified等多个执行类基准测试中达到开源SOTA水平。模型具备完整的工程落地能力，并与主流Agent框架兼容，旨在成为可部署于真实业务系统的底座。为方便体验，其在OpenRouter平台的免费API调用服务将延期一周。

开源生态推理模型发布编码

09:00

公众号：蚂蚁百灵（Ling）

同事件精选62

Ling-2.6-1T 正式开源：面向复杂任务的万亿级综合旗舰模型

Ling-2.6-1T 于上周发布，今日正式开源。该模型定位为面向复杂任务的万亿级综合旗舰模型。

开源生态模型发布

同一事件，精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》

推荐理由：蚂蚁开源万亿参数模型 Ling-2.6-1T，虽然一个多月后才看到，但这是目前国内参数最大的综合性基座，做复杂多模态 agent 的团队可以直接拿来用，省去从头训练的麻烦。