AIHOT

4月27日

14:19

IT之家（RSS）

OpenAI 发布 Privacy Filter：1.5B 参数 PII 脱敏模型，Apache 2.0 开源上线

OpenAI开源了15亿参数的PII脱敏模型Privacy Filter，采用混合专家设计，每次仅激活约5000万参数，可在笔记本电脑等设备上运行。它能根据上下文识别姓名、地址等八类敏感信息，在基准测试中F1分数达97.43%。该模型作为本地预过滤层，帮助用户在文本发送至云端AI前脱敏数据，但高敏感场景仍需结合人工审核。

OpenAI开源生态模型发布部署/工程

13:18

IT之家（RSS）

未来三年小米 AI 投入超 600 亿元：MiMo-V2.5 将开源，几乎适配国内所有芯片

小米宣布未来三年在AI领域的投入将超过600亿元。其基座大模型MiMo开始收费后用户留存率超过35%，即将开源的MiMo-V2.5模型在AA智能与Agent指数上位列全球开源大模型并列第一，并几乎适配国内所有芯片。小米首代机器人VLA大模型团队仅用6个月完成开发，并判断机器人的“GPT3时刻”将在未来1-2年到来。在企业效率方面，小米预计通过全面拥抱Agent技术，整体效率将提升500%。此外，小米的智能助理Miclaw未来将与小爱同学全面融合，并贯通人车家全生态设备。

智能体开源生态模型发布

08:00

HuggingFace Daily Papers（社区热门论文）

Nemotron 3 Nano Omni：高效开放的多模态智能模型

Nemotron 3 Nano Omni是该系列最新模型，首次原生支持音频、文本、图像和视频输入。通过架构、训练数据及方法的改进，其在所有模态上的准确性均超越前代Nemotron Nano V2 VL，尤其在真实文档理解、长音视频理解和智能体计算机使用方面表现领先。该模型基于高效的Nemotron 3 Nano 30B-A3B骨干网络，并融入创新的多模态令牌缩减技术，实现了比同类规模模型更低的推理延迟和更高的吞吐量。为促进后续研发，团队发布了BF16、FP8和FP4格式的模型检查点，以及部分训练数据和代码库。

多模态开源生态模型发布

4月26日

23:20

向阳乔木@vista8

精选85

OpenAI发布GPT-5.5，重点提升AI自主执行复杂任务能力

OpenAI发布GPT-5.5，核心目标是增强模型自主规划与执行多步骤复杂任务的能力，减少人工干预。在多项基准测试中表现突出：在Terminal-Bench 2.0、FrontierMath Tier 4等复杂任务上超越GPT-5.4及Claude Opus等竞品；在GDPval知识工作与OSWorld-Verified真实电脑操作测试中也保持领先。其代码能力更优且效率更高，科研能力显著提升，甚至辅助发现了拉姆齐数的新证明。尽管模型更大更强，其响应速度与GPT-5.4持平。

OpenAI推理模型发布编码

关联讨论 22 条

推荐理由：GPT-5.5 的核心叙事不是跑分，而是从「回答问题」到「把事做完」的范式切换。长上下文检索翻倍、代码任务更聪明且更省 token，这两个信号叠加在一起，做 Agent 和科研工具的人该认真评估了。

03:51

swyx 🇸🇬@swyx

精选70

DeepSeek团队正式推出并开源了DeepSeek-V4预览版模型，标志着高性价比的百万上下文长度时代到来。该系列包含两个模型：DeepSeek-V4-Pro拥有1.6万亿总参数和490亿活跃参数，性能媲美顶级闭源模型；DeepSeek-V4-Flash则拥有2840亿总参数和130亿活跃参数，主打快速、高效与经济。模型现已在官方平台通过专家模式和即时模式开放试用，API也已同步更新。完整的技术报告和模型权重已在Hugging Face平台发布，供社区研究和应用。

DeepSeek: 🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length. 🔹 Dee...

DeepSeek开源生态模型发布

关联讨论 5 条

推荐理由：DeepSeek-V4 把 MoE 推到 1.6T 总参、49B 活跃，百万上下文 + 开源权重，这是开源阵营第一次在旗舰级闭源模型面前不落下风，做长上下文应用的团队该认真测一下了。

4月25日

22:17

meng shao@shao__meng

腾讯混元发布首个重建基础设施后模型「Hy3 preview」

腾讯混元团队在重建基础设施后，推出首个MoE架构模型Hy3 preview，总参295B，支持256K上下文。团队确立能力体系化、评测真实性、性价比三大原则，推动模型向实用转型。评估显示，Hy3在复杂推理与长上下文任务上进入第一梯队，代码与智能体能力进步显著。其突出亮点是能深度挖掘非结构化对话中的隐含约束，并转化为结构化输出，体现了强大的实际应用潜力。

Tencent Hy: 👋Hi /haɪ/, we're the Tencent Hy /haɪ/ team🐧 Today, we open source Hy3 preview (295B A21B), a leading reasoning and age...

开源/仓库推理模型发布编码

关联讨论 3 条

21:36

歸藏(guizang.ai)@op7418

精选79

DeepSeek推出V4模型限时2.5折优惠，其Pro版百万Token输出成本仅6元。模型分为Pro版（总参数1.6T）和Flash版（总参数284B），预训练数据均为32T。在应用中，专家模式对应Pro版，快速模式对应Flash版。测评显示其性能与Claude Opus 4.6持平，Agent能力与世界知识显著增强，并采用新注意力机制以降低计算需求。

歸藏(guizang.ai): DeepSeek V4详细的官方公告也发了: 模型参数 (a) Pro 版本:总参数 1.6T,激活参数 49B (b) Flash 版本:总参数 284B,激活参数 13B (c) 预训练数据量:均为 32T 模式区分(网页端与 APP)...

DeepSeek推理模型发布

关联讨论 5 条

推荐理由：DeepSeek V4-Pro 百万 token 输出只要 6 块，这个定价直接把 Opus 4.6 级别的能力拉到了白菜价，做 Agent 和长上下文应用的产品人该重新算账了。

20:47

The Decoder：AI News（RSS）

Qwen3.6-27B 在多数编程基准测试中击败了规模大得多的前代模型

阿里巴巴新发布的开源模型 Qwen3.6-27B 在多项编程基准测试中超越了其前代模型。该模型仅拥有 270 亿参数，而其前代模型的参数量是其 15 倍。这一结果表明，模型在代码能力上实现了显著的效率提升，以更小的规模取得了更优的性能。

开源生态模型发布编码

关联讨论 5 条

19:13

Berryxia.AI@berryxia

开源OCR模型性能突破，支持90余种语言与完整布局解析

一款新的开源OCR模型在olmocr基准测试中达到85.9%的SOTA性能。该模型参数量为40亿，由90亿参数精简而来，支持超过90种语言并附带基准测试。其核心能力包括保留完整的文档布局信息，能从图像和图表中提取并生成说明文字，同时对手写文本、数学公式、表单及表格具备强大的识别与解析支持。

多模态开源/仓库模型发布

19:11

阿绎 AYi@AYi_AInotes

长篇小说AI创作工具autonovel发布，基于Ling-2.6-flash实现极速生成

autonovel是基于Ling-2.6-flash的AI写作工具，专为长篇小说创作优化。它能以200+ tokens/s的速度生成文本，大幅提升创作效率，并在上下文一致性、伏笔回收和人物性格保持方面表现突出，帮助作者从繁琐的码字劳动中解放，更专注于故事构思。目前提供免费体验额度。

阿绎 AYi: 后续来了兄弟们,卧槽真的太炸了,同样的任务,同样的配置,速度比Claude Sonnet 4.6还快 6 倍,成本低约 50 倍, openrouter 和官方 API 均限时免费 1 周使用时间,白嫖的机会,冲啊兄弟们! 我上周那条讲E...

智能体模型发布部署/工程

03:12

Greg Brockman@gdb

精选72

gpt-5.5 在性能上实现大幅提升，试试看吧：

Satya Nadella: Super excited GPT-5.5 is rolling out to GitHub Copilot, M365 Copilot, Copilot Studio, and Foundry today. With deeper rea...

OpenAI推理模型发布编码

关联讨论 22 条

推荐理由：GPT-5.5 本身是代际级更新，但这条推文只是转发 Nadella 的官宣，没有新数据或新角度。真正值得关注的是它已经铺进 Copilot 全线，做编码和办公场景的人今天就能摸到。

02:08

AK@_akhaliq

精选74

DeepSeek-V4 论文已在 Hugging Face 发布 paper： https：//huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

DeepSeek推理模型发布

关联讨论 6 条

推荐理由：DeepSeek-V4 论文终于落地，这是今年开源阵营最被期待的模型之一，做推理和开源部署的同行值得花时间啃一遍技术细节。

4月24日

22:17

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/DR-Venus-4B-SFT-GGUF

该项目致力于通过开源与开放科学推动人工智能的发展与普及。团队正持续推进技术民主化进程，旨在让更广泛的群体能够接触并利用先进AI工具。其核心路径是依托开放协作模式，降低技术门槛，促进创新生态的构建。

开源/仓库模型发布端侧

19:08

IT之家（RSS）

美团万亿级大模型 LongCat-2.0-Preview 开放测试，全程基于国产算力集群训练

美团新一代基础大模型LongCat-2.0-Preview已开放邀请测试，其总参数规模突破万亿，采用混合专家架构，整体能力被认为对标GPT-4。关键突破在于该模型完全基于国产化算力集群训练完成，标志着美团在此领域取得领先。此前，美团创始人王兴已披露公司持续投入数十亿美元保障算力供应。去年9月，美团曾开源基于相同架构、拥有5600亿参数的首款自研大模型LongCat-Flash。

开源生态数据/训练模型发布

14:19

Artificial Analysis@ArtificialAnlys

小米发布MiMo V2.5 Pro模型，智能与代理能力表现强劲

小米于2026年4月22日发布MiMo V2.5 Pro模型，其在Artificial Analysis智能指数得分54，表现强劲。该模型在代理能力上领先，Agentic Index得分67%，优于Kimi K2.6等开源模型，这主要得益于在τ²-Bench和TerminalBench Hard上的优异表现。此外，其在前沿推理和指令遵循方面也有提升。模型具有1M上下文窗口，1T总参数，API定价具有成本效益，运行同一智能指数仅需462美元。不过，其在事实准确性指数上得分4，存在准确率较低的问题。模型采用MIT许可证，权重暂未公开，目前可通过小米官方API使用。

智能体开源生态模型发布