AIHOT

AI HOT

4月24日

11:24

Ethan Mollick@emollick

现在又有了新的DeepSeek模型，而且似乎是完全开放权重的。基准测试成绩不错，但对于开源模型来说，这并不总是那么有意义。应该很快就能实际体验了。

DeepSeek开源/仓库模型发布

11:24

Chubby♨️@kimmonismus

Deepseek v4 pro 评测。大致与 GPT-5.4 xhigh 和 opus 4.6 max 相当

DeepSeek模型发布评测/基准

11:24

Chubby♨️@kimmonismus

Deepseek v4 相比 DeepSeek 3 是一次巨大的飞跃，在 SWE verified 上超越了 opus 4.6 和 GPT-5.4，并在 Codeforces 上创造了新纪录。但仍需针对 opus 4.7 和 GPT-5.5 进行测试，并观察实际使用是否如其承诺般出色。重大发布！顶尖的开源模型！

DeepSeek开源生态模型发布编码

10:44

小互@xiaohu

GPT-5.5评测重回榜首，性能提升但幻觉率仍高

在独立评测中，GPT-5.5以3分优势超越Anthropic和Google的模型，重回性能榜首。其API定价大幅上涨，输入与输出费用分别达到每百万5美元和30美元，但token消耗减少了约40%。模型通过自我编写的算法进行了优化，使token生成速度提升超过20%。尽管知识准确率达到57%的历史新高，但其幻觉率也高达86%，显示出性能与可靠性之间的显著矛盾。

OpenAI模型发布评测/基准

08:08

IT之家（RSS）

小米发布 MiMo-V2.5-TTS / ASR 语音大模型：通过自然语言调度声音表现

小米发布全链路语音大模型系列MiMo-V2.5，包含TTS（语音合成）与ASR（语音识别）两大核心。TTS系列包含三款模型：基础版内置多款音色并支持精细控制；VoiceDesign版可一句话生成新音色；VoiceClone版能通过少量样本高保真复刻音色。三者均支持通过自然语言指令和音频标签精细调度声音表现，已在小米MiMo开放平台限时免费。ASR模型已正式开源，在中英双语、方言、强噪音及多人对话等复杂场景下的识别性能达到业界领先水平。

开源生态模型发布语音

08:00

Hugging Face：Blog（RSS）

精选78

DeepSeek-V4：智能体可实际使用的百万token上下文

DeepSeek发布新一代模型DeepSeek-V4，其核心突破在于实现了长达百万token的上下文窗口，并确保智能体能够有效利用这一扩展的上下文能力。该模型延续了通过开源与开放科学推动人工智能发展与普及的使命，标志着大模型在长上下文理解和实际应用方面迈出重要一步。

智能体DeepSeek开源生态模型发布

关联讨论 5 条

推荐理由：DeepSeek 把上下文窗口推到百万 token 不稀奇，关键是「agent 能实际用」这六个字。如果实测成立，RAG 的很多工程妥协可以扔掉了，做长文档和复杂 agent 的人该第一时间跑一遍。

02:21

TestingCatalog News 🗞@testingcatalog

OPENAI 🚨： GPT-5.5 正在觉醒 👀

OpenAI模型发布

4月23日

08:00

蚂蚁百灵：Developer Blog（网页）

精选67

Ling-2.6-flash 发布：更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题，Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化，旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s，在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平，保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程

关联讨论 2 条

推荐理由：蚂蚁百灵这次打的是「省 token」这张牌，104B 总参但只激活 7.4B，Agent 场景评测对齐同尺寸 SOTA，输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。

01:10

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/LLaDA2.0-Uni

inclusionAI团队发布了LLaDA2.0-Uni模型。该版本在统一的多模态理解与生成能力上取得显著进展，支持图像、文本、音频等多种输入与输出模态。模型参数量达到约70B，在多项基准测试中，其综合性能较前代提升超过15%。此次发布延续了通过开源与开放科学来推动人工智能民主化的核心使命。

开源/仓库模型发布端侧

4月22日

18:16

TestingCatalog News 🗞@testingcatalog

OPENAI 🚨： GPT-5.5 和一系列内部模型名称最近在 Codex 上被发现，这通常意味着 OpenAI 正准备发布一个新模型。 - oai-2.1 - arcanine - glacier-alpha - glacier-alpha-block-cy4 - glacier-alpha-block-cy3 很快 👀 致谢 @TheAhmadOsman

OpenAI模型发布

关联讨论 7 条

4月21日