AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
AI HOT
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月20日
17:31
蚂蚁 inclusionAI:GitHub 新仓库
精选69
DR-Venus:基于开放数据的边缘级深度研究智能体

DR-Venus 是一个仅用1万条开放数据训练的40亿参数深度研究智能体,基于Qwen3-4B-Thinking-2507架构,支持200步工具调用和超20万tokens的上下文。它通过监督微调与强化学习两阶段训练,在BrowseComp、GAIA等多个深度研究基准上树立了小模型性能新标杆。其SFT版本已超越多数同类开源模型,而RL版本进一步将长程任务可靠性和工具使用校准度提升2-3个百分点。项目已全面开源模型、代码与训练流程。

智能体开源/仓库推理模型发布
关联讨论 1 条HuggingFace Daily Papers(社区热门论文)
推荐理由:4B 参数、仅用 1 万条公开数据就能在多个 deep research benchmark 上碾压 8B 对手,蚂蚁 inclusionAI 这次证明了小模型做 Agent 的关键不在参数量而在数据管线,做端侧 Agent 的团队值得拆一下它的 SFT+RL 流程。
15:40
公众号:通义实验室(千问)
精选59
通义千问发布 Qwen3.6-Max-Preview

通义千问发布 Qwen3.6-Max-Preview 预览版,相比 Qwen3.6-Plus 在多项基准上显著提升:智能体编程(SkillsBench +9.9、SciCode +6.3、NL2Repo +5.0、Terminal-Bench 2.0 +3.8)、世界知识(SuperGPQA +2.3、QwenChineseBench +5.3)、指令遵循(ToolcallFormatIFBench +2.8)。新版本支持 preserve_thinking,可在消息中保留前序轮次思维内容,避免多步任务上下文丢失,官方推荐用于智能体开发。用户可登录 Qwen Studio 直接对话,或通过阿里云百炼(即将上线)调用 API。

智能体推理模型发布编码
关联讨论 1 条公众号:通义实验室(千问)
推荐理由:虽然只是个预览版,但 Qwen 3.6 Max 在智能体编程上的提升很扎实,benchmark 跳了 5-10 点,而且支持保留思维链,是我觉得 Agent 开发者最值得立刻上手的新玩具。
4月19日
15:48
TestingCatalog News 🗞@testingcatalog
47
Grok 4.3(测试版)现已向 SuperGrok 和 X Premium+ 用户推出! 测试时间 👀
xAI推理模型发布
4月17日
16:48
蚂蚁 inclusionAI:GitHub 新仓库
精选56
inclusionAI发布LLaDA2.0-Uni模型

LLaDA2.0-Uni是一个统一的多模态模型,具备对世界的理解与生成能力。该模型通过整合视觉、语言等多模态信息,实现了跨模态的语义理解和内容生成。其架构支持从图像理解到文本生成、跨模态检索等复杂任务,标志着多模态人工智能向更通用、统一的方向演进。

多模态开源生态模型发布

推荐理由:蚂蚁 inclusionAI 推出 LLaDA2.0-Uni,主打理解与生成统一架构,但距发布已过两周且信息极少,建议等官方技术报告出来再决定是否跟进。
4月16日
21:22
公众号:通义实验室(千问)
精选62
Qwen3.6-35B-A3B 开源!
开源/仓库模型发布
关联讨论 1 条公众号:通义实验室(千问)
推荐理由:千问又推轻量 MoE 模型,35B 总参激活仅 3B,小团队能跑,但正文就一句宣传语,缺技术细节,先观望。
10:30
公众号:腾讯混元
53
腾讯混元3D世界模型2.0发布:无缝对接游戏工作流
多模态开源生态模型发布
00:07
AK@_akhaliq
55
NVIDIA 在 Hugging Face 上发布了 Lyra 2.0 可探索的生成式 3D 世界 论文: https://huggingface.co/papers/2604.13036 模型: https://huggingface.co/nvidia/Lyra-2.0
多模态开源生态模型发布
4月15日
06:05
Tibo@thsottiaux
69
今天我们推出 GPT-5.4-Cyber 并扩展我们的网络安全可信访问(TAC)计划。 https://openai.com/index/scaling-trusted-access-for-cyber-defense/
OpenAI安全/对齐模型发布
4月14日
22:15
NVIDIA Technical Blog(开发者技术博客 · RSS)
精选55
NVIDIA Ising 推出 AI 驱动的工作流,用于构建容错量子系统

NVIDIA 推出了 Ising 系列开放 AI 模型,专用于构建量子处理器。这是首个此类模型家族,首发包含 Ising Calibration 和 Ising Decoding 两个领域,共同应对量子计算中的根本挑战——量子比特固有的噪声问题,目前最先进的量子处理器每进行约一千次操作就会发生一次错误。

开源生态模型发布

推荐理由:NVIDIA 为构建容错量子系统开源了一组 AI 模型,这大概是头一次有芯片巨头把 AI 正儿八经地往量子纠错里塞,做量子硬件的团队值得跟踪下,看看这能不能成为标准范式。
4月13日
08:56
公众号:MiniMax(稀宇科技)
54
MiniMax M2.7 × Hermes Agent:开启自我进化的 Agent 工作流

MiniMax M2.7 与 Hermes Agent 结合,构建可自我进化的 AI 智能体工作流。

智能体模型发布
4月12日
21:30
公众号:MiniMax(稀宇科技)
精选57
MiniMax M2.7开源,携手全球伙伴加速AI生态繁荣

MiniMax 正式开源 M2.7 模型,并联合全球合作伙伴共同加速人工智能生态的繁荣发展。

开源生态模型发布

推荐理由:MiniMax M2.7 开源了,但官方只丢了个标题,没说比 Llama 强在哪,开源社区又多了一个「我也行」,开发者看一眼就好。
09:02
NVIDIA Technical Blog(开发者技术博客 · RSS)
精选56
MiniMax M2.7在NVIDIA平台上推进可扩展智能体工作流以支持复杂AI应用

MiniMax M2.7作为热门模型MiniMax M2.5的增强版本发布,专为智能体框架及推理、机器学习研究工作流、软件工程、办公工作等复杂用例构建。该模型的开源权重现已通过NVIDIA及开源推理生态系统提供。MiniMax M2系列属于稀疏混合专家模型。

智能体开源生态模型发布
关联讨论 2 条MiniMax:Blog(网页)HuggingFace Daily Papers(社区热门论文)
推荐理由:MiniMax M2.7 作为开源 Agent 模型,重点优化了工具调用和推理效率,虽然已经不是新消息,但对自研 Agent 应用的团队仍有落地参考价值。
4月10日
21:30
公众号:MiniMax(稀宇科技)
30
MiniMax Music 2.6:我们想讲四个人的故事

MiniMax Music 2.6 版本发布,以“四个人的故事”为主题。

多模态模型发布
17:14
公众号:智谱(GLM)
精选59
GLM-5.1获LMArena代码榜开源第一、全球第三

GLM-5.1在LMArena Code Arena登顶开源第一、全球第三。它继承上一代的SOTA编码能力,并在长程任务突破:8小时构建Linux桌面、655次迭代优化向量数据库、1000轮工具调用优化机器学习模型。METR榜下,它是唯一达8小时级持续工作的开源模型(除Claude Opus 4.6外)。

开源生态模型发布编码
关联讨论 1 条公众号:智谱(GLM)
推荐理由:智谱GLM-5.1在LMArena代码榜拿下开源第一,长程任务能力甚至接近闭源顶尖模型,做开源的开发者和团队可以把它放进候选名单了。
4月9日
17:01
公众号:腾讯混元
51
腾讯Robotics X实验室联合混元推出2B具身模型:22项评测16项最佳

腾讯Robotics X实验室与混元联合推出2B参数规模的具身模型,在22项评测中取得16项最佳成绩。该模型旨在为真实世界AI智能体提供基础支撑。

具身智能模型发布
4月8日
14:06
蚂蚁 inclusionAI:HuggingFace 新模型
34
inclusionAI/TC-AE

inclusionAI团队发布了TC-AE项目,旨在通过开源与开放科学推动人工智能技术的进步与民主化。该项目致力于降低AI技术的使用门槛,促进更广泛的社区参与和创新。核心变化在于构建了一个可访问的AI开发框架,强调协作与知识共享。此举预期将加速AI工具在多元领域的应用,并推动技术发展的透明性与包容性。

开源/仓库模型发布
10:41
公众号:智谱(GLM)
精选62
GLM-5.1开源:一个独立工作8小时的模型

智谱推出开源模型GLM-5.1,支持独立工作长达8小时。模型可直接部署使用,无需人工频繁干预,适用于长周期自动化任务场景。

智能体开源生态模型发布
关联讨论 1 条公众号:智谱(GLM)
推荐理由:智谱把 GLM-5.1 开源,并且主打 8 小时独立工作,这个定位切中了 agent 场景下长任务执行的痛点,想做自动化流程的可以跑起来试试。
4月7日
19:32
公众号:蚂蚁百灵(Ling)
52
Ming-flash-omni:从看图到发文,打通全模态创作闭环

Ming-flash-omni 模型具备全模态创作能力,能够同时完成照片中路人干扰的识别、自动修图、修图效果自评,并最终生成一段社交媒体推文,实现从视觉理解到内容发布的完整闭环。

多模态模型发布
4月3日
08:29
Artificial Analysis@ArtificialAnlys
56
微软发布MAI-Transcribe-1语音转录模型,准确率达3.0%

微软AI超级智能团队发布了MAI-Transcribe-1语音转录模型。该模型在Artificial Analysis语音转文本排行榜的AA-WER指标上达到3.0%的词错误率,位列第四,仅次于Mistral Voxtral Small、Google Gemini 3.1 Pro High和ElevenLabs Scribe v2。其处理速度约为实时音频的69倍,属于高速高精度模型。模型支持包括英语、法语、阿拉伯语、日语和中文在内的25种语言,其API目前已在Microsoft Foundry的Azure Speech服务上提供公开预览。

Microsoft模型发布语音
4月2日
19:58
公众号:美团技术团队(LongCat)
37
LongCat-Flash-Prover:AI 攻克数学定理证明,不仅要"算得对",更要"证得严"
推理模型发布
19:58
公众号:美团技术团队(LongCat)
53
美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

美团发布原生多模态模型 LongCat-Next,将视觉与语音作为模型的固有输入输出模态,而非传统语言模型的外部插件。该模型旨在构建能够直接感知、理解并作用于真实世界的 AI 系统,强调多模态能力在底层架构中的原生融合,而非后期拼接。

多模态模型发布
13:46
公众号:阶跃星辰(Step)
42
阶跃 Step 3.5 Flash 系列上新,Step Plan 用户现可体验

阶跃星辰发布 Step 3.5 Flash 系列,主打更快、更好用、更加 Agent-native,面向所有 Step Plan 用户开放体验。

智能体模型发布
12:32
公众号:通义实验室(千问)
54
Qwen3.6-Plus:编码智能体能力全面跃升!
智能体模型发布编码
08:05
公众号:智谱(GLM)
45
智谱发布GLM-5V-Turbo多模态Coding基座模型

智谱今日发布GLM-5V-Turbo,这是一款多模态Coding基座模型,专注于编程场景下的多模态任务处理。

多模态模型发布
4月1日
14:57
公众号:通义实验室(千问)
精选59
Wan2.7-Image:人更真,字更稳,色更准
图像生成模型发布

推荐理由:虽是两月前旧闻,但万相2.7在人像、文字和色彩上的几项硬升级,让国产文生图离实用更近一步,做AI绘画的值得回头补看。
3月30日
21:08
公众号:通义实验室(千问)
精选59
215项SOTA + 自然涌现Vibe Coding!Qwen3.5-Omni发布

Qwen3.5-Omni发布,在215项基准上达到SOTA,并自然涌现出Vibe Coding能力,成为原生全模态新标杆。

多模态模型发布

推荐理由:Qwen3.5-Omni 在 215 项基准上刷到 SOTA,还能自然涌现 Vibe Coding,但已经是两个多月前的消息,现在看到更多是补历史课。做全模态应用的研究者还是值得翻翻技术报告。
3月27日
21:12
公众号:昆仑万维(天工)
54
昆仑万维携AIGC全家桶亮相2026中关村论坛,三大世界第一梯队模型发布

昆仑万维在2026中关村论坛发布AIGC全家桶,其中包括三款达到世界第一梯队的模型。

多模态模型发布
19:21
公众号:智谱(GLM)
52
GLM-5.1已面向所有Coding Plan用户开放

智谱GLM-5.1已面向所有Coding Plan用户开放。

模型发布编码
3月25日
13:15
公众号:昆仑万维(天工)
46
Mureka V8登顶Artificial Analysis双榜单第一

Mureka V8 在 Artificial Analysis 两项榜单中均位列第一。

多模态模型发布
00:00
NVIDIA Technical Blog(开发者技术博客 · RSS)
51
构建用于推理、多模态 RAG、语音和安全的 NVIDIA Nemotron 3 智能体

Agentic AI 是一个由专门模型协同工作,处理规划、推理、检索与安全防护的生态系统。为应对系统扩展需求,开发者需要能理解多模态数据、实现自然对话并安全跨语言模态运行的模型。NVIDIA 在 GTC 2026 上推出了新一代 Nemotron 模型。

智能体检索增强多模态推理
3月24日
15:34
公众号:通义实验室(千问)
51
PrismAudio:声画同频,音效随行

PrismAudio 由通义实验室(千问)开源发布,定位为“更会思考的AI音效师”,能够实现声画同频、音效随行的智能音效生成。

多模态模型发布视频
3月19日
00:48
公众号:小米 MiMo
53
Xiaomi MiMo-V2-Pro & Omni & TTS 全球发布
多模态模型发布语音
00:45
公众号:小米 MiMo
37
Xiaomi MiMo-V2-TTS 发布:为 Agent 注入灵魂,从此刻开始发声
多模态模型发布语音
00:25
公众号:小米 MiMo
49
Xiaomi MiMo-V2-Omni 发布:看得清,听得懂,能动手的全模态 Agent 基座
智能体多模态模型发布
00:23
公众号:小米 MiMo
46
Xiaomi MiMo-V2-Pro 发布:面向 Agent 时代的旗舰基座
智能体模型发布
3月18日
13:39
公众号:MiniMax(稀宇科技)
50
MiniMax M2.7: 开启模型的自我进化

MiniMax 发布 M2.7 模型,主打模型的自我进化能力。该版本在架构或训练方式上实现了关键突破,使模型能够在不依赖人工标注或外部反馈的条件下持续改进自身性能。具体技术细节和评测数据尚未公开。

模型发布
00:00
MiniMax:Blog(网页)
精选61
MiniMax M2.7:自我进化的早期回声

M2.7是M2系列中首个深度参与自身进化的模型。它能构建复杂的智能体框架,完成精细的生产力任务,尤其在软件工程方面表现突出,其SWE-Pro基准测试得分56.22%,接近Opus的最佳水平。模型的办公软件处理能力在开源模型中领先,GDPval-AA的ELO分数为1495。M2.7能保持97%的技能遵循率,处理超过40个、每个超过2000 token的复杂技能。该模型通过内部研究智能体框架,实现了“分析-修改-评估”的自主迭代优化循环,在内部评估中提升了性能。

智能体模型发布编码
关联讨论 2 条MiniMax:Blog(网页)HuggingFace Daily Papers(社区热门论文)
推荐理由:MiniMax M2.7 让模型参与自身进化,在 SWE-Pro 和 VIBE-Pro 上接近 Opus 水平,Agent Teams 设计也值得看,但整体仍是追赶者姿态。
3月16日
10:30
公众号:智谱(GLM)
35
GLM-5-Turbo:龙虾增强的基座模型

智谱发布GLM-5-Turbo基座模型,该模型采用了龙虾增强技术,被描述为“龙虾增强的基座模型”,是一款基于龙虾增强的基座模型。

模型发布
3月10日
11:54
公众号:腾讯混元
精选59
混元世界模型再进化:开源首个面向世界模型的强化学习后训练框架WorldCompass
多模态开源生态模型发布

推荐理由:这是国内大厂首次开源世界模型的RL后训练框架,虽然发布有段时间,但做具身智能和多模态生成的团队仍可直接白嫖代码和模型,省去不少造轮子的时间。
3月9日
18:00
公众号:小红书技术(dots.llm)
52
REDSearcher:30B参数深度搜索Agent超越GPT-5,低成本可扩展

REDSearcher是一个30B参数的深度搜索Agent,性能超越GPT-5,同时实现低成本与可扩展性。

智能体搜索模型发布
‹ 上一页
1…181920212223
下一页 ›