AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 728 条
全部一手资讯X论文
标签「模型发布」清除
5月29日周五
07:21IT之家(RSS)64Claude Opus 4.8 上线:提升 AI 编程可靠性,减少无依据结论
06:18MarkTechPost(RSS)72Anthropic发布Claude Opus 4.8,同步推出动态工作流与更便宜的快速模式,工作流最多支持1000个子智能体
05:42The Decoder:AI News(RSS)71Anthropic 发布 Claude Opus 4.8:被称作"小幅但实在的改进",在多数基准测试中超越 GPT-5.5
02:42xAI:News(网页)82精选Grok Build 0.1 on API
01:14The Verge:AI(RSS)68Claude 的新模型在"出错时更'诚实'"
01:14TechCrunch:AI(RSS)72同事件精选Anthropic 发布 Opus 4.8 并推出新型"动态工作流"工具同一事件,精选展示《Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级》
01:08Hacker News 热门(buzzing.cc 中文翻译)87克劳德 作品4.8
01:05Anthropic:Newsroom(网页)85精选Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
5月28日周四
23:19IT之家(RSS)60消息称微软下周将推全新编程模型,以争取开发者群体认可
15:37The Decoder:AI News(RSS)60ElevenLabs Music v2 实现从歌剧到重金属的流派转换而不失音乐连贯性
02:35The Decoder:AI News(RSS)55微软 MAI-Image-2.5 在基准测试中追平谷歌 Nano Banana 2
5月27日周三
16:14IT之家(RSS)44MiniMax预告M3系列模型,并回顾M2.x系列技术细节
14:14IT之家(RSS)629.4 秒生成 512×512 图像,Bonsai Image 4B 生图 AI 登陆苹果 iPhone 17 Pro Max
14:14IT之家(RSS)63微软最强生图 AI 模型 MAI-Image-2.5 冲上 Arena 第三:更强文字生成
11:19HuggingFace Daily Papers(社区热门论文)72同事件精选MiniMax-M2系列:微小激活释放最大真实世界智能同一事件,精选展示《MiniMax M2.7:自我进化的早期回声》
06:37MarkTechPost(RSS)61Stability AI 发布 Stable Audio 3:用于音频生成与编辑的快速潜在扩散模型家族
5月26日周二
14:11IT之家(RSS)76精选面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上
13:11IT之家(RSS)77同事件精选谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题同一事件,精选展示《AlphaProof Nexus:用形式化验证驱动AI数学证明搜索》
13:11IT之家(RSS)67昆仑万维天工 AI 发布 SkyClaw-v1.0:面向真实工作流的百万上下文 Agent 模型
11:35公众号:面壁智能(MiniCPM)59面壁智能联合清华大学、OpenBMB发布端侧文本基座模型MiniCPM5-1B
11:30公众号:昆仑万维(天工)53天工AI发布SkyClaw-v1.0:面向真实工作流的百万上下文Agent模型
09:11IT之家(RSS)59Anthropic 或公开最强模型 Mythos,曾短暂现身多款产品
07:11IT之家(RSS)74精选OpenAI GPT-5.6 模型曝下月发布:AI 上下文 150 万 tokens
5月25日周一
18:49蚂蚁 inclusionAI:HuggingFace 新模型71同事件精选<中文标题>SingGuard: 策略自适应多模态护栏模型族开源</中文标题>同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
18:48蚂蚁 inclusionAI:HuggingFace 新模型69同事件精选蚂蚁 inclusionAI 发布策略自适应多模态安全护栏模型 Sing-Guard-8b同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
18:48蚂蚁 inclusionAI:HuggingFace 新模型68同事件精选inclusionAI 发布 Sing-Guard-2b:策略自适应多模态大模型安全护栏同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
15:25蚂蚁 inclusionAI:GitHub 新仓库67精选蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard
15:11IT之家(RSS)52马斯克宣布 Grok V9-Medium 1.5T 模型完成训练:加入大量 Cursor 数据,两到三周内发布
12:11IT之家(RSS)72同事件精选面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN同一事件,精选展示《首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布》
11:35公众号:面壁智能(MiniCPM)59面壁智能联合清华开源中国首个基于昇腾训练的1.58-bit端侧大模型 BitCPM-CANN
07:06MarkTechPost(RSS)61阶跃星辰发布StepAudio 2.5 Realtime:一款具有角色扮演RLHF和副语言理解的端到端语音模型
5月24日周日
16:06MarkTechPost(RSS)56NVIDIA发布Gated DeltaNet-2:解耦Delta规则中擦除与写入的线性注意力层
5月23日周六
18:27The Decoder:AI News(RSS)65阿里巴巴最新AI模型自主运行35小时为自研芯片优化代码
15:09IT之家(RSS)56让机器人拥有"肌肉记忆",智元推出新一代二阶段 BFM-2 基座模型
11:09IT之家(RSS)65微软推出 Fara1.5 系列浏览器 AI 智能体模型,72% 任务成功率超 OpenAI Operator
08:16Hugging Face:Blog(RSS)63精选NVIDIA 发布 Nemotron-Labs Diffusion 系列模型,支持三种生成模式
5月22日周五
20:09IT之家(RSS)75阿里千问 App、PC 端及网页端接入全新一代大模型 Qwen3.7-Max
18:09IT之家(RSS)70精选网易有道"子曰4"多模态模型、语音合成模型全量开源
16:35MarkTechPost(RSS)66微软发布Fara1.5浏览器操作智能体系列:性能超越OpenAI Operator与Gemini 2.5
15:09IT之家(RSS)70美团开源 LongCat-Video-Avatar 1.5:数字人视频从"彩排"走向"真舞台",生成 10 秒视频仅需 1 分钟
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月29日
07:21
IT之家(RSS)
64
Claude Opus 4.8 上线:提升 AI 编程可靠性,减少无依据结论
Anthropic推理模型发布编码
06:18
MarkTechPost(RSS)
72
Anthropic发布Claude Opus 4.8,同步推出动态工作流与更便宜的快速模式,工作流最多支持1000个子智能体

Anthropic推出Claude Opus 4.8,在Claude Code中引入动态工作流和更便宜的快速模式,目前处于研究预览阶段。工作流最多可调用1000个子智能体执行任务。

Anthropic模型发布编码
关联讨论 12 条X:Claude Devs (@ClaudeDevs)X:Boris Cherny (@bcherny)X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)X:OpenRouter (@OpenRouter)X:Thariq (@trq212)X:Kim (@kimmonismus)X:Claude (@claudeai)X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)
05:42
The Decoder:AI News(RSS)
71
Anthropic 发布 Claude Opus 4.8:被称作"小幅但实在的改进",在多数基准测试中超越 GPT-5.5

Anthropic 发布其最新模型 Claude Opus 4.8。该模型在大多数基准测试中超越了 GPT-5.5 和 Gemini 3.1 Pro。其代码错误自动捕获能力是前代产品的四倍。同步推出动态工作流功能,可启动数百个并行子智能体来处理跨代码库迁移等任务。

Anthropic推理模型发布
关联讨论 12 条X:Claude Devs (@ClaudeDevs)X:Boris Cherny (@bcherny)X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)X:OpenRouter (@OpenRouter)X:Thariq (@trq212)X:Kim (@kimmonismus)X:Claude (@claudeai)X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)
02:42
xAI:News(网页)
精选82
Grok Build 0.1 on API

xAI 的最新编码模型 Grok Build 0.1 已通过 xAI API 进入公开测试阶段。该模型专为智能体编码任务训练,支持网页开发、调试和 MCP,同时也是驱动 Grok Build CLI 的同一模型。其推理速度超过 100 tokens/秒,定价为输入 $1/m tokens,输出 $2/m tokens。除编码外,它也适用于通用智能体及工具调用场景,并可通过 OpenRouter 和 Vercel AI Gateway 获取。

xAI模型发布编码
关联讨论 4 条X:xAI (@xai)X:Elon Musk (@elonmusk, xAI)X:阿易 AI Notes (@AYi_AInotes)X:Testing Catalog (@testingcatalog)
推荐理由:xAI 把编码模型卷到了 100+ t/s 和 $2/M 输出,专攻 agentic coding,这是直接在叫板 Claude Code 和 Cursor,做开发工具的同行该重新算账了。
01:14
The Verge:AI(RSS)
68
Claude 的新模型在"出错时更'诚实'"

Anthropic 在周四发布了其最新模型 Claude Opus 4.8。新模型在生成错误内容时,更倾向于主动标示不确定性,并减少做出无根据的断言。在内部评估中,其产出未经证实断言的可能性比前代模型降低约 4 倍。

Anthropic安全/对齐模型发布
01:14
TechCrunch:AI(RSS)
同事件精选72
Anthropic 发布 Opus 4.8 并推出新型"动态工作流"工具

Anthropic 发布了最新的 Opus 4.8 大语言模型,并为该模型引入了一个名为“Dynamic Workflows”的新工具。该工具旨在协调由多个子代理组成的群组,以执行复杂任务。

智能体Anthropic推理模型发布
同一事件,精选展示《Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级》
推荐理由:Opus 4.8 是 Anthropic 对 Opus 4.7 失望反应的快速回应,亮点不在跑分而在模型能主动标记不确定性,这比正确率更实用。动态工作流让跨子 agent 的代码迁移成为现实,开发团队值得关注。
01:08
Hacker News 热门(buzzing.cc 中文翻译)
87
克劳德 作品4.8

Anthropic 发布了新版模型 Claude Opus 4.8。该模型的具体技术参数、性能基准与定价等详情暂未提供。本文提供了其官方公告页面的链接,并记录了该新闻在 Hacker News 上的讨论热度。

Anthropic推理模型发布
关联讨论 12 条X:Claude Devs (@ClaudeDevs)X:Boris Cherny (@bcherny)X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)X:OpenRouter (@OpenRouter)X:Thariq (@trq212)X:Kim (@kimmonismus)X:Claude (@claudeai)X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)
01:05
Anthropic:Newsroom(网页)
精选85
Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级

Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用,价格与前代相同。同步推出的新功能包括:用户可控制任务投入程度、Claude Code 新增“动态工作流”特性,以及 Opus 4.8 的 2.5 倍速模式价格降低为以往的三分之一。早期测试者反馈其在智能体任务中的判断力更可靠、工具调用更高效。该模型在 Online-Mind2Web 测评中得分 84%,超越了 Opus 4.7 和 GPT-5.5。此外,其诚实度与对齐表现也得到提升,代码错误漏检率降低了约 75%。

智能体Anthropic推理模型发布
关联讨论 12 条X:Claude Devs (@ClaudeDevs)X:Boris Cherny (@bcherny)X:Artificial Analysis (@ArtificialAnlys)X:洪明 (@hongming731)X:OpenRouter (@OpenRouter)X:Thariq (@trq212)X:Kim (@kimmonismus)X:Claude (@claudeai)X:Rohan Paul (@rohanpaul_ai)X:邵猛 (@shao__meng)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)
推荐理由:Opus 4.8看着是常规升级,但动态工作流让Claude Code能啃下跨十万行代码迁移这种硬骨头,快速模式降价三倍更是直接拉低了实时场景的入场券。
5月28日
23:19
IT之家(RSS)
60
消息称微软下周将推全新编程模型,以争取开发者群体认可

微软计划在下周Build大会发布多款自研AI模型,旨在争取开发者认可。其中将包含一款编程专用模型,以提升GitHub Copilot的竞争力,应对Cursor与Claude Code等对手的挑战。同时,微软还将推出多款不同规格的新模型,具备语音转写、逻辑推理、语音处理及图像生成等技能。

Microsoft多模态模型发布编码
15:37
The Decoder:AI News(RSS)
60
ElevenLabs Music v2 实现从歌剧到重金属的流派转换而不失音乐连贯性

ElevenLabs 发布了升级版 AI 音乐生成模型 Music v2。该模型支持跨流派创作,单首乐曲可实现从歌剧到重金属再到说唱的风格转换,并保持音乐连贯性。新功能支持音乐局部重新生成,允许用户在不修改乐曲其他部分的情况下,对特定片段进行重写。

多模态模型发布
02:35
The Decoder:AI News(RSS)
55
微软 MAI-Image-2.5 在基准测试中追平谷歌 Nano Banana 2

微软的 MAI-Image-2.5 在 Arena 文本生成图像排行榜上排名第三,与谷歌的 Nano Banana 2 持平,但仍落后于 OpenAI 的 Image-2。该模型相比其前代产品有显著提升,特别是在渲染图像内文字和商业视觉效果方面。

Microsoft多模态模型发布
5月27日
16:14
IT之家(RSS)
44
MiniMax预告M3系列模型,并回顾M2.x系列技术细节

MiniMax在X平台预告即将推出M3系列AI模型,并关联到一篇回顾M2.x系列的论文。论文指出,M2.x系列总参数229.9B,但每个词元仅激活9.8B参数,配备192K上下文窗口,预训练数据规模达29.2T词元。模型采用62层Transformer架构和256个专家(每词元激活8个),其训练系统是基于智能体的强化学习系统Forge。论文还披露,M2.7已展现出“自我进化”雏形,能自主排查训练错误并修改代码,已吸收团队30%至50%的日常迭代工作量。

模型发布行业动态
14:14
IT之家(RSS)
62
9.4 秒生成 512×512 图像,Bonsai Image 4B 生图 AI 登陆苹果 iPhone 17 Pro Max
图像生成模型发布端侧
14:14
IT之家(RSS)
63
微软最强生图 AI 模型 MAI-Image-2.5 冲上 Arena 第三:更强文字生成
Microsoft图像生成多模态模型发布
11:19
HuggingFace Daily Papers(社区热门论文)
同事件精选72
MiniMax-M2系列:微小激活释放最大真实世界智能

MiniMax推出M2系列大语言模型。其旗舰模型M2采用混合专家(MoE)架构,总参数229.9B,每个token仅激活9.8B参数。该系列专为智能体部署设计,基于三大组件构建:智能体驱动的数据管道、可扩展的智能体原生强化学习系统Forge,以及展示早期自我进化能力的M2.7检查点。这种设计使其在智能体编码、深度搜索、办公任务及推理基准测试中达到了前沿性能水平。

智能体推理模型发布
同一事件,精选展示《MiniMax M2.7:自我进化的早期回声》
推荐理由:MiniMax 把激活参数压到 9.8B 却敢喊前沿,整套 design 都是为 agent 场景重做的,搞 agent 的开发者该认真看一眼这个信号。
06:37
MarkTechPost(RSS)
61
Stability AI 发布 Stable Audio 3:用于音频生成与编辑的快速潜在扩散模型家族

Stability AI 发布了 Stable Audio 3,这是一个用于器乐和音效生成的潜在扩散模型家族。此次发布包含 Small 和 Medium 两个开放权重变体。Small 变体可在 MacBook Pro M4 CPU 上运行,Medium 变体适配 8GB 显存的消费级显卡。两者均采用流匹配、蒸馏预热和对抗后训练的三阶段流水线,以生成 44.1 kHz 的立体声音频。在 BBC Sound Effects 基准测试(5秒片段)中,SA3 Medium 的 FAD 得分为 0.369,优于论文中评估的所有开放权重基线。

多模态模型发布语音
5月26日
14:11
IT之家(RSS)
精选76
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。该模型仅1B参数,在AA-Index榜单上超越所有2B参数以下模型,相比3个月前的Qwen3.5-2B效果更优且参数量减半。经INT4量化后权重仅0.5GB,支持在手机和浏览器上运行。其Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,现已全面开源模型权重、训练数据集与部署方案。

开源生态模型发布端侧

推荐理由:1B参数干翻所有2B以下模型,量化后0.5GB就能塞进手机和浏览器,这个效率把端侧模型的门槛又压低了,做移动端AI的值得跟进。
13:11
IT之家(RSS)
同事件精选77
谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
智能体DeepMind开源生态推理
同一事件,精选展示《AlphaProof Nexus:用形式化验证驱动AI数学证明搜索》
推荐理由:AlphaProof Nexus 不是刷榜,是真解了 Erdős 难题,56 年悬而未决的那两道——这说明 AI 开始从具身数学题爬向纯数学研究了,做理论的人该认真看一眼。
13:11
IT之家(RSS)
67
昆仑万维天工 AI 发布 SkyClaw-v1.0:面向真实工作流的百万上下文 Agent 模型

昆仑万维天工AI近日正式推出高性能智能体模型SkyClaw-v1.0及其轻量化版本SkyClaw-v1.0-lite。该模型支持百万token上下文,深度适配真实智能体工作场景,重点优化了复杂工具调用、多轮任务执行与代码生成等能力。在多项智能体基准测试中,其性能超越了MiniMax 2.7、DeepSeek V4 Flash等开源模型,并接近DeepSeek V4 Pro、Claude Opus 4.6等更大规模模型。该模型定价极具竞争力,已接入天工Skywork,并提供2至4周免费试用。

智能体模型发布编码
11:35
公众号:面壁智能(MiniCPM)
59
面壁智能联合清华大学、OpenBMB发布端侧文本基座模型MiniCPM5-1B

面壁智能联合清华大学、OpenBMB开源社区发布并开源MiniCPM5-1B,一款1B参数的端侧文本基座大模型。其在AA-Index榜单得分17.9分,超越所有2B以下参数模型,包括Qwen3.5-2B(16.3分),验证了智能密度约每3.5个月翻一番的密度定律。INT4量化后权重仅0.5GB,可运行于手机、浏览器等终端。Base Model由AI训练框架ForgeTrain(全球首个完全由AI编写,训练速度比Megatron快10%)在华为昇腾上预训练完成。模型全面开源权重、训练数据集Ultra-FineWeb-L3及部署方案,支持Llama_factory、SGLang、vLLM等主流框架。

Hugging Face开源生态推理模型发布
11:30
公众号:昆仑万维(天工)
53
天工AI发布SkyClaw-v1.0:面向真实工作流的百万上下文Agent模型

天工AI今日推出SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite,支持百万token上下文,深度适配复杂工具调用、多轮任务执行、代码生成与文件编辑等智能体场景。模型在主流Agent benchmark上全面超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6,在OpenClaw任务上接近更大规模模型,定价低于Minimax 2.7与Qwen 3.6一半。训练采用大规模mid-train、合成轨迹SFT与端到端Agentic RL优化,适配OpenClaw、Hermes、Claude Code等主流Agent框架。模型已于5月22日接入天工Skywork,开放2至4周免费试用,并提供兼容OpenAI格式的免费API调用。

智能体模型发布编码
09:11
IT之家(RSS)
59
Anthropic 或公开最强模型 Mythos,曾短暂现身多款产品

据科技媒体报道,Anthropic 似乎准备公开上线其前沿模型 Claude Mythos 预览版。该模型名称“claude-mythos-1-preview”曾短暂出现在 Claude Code 和 Claude Security 的公开版本中。Claude Mythos 定位为面向计算机安全任务的模型,相比现有旗舰模型 Opus 4.7,在代码推理和自主执行方面有显著提升。但因其能力过强,Anthropic 担忧公开发布可能带来安全风险,目前尚未全面开放。同时,Anthropic 还在推进名为“Glasswing”的联合项目,旨在保护关键软件系统。

Anthropic安全/对齐模型发布
07:11
IT之家(RSS)
精选74
OpenAI GPT-5.6 模型曝下月发布:AI 上下文 150 万 tokens

多名开发者在 OpenAI Codex 后端日志中发现未官宣的 GPT-5.6 模型,内部代号 iris-alpha。该模型将支持 150 万 token 的上下文窗口,较当前 GPT-5.5 的 105 万 token 提升约 43%,有望于今年 6 月发布。测试显示,在输入达到 90 万 token 时仍能流畅响应。同系列还发现了 ember-alpha 与 beacon-alpha 版本。此外,GPT-5.6 在前端界面生成能力上也有所提升。基于爆料信息,Anthropic Claude、Google Gemini 及 xAI Grok 也可能瞄准同期发布新模型。

OpenAI模型发布编码

推荐理由:开发者从后端日志扒出 GPT-5.6,150 万上下文是真香,直接生成商用级前端界面更让人眼馋,这代模型值得等。
5月25日
18:49
蚂蚁 inclusionAI:HuggingFace 新模型
同事件精选71
<中文标题>SingGuard: 策略自适应多模态护栏模型族开源</中文标题>

<中文摘要>SingGuard 是一个策略自适应的多模态护栏模型族,包含 Sing-Guard-4b 和 Sing-Guard-8b 两个版本。它将安全策略作为运行时输入而非固定分类,部署团队可自定义自然语言规则而无需重训练模型。支持文本、图像、图文、多语言以及查询端与响应端的安全评估,提供快速和快慢结合两种推理模式。在涵盖多模态安全、纯图像安全、文本查询/响应安全、多语言查询/响应安全六大类基准上取得平均 SOTA 表现。模型已开源至 HuggingFace 和 ModelScope。</中文摘要>

Hugging Face多模态安全/对齐模型发布
同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
推荐理由:蚂蚁的 SingGuard 把安全策略变成了运行时输入,意味着审核规则可以随时改而不必重训模型,这对做内容安全的产品人是真省事,值得跟进。
18:48
蚂蚁 inclusionAI:HuggingFace 新模型
同事件精选69
蚂蚁 inclusionAI 发布策略自适应多模态安全护栏模型 Sing-Guard-8b

SingGuard 是蚂蚁 inclusionAI 推出的策略自适应多模态大语言模型安全护栏模型族(版本 Sing-Guard-8b),支持纯文本、纯图像、图文混合、多语言查询与回复的安全评估。其核心设计将安全策略作为运行时输入,部署团队可基于默认分类或自定义自然语言规则评估内容,无需重新训练模型。模型内置 fast-slow 动态推理流程:首 token 路由快速输出安全信号,需深度推理时继续生成更精确的最终判断。在涵盖多模态安全、纯图像安全、文本查询与回复安全、多语言查询与回复安全的六大基准测试上取得平均 SOTA 性能,并已开源至 HuggingFace 与 ModelScope。

Hugging Face多模态安全/对齐开源/仓库
同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
推荐理由:蚂蚁集团开源的多模态内容审核模型,最大亮点是运行时动态注入安全策略而不需重训,对需要灵活定制审核规则的团队是低门槛的高分工程实现。
18:48
蚂蚁 inclusionAI:HuggingFace 新模型
同事件精选68
inclusionAI 发布 Sing-Guard-2b:策略自适应多模态大模型安全护栏

inclusionAI 开源了 Sing-Guard 模型家族,版本包括 Sing-Guard-2b 和 Sing-Guard-8b。该模型将安全策略作为运行时输入,支持文本、图像、图文及多语言场景的查询侧

Hugging Face多模态安全/对齐模型发布
同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
推荐理由:SingGuard把安全策略变成运行时输入,不用再为新规则重新训练模型,这对需要频繁调整审核标准的团队来说是个实用的发布。
15:25
蚂蚁 inclusionAI:GitHub 新仓库
精选67
蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard

SingGuard 是蚂蚁 inclusionAI 开源的多模态安全护栏模型族,提供 2B、4B、8B 三个参数版本。它将安全策略作为运行时输入,支持文本、图像、图文、多语言及查询/回复侧的安全评估,无需重新训练即可适配不同规则。采用快慢动态推理机制,在低延迟场景下输出紧凑判断,对模糊或高风险内容进行策略引导的推理。在多模态安全、图像安全、文本查询与回复安全、多语言查询与回复安全等基准上达到 SOTA 平均性能。模型已上架 HuggingFace 和 ModelScope。

多模态安全/对齐模型发布

推荐理由:蚂蚁 inclusionAI 把安全护栏做成了“运行时可配置”的模型,换审核规则不用重训,对需要快速适配法规的团队是个真需求。不过生态刚起步,暂时还是小众工具。
15:11
IT之家(RSS)
52
马斯克宣布 Grok V9-Medium 1.5T 模型完成训练:加入大量 Cursor 数据,两到三周内发布
xAI模型发布编码
12:11
IT之家(RSS)
同事件精选72
面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
开源生态模型发布端侧
同一事件,精选展示《首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布》
推荐理由:谁说国产算力只能跑小模型?面壁这个1.58-bit模型在昇腾上原生训练,直接把8B塞进旗舰手机,开源全套训练底座,做端侧的该看一眼。
11:35
公众号:面壁智能(MiniCPM)
59
面壁智能联合清华开源中国首个基于昇腾训练的1.58-bit端侧大模型 BitCPM-CANN

面壁智能联合清华大学正式开源中国首个基于昇腾训练的1.58-bit端侧大模型BitCPM-CANN,实现6倍显存效率提升,可将60B参数大模型封装进手机等端侧设备。

推理模型发布端侧
07:06
MarkTechPost(RSS)
61
阶跃星辰发布StepAudio 2.5 Realtime:一款具有角色扮演RLHF和副语言理解的端到端语音模型

阶跃星辰于2026年5月发布StepAudio 2.5 Realtime,这是一款支持完全可定制个性化角色的端到端实时语音大语言模型。该模型通过WebSocket API提供服务,支持中英文。在2026年4月进行的五个基准测试维度中均排名第一,具体包括80.41的人类评测得分和82.18的副语言理解得分。

模型发布语音
5月24日
16:06
MarkTechPost(RSS)
56
NVIDIA发布Gated DeltaNet-2:解耦Delta规则中擦除与写入的线性注意力层

NVIDIA推出了改进的线性注意力模型Gated DeltaNet-2。其核心创新在于将Delta规则中控制记忆擦除与写入的单一门控机制,解耦为两个独立的通道级门控。该模型参数规模为1.3B,在100B个FineWeb-Edu令牌数据上训练。实验表明,它在语言建模、常识推理和长上下文检索等任务中全面超越了Mamba-2、Gated DeltaNet、KDA及Mamba-3等现有模型,尤其在RULER S-NIAH和多关键针检索任务中取得了最显著的性能提升。

推理搜索模型发布
5月23日
18:27
The Decoder:AI News(RSS)
65
阿里巴巴最新AI模型自主运行35小时为自研芯片优化代码

阿里巴巴云千问团队发布Qwen3.7-Max,这是一款专为长时间自主智能体任务设计的闭源模型。该模型曾在单次会话中持续运行35小时,为阿里巴巴自研的专用芯片优化代码。在标准基准测试中,Qwen3.7-Max的表现与Claude Opus 4.6持平,并超越了国内竞品如DeepSeek V4 Pro和Kimi K2.6。此外,团队还现场演示了该模型指挥一个四足机器人执行任务的能力。

智能体模型发布编码
15:09
IT之家(RSS)
56
让机器人拥有"肌肉记忆",智元推出新一代二阶段 BFM-2 基座模型

智元于5月23日发布新一代二阶段运动控制基座模型BFM-2,其核心特点是让机器人具备“肌肉记忆”。该模型使机器人能在静态、预设动作或随机输入等任意状态下,自主完成高稳定性的动作插值与动态任务闭环,为具身智能提供可靠的运动基础。演示视频显示,搭载该模型的机器人在被击倒后能快速自主站起并恢复平衡。

具身智能数据/训练模型发布
11:09
IT之家(RSS)
65
微软推出 Fara1.5 系列浏览器 AI 智能体模型,72% 任务成功率超 OpenAI Operator

微软研究院发布了 Fara1.5 系列浏览器 AI 智能体模型,包含 4B、9B 和 27B 三个版本。该模型专为浏览器操作设计,能读取截图并输出鼠标键盘指令。其 27B 版本在 Online-Mind2Web 基准测试中取得 72% 的任务成功率,显著超过 OpenAI Operator(58.3%)和 Gemini 2.5 Computer Use(57.3%)。模型基于约 200 万样本微调训练,并具备安全机制,在关键操作前会主动向用户确认。

智能体Microsoft模型发布
08:16
Hugging Face:Blog(RSS)
精选63
NVIDIA 发布 Nemotron-Labs Diffusion 系列模型,支持三种生成模式

NVIDIA 发布 Nemotron-Labs Diffusion 系列,含 3B、8B、14B 文本模型和 8B 视觉-语言模型(VLM),均采用商用友好的 NVIDIA Nemotron Open Model License 或 NVIDIA Source Code License。模型支持自回归、扩散(逐块并行生成后逐步精炼)和自推测(扩散草拟候选 token 再自回归验证)三种模式。8B 模型平均准确率比 Qwen3 8B 提升 1.2%,扩散模式每次前向传递的 token 数(TPF)达自回归的 2.6 倍,自推测达 6–6.4 倍。模型在 1.3T tokens 上预训练、45B tokens 上微调,代码与模型已发布于 HuggingFace 和 GitHub,推理将获 SGLang 支持。

多模态推理模型发布

推荐理由:自推测模式让文本生成速度飙到AR模型的4倍,而且输出质量无损。NVIDIA这次开源的不仅是个新模型,更是一套能直接用在现有流程里的加速方案。
5月22日
20:09
IT之家(RSS)
75
阿里千问 App、PC 端及网页端接入全新一代大模型 Qwen3.7-Max

5月22日,阿里千问App官方宣布,千问App、PC端及网页端接入全新一代大模型Qwen3.7-Max。用户需将千问App更新至6.9.7及以上版本,即可免费体验该模型。Qwen3.7-Max定位为全能的智能体基座,核心能力覆盖编程开发、办公流程自动化及超长周期任务执行。官方实测显示,在一项长达35小时、包含超过1000次工具调用的全自主内核优化实验中,该模型保持了连贯推理。此外,模型具备跨框架泛化能力,并即将通过阿里云百炼平台提供API调用服务。

智能体MCP/工具模型发布
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)
18:09
IT之家(RSS)
精选70
网易有道"子曰4"多模态模型、语音合成模型全量开源

网易有道宣布将其“子曰”大模型4.0的多模态模型与语音合成模型面向全球全量开源。其中,多模态模型(27B参数)专注于教育场景,在处理高难度视觉数理问题上达到行业顶尖水平,纯文本中文数理难题准确率为81.4%。该模型通过思维链优化,将输出长度压缩43.2%,有效降低了推理成本。同时开源的语音合成模型支持跨语种音色与情感迁移克隆,3秒内即可完成零样本复制,准确度超97%,并支持包括中、英、日、韩在内的14种语言。

多模态开源生态推理模型发布

推荐理由:有道把垂直教育的多模态模型全量开源,27B参数在视觉数理上做到SOTA,还把思维链压缩了43%,推理成本实打实下降,做教育应用的可以拿来做二次开发;TTS的跨语种情感克隆也实用,3秒克隆14种语言。
16:35
MarkTechPost(RSS)
66
微软发布Fara1.5浏览器操作智能体系列:性能超越OpenAI Operator与Gemini 2.5

微软研究院近日推出Fara1.5系列浏览器操作智能体,包含4B、9B和27B三种参数规模。其中最大模型Fara1.5-27B在Online-Mind2Web基准测试中达到72%的准确率,显著优于OpenAI Operator、Gemini 2.5 Computer Use等主流模型。此次发布同步推出FaraGen1.5合成数据流水线,可在受控环境中高效训练智能体,为自动化浏览器操作提供了新解决方案。

智能体MCP/工具Microsoft模型发布
15:09
IT之家(RSS)
70
美团开源 LongCat-Video-Avatar 1.5:数字人视频从"彩排"走向"真舞台",生成 10 秒视频仅需 1 分钟

美团技术团队开源了数字人视频生成模型 LongCat-Video-Avatar 1.5。该版本在唇形同步、物理合理性、长视频稳定性和多人互动方面全面升级,支持复杂语音输入与多种主体。通过 DMD 蒸馏技术,推理效率提升约 15 倍,生成 10 秒视频仅需约 1 分钟。在性能评测中,模型在四个关键维度表现领先,用户偏好对比中胜率均超 54%,旨在推动数字人视频从技术演示走向商业应用。

开源生态推理模型发布视频
关联讨论 1 条美团 LongCat:HuggingFace 新模型
‹ 上一页
1…678910…19
下一页 ›