AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「模型发布」清除
5月26日周二
11:30公众号:昆仑万维(天工)53天工AI发布SkyClaw-v1.0:面向真实工作流的百万上下文Agent模型
10:59Tencent Hy69腾讯混元新翻译模型双榜亮眼,小程序发布
09:55Alibaba Cloud16Anthropic发布Claude Code新功能
09:11IT之家(RSS)59Anthropic 或公开最强模型 Mythos,曾短暂现身多款产品
07:11IT之家(RSS)74精选OpenAI GPT-5.6 模型曝下月发布:AI 上下文 150 万 tokens
03:20Emad58Grok V9-Medium完成训练,2至3周内发布
5月25日周一
18:49蚂蚁 inclusionAI:HuggingFace 新模型71同事件精选<中文标题>SingGuard: 策略自适应多模态护栏模型族开源</中文标题>同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
18:48蚂蚁 inclusionAI:HuggingFace 新模型69同事件精选蚂蚁 inclusionAI 发布策略自适应多模态安全护栏模型 Sing-Guard-8b同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
18:48蚂蚁 inclusionAI:HuggingFace 新模型68同事件精选inclusionAI 发布 Sing-Guard-2b:策略自适应多模态大模型安全护栏同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
15:25蚂蚁 inclusionAI:GitHub 新仓库67精选蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard
15:11IT之家(RSS)52马斯克宣布 Grok V9-Medium 1.5T 模型完成训练:加入大量 Cursor 数据,两到三周内发布
15:08🚨 AI News | TestingCatalog48Grok新模型V9-Medium即将发布
13:50Elon Musk71精选Grok V9-Medium模型完成训练即将发布
13:21小互61影眸科技发布 Rodin Gen-2.5 3D 生成模型
12:11IT之家(RSS)72同事件精选面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN同一事件,精选展示《首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布》
11:35公众号:面壁智能(MiniCPM)59面壁智能联合清华开源中国首个基于昇腾训练的1.58-bit端侧大模型 BitCPM-CANN
07:06MarkTechPost(RSS)61阶跃星辰发布StepAudio 2.5 Realtime:一款具有角色扮演RLHF和副语言理解的端到端语音模型
06:27Chubby♨️71Google DeepMind的AlphaProof Nexus自主解决多个开放数学问题
5月24日周日
16:06MarkTechPost(RSS)56NVIDIA发布Gated DeltaNet-2:解耦Delta规则中擦除与写入的线性注意力层
07:27Chubby♨️542026年AI大模型发布呈现谨慎与意外交织的戏剧性场面
07:07🚨 AI News | TestingCatalog65Anthropic准备发布Claude Mythos 1模型
06:49StepFun76精选StepAudio实时语音发布,能听懂你的语气与言外之意
05:27Chubby♨️56GPT-5.6即将发布,UI优化有进展
00:57Chubby♨️66Claude Opus 4.8现身Vertex平台引关注
5月23日周六
18:27The Decoder:AI News(RSS)65阿里巴巴最新AI模型自主运行35小时为自研芯片优化代码
15:09IT之家(RSS)56让机器人拥有"肌肉记忆",智元推出新一代二阶段 BFM-2 基座模型
11:09IT之家(RSS)65微软推出 Fara1.5 系列浏览器 AI 智能体模型,72% 任务成功率超 OpenAI Operator
08:16Hugging Face:Blog(RSS)63精选NVIDIA 发布 Nemotron-Labs Diffusion 系列模型,支持三种生成模式
06:37🚨 AI News | TestingCatalog65Anthropic Mythos级模型将在强化安全后发布
5月22日周五
22:56Rohan Paul75精选首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
22:19Runway71Runway发布Aleph 2.0视频编辑模型
20:26Chubby♨️41六月将迎来多款重磅AI模型发布
20:09IT之家(RSS)75阿里千问 App、PC 端及网页端接入全新一代大模型 Qwen3.7-Max
19:20Alibaba Cloud69Qwen3.7-Max上线Model Studio享五折优惠
19:20Alibaba Cloud79Qwen3.7-Max上线Model Studio享五折优惠
18:50Alibaba Cloud82Qwen3.7-Max上线Model Studio享五折优惠
18:19Qwen77Qwen3.7-Max上线OpenRouter,主打智能体任务
18:09IT之家(RSS)70精选网易有道"子曰4"多模态模型、语音合成模型全量开源
16:35MarkTechPost(RSS)66微软发布Fara1.5浏览器操作智能体系列:性能超越OpenAI Operator与Gemini 2.5
15:09IT之家(RSS)70美团开源 LongCat-Video-Avatar 1.5:数字人视频从"彩排"走向"真舞台",生成 10 秒视频仅需 1 分钟
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月26日
11:30
公众号:昆仑万维(天工)
53
天工AI发布SkyClaw-v1.0:面向真实工作流的百万上下文Agent模型

天工AI今日推出SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite,支持百万token上下文,深度适配复杂工具调用、多轮任务执行、代码生成与文件编辑等智能体场景。模型在主流Agent benchmark上全面超越Minimax 2.7、DeepSeek V4 Flash及Qwen 3.6,在OpenClaw任务上接近更大规模模型,定价低于Minimax 2.7与Qwen 3.6一半。训练采用大规模mid-train、合成轨迹SFT与端到端Agentic RL优化,适配OpenClaw、Hermes、Claude Code等主流Agent框架。模型已于5月22日接入天工Skywork,开放2至4周免费试用,并提供兼容OpenAI格式的免费API调用。

智能体模型发布编码
10:59
Tencent Hy@TencentHunyuan
69
腾讯混元新翻译模型双榜亮眼,小程序发布

腾讯混元发布翻译模型 Hy-MT2,在 Hugging Face 开源模型趋势排行榜上表现突出:1.8B 版本排名第一,30B-A3B(MoE)版本排名第四,下载量已超 7K。官方同步推出了基于该模型的“腾讯混译”微信小程序,支持语音输入与离线翻译,并可自定义翻译风格与指令。模型代码与权重已开源。

Hugging Face开源生态模型发布
关联讨论 2 条X:腾讯混元 (@TencentHunyuan)IT之家(RSS)
09:55
Alibaba Cloud@alibaba_cloud
16
Anthropic发布了Claude Code的更新,现在它可以在后台运行任务。
模型发布
09:11
IT之家(RSS)
59
Anthropic 或公开最强模型 Mythos,曾短暂现身多款产品

据科技媒体报道,Anthropic 似乎准备公开上线其前沿模型 Claude Mythos 预览版。该模型名称“claude-mythos-1-preview”曾短暂出现在 Claude Code 和 Claude Security 的公开版本中。Claude Mythos 定位为面向计算机安全任务的模型,相比现有旗舰模型 Opus 4.7,在代码推理和自主执行方面有显著提升。但因其能力过强,Anthropic 担忧公开发布可能带来安全风险,目前尚未全面开放。同时,Anthropic 还在推进名为“Glasswing”的联合项目,旨在保护关键软件系统。

Anthropic安全/对齐模型发布
07:11
IT之家(RSS)
精选74
OpenAI GPT-5.6 模型曝下月发布:AI 上下文 150 万 tokens

多名开发者在 OpenAI Codex 后端日志中发现未官宣的 GPT-5.6 模型,内部代号 iris-alpha。该模型将支持 150 万 token 的上下文窗口,较当前 GPT-5.5 的 105 万 token 提升约 43%,有望于今年 6 月发布。测试显示,在输入达到 90 万 token 时仍能流畅响应。同系列还发现了 ember-alpha 与 beacon-alpha 版本。此外,GPT-5.6 在前端界面生成能力上也有所提升。基于爆料信息,Anthropic Claude、Google Gemini 及 xAI Grok 也可能瞄准同期发布新模型。

OpenAI模型发布编码

推荐理由:开发者从后端日志扒出 GPT-5.6,150 万上下文是真香,直接生成商用级前端界面更让人眼馋,这代模型值得等。
03:20
Emad@EMostaque
58
xAI的Grok基础模型V9-Medium(1.5T参数)已完成训练,评测结果良好。在补充训练中加入了大量Cursor数据。该模型即将开始微调,几天后启动强化学习,预计2至3周后向公众发布。这将是相较于目前服务所有Grok生产流量的0.5T参数v8-small模型的重大改进,尤其在复杂编码任务上。有人推测其后训练可能使用了类似Cursor调整Kimi时远超预训练的计算量。

Elon Musk: Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...

xAI模型发布编码
5月25日
18:49
蚂蚁 inclusionAI:HuggingFace 新模型
同事件精选71
<中文标题>SingGuard: 策略自适应多模态护栏模型族开源</中文标题>

<中文摘要>SingGuard 是一个策略自适应的多模态护栏模型族,包含 Sing-Guard-4b 和 Sing-Guard-8b 两个版本。它将安全策略作为运行时输入而非固定分类,部署团队可自定义自然语言规则而无需重训练模型。支持文本、图像、图文、多语言以及查询端与响应端的安全评估,提供快速和快慢结合两种推理模式。在涵盖多模态安全、纯图像安全、文本查询/响应安全、多语言查询/响应安全六大类基准上取得平均 SOTA 表现。模型已开源至 HuggingFace 和 ModelScope。</中文摘要>

Hugging Face多模态安全/对齐模型发布
同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
推荐理由:蚂蚁的 SingGuard 把安全策略变成了运行时输入,意味着审核规则可以随时改而不必重训模型,这对做内容安全的产品人是真省事,值得跟进。
18:48
蚂蚁 inclusionAI:HuggingFace 新模型
同事件精选69
蚂蚁 inclusionAI 发布策略自适应多模态安全护栏模型 Sing-Guard-8b

SingGuard 是蚂蚁 inclusionAI 推出的策略自适应多模态大语言模型安全护栏模型族(版本 Sing-Guard-8b),支持纯文本、纯图像、图文混合、多语言查询与回复的安全评估。其核心设计将安全策略作为运行时输入,部署团队可基于默认分类或自定义自然语言规则评估内容,无需重新训练模型。模型内置 fast-slow 动态推理流程:首 token 路由快速输出安全信号,需深度推理时继续生成更精确的最终判断。在涵盖多模态安全、纯图像安全、文本查询与回复安全、多语言查询与回复安全的六大基准测试上取得平均 SOTA 性能,并已开源至 HuggingFace 与 ModelScope。

Hugging Face多模态安全/对齐开源/仓库
同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
推荐理由:蚂蚁集团开源的多模态内容审核模型,最大亮点是运行时动态注入安全策略而不需重训,对需要灵活定制审核规则的团队是低门槛的高分工程实现。
18:48
蚂蚁 inclusionAI:HuggingFace 新模型
同事件精选68
inclusionAI 发布 Sing-Guard-2b:策略自适应多模态大模型安全护栏

inclusionAI 开源了 Sing-Guard 模型家族,版本包括 Sing-Guard-2b 和 Sing-Guard-8b。该模型将安全策略作为运行时输入,支持文本、图像、图文及多语言场景的查询侧

Hugging Face多模态安全/对齐模型发布
同一事件,精选展示《蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard》
推荐理由:SingGuard把安全策略变成运行时输入,不用再为新规则重新训练模型,这对需要频繁调整审核标准的团队来说是个实用的发布。
15:25
蚂蚁 inclusionAI:GitHub 新仓库
精选67
蚂蚁 inclusionAI 开源多模态安全护栏模型 SingGuard

SingGuard 是蚂蚁 inclusionAI 开源的多模态安全护栏模型族,提供 2B、4B、8B 三个参数版本。它将安全策略作为运行时输入,支持文本、图像、图文、多语言及查询/回复侧的安全评估,无需重新训练即可适配不同规则。采用快慢动态推理机制,在低延迟场景下输出紧凑判断,对模糊或高风险内容进行策略引导的推理。在多模态安全、图像安全、文本查询与回复安全、多语言查询与回复安全等基准上达到 SOTA 平均性能。模型已上架 HuggingFace 和 ModelScope。

多模态安全/对齐模型发布

推荐理由:蚂蚁 inclusionAI 把安全护栏做成了“运行时可配置”的模型,换审核规则不用重训,对需要快速适配法规的团队是个真需求。不过生态刚起步,暂时还是小众工具。
15:11
IT之家(RSS)
52
马斯克宣布 Grok V9-Medium 1.5T 模型完成训练:加入大量 Cursor 数据,两到三周内发布
xAI模型发布编码
15:08
🚨 AI News | TestingCatalog@testingcatalog
48
Grok基础模型V9-Medium(参数规模1.5T)已完成训练,评估结果良好,预计2-3周内向公众发布。该模型相较于当前服务所有Grok生产流量的0.5T v8-Small版本有巨大改进,尤其针对高难度编码任务。训练中加入了大量Cursor数据,并且未来还会有更多补充训练。目前微调已进行,强化学习将在几天内开始。

Elon Musk: Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplem...

xAI模型发布编码
13:50
Elon Musk@elonmusk
精选71
Grok基础模型V9-Medium(1.5T)已完成训练。评估结果良好。补充训练中加入了大量Cursor数据,后续还会有更多。 微调正在进行中,强化学习将在几天后开始。预计2到3周内公开发布。 这将比当前服务所有Grok生产流量的0.5T v8-small模型有重大改进,尤其在复杂编码任务上。
xAI模型发布编码

推荐理由:Grok 参数翻到 1.5T,还专门喂了 Cursor 代码数据,这波升级明显奔着 coding 去的。如果 evals 不注水,两周后的 coding 排行榜可能变天。
13:21
小互@xiaohu
61
影眸科技发布 Rodin Gen-2.5 3D 生成模型

影眸科技推出 Rodin Gen-2.5,号称全球首个千万面级 3D 生成模型。该模型提供从极低(4秒)到极高(80秒)的五档思考模式,以平衡生成速度与细节精度。其原生 3D 贴图算法能在三维空间直接生成纹理,支持 PBR 材质与 360° 无死角覆盖,并提供 Faithful(贴合参考)与 Creative(自动优化)两种贴图模式。该模型已获 SIGGRAPH 2025 最佳论文奖。

多模态模型发布
12:11
IT之家(RSS)
同事件精选72
面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
开源生态模型发布端侧
同一事件,精选展示《首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布》
推荐理由:谁说国产算力只能跑小模型?面壁这个1.58-bit模型在昇腾上原生训练,直接把8B塞进旗舰手机,开源全套训练底座,做端侧的该看一眼。
11:35
公众号:面壁智能(MiniCPM)
59
面壁智能联合清华开源中国首个基于昇腾训练的1.58-bit端侧大模型 BitCPM-CANN

面壁智能联合清华大学正式开源中国首个基于昇腾训练的1.58-bit端侧大模型BitCPM-CANN,实现6倍显存效率提升,可将60B参数大模型封装进手机等端侧设备。

推理模型发布端侧
07:06
MarkTechPost(RSS)
61
阶跃星辰发布StepAudio 2.5 Realtime:一款具有角色扮演RLHF和副语言理解的端到端语音模型

阶跃星辰于2026年5月发布StepAudio 2.5 Realtime,这是一款支持完全可定制个性化角色的端到端实时语音大语言模型。该模型通过WebSocket API提供服务,支持中英文。在2026年4月进行的五个基准测试维度中均排名第一,具体包括80.41的人类评测得分和82.18的副语言理解得分。

模型发布语音
06:27
Chubby♨️@kimmonismus
71
Google DeepMind的AlphaProof Nexus自主解决多个开放数学问题

Google DeepMind的AlphaProof Nexus系统自主解决了9个开放的Erdős问题(部分问题存在56年),每个问题的成本约几百美元。它还证明了44个OEIS猜想,解决了一个15年的代数几何问题,并在优化理论中发现了新算法参数。其核心机制是将大语言模型的推理能力与Lean形式化验证系统结合,Lean自动检查每一步逻辑,无需人工复核。研究发现,一个仅交替使用大语言模型生成与编译器反馈的基础智能体,便能复现全部9个Erdős问题的成功。该系统还能检测并修正现有数学文献中的表述错误。其局限在于成功案例集中于Lean数学库成熟的领域(如组合、数论),仍无法解决需要全新理论的大问题。

DeepMind开源生态推理模型发布
5月24日
16:06
MarkTechPost(RSS)
56
NVIDIA发布Gated DeltaNet-2:解耦Delta规则中擦除与写入的线性注意力层

NVIDIA推出了改进的线性注意力模型Gated DeltaNet-2。其核心创新在于将Delta规则中控制记忆擦除与写入的单一门控机制,解耦为两个独立的通道级门控。该模型参数规模为1.3B,在100B个FineWeb-Edu令牌数据上训练。实验表明,它在语言建模、常识推理和长上下文检索等任务中全面超越了Mamba-2、Gated DeltaNet、KDA及Mamba-3等现有模型,尤其在RULER S-NIAH和多关键针检索任务中取得了最显著的性能提升。

推理搜索模型发布
07:27
Chubby♨️@kimmonismus
54
2026年AI大模型发布呈现鲜明对比与戏剧性。OpenAI采取审慎策略,通过"可信访问"机制,向验证过的安全专家限量推出GPT-5.5-Cyber。与之形成反差的是,Anthropic官方曾宣称其Claude Mythos模型因过于强大不适合公开发布,但该模型却意外短暂出现在用户界面中,并导致服务容量告罄。现有信息表明,Anthropic正为Claude Mythos(代号claude-mythos-1-preview)在Claude Code与Claude Security等企业产品线上的发布做准备,但这并不等同于面向公众的全面开放。整个过程充满了计划与意外的交织。

🚨 AI News | TestingCatalog: ANTHROPIC 🔥: Mythos 1, "claude-mythos-1-preview", is being prepared for a release on Claude Code and Claude Security. T...

AnthropicOpenAI大佬观点模型发布
07:07
🚨 AI News | TestingCatalog@testingcatalog
65
ANTHROPIC 🔥:Mythos 1,即"claude-mythos-1-preview",正准备在Claude Code和Claude Security上发布。 该模型曾在Claude上短暂可见;此外,新增了提及Mythos的字符串。 > 在Claude Code和Claude Security中访问Claude Mythos模型。 根据Anthropic之前的沟通,这仍不意味着公众将能访问此确切模型。 更多详情请见下方 👇
Anthropic推理模型发布
06:49
StepFun@StepFun_ai
精选76
StepAudio实时语音发布,能听懂你的语气与言外之意

StepAudio 2.5 Realtime 是一款实时语音交互模型。其核心优势在于能感知用户的副语言特征,如语气、节奏、停顿甚至轻叹,从而理解话语背后的真实意图。该模型支持通过 API 高度定制角色人格与说话风格,内置超过10,000种可组合的预置角色,并提供5种开箱即用的预设角色供体验。同时,模型经过RLHF优化,能在复杂的角色扮演压力测试中稳定保持设定的人设。支持中英文双语交互。

模型发布语音

推荐理由:StepFun 这个语音模型把副语言感知做进了实时 API,产品人想搞点情感化语音交互的可以试试,预设角色能省不少调 prompt 的功夫。
05:27
Chubby♨️@kimmonismus
56
看起来 GPT-5.6 的发布非常接近了。真的很期待。5.5 已经是一个极其出色的模型了。希望它在"感觉"上能再好一点。 【引用 @synthwavedd】:我非常激动地宣布,看起来他们开始在 GPT-5.6 的 UI 去臃肿化方面取得进展了!🥹 这是第一个没有任何 UI 指引("默认")的提示词效果--我们正在取得进展……

leo 🐾: i am absolutely THRILLED to announce that it appears they're beginning to make strides on UI de-slopification with GPT-5...

OpenAI模型发布
00:57
Chubby♨️@kimmonismus
66
在Google Vertex上发现了Opus 4.8。不过这一点尚无法确认。 然而,自数据泄露以来,Sonnet 4.8即将到来已是众所周知。 Opus 4.8出现在Vertex上让我感到意外--不过,考虑到加速的发布节奏和GPT-5.5的巨大成功,这确实有可能。 简直太令人兴奋了!

can: claude-opus-4.8 is on Google Vertex 👀

Anthropic模型发布行业动态
5月23日
18:27
The Decoder:AI News(RSS)
65
阿里巴巴最新AI模型自主运行35小时为自研芯片优化代码

阿里巴巴云千问团队发布Qwen3.7-Max,这是一款专为长时间自主智能体任务设计的闭源模型。该模型曾在单次会话中持续运行35小时,为阿里巴巴自研的专用芯片优化代码。在标准基准测试中,Qwen3.7-Max的表现与Claude Opus 4.6持平,并超越了国内竞品如DeepSeek V4 Pro和Kimi K2.6。此外,团队还现场演示了该模型指挥一个四足机器人执行任务的能力。

智能体模型发布编码
15:09
IT之家(RSS)
56
让机器人拥有"肌肉记忆",智元推出新一代二阶段 BFM-2 基座模型

智元于5月23日发布新一代二阶段运动控制基座模型BFM-2,其核心特点是让机器人具备“肌肉记忆”。该模型使机器人能在静态、预设动作或随机输入等任意状态下,自主完成高稳定性的动作插值与动态任务闭环,为具身智能提供可靠的运动基础。演示视频显示,搭载该模型的机器人在被击倒后能快速自主站起并恢复平衡。

具身智能数据/训练模型发布
11:09
IT之家(RSS)
65
微软推出 Fara1.5 系列浏览器 AI 智能体模型,72% 任务成功率超 OpenAI Operator

微软研究院发布了 Fara1.5 系列浏览器 AI 智能体模型,包含 4B、9B 和 27B 三个版本。该模型专为浏览器操作设计,能读取截图并输出鼠标键盘指令。其 27B 版本在 Online-Mind2Web 基准测试中取得 72% 的任务成功率,显著超过 OpenAI Operator(58.3%)和 Gemini 2.5 Computer Use(57.3%)。模型基于约 200 万样本微调训练,并具备安全机制,在关键操作前会主动向用户确认。

智能体Microsoft模型发布
08:16
Hugging Face:Blog(RSS)
精选63
NVIDIA 发布 Nemotron-Labs Diffusion 系列模型,支持三种生成模式

NVIDIA 发布 Nemotron-Labs Diffusion 系列,含 3B、8B、14B 文本模型和 8B 视觉-语言模型(VLM),均采用商用友好的 NVIDIA Nemotron Open Model License 或 NVIDIA Source Code License。模型支持自回归、扩散(逐块并行生成后逐步精炼)和自推测(扩散草拟候选 token 再自回归验证)三种模式。8B 模型平均准确率比 Qwen3 8B 提升 1.2%,扩散模式每次前向传递的 token 数(TPF)达自回归的 2.6 倍,自推测达 6–6.4 倍。模型在 1.3T tokens 上预训练、45B tokens 上微调,代码与模型已发布于 HuggingFace 和 GitHub,推理将获 SGLang 支持。

多模态推理模型发布

推荐理由:自推测模式让文本生成速度飙到AR模型的4倍,而且输出质量无损。NVIDIA这次开源的不仅是个新模型,更是一套能直接用在现有流程里的加速方案。
06:37
🚨 AI News | TestingCatalog@testingcatalog
65
Anthropic在Project Glasswing项目最新进展中宣布,Mythos级模型在开发出更强的安全防护措施后,预计将向公众开放。此前,Anthropic与合作伙伴通过该项目已发现超过一万个关键或高危软件漏洞。这为模型后续的强安全防护开发提供了重要背景与方向。

Anthropic: Last month we launched Project Glasswing, our collaborative AI cybersecurity initiative. Since then, we and our partners...

Anthropic安全/对齐模型发布
5月22日
22:56
Rohan Paul@rohanpaul_ai
精选75
首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三元大模型。其核心创新在于采用仅含三种权重状态的极低比特量化技术,使模型内存占用相比BF16降低约6倍,可高效部署于手机、电脑、车载设备等边缘端。更关键的是,整个训练全栈(从量化算子到框架)均在昇腾上原生构建与验证,而非简单移植。该模型家族(0.5B-8B)在多项基准测试上保持了全精度模型95-97%的性能,为资源受限环境下部署和复现大模型提供了可落地的解决方案。

OpenBMB: 🚀 BitCPM-CANN by ModelBest × @Tsinghua_Uni × OpenBMB is here - and it's not about stacking parameters. Memory costs are...

开源/仓库模型发布端侧

推荐理由:首个开源的1.58-bit三元LLM,直接在昇腾芯片上原生训练,内存压缩到BF16的六分之一,8B模型就能跑在手机上,做端侧部署的可以立刻上手试试了。
22:19
Runway@runwayml
71
昨日我们发布了Aleph 2.0,这是我们升级后的视频编辑模型,可让您在保持其他内容不变的情况下,精确修改所需部分。该模型现已集成于全新的Edit Studio中,支持处理最长30秒、1080p分辨率的多镜头序列。 立即通过Runway Academy学习如何开始使用。
模型发布视频
关联讨论 2 条X:Runway (@runwayml)Runway:News(网页)
20:26
Chubby♨️@kimmonismus
41
六月将是巨大的一个月。 - Gemini 3.5 pro(已确认) - GPT-5.6(传闻中,但发布可能性很高) 仍在等待官方公告 Claude Sonnet 4.8(Claude-Code-/Source-Map-Leak)
GoogleOpenAI大佬观点模型发布
20:09
IT之家(RSS)
75
阿里千问 App、PC 端及网页端接入全新一代大模型 Qwen3.7-Max

5月22日,阿里千问App官方宣布,千问App、PC端及网页端接入全新一代大模型Qwen3.7-Max。用户需将千问App更新至6.9.7及以上版本,即可免费体验该模型。Qwen3.7-Max定位为全能的智能体基座,核心能力覆盖编程开发、办公流程自动化及超长周期任务执行。官方实测显示,在一项长达35小时、包含超过1000次工具调用的全自主内核优化实验中,该模型保持了连贯推理。此外,模型具备跨框架泛化能力,并即将通过阿里云百炼平台提供API调用服务。

智能体MCP/工具模型发布
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)
19:20
Alibaba Cloud@alibaba_cloud
69
Qwen3.7-Max现已在Model Studio上线,限时五折(5月22日至6月22日)! 可靠的跨框架支持。专为一键部署和无缝集成到现有技术栈而设计。 🚀 立即体验:https://int.alibabacloud.com/m/1000413314/
模型发布部署/工程
19:20
Alibaba Cloud@alibaba_cloud
79
Qwen3.7-Max现已登陆Model Studio,限时五折(5月22日至6月22日)! 100万上下文窗口。专为在长上下文智能体推理中,无缝处理和保留大规模企业数据流而构建。 🚀 立即体验:https://int.alibabacloud.com/m/1000413314/
推理模型发布
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)
18:50
Alibaba Cloud@alibaba_cloud
82
Qwen3.7-Max现已登陆Model Studio,限时五折(5月22日至6月22日)! 旗舰级编程智能体性能。专为可靠、多步骤的软件执行而设计,最大限度减少人工干预。 🚀 立即体验:https://int.alibabacloud.com/m/1000413314/
智能体模型发布编码
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)
18:19
Qwen@Alibaba_Qwen
77
⚡️⚡️ 【引用 @OpenRouter】:来自 @Alibaba_Qwen 的全新 Qwen3.7-Max 已在 OpenRouter 上线。 作为 Qwen3.7 系列的旗舰模型,专为以智能体为中心的工作而构建:编程、办公与生产力任务,以及长周期自主执行。在编程和智能体基准测试中较 Qwen3.6 有显著提升,并支持显式的提示缓存以处理重复上下文。

OpenRouter: The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...

智能体模型发布编码
关联讨论 8 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)
18:09
IT之家(RSS)
精选70
网易有道"子曰4"多模态模型、语音合成模型全量开源

网易有道宣布将其“子曰”大模型4.0的多模态模型与语音合成模型面向全球全量开源。其中,多模态模型(27B参数)专注于教育场景,在处理高难度视觉数理问题上达到行业顶尖水平,纯文本中文数理难题准确率为81.4%。该模型通过思维链优化,将输出长度压缩43.2%,有效降低了推理成本。同时开源的语音合成模型支持跨语种音色与情感迁移克隆,3秒内即可完成零样本复制,准确度超97%,并支持包括中、英、日、韩在内的14种语言。

多模态开源生态推理模型发布

推荐理由:有道把垂直教育的多模态模型全量开源,27B参数在视觉数理上做到SOTA,还把思维链压缩了43%,推理成本实打实下降,做教育应用的可以拿来做二次开发;TTS的跨语种情感克隆也实用,3秒克隆14种语言。
16:35
MarkTechPost(RSS)
66
微软发布Fara1.5浏览器操作智能体系列:性能超越OpenAI Operator与Gemini 2.5

微软研究院近日推出Fara1.5系列浏览器操作智能体,包含4B、9B和27B三种参数规模。其中最大模型Fara1.5-27B在Online-Mind2Web基准测试中达到72%的准确率,显著优于OpenAI Operator、Gemini 2.5 Computer Use等主流模型。此次发布同步推出FaraGen1.5合成数据流水线,可在受控环境中高效训练智能体,为自动化浏览器操作提供了新解决方案。

智能体MCP/工具Microsoft模型发布
15:09
IT之家(RSS)
70
美团开源 LongCat-Video-Avatar 1.5:数字人视频从"彩排"走向"真舞台",生成 10 秒视频仅需 1 分钟

美团技术团队开源了数字人视频生成模型 LongCat-Video-Avatar 1.5。该版本在唇形同步、物理合理性、长视频稳定性和多人互动方面全面升级,支持复杂语音输入与多种主体。通过 DMD 蒸馏技术,推理效率提升约 15 倍,生成 10 秒视频仅需约 1 分钟。在性能评测中,模型在四个关键维度表现领先,用户偏好对比中胜率均超 54%,旨在推动数字人视频从技术演示走向商业应用。

开源生态推理模型发布视频
关联讨论 1 条美团 LongCat:HuggingFace 新模型
‹ 上一页
1…2122232425…43
下一页 ›