AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「模型发布」清除
6月12日周五
08:00HuggingFace Daily Papers(社区热门论文)64Nemotron 3 Ultra:开放高效混合专家Mamba-Transformer智能体推理模型
07:35karminski-牙医65Google 发布 Diffusion Gemma:26B/4B 激活,5090 达 700+ token/s
03:02Yuchen Jin54Claude Fable 5 尚可,未超 GPT-5.5/Opus 4.8
02:32Artificial Analysis52Ideogram 4.0 开源权重文生图模型发布
01:20Logan Kilpatrick81同事件精选Gemini Omni Flash 视频任务达 SOTA同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
01:17Hacker News 热门(buzzing.cc 中文翻译)72精选DeepSeek-R1 的开源实现
6月11日周四
21:08MiniMax (official)49MiniMax M3权重本周五发布
16:54MarkTechPost(RSS)67Cohere 发布 North Mini Code:30B 参数 MoE 编码模型,3B 活跃参数,单卡 H100 运行,支持 256K 上下文
12:18Midjourney84Midjourney V8.1 默认上线,V8 将弃用
12:10Midjourney:Updates(RSS)64精选Midjourney V8.1 已成为默认模型
10:51小互74Google 开源扩散架构模型 DiffusionGemma
09:19Demis Hassabis77DiffusionGemma 发布:4x 速度文本生成
08:30IT之家(RSS)63因安全顾虑,Anthropic 最强 AI 模型 Claude Fable 5 拒绝回答基础生物问题
08:23ginobefun59BestBlogs早报·06-11:AI政策、万亿IPO、编程鸿沟
07:30IT之家(RSS)65谷歌推出 DiffusionGemma 文本扩散模型:本地 AI 推理速度提升 4 倍
07:30IT之家(RSS)62GPT-5.6 最强 AI 模型已在路上,消息称奥尔特曼预估 OpenAI 明年上市
07:09Berryxia.AI64Google DiffusionGemma:4倍速文本生成开源模型
05:47Chubby♨️49OpenAI 首席科学家称 GPT-5.6 将有意义改进
04:23Simon Willison 博客68DiffusionGemma 发布:Google 开源 26B 参数扩散模型,NVIDIA 免费托管
03:56Ars Technica:AI(RSS)65Google DeepMind 发布 DiffusionGemma,本地 AI 推理速度提升 4 倍
03:42Tomer Tunguz 博客(VC 分析)72Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存
03:22The Decoder:AI News(RSS)56Google 新开源模型 DiffusionGemma:从噪声生成文本,而非逐字逐词
02:52MarkTechPost(RSS)70Google AI 发布 DiffusionGemma:基于文本扩散的 26B MoE 开源模型,生成速度最高提升 4 倍
02:48xAI74同事件精选Grok Voice性能出色价格低廉同一事件,精选展示《Grok 成为 Vapi 的默认语音引擎》
02:16Hacker News 热门(buzzing.cc 中文翻译)65DiffusionGemma:文本生成速度提升4倍
01:53Rohan Paul70Google 发布开源扩散模型 DiffusionGemma
01:25elvis67Cohere发布首个开源编程模型North Mini Code
01:02🚨 AI News | TestingCatalog77Google发布DiffusionGemma:4倍速文本生成
00:44Google AI Developers67Google AI 发布实验性开源模型 DiffusionGemma
00:43fofr69DiffusionGemma:一次性选词提速4倍
00:40Google DeepMind:Blog(RSS)72精选DiffusionGemma:文本生成速度提升4倍的开源扩散模型
00:39Google Developers Blog(RSS)78DiffusionGemma 开发者指南
00:24elvis71Google DeepMind 推出 DiffusionGemma 开放模型
00:23AK46ABot-Earth 0.5 生成式3D地球模型
00:20Sundar Pichai75DiffusionGemma:整块文本生成提速4倍
00:12Google DeepMind72DiffusionGemma:4倍速输出,整块文本同时生成
6月10日周三
21:48The Decoder:AI News(RSS)76Claude Fable 5:首个 Mythos 模型--强大、昂贵且经过严格过滤
21:16TechCrunch:AI(RSS)61Decart 发布 Oasis 3:实时世界模型可模拟数小时逼真驾驶场景
16:46MarkTechPost(RSS)62Anthropic 发布 Claude Fable 5 和 Claude Mythos 5:同款基础模型,不同安全防护,新增 Mythos 级层次
16:45小互67Google 发布实时翻译模型 Gemini 3.5 Live Translate
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
08:00
HuggingFace Daily Papers(社区热门论文)
64
Nemotron 3 Ultra:开放高效混合专家Mamba-Transformer智能体推理模型

Nemotron 3 Ultra 是一个 550B 总参数、55B 激活参数的混合专家(MoE)Mamba-Attention 语言模型。它在 20T tokens 上预训练,上下文窗口扩展至 1M tokens,后训练采用监督微调(SFT)、强化学习(RL)和多方教师在线蒸馏(MOPD)。关键技术包括 LatentMoE、多 token 预测(MTP)、NVFP4 预训练、多环境 RLVR、MOPD 和推理预算控制。相比公开 SOTA 大语言模型,推理吞吐量提升约 6 倍且准确率持平,适合长时间运行的自主智能体任务。模型开源基础、后训练和量化检查点,以及训练数据和配方。

智能体推理模型发布
07:35
karminski-牙医@karminski3
65
Google 发布 Diffusion Gemma:26B/4B 激活,5090 达 700+ token/s

Google 推出 Diffusion Gemma,大小 26B、激活参数量 4B,与 NVIDIA 合作针对 RTX 4090/5090 优化,5090 上速度达 700+ token/s。该扩散文本模型以“刮奖式”并行生成而非逐 token 生成,输出质量略逊但优于此前同类模型:AIME 2026(数学)达 Gemma4-26B-A4B 的 94%,tau2 bench(Agent)达 82%。4bit 量化版仅需 16G 显存即可运行。

Google推理模型发布部署/工程
03:02
Yuchen Jin@Yuchenj_UW
54
Claude Fable 5 到目前为止感觉不错,但我还不认为它相比 GPT-5.5 或 Opus 4.8 有巨大飞跃。 我最大的不满:旧的AI研究论文/博客 + 基本问题常常触发自动降级到 Opus 4.8。 Anthropic 昨晚表示不会再有无声模型切换(很好),但请不要削弱基本的AI研究或生物问题。
Anthropic大佬观点模型发布
02:32
Artificial Analysis@ArtificialAnlys
52
Ideogram 4.0 开源权重文生图模型发布

Ideogram 4.0 是 Ideogram 首个开源权重模型,生成 2K×2K 输出,支持多语言文本渲染、边界框布局控制和透明背景。采用结构化 JSON 提示,提示增强器仅限 Ideogram 专有 API。在 Artificial Analysis 开放权重排行榜排名第8,整体第31,领先 Seedream 3.0 等闭源模型。API 三档:Turbo $30/千张、Default $60/千张、Quality $100/千张。开源权重免费用于评估和非商业用途,商业自部署需单独许可。

图像生成开源生态模型发布
01:20
Logan Kilpatrick@OfficialLoganK
同事件精选81
Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA : ) 很高兴很快能将这一能力通过 API 提供给开发者!
Google图像生成多模态模型发布
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:视频生成正式进入全模态一体时代,Gemini Omni Flash 把图生视频、文生视频和剪辑整合在一个模型里,API 很快上线,做视频工具的可以提前琢磨对手在哪了。
01:17
Hacker News 热门(buzzing.cc 中文翻译)
精选72
DeepSeek-R1 的开源实现

DeepSeek-R1 的开源复现项目已在 GitHub 发布,在 Hacker News 上获得 101 个积分。该项目旨在以开源方式复现 DeepSeek-R1 模型。

Hugging Face开源/仓库推理模型发布

推荐理由:Hugging Face 把 DeepSeek-R1 的完整训练管线拆解得清清楚楚,从数据蒸馏到 GRPO 强化学习都开源了,还放出了复现的模型和数据集。想理解或自己训练推理模型的开发者,这大概是目前最实用的路线图。
6月11日
21:08
MiniMax (official)@MiniMax_AI
49
我们高性能MSA内核库现已开源。M3权重预计本周五发布。感谢等待! Github: https://github.com/MiniMax-AI/MSA Paper:https://github.com/MiniMax-AI/MSA/blob/main/docs/MiniMaxSparseAttention.pdf 主推文:权重周五发布🫶

RyanLee: Hey everyone - our high-performance MSA kernel library is now open-source. The M3 weights are expected to drop this Frid...

开源/仓库模型发布
16:54
MarkTechPost(RSS)
67
Cohere 发布 North Mini Code:30B 参数 MoE 编码模型,3B 活跃参数,单卡 H100 运行,支持 256K 上下文

Cohere 推出首款开发者编码模型 North Mini Code,采用 30B 总参数的混合专家(MoE)架构,每次推理仅激活 3B 参数,可在单块 H100 GPU 上运行,支持 256K token 上下文窗口,专为智能体编码场景设计,模型权重开源。

模型发布编码
12:18
Midjourney@midjourney
84
我们已将 V8.1 设为 Midjourney 所有用户的新默认模型。V8 将在两周后弃用。V8.2 即将开始测试。

Midjourney: V8.1 is live! Our iconic aesthetics are back w native 2K HD rendering - 3x faster and 3x cheaper vs V8. Full quality V8....

图像生成模型发布
关联讨论 2 条X:Midjourney (@midjourney)Midjourney:Updates(RSS)
12:10
Midjourney:Updates(RSS)
精选64
Midjourney V8.1 已成为默认模型

Midjourney 已将默认模型从 V7 升级为 V8.1。V8.1 在智能性、连贯性、对详细提示的遵循度以及文本渲染效果上均有提升,HD 模式也已支持。

图像生成模型发布
关联讨论 2 条X:Midjourney (@midjourney)Midjourney:Updates(RSS)
推荐理由:虽然V8.1不是大版本,但设为默认后所有用户自动升级,尤其是文本和复杂提示词的理解增强,做设计的朋友值得重新测试一下关键词。
10:51
小互@xiaohu
74
Google 开源扩散架构模型 DiffusionGemma

Google 开源 DiffusionGemma,基于扩散架构,一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存,一次生成 256 tokens。多轮迭代自我纠错,可修改已生成内容。

Google开源/仓库推理模型发布
09:19
Demis Hassabis@demishassabis
77
Google Gemma 团队推出实验性开放文本扩散模型 DiffusionGemma,采用 Apache 2.0 许可。该模型突破传统逐 token 顺序生成方式,能同时生成整段文本。Demis Hassabis 称其速度是其他 Gemma 4 模型的 4 倍。

Google Gemma: Meet DiffusionGemma! An experimental open model that explores a fast approach to text generation, released under an Apac...

Google开源/仓库模型发布
08:30
IT之家(RSS)
63
因安全顾虑,Anthropic 最强 AI 模型 Claude Fable 5 拒绝回答基础生物问题

Anthropic 昨日推出最强 AI 模型 Claude Fable 5(Mythos 级),其在生物学领域能力突出,但为防范生物武器风险,设置极为保守的安全限制,导致模型拒绝回答“细胞膜”“线粒体”等大量基础生物问题,仅“什么是癌症”等极少数问题获回复,被拒提问转由 Claude Opus 4.8 解答。化学、网络安全类问题接纳度较高。Anthropic 表示此防护策略为临时取舍,未来计划面向生物专业群体推出解除限制的 Mythos 级模型。

Anthropic安全/对齐模型发布
08:23
ginobefun@hongming731
59
BestBlogs早报·06-11:AI政策、万亿IPO、编程鸿沟

Anthropic CEO Dario Amodei 发布万字政策长文,以《魔戒》树须比喻AI与政策的时间错位,提出五领域行动框架(安全审计、失业保障、下游监管、权力平衡、国际治理)。OpenAI确认秘密提交S-1招股书,估值超8500亿美元,月收入20亿美元,周活跃用户9亿;与估值9650亿美元的Anthropic、SpaceX开启万亿级IPO竞速。MIT与宾夕法尼亚大学追踪10万开发者发现:AI编程工具使代码行数暴增17.3倍,实际发布的软件版本仅增长30%。

政策/监管模型发布现象/趋势行业动态
07:30
IT之家(RSS)
65
谷歌推出 DiffusionGemma 文本扩散模型:本地 AI 推理速度提升 4 倍

谷歌6月11日发布开源文本扩散模型DiffusionGemma,本地推理速度较自回归模型提升4倍。采用Apache 2.0许可证,可从Hugging Face下载权重。采样速度1479 tokens/秒,开销0.84秒。代码生成HumanEval达89.6%,数学AIME 2025达23.3%超越对比模型。在H100 GPU上每秒生成1000 token,DGX Station上可达2000 token。

Google开源生态推理模型发布
07:30
IT之家(RSS)
62
GPT-5.6 最强 AI 模型已在路上,消息称奥尔特曼预估 OpenAI 明年上市

OpenAI CEO 萨姆·奥尔特曼本周在致员工内部邮件中预估公司“明年内”上市,此前已向美国证券交易委员会秘密提交 IPO 申请。奥尔特曼表示,技术发展速度可能影响 IPO 时间,尤其指出递归自我改进(RSI)若加速,推迟 IPO 会更有利。OpenAI 同时正筹备全新模型,代号 5.6,据首席科学家 Jakub Pachocki 称,该模型将比当前旗舰系统 GPT-5.5 有“显著改进”。

OpenAI模型发布行业动态
07:09
Berryxia.AI@berryxia
64
Google DiffusionGemma:4倍速文本生成开源模型

Google 发布实验性开源模型 DiffusionGemma(Apache 2.0),采用并行 diffusion 方式代替传统自回归“逐词预测”,可同时起草、纠错和精炼整块文本,生成速度达 4 倍提升(1000+ token/s)。模型在 18GB 消费级显卡即可本地运行,适用于代码、数学、复杂编辑等任务,已开源权重至 Hugging Face。

Google: Meet DiffusionGemma ⚡ Our latest experimental open model (Apache 2.0) that generates text up to 4x faster. Instead of pr...

Google开源生态模型发布部署/工程
05:47
Chubby♨️@kimmonismus
49
OpenAI 首席科学家 Jakub Pachocki 在 Slack 消息中写道,GPT-5.6 将比 GPT-5.5 有"有意义的改进"。 GPT-5.5 很棒,是我在 Codex 中的日常伴侣。一次重大飞跃将受到欢迎。 但事实是:OpenAI 需要自己的神话/传说。 来源:The Information
OpenAI模型发布
04:23
Simon Willison 博客
68
DiffusionGemma 发布:Google 开源 26B 参数扩散模型,NVIDIA 免费托管

Google 将去年 5 月短暂发布的 Gemini Diffusion 研究成果转化为开放权重的 Gemma 模型,模型名为 google/diffusiongemma-26B-A4B-it,采用 Apache 2 许可证开源。NVIDIA 正通过其 NIM 云 API 免费托管该模型。实测生成 2,409 个模型 token 仅需 4.4 秒,速度至少达到 500 token/s。

Google多模态开源生态模型发布
03:56
Ars Technica:AI(RSS)
65
Google DeepMind 发布 DiffusionGemma,本地 AI 推理速度提升 4 倍

Google DeepMind 发布 DiffusionGemma,一款利用扩散模型加速文本输出的新模型,本地 AI 推理速度达到传统模型的 4 倍。

GoogleHugging Face开源生态推理
03:42
Tomer Tunguz 博客(VC 分析)
72
Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存

Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。

Anthropic大佬观点安全/对齐模型发布
关联讨论 31 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
03:22
The Decoder:AI News(RSS)
56
Google 新开源模型 DiffusionGemma:从噪声生成文本,而非逐字逐词

Google 发布 260 亿参数的 DiffusionGemma 模型,文本生成方式不再逐 token 预测,而是通过扩散过程从噪声直接生成,类似图像 AI 将噪声转化为图片。Nvidia 测试显示,该模型在单块 H100 GPU 上可达约每秒 1,000 tokens,速度约为可比自回归模型的四倍。代价是输出质量较低,因此 Google 目前将其定位为面向开发者的实验性工具。模型已开源。

Google多模态开源生态模型发布
02:52
MarkTechPost(RSS)
70
Google AI 发布 DiffusionGemma:基于文本扩散的 26B MoE 开源模型,生成速度最高提升 4 倍

Google DeepMind 发布实验性开源模型 DiffusionGemma,参数量 26B,采用混合专家(MoE)架构,通过文本扩散(text diffusion)技术实现在 GPU 上最高 4 倍生成速度提升。模型权重已开放。

Google开源生态推理模型发布
02:48
xAI@xai
同事件精选74
Grok Voice 提供最先进的性能,具有类人的时机、语调和温暖感。而且价格仅为竞争对手的一小部分。 查看详情:http://x.ai/api/voice

ServiceNow AI Research: 🚀 Grok Voice Think Fast 1.0 (@xAI) lands on the Pareto frontier on EVA-Bench - no system in the eval beats it on accura...

xAI模型发布语音
同一事件,精选展示《Grok 成为 Vapi 的默认语音引擎》
推荐理由:语音AI的SOTA这次不是OpenAI了,Grok Voice在EVA-Bench上无死角领先,价格还打到对手十分之一,做语音产品的可以认真看看这个帕累托前沿选手。
02:16
Hacker News 热门(buzzing.cc 中文翻译)
65
DiffusionGemma:文本生成速度提升4倍

DiffusionGemma 是 Google 推出的文本生成模型,其文本生成速度相比前代提升 4 倍。该模型详情已发布在 Google 官方博客。

Google开源/仓库推理模型发布
01:53
Rohan Paul@rohanpaul_ai
70
Google 发布开源扩散模型 DiffusionGemma

Google 推出开源实验性模型 DiffusionGemma,基于 Gemma 4 的文本扩散研究。该模型为 26B MoE 架构,仅激活 3.8B 参数,量化后可适配 18GB VRAM。核心突破在于每轮前向传播并行生成 256 个 token,实现推理速度提升 4 倍:H100 上可达 1000+ tokens/s,RTX 5090 达 700+ tokens/s。DiffusionGemma 通过初始化随机占位符画布并运行多轮并行去噪,同时生成整段文本,许可证为 Apache 2.0。

Sundar Pichai: DiffusionGemma is an open, experimental model that brings our text diffusion research to Gemma 4. It's a racehorse 🏇ach...

Google开源生态推理模型发布
01:25
elvis@omarsar0
67
Cohere发布了其首个开源编程模型North Mini Code。该模型小巧高效,专为智能体性能设计,并欢迎社区反馈。Elvis Saravia对此赞叹不已,期待尽快将其与自己的DAIR.AI编程智能体配合使用。

Cohere: Introducing Cohere's first open-source coding model: North Mini Code Small & efficient, designed for agentic performance...

开源生态模型发布编码
01:02
🚨 AI News | TestingCatalog@testingcatalog
77
Google发布了实验性开源模型DiffusionGemma,采用Apache 2.0许可。该模型不再逐token预测,而是同时生成整块文本,速度提升高达4倍。它能在生成过程中自我纠正,并实时格式化复杂Markdown。性能与Gemma 4相当。

Google Gemma: Meet DiffusionGemma! An experimental open model that explores a fast approach to text generation, released under an Apac...

Google开源生态模型发布
00:44
Google AI Developers@googleaidevs
67
Google AI 发布实验性开源模型 DiffusionGemma

Google AI 发布实验性开源模型 DiffusionGemma,采用 Apache 2.0 许可证。该模型基于文本扩散方法,将生成瓶颈从内存带宽转向计算,在专用 GPU 上 token 输出速度最高提升 4 倍。推理时仅激活 3.8B 参数,量化后可适配 24GB VRAM 消费级 GPU。并行 token 生成支持自我纠错,适用于代码填充、行内编辑等非线性结构。DiffusionGemma 优先速度而非极致质量,生产场景仍推荐标准 Gemma 4。

Google开源生态模型发布编码
00:43
fofr@fofrAI
69
DiffusionGemma,大语言模型一次性选出所有词。速度快4倍。 你可以从这里获取权重和说明开始使用: https://huggingface.co/google/diffusiongemma-26B-A4B-it
GoogleHugging Face推理模型发布
00:40
Google DeepMind:Blog(RSS)
精选72
DiffusionGemma:文本生成速度提升4倍的开源扩散模型

Google DeepMind 发布开源实验模型 DiffusionGemma,采用文本扩散技术,突破自回归逐 token 生成方式,每次前向并行生成 256 个 token。该 26B MoE 模型推理时仅激活 3.8B 参数,量化后适配 18GB 显存消费级 GPU。在 H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s,速度提升 4 倍。具备双向注意力和自我修正能力,面向内联编辑、代码填充等本地交互工作流,以 Apache 2.0 许可证开放。

Google开源生态推理模型发布

推荐理由:DiffusionGemma 虽为实验性质,但它把文本生成从“串行打字机”变成了“并行印刷机”,本地推理速度 4 倍提升,对需要实时交互的开发者是个值得关注的方向。
00:39
Google Developers Blog(RSS)
78
DiffusionGemma 开发者指南

DiffusionGemma 是 Google 基于 Gemma 4 架构的实验性文本生成模型,采用扩散式并行生成替代逐 token 自回归,实现更快推理、双向上下文感知和实时自我修正,并可在消费级 GPU 上部署。模型通过迭代去噪并行生成并细化 256-token 块,在处理数独等复杂约束任务上优于传统语言模型,且微调效果显著。它已集成 vLLM 等推理框架,为开发者提供一种高性能、高效长上下文扩展且易于定制部署的非自回归新方法。

Google推理模型发布部署/工程
00:24
elvis@omarsar0
71
太棒了!我最近花了很多时间在研究扩散大语言模型上,所以这个时机恰到好处。我觉得文本扩散领域还有很多未被充分探索的研究问题。权重已在 HuggingFace 上可用。

Google DeepMind: DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting w...

Google推理模型发布
00:23
AK@_akhaliq
46
ABot-Earth 0.5 生成式3D地球模型
多模态模型发布
00:20
Sundar Pichai@sundarpichai
75
DiffusionGemma 是一个开放的实验性模型,它将我们的文本扩散研究引入 Gemma 4。它是一匹赛马 🏇,通过同时生成整块文本(而非逐 token(逐词)预测输出)实现高达 4 倍更快的推理速度!
Google开源/仓库推理模型发布
00:12
Google DeepMind@GoogleDeepMind
72
DiffusionGemma 是我们新的实验性开放模型,在专用 GPU 上输出速度最高可提升 4 倍。 它不是逐词预测,而是同时生成整块文本。这让模型能够自我纠正,并实时格式化复杂 Markdown。
DeepMind开源/仓库模型发布
6月10日
21:48
The Decoder:AI News(RSS)
76
Claude Fable 5:首个 Mythos 模型--强大、昂贵且经过严格过滤

Anthropic 发布 Claude Fable 5,这是新 Mythos 类别的首个模型。该模型在 SWE-bench Verified 上达到 95%,几乎在所有基准测试中领先,但成本是 Opus 4.8 的两倍,每百万 token 价格为 10 美元或 50 美元。严格的安全过滤器会阻止约 9% 的请求,同时新增 30 天数据保留政策,即使签订零数据保留合同也适用。

Anthropic安全/对齐推理模型发布
关联讨论 31 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
21:16
TechCrunch:AI(RSS)
61
Decart 发布 Oasis 3:实时世界模型可模拟数小时逼真驾驶场景

Decart 推出 Oasis 3,一个实时世界模型,能够生成逼真的驾驶环境用于自动驾驶车辆测试,现已通过 API 向开发者开放。

具身智能模型发布视频
16:46
MarkTechPost(RSS)
62
Anthropic 发布 Claude Fable 5 和 Claude Mythos 5:同款基础模型,不同安全防护,新增 Mythos 级层次

Anthropic 正式推出 Claude Fable 5,附带分类器,全面开放使用;同时发布 Claude Mythos 5,仍保持受限访问,但通过 Project Glasswing 解除了网络安全防护。两款模型基于同一底层模型,区别在于安全机制配置,并新增了 Mythos-Class 层级。

Anthropic安全/对齐模型发布
16:45
小互@xiaohu
67
Google 发布实时翻译模型 Gemini 3.5 Live Translate

Google 推出 Gemini 3.5 Live Translate,支持 70 多种语言的实时边听边译,保留说话人的语调、节奏和音高,延迟仅数秒。模型具备自动语言检测,无需预先指定源语言和目标语言。同时自动滤除噪音,嘈杂环境可用。Google Translate App 新增「听筒模式」,贴耳即可听翻译。开发者可通过 Gemini Live API 和 Google AI Studio 调用。

Google模型发布语音
‹ 上一页
1…1011121314…43
下一页 ›