AIHOT

精选全部 AI 动态 AI 日报 Agent 接入关于更新日志反馈信源提报

AI HOT

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月6日

01:26

Chubby♨️@kimmonismus

精选83

OpenAI推出GPT-5.5 Instant作为ChatGPT新默认模型，实现显著升级

OpenAI正式将GPT-5.5 Instant设置为ChatGPT的新默认模型，该模型在基准测试中表现大幅提升，变得更智能、准确和可靠。其在图像分析、STEM、写作及医学、法律等高精度领域能力增强。核心升级在于个性化功能，能有效利用用户保存的记忆、过往聊天、文件和Gmail上下文，并展示影响回复的记忆来源。该模型将在未来两天内向所有用户推出，个性化改进优先面向网页版Plus和Pro用户，移动版随后跟进；API版本为gpt-5.5-chat-latest。官方表示，升级后的模型能提供更智能、清晰、个性化的答案，语气温暖自然且更简洁。

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI多模态推理模型发布

关联讨论 23 条X：Testing Catalog (@testingcatalog)Simon Willison 博客X：swyx (@swyx)X：Greg Brockman (@gdb)The Decoder：AI News（RSS）X：Vista (@vista8)X：Rohan Paul (@rohanpaul_ai)X：宝玉 (@dotey)X：Sam Altman (@sama)X：Tibo (@thsottiaux)OpenAI：官网动态（RSS · 排除企业/客户案例）X：OpenAI Developers (@OpenAIDevs)Ethan Mollick：One Useful Thing（RSS）X：歸藏 (@op7418)X：OpenAI (@OpenAI)X：Satya Nadella (@satyanadella)X：Artificial Analysis (@ArtificialAnlys)Hacker News 热门（buzzing.cc 中文翻译）X：Kim (@kimmonismus)X：Eric Mitchell (@ericmitchellai)X：Berry Xia (@berryxia)X：ChatGPT (@ChatGPTapp)IT之家（RSS）

推荐理由：ChatGPT默认模型直接换到GPT-5.5 Instant，个性化能力是代际跃迁，明天打开就能感受到不同。

01:12

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选82

GPT-5.5 Instant：更智能、更清晰、更个性化

ChatGPT的默认模型已更新为GPT-5.5 Instant。新版模型能提供更智能、更准确的答案，并有效减少了幻觉现象。同时，用户获得了更强的个性化控制能力，使交互体验更贴合个人需求。此次升级标志着模型在理解精度与响应定制化方面取得了显著进步。

OpenAI推理模型发布

推荐理由：ChatGPT默认模型替换为GPT-5.5 Instant，不只是变聪明，幻觉减少和个性化控制才是真改进，每个用户都能马上感觉到不同。

01:00

TestingCatalog News 🗞@testingcatalog

Inworld AI发布了新一代实时对话语音模型Realtime TTS-2。该模型的核心突破在于，能在说话前处理完整的多轮对话音频上下文，从而像真人一样实时适应对话情境。其关键特性包括：单一音色支持超过100种语言，首次音频生成延迟低于200毫秒，并能通过自然语言指令调整语音风格，无需预设情感标签。这标志着语音AI首次具备了"聆听"对话整体氛围而不仅是字面内容的能力，其架构设计旨在实现既自然动听又富有情境感知的对话体验。

Inworld AI: Introducing Realtime TTS-2, a new generation of voice model built for realtime conversation. It is the first voice model...

产品更新语音

00:58

xAI@xai

精选80

Grok 4.3 现已在 xAI API 上线。这是我们迄今为止最快、最智能的模型。它在 @ArtificialAnlys 排行榜上的智能体工具调用和指令遵循方面位居榜首，并在 @ValsAI 的企业领域（如判例法和公司金融）中排名第一。 Grok 4.3 支持 100 万令牌的上下文窗口，定价为输入每百万令牌 1.25 美元，输出每百万令牌 2.50 美元。创建 API 密钥并开始构建：http：//console.x.ai/team/default/api-keys

智能体xAI推理模型发布

关联讨论 1 条X：Elon Musk (@elonmusk, xAI)

推荐理由：Grok 4.3 登顶 agentic tool calling 榜，定价有竞争力，做 agent 的值得认真看。虽然不算顶级发布，但 xAI 靠性能价格组合可能抢下不少性价比敏感开发者。

00:56

Rohan Paul@rohanpaul_ai

SubQ首发：1200万token上下文窗口，成本降低95%以上

SubQ模型发布，这是首个基于完全次二次稀疏注意力架构（SSA）的前沿LLM，拥有1200万token的上下文窗口。它在处理100万token时比FlashAttention快52倍，成本低于Opus的5%。该模型突破传统Transformer注意力计算所有token关系的限制，通过稀疏注意力选择性聚焦重要关系，使长上下文处理的计算量减少近1000倍，显著改变了LLM的成本曲线和扩展方式。

Alexander Whedon: Introducing SubQ - a major breakthrough in LLM intelligence. It is the first model built on a fully sub-quadratic sparse...

推理模型发布

关联讨论 1 条X：邵猛 (@shao__meng)

5月5日

23:56

Luma@LumaLabsAI

精选71

Luma Labs 推出的 UNI-1.1-Max 和 UNI-1.1 多模态模型在 Image Arena 的文本生成图像与图像编辑综合排名中位列第三，且未采用智能体搜索技术。具体来看，在文本生成图像竞技场中，两款模型分别排名第六和第七；在多图像编辑和单图像编辑竞技场中，它们均进入前十一名，其中 UNI-1.1-Max 在单图像编辑中排名第七。这一成绩标志着 Luma Labs 在多模态前沿领域取得了扎实进展。

Arena.ai: Exciting news: UNI-1.1-Max and UNI-1.1 debuts making @LumaLabsAI the #3 lab in the Image Arena across both Text-to-Image...

图像生成模型发布评测/基准

关联讨论 2 条X：Rohan Paul (@rohanpaul_ai)X：Luma AI (@LumaLabsAI)

推荐理由：Luma这次更新在图像编辑上提升明显，直接挤进竞技场前三，对做设计和视频的人来说是个信号，但文本到图像还是老几样，可以观望一下。

07:49

Artificial Analysis@ArtificialAnlys

匿名文生图模型Peanut在Artificial Analysis文生图竞技场中首次亮相即位列第八。其模型权重预计很快发布，届时将成为领先的开源权重文生图模型。Peanut被定位为新的开源领导者，性能预计将超越Z-Image Turbo、Qwen-Image和FLUX.2 【dev】等现有模型。更多细节和权重文件即将公布。

Artificial Analysis: A new anonymous model debuts at #8 in the Artificial Analysis Text to Image Arena! Peanut's weights are expected to be r...

图像生成开源/仓库模型发布

03:18

Artificial Analysis@ArtificialAnlys

一款新的匿名模型在Artificial Analysis文本转图像竞技场中首次亮相，位列第8！Peanut的权重预计即将发布，这将使其成为领先的文本转图像开源权重模型。 Peanut定位为新的领先开源权重文本转图像模型，超越了Z-Image Turbo、Qwen-Image和FLUX.2 【dev】。更多详细信息（及权重）即将公布。查看下方🧵中Artificial Analysis图像竞技场里Peanut的生成示例。

图像生成开源/仓库模型发布评测/基准

00:45

Elon Musk@elonmusk

在"Vals AI"的私人基准测试中，Grok 4.3在法律和金融领域展现出领先的智能水平。它在CaseLaw （v2）测试中以79.31%的准确率排名第一，该测试基于真实加拿大法庭案例，评估深度法律推理和先例理解能力，表现优于GPT-5.1。同时，它在针对复杂长期信贷协议的CorpFin （v2）测试中以68.53%的准确率夺冠，评估了对多页金融合同条款、风险的理解。这些模拟高风险现实挑战的测试表明，Grok 4.3在最困难的任务中具备卓越的推理能力。xAI正致力于构建世界所需的推理引擎。

X Freeze: Grok 4.3 just became the smartest AI in the world at law and money It took #1 on TWO brutal private tests no other model...

xAI推理评测/基准

5月4日

23:48

Chubby♨️@kimmonismus

初创公司Video Rebirth的文本生成视频模型Bach-1.0 Preview在Artificial Analysis的全球AI视频排行榜上首次亮相即位列第六。其性能与Vidu Q3 Pro、Kling 3.0 Omni 1080p （Pro）及grok-imagine-video等知名模型相当。该模型计划于五月下旬广泛发布。

Artificial Analysis: Bach-1.0 Preview from Video Rebirth debuts at #6 on the Artificial Analysis Text to Video Leaderboard (No Audio)! Bach-1...

模型发布视频评测/基准

22:16

Rohan Paul@rohanpaul_ai

初创公司Video Rebirth凭借其模型Bach-1.0 Preview，在Artificial Analysis的文本转视频榜单中首次进入前六名，打破了该榜单长期由阿里巴巴、字节跳动、xAI等万亿美元级巨头主导的局面。其模型性能与Vidu Q3 Pro、Kling 3.0 Omni 1080p （Pro）及grok-imagine-video等顶尖模型相当，并计划于五月下旬广泛发布。这一突破标志着初创企业在高质量AI视频生成领域取得了显著进展，为该领域的竞争格局带来了新的变数。

Artificial Analysis: Bach-1.0 Preview from Video Rebirth debuts at #6 on the Artificial Analysis Text to Video Leaderboard (No Audio)! Bach-1...

模型发布视频

21:24

小互@xiaohu

传谷歌I/O将发布Omni模型，Gemini或升级为全模态生产力入口

据传谷歌将在I/O大会发布名为“Omni”的新模型，旨在将Gemini从聊天助手升级为集成写作、图片、视频、长上下文记忆与复杂任务流的全模态生产力平台。该模型可能原生支持视频生成与输出，超越现有的Veo 3.1。同时，Gemini 3.2/3.5版本或专注于提升推理速度与效率，而Ultra版本则向长上下文、重记忆及多步骤工作流方向深化。若消息属实，Gemini将成为首个具备视频输出能力的顶级Omni模型。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google多模态模型发布视频

17:48

Artificial Analysis@ArtificialAnlys

Bach-1.0 Preview from Video Rebirth 在 Artificial Analysis 文本转视频排行榜（无音频）中首次亮相，位列第6！ Bach-1.0 Preview 是来自 @video_rebirth 的最新文本转视频模型，其性能与 Vidu Q3 Pro、Kling 3.0 Omni 1080p （Pro）和 grok-imagine-video 相近。 Bach-1.0 Preview 计划于五月下旬广泛发布。在下方 Artificial Analysis 视频竞技场中查看 Bach-1.0 Preview 的生成示例 🧵

模型发布视频

5月3日

16:45

Chubby♨️@kimmonismus

据泄露信息显示，谷歌可能正在为其Gemini平台测试一款全新的Omni模型，专注于视频生成功能，其界面标语为"由Omni驱动"。该模型的内部代号接近当前基于Veo的视频工具"Toucan"。分析指出，若谷歌正式发布名为Gemini Omni的视频生成模型，其性能很可能超越现有的Veo 3.1版本。此举若成真，Gemini将成为首个具备视频输出能力的顶级Omni模型，相关进展或于即将到来的Google I/O大会上正式公布。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google多模态模型发布视频

15:51

The Decoder：AI News（RSS）

小米开源模型 MiMo-V2.5-Pro 瞄准 Claude Opus，实现数小时自主编程

小米发布开源模型 MiMo-V2.5-Pro，其编程基准测试成绩接近 Anthropic 的 Claude Opus 4.6，同时令牌消耗量减少 40% 至 60%。该模型能持续数小时自主处理单一任务，标志着中国开源模型竞争焦点正从单纯追求基准分数，转向降低运行成本与提升任务持久性。小米借此进一步深入与 DeepSeek 等国内开源提供商的竞争。

Anthropic开源/仓库模型发布编码

06:50

TestingCatalog News 🗞@testingcatalog

谷歌I/O动态：Gemini测试用于视频生成的新Omni模型

谷歌正在其Gemini平台测试一款名为“Omni”的新模型，专注于视频生成功能。泄露信息显示，该模型的界面提示用户“从一个想法开始或尝试一个模板”，并注明“由Omni驱动”。这一模型可能与内部代号“Toucan”的视频生成工具密切相关，后者目前由Veo驱动。如果谷歌计划正式发布用于视频生成的Gemini Omni，其性能很可能超越当前的Veo 3.1版本。若消息属实，Gemini将成为首个具备视频输出能力的顶级Omni模型，这标志着谷歌在视频生成领域的重大技术进展，并可能为未来的Google I/O 2026活动预热。此举显示了谷歌在人工智能视频生成方面的持续创新和竞争态势。

Google多模态模型发布视频

5月2日