AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
5月6日周三
04:33ChatGPT73精选向我们所有使用新即时模型的用户致以热烈的祝贺。
04:31Sam Altman49特别是当速度、智能、个性以及强大的记忆/个性化功能这些改进结合在一起时,它们共同作用所产生的效果,感觉像是超越了各部分简单相加的总和 【引用 @sama】:chatgpt中的新即时模型真是太棒了 如果你已经有一段时间只使用思考模型,不妨试试它!
04:28Greg Brockman91精选重大ChatGPT升级现正推出,形式为GPT-5.5 Instant: 这是一次重大升级,以更温暖自然的语调提供更智能、更清晰、更个性化的答案。 同时它也更简洁,这正是我们所了解到的用户需求。我们相信你会喜欢与它对话。
03:57Elon Musk83精选Grok 4.3 【引用 @xai】:Grok 4.3 现已在 xAI API 上线。这是我们迄今为止最快、最智能的模型。 它在 @ArtificialAnlys 排行榜的智能体工具调用和指令遵循方面位居榜首,并在 @ValsAI 的企业领域(如案例法和公司金融)中排名第一。 Grok 4.3 支持 100 万 token 的上下文窗口,定价为输入每百万 token 1.25 美元,输出每百万 token 2.50 美元。 创建 API 密钥并开始构建:http://console.x.ai/team/default/api-keys
03:32TestingCatalog News 🗞71Google为Gemma 4系列发布了多令牌预测(MTP)草稿模型。它在不损失性能的情况下带来了3倍的速度提升。 期待在Mac Mini上测试带有MTP草稿模型的量化版Gemma 4!
02:31TestingCatalog News 🗞77精选GPT-5.5即时版全面推送 更简洁智能
02:30The Decoder:AI News(RSS)72精选ChatGPT 更新推出 GPT-5.5 Instant 模型,幻觉减少且答案更个性化
02:00宝玉77精选OpenAI 将 ChatGPT 默认模型全面升级为 GPT-5.5 Instant
01:42OpenAI:官网动态(RSS · 排除企业/客户案例)75精选GPT-5.5 Instant 系统卡片
01:31ChatGPT83精选GPT-5.5即时版全面推送 更简洁智能
01:30OpenAI86精选GPT-5.5即时版开始推送升级
01:27Eric82精选ChatGPT默认模型升级至GPT-5.5 Instant
01:26Chubby♨️83精选OpenAI推出GPT-5.5 Instant作为ChatGPT新默认模型,实现显著升级
01:12OpenAI:官网动态(RSS · 排除企业/客户案例)82精选GPT-5.5 Instant:更智能、更清晰、更个性化
01:00TestingCatalog News 🗞69Inworld AI发布新一代实时对话语音模型Realtime TTS-2
00:58xAI80精选Grok 4.3正式上线API 速度与智能双突破
00:56Rohan Paul65SubQ首发:1200万token上下文窗口,成本降低95%以上
5月5日周二
23:56Luma71前沿多模态,赋能商业应用
07:49Artificial Analysis52匿名图像模型Peanut即将开源,有望领跑开源文生图领域
03:18Artificial Analysis69匿名模型Peanut登顶开源文生图榜
00:45Elon Musk41尝试Grok:在法律与金融领域展现卓越推理能力
5月4日周一
23:48Chubby♨️62初创公司Video Rebirth文生视频模型Bach-1.0跻身全球前六
22:16Rohan Paul64初创公司Video Rebirth闯入AI视频生成榜单前六,打破巨头垄断
21:24小互56传谷歌I/O将发布Omni模型,Gemini或升级为全模态生产力入口
17:48Artificial Analysis56Bach-1.0预览版登顶文生视频榜单
5月3日周日
16:45Chubby♨️45谷歌或于I/O大会推出全新Omni模型,Gemini视频生成能力有望升级
15:51The Decoder:AI News(RSS)60小米开源模型 MiMo-V2.5-Pro 瞄准 Claude Opus,实现数小时自主编程
06:50TestingCatalog News 🗞58谷歌I/O动态:Gemini测试用于视频生成的新Omni模型
5月2日周六
15:50The Decoder:AI News(RSS)59xAI 发布 Grok 4.3,大幅降价并推出创意项目 Imagine 智能体模式
15:44Chubby♨️51谷歌筹备I/O大会,新模型即将发布
13:49TestingCatalog News 🗞66谷歌Gemini新模型现身,性能大幅提升
04:40Elon Musk54Grok法律领域表现夺魁,成本优势显著
03:40Elon Musk53Grok 4.3模型登陆Vercel平台
00:47OpenAI76精选GPT-5.5发布一周创营收新高
5月1日周五
23:39Elon Musk55Grok 4.3成本大降,智能评估效率提升
19:17Hacker News 热门(buzzing.cc 中文翻译)76精选Grok 4.3
17:46MiniMax (official)2盯--
16:47The Decoder:AI News(RSS)51Mistral 新旗舰模型 Medium 3.5 将聊天、推理和代码功能整合为一体
15:14Chubby♨️57Grok 4.3是一个非常出色的模型,尤其考虑到其仅5亿参数!
13:46TestingCatalog News 🗞54Grok 4.3 API版本现已上线
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月6日
04:33
ChatGPT@ChatGPTapp
精选73
向我们所有使用新即时模型的用户致以热烈的祝贺。
OpenAI模型发布

推荐理由:OpenAI突然发了一个「Instant模型」,推文只有一句庆祝,没给任何能力指标。如果真是主打实时响应,那对聊天体验是实打实的提升,但现在啥也看不出来。
04:31
Sam Altman@sama
49
特别是当速度、智能、个性以及强大的记忆/个性化功能这些改进结合在一起时,它们共同作用所产生的效果,感觉像是超越了各部分简单相加的总和 【引用 @sama】:chatgpt中的新即时模型真是太棒了 如果你已经有一段时间只使用思考模型,不妨试试它!

Sam Altman: the new instant model in chatgpt is so good damn if you have been thinking-model-only for awhile, give it a try!

OpenAI模型发布
04:28
Greg Brockman@gdb
精选91
重大ChatGPT升级现正推出,形式为GPT-5.5 Instant: 这是一次重大升级,以更温暖自然的语调提供更智能、更清晰、更个性化的答案。 同时它也更简洁,这正是我们所了解到的用户需求。我们相信你会喜欢与它对话。

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI模型发布

推荐理由:ChatGPT终于迎来一次真正的代际升级,GPT-5.5 Instant把聪明和人性化揉在一起,而且更简洁了,之前那些因为啰嗦被嫌弃的对话可以翻篇了。
03:57
Elon Musk@elonmusk
精选83
Grok 4.3 【引用 @xai】:Grok 4.3 现已在 xAI API 上线。这是我们迄今为止最快、最智能的模型。 它在 @ArtificialAnlys 排行榜的智能体工具调用和指令遵循方面位居榜首,并在 @ValsAI 的企业领域(如案例法和公司金融)中排名第一。 Grok 4.3 支持 100 万 token 的上下文窗口,定价为输入每百万 token 1.25 美元,输出每百万 token 2.50 美元。 创建 API 密钥并开始构建:http://console.x.ai/team/default/api-keys

xAI: Grok 4.3 is now live on the xAI API. It's our fastest, most intelligent model to date. It tops the @ArtificialAnlys lead...

智能体xAI推理模型发布

推荐理由:Grok 4.3 把 agentic tool calling 和指令遵循两个榜单压在脚下,百万上下文配上亲民价格,对做自动化 agent 的团队是个够分量的信号。
03:32
TestingCatalog News 🗞@testingcatalog
71
Google为Gemma 4系列发布了多令牌预测(MTP)草稿模型。它在不损失性能的情况下带来了3倍的速度提升。 期待在Mac Mini上测试带有MTP草稿模型的量化版Gemma 4!

Google for Developers: Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...

Google推理模型发布
02:31
TestingCatalog News 🗞@testingcatalog
精选77
OPENAI 🚨: GPT-5.5 Instant 正在向所有 ChatGPT 用户推出!"gpt-5.5-chat-latest" 也将进入 API。 > 更加简洁。更好的记忆。更个性化。 即时测试时间 👀

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI模型发布

推荐理由:GPT-5.5 Instant这版从语气到长度都在优化,免费用户终于能摸到GPT-5.5的门槛了,实际体验可能会比参数更重要。
02:30
The Decoder:AI News(RSS)
精选72
ChatGPT 更新推出 GPT-5.5 Instant 模型,幻觉减少且答案更个性化

OpenAI 将 ChatGPT 的默认模型更新为 GPT-5.5 Instant。内部测试显示,该模型在医学和法律等高风险主题上产生的幻觉声称减少了 52.5%。新功能“记忆来源”允许用户查看影响特定回答的存储上下文。该模型正立即向所有用户推出,但基于过去聊天记录、文件和 Gmail 的个性化功能将首先在网页版上向 Plus 和 Pro 用户开放。此次更新旨在提升回答的准确性和个性化体验。

OpenAI产品更新安全/对齐

推荐理由:GPT-5.5 Instant换到默认模型,减少一半幻觉是个硬指标进步,记忆源让用户知道ChatGPT为什么这样回答,透明度这块终于追上了。
02:00
宝玉@dotey
精选77
OpenAI 将 ChatGPT 默认模型全面升级为 GPT-5.5 Instant

OpenAI 将 ChatGPT 默认模型全面升级为 GPT-5.5 Instant,替换原有的 GPT-5.3 Instant,并向所有用户推送。新模型显著减少了事实幻觉,在医疗、法律等高风险领域的错误率大幅降低,并在多项基准测试中性能提升。回答风格更为简洁,减少冗余内容。同时增强了记忆功能,能主动利用用户历史聊天记录等数据提供个性化回答,并上线“记忆来源”功能供用户管理引用。免费用户即可使用新版模型,付费用户可保留旧版三个月。个性化记忆功能将逐步向各版本用户开放。

ChatGPT: GPT-5.5 Instant is starting to roll out to everyone in ChatGPT. Much more concise. Better memory. More personalized. And...

OpenAI产品更新推理

推荐理由:默认模型直接换到 GPT-5.5 Instant,幻觉砍半、回答更简洁,还开始主动用你的聊天记录,日常对话的体验会有明显提升,值得看看具体变了什么。
01:42
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选75
GPT-5.5 Instant 系统卡片

OpenAI 于2026年5月5日发布了最新即时模型 GPT-5.5 Instant。该模型在网络安全、生物与化学防范两个类别首次被定位为“高能力”级别,并为此实施了相应的安全防护措施。其整体安全缓解方案与此系列前代模型相似。官方明确,不存在名为 GPT-5.4 Instant 的模型,其主要对标基线是 GPT-5.3 Instant。为避免混淆,GPT-5.5 模型被特指为 GPT-5.5 Thinking。

OpenAI安全/对齐模型发布

推荐理由:GPT-5.5 Instant 是第一个被 OpenAI 标记为「高能力」的 Instant 模型,安全评估里多了些新门槛,做 AI 安全的可以翻开系统卡看看具体红线画在哪。
01:31
ChatGPT@ChatGPTapp
精选83
GPT-5.5 Instant 开始向所有 ChatGPT 用户推出。 更简洁。记忆更佳。更个性化。 而且对话体验顺畅得多。真的。
OpenAI模型发布

推荐理由:GPT-5.5 Instant 不是 GPT-5,但对每天用 ChatGPT 的人来说,更简洁、更好记忆这些改动比跑分提升更实在,值得等推送。
01:30
OpenAI@OpenAI
精选86
GPT-5.5 Instant 正在 ChatGPT 中逐步推出。 这是一次重大升级,以更温暖、更自然的语调为您提供更智能、更清晰、更个性化的答案。 同时它也更加简洁,这正是我们所了解到的用户需求。我们相信您会喜欢与它对话。
OpenAI模型发布

推荐理由:GPT-5.5 Instant 是 OpenAI 给所有人的即时升级,更聪明更自然还更简洁,这可能是 ChatGPT 推出以来最接地气的版本迭代。
01:27
Eric@ericmitchellai
精选82
OpenAI宣布将ChatGPT的默认模型更新为GPT-5.5 Instant。新版模型在智能水平、图像理解能力和事实准确性方面均有显著提升。其回应风格变得更简洁、直接和自然,同时提供更个性化和清晰的答案。此次升级基于用户反馈,旨在提供更优质的对话体验。

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI模型发布

推荐理由:ChatGPT 默认模型这次升级把智能、图片感知和事实性都拉高了一截,更简洁的写作风格可能终于解决了啰嗦的老毛病,所有用户开机就能感受到变化,值得第一时间试。
01:26
Chubby♨️@kimmonismus
精选83
OpenAI推出GPT-5.5 Instant作为ChatGPT新默认模型,实现显著升级

OpenAI正式将GPT-5.5 Instant设置为ChatGPT的新默认模型,该模型在基准测试中表现大幅提升,变得更智能、准确和可靠。其在图像分析、STEM、写作及医学、法律等高精度领域能力增强。核心升级在于个性化功能,能有效利用用户保存的记忆、过往聊天、文件和Gmail上下文,并展示影响回复的记忆来源。该模型将在未来两天内向所有用户推出,个性化改进优先面向网页版Plus和Pro用户,移动版随后跟进;API版本为gpt-5.5-chat-latest。官方表示,升级后的模型能提供更智能、清晰、个性化的答案,语气温暖自然且更简洁。

OpenAI: GPT-5.5 Instant is starting to roll out in ChatGPT. It's a big upgrade, giving you smarter, clearer, and more personaliz...

OpenAI多模态推理模型发布

推荐理由:ChatGPT默认模型直接换到GPT-5.5 Instant,个性化能力是代际跃迁,明天打开就能感受到不同。
01:12
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选82
GPT-5.5 Instant:更智能、更清晰、更个性化

ChatGPT的默认模型已更新为GPT-5.5 Instant。新版模型能提供更智能、更准确的答案,并有效减少了幻觉现象。同时,用户获得了更强的个性化控制能力,使交互体验更贴合个人需求。此次升级标志着模型在理解精度与响应定制化方面取得了显著进步。

OpenAI推理模型发布

推荐理由:ChatGPT默认模型替换为GPT-5.5 Instant,不只是变聪明,幻觉减少和个性化控制才是真改进,每个用户都能马上感觉到不同。
01:00
TestingCatalog News 🗞@testingcatalog
69
Inworld AI发布了新一代实时对话语音模型Realtime TTS-2。该模型的核心突破在于,能在说话前处理完整的多轮对话音频上下文,从而像真人一样实时适应对话情境。其关键特性包括:单一音色支持超过100种语言,首次音频生成延迟低于200毫秒,并能通过自然语言指令调整语音风格,无需预设情感标签。这标志着语音AI首次具备了"聆听"对话整体氛围而不仅是字面内容的能力,其架构设计旨在实现既自然动听又富有情境感知的对话体验。

Inworld AI: Introducing Realtime TTS-2, a new generation of voice model built for realtime conversation. It is the first voice model...

产品更新语音
00:58
xAI@xai
精选80
Grok 4.3 现已在 xAI API 上线。这是我们迄今为止最快、最智能的模型。 它在 @ArtificialAnlys 排行榜上的智能体工具调用和指令遵循方面位居榜首,并在 @ValsAI 的企业领域(如判例法和公司金融)中排名第一。 Grok 4.3 支持 100 万令牌的上下文窗口,定价为输入每百万令牌 1.25 美元,输出每百万令牌 2.50 美元。 创建 API 密钥并开始构建:http://console.x.ai/team/default/api-keys
智能体xAI推理模型发布

推荐理由:Grok 4.3 登顶 agentic tool calling 榜,定价有竞争力,做 agent 的值得认真看。虽然不算顶级发布,但 xAI 靠性能价格组合可能抢下不少性价比敏感开发者。
00:56
Rohan Paul@rohanpaul_ai
65
SubQ首发:1200万token上下文窗口,成本降低95%以上

SubQ模型发布,这是首个基于完全次二次稀疏注意力架构(SSA)的前沿LLM,拥有1200万token的上下文窗口。它在处理100万token时比FlashAttention快52倍,成本低于Opus的5%。该模型突破传统Transformer注意力计算所有token关系的限制,通过稀疏注意力选择性聚焦重要关系,使长上下文处理的计算量减少近1000倍,显著改变了LLM的成本曲线和扩展方式。

Alexander Whedon: Introducing SubQ - a major breakthrough in LLM intelligence. It is the first model built on a fully sub-quadratic sparse...

推理模型发布
5月5日
23:56
Luma@LumaLabsAI
71
Luma Labs 推出的 UNI-1.1-Max 和 UNI-1.1 多模态模型在 Image Arena 的文本生成图像与图像编辑综合排名中位列第三,且未采用智能体搜索技术。具体来看,在文本生成图像竞技场中,两款模型分别排名第六和第七;在多图像编辑和单图像编辑竞技场中,它们均进入前十一名,其中 UNI-1.1-Max 在单图像编辑中排名第七。这一成绩标志着 Luma Labs 在多模态前沿领域取得了扎实进展。

Arena.ai: Exciting news: UNI-1.1-Max and UNI-1.1 debuts making @LumaLabsAI the #3 lab in the Image Arena across both Text-to-Image...

图像生成模型发布评测/基准
07:49
Artificial Analysis@ArtificialAnlys
52
匿名文生图模型Peanut在Artificial Analysis文生图竞技场中首次亮相即位列第八。其模型权重预计很快发布,届时将成为领先的开源权重文生图模型。Peanut被定位为新的开源领导者,性能预计将超越Z-Image Turbo、Qwen-Image和FLUX.2 【dev】等现有模型。更多细节和权重文件即将公布。

Artificial Analysis: A new anonymous model debuts at #8 in the Artificial Analysis Text to Image Arena! Peanut's weights are expected to be r...

图像生成开源/仓库模型发布
03:18
Artificial Analysis@ArtificialAnlys
69
一款新的匿名模型在Artificial Analysis文本转图像竞技场中首次亮相,位列第8!Peanut的权重预计即将发布,这将使其成为领先的文本转图像开源权重模型。 Peanut定位为新的领先开源权重文本转图像模型,超越了Z-Image Turbo、Qwen-Image和FLUX.2 【dev】。 更多详细信息(及权重)即将公布。 查看下方🧵中Artificial Analysis图像竞技场里Peanut的生成示例。
图像生成开源/仓库模型发布评测/基准
00:45
Elon Musk@elonmusk
41
在"Vals AI"的私人基准测试中,Grok 4.3在法律和金融领域展现出领先的智能水平。它在CaseLaw (v2)测试中以79.31%的准确率排名第一,该测试基于真实加拿大法庭案例,评估深度法律推理和先例理解能力,表现优于GPT-5.1。同时,它在针对复杂长期信贷协议的CorpFin (v2)测试中以68.53%的准确率夺冠,评估了对多页金融合同条款、风险的理解。这些模拟高风险现实挑战的测试表明,Grok 4.3在最困难的任务中具备卓越的推理能力。xAI正致力于构建世界所需的推理引擎。

X Freeze: Grok 4.3 just became the smartest AI in the world at law and money It took #1 on TWO brutal private tests no other model...

xAI推理评测/基准
5月4日
23:48
Chubby♨️@kimmonismus
62
初创公司Video Rebirth的文本生成视频模型Bach-1.0 Preview在Artificial Analysis的全球AI视频排行榜上首次亮相即位列第六。其性能与Vidu Q3 Pro、Kling 3.0 Omni 1080p (Pro)及grok-imagine-video等知名模型相当。该模型计划于五月下旬广泛发布。

Artificial Analysis: Bach-1.0 Preview from Video Rebirth debuts at #6 on the Artificial Analysis Text to Video Leaderboard (No Audio)! Bach-1...

模型发布视频评测/基准
22:16
Rohan Paul@rohanpaul_ai
64
初创公司Video Rebirth凭借其模型Bach-1.0 Preview,在Artificial Analysis的文本转视频榜单中首次进入前六名,打破了该榜单长期由阿里巴巴、字节跳动、xAI等万亿美元级巨头主导的局面。其模型性能与Vidu Q3 Pro、Kling 3.0 Omni 1080p (Pro)及grok-imagine-video等顶尖模型相当,并计划于五月下旬广泛发布。这一突破标志着初创企业在高质量AI视频生成领域取得了显著进展,为该领域的竞争格局带来了新的变数。

Artificial Analysis: Bach-1.0 Preview from Video Rebirth debuts at #6 on the Artificial Analysis Text to Video Leaderboard (No Audio)! Bach-1...

模型发布视频
21:24
小互@xiaohu
56
传谷歌I/O将发布Omni模型,Gemini或升级为全模态生产力入口

据传谷歌将在I/O大会发布名为“Omni”的新模型,旨在将Gemini从聊天助手升级为集成写作、图片、视频、长上下文记忆与复杂任务流的全模态生产力平台。该模型可能原生支持视频生成与输出,超越现有的Veo 3.1。同时,Gemini 3.2/3.5版本或专注于提升推理速度与效率,而Ultra版本则向长上下文、重记忆及多步骤工作流方向深化。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google多模态模型发布视频
17:48
Artificial Analysis@ArtificialAnlys
56
Bach-1.0 Preview from Video Rebirth 在 Artificial Analysis 文本转视频排行榜(无音频)中首次亮相,位列第6! Bach-1.0 Preview 是来自 @video_rebirth 的最新文本转视频模型,其性能与 Vidu Q3 Pro、Kling 3.0 Omni 1080p (Pro) 和 grok-imagine-video 相近。 Bach-1.0 Preview 计划于五月下旬广泛发布。 在下方 Artificial Analysis 视频竞技场中查看 Bach-1.0 Preview 的生成示例 🧵
模型发布视频
5月3日
16:45
Chubby♨️@kimmonismus
45
据泄露信息显示,谷歌可能正在为其Gemini平台测试一款全新的Omni模型,专注于视频生成功能,其界面标语为"由Omni驱动"。该模型的内部代号接近当前基于Veo的视频工具"Toucan"。分析指出,若谷歌正式发布名为Gemini Omni的视频生成模型,其性能很可能超越现有的Veo 3.1版本。此举若成真,Gemini将成为首个具备视频输出能力的顶级Omni模型,相关进展或于即将到来的Google I/O大会上正式公布。

TestingCatalog News 🗞: GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template....

Google多模态模型发布视频
15:51
The Decoder:AI News(RSS)
60
小米开源模型 MiMo-V2.5-Pro 瞄准 Claude Opus,实现数小时自主编程

小米发布开源模型 MiMo-V2.5-Pro,其编程基准测试成绩接近 Anthropic 的 Claude Opus 4.6,同时令牌消耗量减少 40% 至 60%。该模型能持续数小时自主处理单一任务,标志着中国开源模型竞争焦点正从单纯追求基准分数,转向降低运行成本与提升任务持久性。小米借此进一步深入与 DeepSeek 等国内开源提供商的竞争。

Anthropic开源/仓库模型发布编码
06:50
TestingCatalog News 🗞@testingcatalog
58
谷歌I/O动态:Gemini测试用于视频生成的新Omni模型

谷歌正在其Gemini平台测试一款名为“Omni”的新模型,专注于视频生成功能。泄露信息显示,该模型的界面提示用户“从一个想法开始或尝试一个模板”,并注明“由Omni驱动”。这一模型可能与内部代号“Toucan”的视频生成工具密切相关,后者目前由Veo驱动。如果谷歌计划正式发布用于视频生成的Gemini Omni,其性能很可能超越当前的Veo 3.1版本。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型,这标志着谷歌在视频生成领域的重大技术进展,并可能为未来的Google I/O 2026活动预热。此举显示了谷歌在人工智能视频生成方面的持续创新和竞争态势。

Google多模态模型发布视频
5月2日
15:50
The Decoder:AI News(RSS)
59
xAI 发布 Grok 4.3,大幅降价并推出创意项目 Imagine 智能体模式

xAI 正式推出 Grok 4.3 模型,其核心策略是大幅降低价格并增强工具使用能力。新模型在实际任务处理上有所提升,但在性能上仍落后于 OpenAI 和 Anthropic 的顶尖模型。此次发布还引入了一个基于智能体的新型图像生成器“Imagine”模式,专门服务于创意项目。

xAI图像生成推理模型发布
15:44
Chubby♨️@kimmonismus
51
不错!Google 正在为 I/O 大会做准备。新模型即将推出

can: 🚨 Google updated Gemini 3 Flash in arena It still has the same name "Gemini 3 Flash". However, output quality is two ti...

Google模型发布评测/基准
13:49
TestingCatalog News 🗞@testingcatalog
66
谷歌新的Gemini Flash模型已在LM Arena上出现。同时,Vertex AI客户收到邮件,Gemini 3.1 Flash Lite即将正式发布。引用推文指出,虽然模型在竞技场中仍显示为"Gemini 3 Flash",但其输出质量已跃升两个层级,性能更接近当前的Gemini 3.1 Pro,是一次重大升级,实际版本可能是3.1、3.2或3.5 Flash。

can: 🚨 Google updated Gemini 3 Flash in arena It still has the same name "Gemini 3 Flash". However, output quality is two ti...

Google模型发布评测/基准
04:40
Elon Musk@elonmusk
54
Grok在法律领域排名第一 【引用 @ArthurMacwaters】:Grok 4.3发布 > 判例法领域第一 > 公司金融领域第一 > 考虑到每百万tokens成本显著更低(比opus 4.7和openai 5.5低5-10倍),表现令人印象深刻 看到在高度注重细节的应用领域性能大幅提升,非常令人兴奋

Arthur MacWaters: Grok 4.3 release > #1 in caselaw > #1 in corpfin > impressive given significantly lower cost per 1m tokens (5-10x less t...

xAI大佬观点推理
03:40
Elon Musk@elonmusk
53
Grok 4.3 现已登陆 Vercel xAI 的最新模型,具备改进的工具调用和指令遵循能力。 立即使用 model: 'xai/grok-4.3' 进行尝试 https://vercel.com/changelog/grok-4-3-on-ai-gateway

Vercel Developers: Grok 4.3 is on AI Gateway. xAI's latest model, with improved tool calling and instruction following. Try it now with mod...

xAI产品更新
00:47
OpenAI@OpenAI
精选76
GPT-5.5发布已有一周,这已经是我们迄今为止最强大的模型发布。 API收入增长速度比以往任何版本都快两倍以上,而随着企业对智能编码工具的需求持续攀升,Codex在不到七天内收入翻倍。
OpenAI行业动态

推荐理由:GPT-5.5首周收入增速超以往两倍,Codex七天翻番,这是企业市场对agentic coding的真实投票,比benchmark更有说服力。
5月1日
23:39
Elon Musk@elonmusk
55
Grok 4.3 此次发布显示运行 Artificial Analysis Intelligence Index 的成本效益有所提高,Grok 4.3 在智能与成本的帕累托边界上表现稳健。 得益于输入 token 价格降低 37.5% 和输出 token 价格降低 58.3%,运行 Intelligence Index 评估的成本为 395 美元,较 Grok 4.20 0309 v2 整体下降约 20%。

Artificial Analysis: This release shows increased cost efficiency to run the Artificial Analysis Intelligence Index, with Grok 4.3 sitting co...

xAI数据/训练模型发布
19:17
Hacker News 热门(buzzing.cc 中文翻译)
精选76
Grok 4.3

x.ai 正式发布了 Grok 4.3 模型,开发者可通过官方文档获取详细信息。该模型在 Hacker News 社区获得关注,相关帖子收获了 100 点热度。此次发布标志着 Grok 系列模型的持续迭代更新。

xAI多模态推理模型发布

推荐理由:xAI 的 Grok 4.3 如期而至,性能和对标都写在文档里了,想了解最新大模型实力的开发者值得花五分钟看一眼。
17:46
MiniMax (official)@MiniMax_AI
2
盯--

Florian Brand: 👀

其他
16:47
The Decoder:AI News(RSS)
51
Mistral 新旗舰模型 Medium 3.5 将聊天、推理和代码功能整合为一体

Mistral 发布其新旗舰模型 Mistral Medium 3.5,它将此前独立的聊天、推理和代码生成模型合并为一个单一产品。同时,该公司为其编程工具 Vibe 增加了异步云代理功能,并为聊天产品 Le Chat 引入了新的智能体模式。

智能体推理模型发布编码
15:14
Chubby♨️@kimmonismus
57
xAI发布的Grok 4.3模型在Artificial Analysis Intelligence Index上获得53分,相比Grok 4.20输入成本降低约40%,输出成本降低约60%,性价比突出。其最大亮点是在真实世界代理任务(GDPval-AA)上的ELO评分跃升321点至1500,超越了Gemini 3.1 Pro Preview和Muse Spark等模型,但仍大幅落后于GPT-5.5。该模型在指令遵循和客服任务上表现强劲,同时在Omniscience基准上准确率提升但幻觉率增加。总体而言,Grok 4.3以更低成本实现了更高的智能指数得分,成为同智能层级中成本效益较高的模型之一。

Artificial Analysis: xAI has launched Grok 4.3, achieving 53 on the Artificial Analysis Intelligence Index with improved agentic performance,...

xAI推理模型发布
13:46
TestingCatalog News 🗞@testingcatalog
54
Grok 4.3 现已可在 API 上使用 👀
xAI模型发布
‹ 上一页
1…2728293031…36
下一页 ›