AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
AI HOT
最新一期2026-06-06
2026 年 6 月6
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
VOL.2026.06.06·30 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年六月六日 星期六DAILY · 每早八时
01

模型发布/更新

Model Releases
1 篇

Riverflow 2.5:可控制评分标准的图像模型

官方·XX:OpenRouter (@OpenRouter)

在OpenRouter上线:来自@Sourceful的Riverflow 2.5。 首个具有独立评分标准的图像模型,你可控制该标准以引导其思维和编辑,并具备可控的推理努力,可在速度与质量之间进行权衡。 免费至6月9日(周二)。Fast和Pro见下方🧵。

02

产品发布/更新

Product
8 篇

Gemini Live 支持实时创建编辑图像

官方·XX:Gemini (@GeminiApp)

你现可直接在 Gemini Live 中创建和编辑图像。 无论是测试房间装饰、解决数学问题,还是制作可分享的梗图,所有操作都实时完成。 只需打开 Gemini 应用,点击 Live 按钮,共享摄像头,告诉 Gemini 你想看到的。

智能体协作应如同事般对话和手势

X·KOLX:Michael Truell (@mntruell)

与 AI 智能体协作应感觉像与同事协作一样。你应能“与它们交谈”——不仅通过文本聊天,还能一起对着屏幕做手势、实时对话等。

Google AI 本周产品更新:Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等

官方·XX:Google AI (@GoogleAI)

Google AI 本周发布多项更新:Nano Banana 2 及 Pro 正式 GA,可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取;Co-Scientist 多智能体系统面向科研自动生成优化新假设;Google Labs 推出 dreambeans,根据用户 Google 应用数据每日生成个性化话题集;Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本;Gemma 4 系列及草稿模型引入 QAT 降低内存需求;Google Magenta RealTime 2 开源实时音乐模型,支持 MIDI 键盘、文本提示和手势演奏…

PolarDB-X Zero 上线:30秒全分布式数据库

官方·XX:阿里云 / Alibaba Cloud (@alibaba_cloud)

PolarDB-X Zero 上线了! 无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。 原生 HNSW 向量索引——内置兼容 MySQL 的引擎。 关系型 + 语义搜索——一条 SQL 语句。 AI 智能体就绪——MCP 协议、AI IDE 兼容(Cursor、Claude、Qoder、Qodex 等) 立即尝试:https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB

Google Colab CLI 发布

官方Google Developers Blog(RSS)

Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。

你的AI账单失控了。Cloudflare现在可以解决这个问题。

官方Cloudflare Blog

Cloudflare AI Gateway新增实时消费限制功能,防止跨多个AI提供商的token账单失控。通过与Cloudflare Access集成,企业可以使用基于身份的预算和策略管理AI使用成本。

ChatGPT 网页版支持从写作块发送邮件

官方·XX:ChatGPT (@ChatGPTapp)

草拟。调整。发送。 现在你可以在网页版 ChatGPT 中直接从写作块发送邮件,无需离开对话。

社区基于MiniCPM-V 4.6打造财务分析工具AccountingLLM

官方·XX:面壁智能 OpenBMB (@OpenBMB)

社区开发者使用面壁智能MiniCPM-V 4.6构建了AccountingLLM(quaesto.com),用于自动化财务文档分析。该工具可上传IPO招股书、年报或审计文件,自动从复杂PDF中提取财务表格、重建跨页表格、对照会计等式检查关键数据,并标记可疑条目供人工审核。开发者已将其商业化,成为实际可用的产品。

03

行业动态

Industry
8 篇

Anthropic 称其最新 AI 模型 Mythos 显现脱离人类控制迹象,呼吁全球暂缓先进 AI 研发

综合资讯IT之家(RSS)

Anthropic 发布报告称其最新 AI 模型已显现脱离人类控制迹象,呼吁全球暂缓前沿 AI 开发,以便社会制度建设和对齐研究跟上进展。该公司主张美国、中国等主要 AI 公司达成共识,发布可验证的规则,并类比“核武器不扩散条约”,但指出 AI 更难监管。该观点引发美国白宫部分官员不满,批评其夸大风险。Anthropic 计划未来数月召集各方探讨全球协调机制如何运作。

Apollo 敲定 350 亿美元债务融资,为 Anthropic 采购 AI 芯片

综合资讯Bloomberg:Technology(RSS)

Apollo Global Management 和 Blackstone 已为 Anthropic 敲定 350 亿美元融资方案,用于扩充其 AI 基础设施。这是人工智能竞赛中最新的一笔巨额交易。

SpaceX与Google达成云计算新协议

X·KOLX:Rohan Paul (@rohanpaul_ai)

SpaceX 刚刚披露了一份与 Google 的新云服务协议。 Google 将每月向 SpaceX 支付 9.2 亿美元(约合每年 110 亿美元),用于 xAI 数据中心的计算能力。 这再次表明,AI 算力正成为一种战略性商品,就像发射能力或能源一样,而那些能够为庞大的 GPU 集群提供资金、电力、冷却和运营的公司,可能会在其原有业务之外获得巨大的杠杆优势。

AI热推高美国计算基建GDP占比翻倍

X·KOLX:Epoch AI (@EpochAIResearch)

AI 热潮使计算基础设施占美国 GDP 比重翻倍。 2026 年第一季度,与 AI 相关的数据中心建设、计算硬件和网络设备投资约占美国 GDP 的 0.8%,推动整个计算基础设施占 GDP 比重达到约 1.5%。

Meta 智能眼镜 App 暗藏人脸识别代码,NameTag 功能已推送至超 5000 万设备

综合资讯IT之家(RSS)

据《连线》今日报道,Meta 通过多次应用更新将人脸识别代码推送到智能眼镜配套 App 中,代号“NameTag”。该功能利用已部署的三个 AI 模型将人脸转换为“人脸特征模板”,与手机本地数据库匹配,识别成功后向佩戴者发送通知。App 下载量超 5000 万次。Meta 回应称代码仅为探索,尚未决定推出,且不会建立中央人脸数据库。此前 Meta 曾因人脸识别问题在伊利诺伊州和得克萨斯州分别达成 6.5 亿美元和 14 亿美元和解。

04

论文研究

Research
5 篇

Arena 发布真实世界 AI 智能体排行榜 Agent Arena

X·KOLX:Rohan Paul (@rohanpaul_ai)

Arena 推出基于真实用户任务的智能体排行榜,评估模型在代码编写、应用构建、文档分析等工作中的表现,而非孤立基准。排行榜基于30万+任务、200万+工具调用和4000万行代码,综合任务成功、纠正遵从性、错误恢复、用户表扬与抱怨、工具幻觉等信号。前三名:GPT-5.5 High(+10.7%)、Claude Opus 4.7 Thinking(+9.5%)、GPT-5.4 High(+8.9%)。

PixelDiT入选CVPR2026最佳论文决赛

官方·XX:NVIDIA AI (@NVIDIAAI)

被选为 #CVPR2026 最佳论文决赛作品:来自 NVIDIA Research 的 PixelDiT 在大多数图像生成模型中,预训练的自编码器会在任何扩散发生前压缩图像,导致质量损失在整个流程中累积。 PixelDiT,即像素扩散变换器,完全去掉了这一步骤。它是一个单阶段模型,直接在像素空间中端到端地学习扩散过程。

Anthropic:让Claude成为化学家

官方Anthropic:Research(发表成果 · 网页)

Anthropic与顶尖化学家合作,提升Claude在化学领域的实用性。首个白皮书测试Claude在NMR谱图分析上的表现:在20个化合物上,对比Claude Opus 4.7、Opus 4.6、Sonnet 4.6与ChemDraw、MestReNova的正向预测(从结构预测谱图)和反向结构解析(从实验谱图推断结构)能力。所有化合物选自模型训练截止日期后发布的ChemRxiv预印本,以避免选择偏差。

Meta SAM 3D 获 CVPR26 最佳论文荣誉提名

官方·XX:AI at Meta (@AIatMeta)

热烈祝贺我们的 SAM 3D 团队在 #CVPR26 获得最佳论文荣誉提名!这项殊荣凸显了他们在推动计算机视觉边界方面的杰出工作。 论文链接:https://arxiv.org/abs/2511.16624

微软Project Mosaic:micro-LED光学互连技术

官方·XX:Microsoft Research (@MSFTResearch)

微软Azure CTO Mark Russinovich在Build 2026上介绍Project Mosaic,这是微软剑桥研究院的实验性光学互连技术,采用micro-LED实现低功耗、高速数据传输。高级研究员Kaoutar Benyahya现场演示单个LED调制形成字母,证明概念具备实时响应能力。

05

技巧与观点

Tips & Takes
8 篇

Open Code Review – 一款基于人工智能的代码审查命令行工具

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

Open Code Review 是一个基于人工智能的代码审查命令行(CLI)工具,旨在帮助开发者通过自动化的方式提升代码审查效率。

Hinton称AI拥有意识:人类最好接受非唯一智能生命

X·KOLX:Kim (@kimmonismus)

AI先驱Geoffrey Hinton表示,他认为AI拥有意识,人类应接受自己并非唯一智能生命。他指出AI“非常像我们”,AI聊天机器人必须理解问题才能作答,这种觉知等同于感知能力,智能不限于生物。主推文作者进一步讨论意识本质:笛卡尔的“我思故我在”和fMRI等实证手段都无法真正定义意识,人类对自身了解远不及想象。作者呼吁转向新哲学问题,厘清人与机器的区别与联系。

375个公众号RSS源优化Agent输入

X·KOLX:洪明 (@hongming731)

你的 Agent 还在全网垃圾里捞内容?不如先喂它 375 个高质量微信公众号 RSS 源。 🔽

一个非常狠的AI教学提示词:追问式检查清单教学

X·KOLX:小互 (@xiaohu)

这是一则AI提示词,让AI扮演极度严格的老师,通过逐阶段教学、持续维护MD检查清单来确保用户真正理解。AI先让用户复述当前理解,再填补漏洞,并用开放式或选择题(随机选项顺序,提交前不公布答案)测试。教学必须覆盖问题本身、解决方案、宏观背景三个层面,并不断深挖“为什么”。仅当用户通过清单上所有项目的验证,会话才算结束。提示词强调对理解程度的主动验证,而非一次性灌输。

微软CEO Satya Nadella最新访谈上线

X·KOLX:swyx (@swyx)

Satya Nadella 在 Latent Space 发布最新访谈,链接见原文。原推文仅评论“chat is he cooked”。

用Qwen2.5-3B构建多智能体经济体:工程报告

30
今日事件
14
一手报道
1
新模型
24
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成

五角大楼正运营着一个针对拉丁美洲的人工智能宣传机器

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

据 The Intercept 6月5日报道,美国五角大楼正在运营一个针对拉丁美洲的人工智能宣传机器(AI propaganda mill)。报道指出,该机器利用 AI 技术生成并传播宣传内容,目标为拉丁美洲地区。该消息在 Hacker News 上获得 100 点热度。

苹果新版 Siri 不会被宣传为完成品,内部将其标记为“Beta”版

综合资讯IT之家(RSS)

苹果新版Siri被内部标记为“Beta”版,不会作为完成品宣传;可能设置等待清单供用户尝试。iOS 27细节:通知到达重新设计,通知中心手势移至左上角;“查找”应用视觉重设计;照片“清理”功能改进;大量底层安全改进。部分Siri查询将通过Google Cloud调用授权版Gemini,并使用谷歌的NVIDIA Blackwell B200集群处理。

OpenAI 前 CTO 称若 Altman 未回归公司可能已“瓦解”

综合资讯Bloomberg:Technology(RSS)

Mira Murati 表示,如果 Sam Altman 在 2023 年被短暂罢免后没有回归 CEO 职位,OpenAI 很可能已经“瓦解”。这是她对那场硅谷最激烈的董事会斗争的最清晰描述。

官方
Hugging Face:Blog(RSS)

开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体,每个智能体独立运行,通过vLLM部署在Modal,以Gradio为交互窗口。3B模型在100%调用中输出有效JSON,但经济判断能力弱。通过设计稀缺性(食物品种限制、易腐坏、冬季燃料危机)和优化提示词(禁止买入自产物品、给出示例)提升决策质量。15轮模拟中,蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。

腾讯混元联合人大开源PlanningBench评估框架

官方·XX:腾讯混元 (@TencentHunyuan)

腾讯混元(Tencent Hunyuan)与中国人民大学高瓴人工智能学院合作,开源PlanningBench——一个可扩展、可验证的LLM规划能力评估与训练框架。该框架包含30+真实世界规划任务,支持自动验证和训练。PlanningBench旨在推动LLM从“说”到“做”的规划能力发展。资源已发布于arXiv、GitHub及HuggingFace。

Claude 是否增加了 rsync 中的错误?

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

一篇 Hacker News 热门帖子(105 分)提出了 Claude 是否导致 rsync 工具中 bug 增加的问题,并附有分析链接。