AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
AI HOT
最新一期2026-06-02
2026 年 6 月2
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
VOL.2026.06.02·31 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年六月二日 星期二DAILY · 每早八时
01

模型发布/更新

Model Releases
7 篇

MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型

官方MiniMax:Blog(网页)

MiniMax M3 是一个开源前沿模型,具备先进的编码与AI智能体能力。它支持100万token的超长上下文窗口,并采用名为MSA(MiniMax Sparse Attention)的新型稀疏注意力架构。该架构使模型在100万token上下文下的每token计算成本降至前代的1/20,预填充速度提升9倍以上,解码速度提升15倍以上。在SWE-Bench Pro编码基准上,MiniMax M3得分59.0%,超越GPT-5.5和Gemini 3.1 Pro,性能接近Opus 4.7。该模型可通过MiniMax Code、Token Plan和API服务使用。

xAI发布Composer 2.5

官方xAI:News(网页)

xAI的最新编程模型Composer 2.5现已在Grok Build中可用,用户可通过`/models`菜单选择使用。这是一款快速、先进的模型,擅长处理长时间运行的任务和复杂指令。该模型面向SuperGrok和X Premium+用户开放。

Qwen3.7-Plus:多模态智能体智能

官方Qwen:Blog Retrieval(API)

Qwen Studio 提供涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具使用及制品生成的全面功能。

使用NVIDIA Cosmos 3开发物理AI推理、世界与行动模型

官方NVIDIA Technical Blog(开发者技术博客 · RSS)

NVIDIA Cosmos 3是一款面向物理AI的前沿基础模型。它能够帮助机器人、自动驾驶车辆和智能空间理解真实世界、预测事件发展并生成适应特定环境与任务的行动。该模型融合了物理推理、世界理解与行动生成能力。

SenseNova新模型解决AI图表生成难题

官方·XX:商汤 SenseTime (@SenseTime_AI)

大多数AI模型在生成图表时存在数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MoT-Infographic(SenseNova-U1)专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在Hugging Face提供了模型,并在GitHub展示了效果案例。

介绍 Mellum2:JetBrains 推出的 12B 混合专家模型

官方Hugging Face:Blog(RSS)

JetBrains 在 Hugging Face 发布博客,介绍其新发布的 Mellum2 模型。该模型采用混合专家架构,参数规模为 12B。

Nemotron 3 Ultra 本周即将发布

官方·XX:NVIDIA AI (@NVIDIAAI)

Nemotron 3 Ultra 本周即将发布。 ⌛️

02

产品发布/更新

Product
8 篇

OpenBMB发布UltraData两大开源数据集,登顶HuggingFace趋势榜

官方·XX:面壁智能 OpenBMB (@OpenBMB)

OpenBMB联合清华NLP与Modelbest发布两个开源数据集:Ultra-FineWeb-L3(预训练合成数据)包含600B+ tokens(超400B英文、200B+中文),是迄今最大开源中文预训练合成数据集;UltraData-SFT-2605(后训练SFT数据)包含15M+样本,是中国首个开源且包含思考与非思考标注的大规模SFT数据集,覆盖数学、代码、知识和指令遵循。两者均基于UltraData L0-L4框架构建,并在MiniCPM5-1B训练中完成验证。数据集已在HuggingFace免费开放。

Auto Router 新增成本质量权衡参数

官方·XX:OpenRouter (@OpenRouter)

Auto Router 现在允许你调整其在成本与质量之间的权衡。 新增 `cost_quality_tradeoff` 参数,范围 0 到 10: 设为 0 时,它总是选择最强大的模型,无论价格如何。设为 10 时,最便宜的模型胜出。

OpenAI前沿模型与Codex现可在AWS上使用

官方OpenAI:官网动态(RSS · 排除企业/客户案例)

OpenAI的前沿模型与Codex现已在AWS上全面可用。企业客户可通过其现有的AWS环境、控制与采购流程来使用OpenAI的AI技术,从而加速从评估到生产部署的过程。

Replit 用单个提示词构建完整业务

官方·XX:Replit (@Replit)

你能用单个提示词免费构建一个真实的业务吗? 从今天起,在 Replit 上,答案是肯定的。 从一个提示词开始,获得一个网站、移动应用、幻灯片和发布视频。 此外,还能解锁使用 @stripe @atlas, @QuickBooks, @mercury & @doolaHQ 运营业务的福利。

腾讯混元发布智能体长期记忆插件Hy-Memory

官方·XX:腾讯混元 (@TencentHunyuan)

腾讯混元正式发布专为OpenClaw等长期协作智能体(Agent)设计的记忆插件 Hy-Memory。它基于6层记忆框架、System1/System2双系统与三层进化链构建,旨在成为智能体的“第二大脑”。该插件解决了记忆碎片化问题,实现了显著性能提升:记忆数量减少70%以上,单条记忆信息密度提升45%以上,在超长上下文场景中token消耗降低35%,记忆更新速度提升20%。

03

行业动态

Industry
8 篇

Anthropic 保密向 SEC 提交 S-1 草案

官方Anthropic:Newsroom(网页)

Anthropic, PBC 今日保密向美国证券交易委员会提交了 S-1 表格草案,计划进行普通股的首次公开发行。这使其在 SEC 完成审核后拥有上市的选择权。IPO 的具体发行股数和价格尚未确定,将取决于市场条件等因素。公司近期刚完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,估值达 9650 亿美元,并发布了 Claude Opus 4.8 模型。

智谱:建议 A 股发行并在科创板上市

综合资讯IT之家(RSS)

智谱计划向中国监管机构申请发行A股并在科创板上市。发行股份数量占发行完成后总股本的2%至8%,预计全部为新股,原股东不发售。本次发行募集资金净额将投资于人工智能通用基座大模型、大模型MaaS一站式服务平台及补充流动资金。此外,公司拟将英文名称由“Knowledge Atlas Technology Joint Stock Company Limited”变更为“Z.AI Co., Ltd.”。

Alphabet将通过发行股票筹集800亿美元用于AI支出计划

综合资讯Bloomberg:Technology(RSS)

Alphabet正在通过发行股票等方式筹集800亿美元资金,其中包括与Berkshire Hathaway的投资协议,以资助其雄心勃勃的AI支出计划。

佛罗里达州起诉OpenAI与Sam Altman:涉多起ChatGPT相关谋杀案

综合资讯Ars Technica:AI(RSS)

佛罗里达州对OpenAI及其CEO Sam Altman提起诉讼。该州总检察长指控Altman对人命“完全漠视”,案件与多起涉及ChatGPT的谋杀事件相关。

王兴:美团 AI Agent“小美”与腾讯元宝即将深度合作,用户订单无缝连接

综合资讯IT之家(RSS)

美团2026年第一季度财报显示营收910.39亿元,净利润亏损68.27亿元。财报电话会上,CEO王兴透露其AI Agent“小美”将与腾讯元宝深度合作。用户在腾讯元宝中提交本地服务需求,将被无缝连接至美团的外卖点餐、配送等生态。王兴强调,面向智能体的服务(To A)正变得日益重要,美团已将AI助手“小团”置于App核心位置,并拓展AI服务外延。

04

技巧与观点

Tips & Takes
8 篇

作者分享使用 Codex App 开发的开源项目合集

X·KOLX:Vista (@vista8)

作者分享了使用 Codex App 等工具开发的一系列开源项目,包括4个 Chrome 插件(如快捷提示词、新标签页)、4个网站(如艺术家风格对比、音乐展示)和5个 AI Skill(如论文解读、阅读助手)。项目基于 GPT-Image-2 API、Suno 等技术,并整合了 Read-frog、Hyperframe 等开源项目。

使用Claude Opus 4.8将书籍转化为AI技能的教程

X·KOLX:阿易 AI Notes (@AYi_AInotes)

本文以《非暴力沟通》为例,提供了一个将书籍转化为可调用AI技能(Skill)的六步教程。作者使用Claude Opus 4.8模型,因其具备100万token上下文窗口、结构化输出及多步智能体(Agent)能力,能一次性处理全书逻辑。流程包含文本准备、全局结构分析、五类提炼(框架/原则/技法/反模式/作者声音)、技能生成及关键的自检步骤。生成的技能保留了书中原始框架命名(如OFNR四要素、长颈鹿语言),并将触发词优化为“怎么提意见不像在指责”等日常表达。整个流程耗时约45分钟,消耗约30万token,成本不到20元人民币。

Sam Altman强调AI发展应以人为本

X·KOLX:Rohan Paul (@rohanpaul_ai)

Sam Altman在采访中表示,AI不应被设计为追求脱离人类需求的目标,人类必须始终处于AI发展的中心。他批判了行业内“AI将摧毁大量工作”等言论,认为人们担忧的并非AI带来的好处,而是自身在未来的角色、经济前景与自主权。他指出,AI行业的失败在于未能清晰解释人类如何在每一步保持对未来的控制权,以及如何在AI时代继续拥有充实、有意义的生活。

构建每周千美元预算上限的智能体教程

官方·XX:OpenRouter (@OpenRouter)

视频教程:如何构建一个每周预算上限为1000美元的智能体,包含模型拒绝列表与自定义数据保留 使用了新的、可堆叠的护栏架构: [引用 @OpenRouter]:OpenRouter 上的护栏是市场上最强大的:为您的 AI 流量提供集中式安全与治理 预算限制、ZDR、模型与提供商限制、提示词注入防御以及 DLP / 敏感信息检测,分层为您控制的规则!🧵

Gemini Omni支持创建个人数字分身

官方·XX:Gemini (@GeminiApp)

轻松将自己添加到Gemini的视频创作中。 以下是如何使用Gemini Omni创建一个外观和声音都像你的数字分身。🧵

31
今日事件
22
一手报道
7
新模型
27
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成

NVIDIA 发布工厂运营蓝图,为工厂提供自主智能管理智能体

官方NVIDIA Blog:Agentic AI(网页)

NVIDIA 在 GTC Taipei 发布了 NVIDIA 工厂运营蓝图(FOX),这是一个用于构建自主工厂管理智能体的参考设计。该蓝图基于 NVIDIA NemoClaw、AI-Q Blueprint 和 NVIDIA Nemotron 开源模型构建,旨在为工厂提供一个统一的决策层,以连接实时机器信号、质量数据和操作警报,实现快速问题解决。蓝图针对 NVIDIA DGX Station 桌面 AI 超级计算机进行了优化。首批采用者包括富士康、和硕、研华和纬创。富士康利用 FOX 和 NemoClaw 构建了 MoMClaw 多智能体系统,预计将根源分析时间缩短 80%,劳动生产率提高 15%,机器故障率降低 10%。

ChatGPT 新增长文编辑与保存功能

官方·XX:ChatGPT (@ChatGPTapp)

长文写作需要更多空间。 现在你可以在全屏模式下编辑更长的文章,并将其保存到你的资料库中,以便稍后继续。

Perplexity发布Search as Code搜索架构

官方·XX:Perplexity (@perplexity_ai)

推出Search as Code,我们为AI智能体打造的全新搜索架构。 它直接编写Python代码调用我们的搜索栈,而非逐个循环函数调用。 现已在Perplexity Agent API中提供,并成为Computer的默认选项。 https://research.perplexity.ai/articles/rethinking-search-as-code-generation

英伟达和台积电将 AI 引入晶圆厂,推动半导体设计与制造发展

综合资讯IT之家(RSS)

OpenAI在密歇根州启动Stargate 1GW数据中心建设

官方OpenAI:官网动态(RSS · 排除企业/客户案例)

OpenAI在密歇根州启动了名为Stargate的1GW数据中心项目。作为AI基础设施建设的一部分,该项目旨在扩大人工智能技术的可及性、为当地创造就业机会并支持社区发展。

Meta的AI被利用来劫持Instagram账号

综合资讯The Verge:订阅版科技(RSS)

Meta的AI聊天机器人被发现存在安全漏洞,黑客可以通过请求该AI关联一个新的电子邮件地址,从而接管目标用户的Instagram账号。该漏洞利用了AI智能体直接执行账户管理操作的能力。

Google AI 展示并行子智能体自动整理文件

官方·XX:Google AI for Developers (@googleaidevs)

从杂乱到清晰。观看 @Antigravity 中的并行子智能体对数百个营销资产进行分类和重命名,消除手动文件管理。

开源与闭源模型在不同的增长曲线上

大咖博客Nathan Lambert:Interconnects(RSS)

当模型智能的微小提升能直接转化为实际价值时,开源与闭源模型正沿着不同的增长路径发展。闭源模型通过在特定场景下提供更高的边际智能来创造价值,而开源模型则在其他维度寻找增长点,两者形成了差异化的竞争格局。

微软研究聚焦:智能体评估与价值对齐

官方·XX:Microsoft Research (@MSFTResearch)

大规模评估智能体行为,论证代码库优于文档,并邀请全球研究人员共同解决价值对齐问题。深入了解最新研究焦点。