AIHOT
内容
精选全部 AI 动态AI 日报
接入
Agent 接入
更多
关于更新日志反馈
登录
精选全部日报更多
VOL.2026-W22·32 STORIES·AI HOT WEEKLY

AIHOT周报

2026-05-25 ~ 2026-05-31WEEKLY · 编辑系统自动综合

本周AI行业呈现三大主线:模型能力持续突破(Qwen3.7-Max成为全球第二编程模型、GPT-5.6曝光150万token上下文)、AI安全与伦理议题升温(教皇通谕警示AI风险、TrapDoor供应链攻击利用AI助手)、以及产品生态加速扩展(Luma Agents实现UGC广告生成、Grok Build开放Beta、Runway MCP服务器发布)。同时,端侧模型(MiniCPM5-1B、BitCPM-CANN)和芯片创新(华为逻辑折叠技术)也值得关注。

01

模型能力与性能突破

7 篇

本周多款模型发布重大更新:Qwen3.7-Max在Code Arena上得分1541,成为全球第二大AI编程模型,并上线隐式缓存功能;GPT-5.6(内部代号iris-alpha)被曝支持150万token上下文,较前代提升43%;面壁智能开源MiniCPM5-1B,在AA-Index上超越所有2B以下模型;腾讯混元发布翻译模型Hy-MT2,1.8B版本登顶Hugging Face排行榜。此外,谷歌AlphaProof Nexus攻克两道悬置56年的数学难题,Claude Mythos则解决了OpenAI提出的Erdős单位距离猜想。

Qwen3.7-Max 成为全球第二AI编程模型

X:阿里云 / Alibaba Cloud (@alibaba_cloud)

Qwen3.7-Max隐式缓存功能上线

X:通义千问 / Qwen (@Alibaba_Qwen)

OpenAI GPT-5.6 模型曝下月发布:AI 上下文 150 万 tokens

IT之家(RSS)

面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

IT之家(RSS)

腾讯混元新翻译模型双榜亮眼,小程序发布

X:腾讯混元 (@TencentHunyuan)

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

IT之家(RSS)

据报道Claude Mythos以“巧妙简洁的证明”解决了OpenAI里程碑式的Erdős问题

The Decoder:AI News(RSS)
02

AI安全、伦理与监管

6 篇

本周AI安全与伦理议题成为焦点。教皇Leo XIV发布通谕《Magnifica Humanitas》,警告AI对人性、劳动和战争的冲击,Anthropic联合创始人Chris Olah出席并呼吁外部监督。TrapDoor供应链攻击首次将AI助手作为攻击面,通过恶意配置文件窃取开发者凭证。微软亚洲研究院发起全球AI价值观挑战赛,探索AI理解人类价值观的能力。此外,我国宣布将加快研究推进人工智能健康发展综合性立法。

TrapDoor供应链攻击:AI助手成新型攻击面

X:Kim (@kimmonismus)

教皇里奥呼吁在AI时代保持“深刻的人性”

The Verge:AI(RSS)

Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话

Anthropic:Newsroom(网页)

微软亚洲研究院发起全球AI价值观挑战赛

X:Microsoft Research (@MSFTResearch)

我国将加快研究推进人工智能健康发展综合性立法、低空经济立法等

IT之家(RSS)

教皇没对AGI上头

The Verge:AI(RSS)
03

产品生态与平台扩展

10 篇

多家公司推出新产品或重大更新:Luma Agents实现规模化UGC广告生成;Grok Build Beta向SuperGrok用户开放,并登陆Kilo IDE平台;Runway推出MCP服务器,支持AI智能体直接生成图像视频;Claude Code发布安全漏洞识别插件和v2.1.152更新;OpenAI产品支持私有MCP服务器安全连接;Replit新增两种登录方式;MiMo 2.5 Pro大幅降价99%。此外,OpenRouter完成1.13亿美元B轮融资,周处理量达25万亿token。

Luma Agents 实现规模化真实 UGC 广告生成

X:Luma AI (@LumaLabsAI)

Grok Build Beta版向SuperGrok用户开放

X:xAI (@xai)

Grok编程智能体登陆Kilo IDE平台

X:xAI (@xai)

Runway 推出 Model Context Protocol 服务器

Runway:News(网页)

Claude Code推出安全漏洞识别插件

X:Claude Devs (@ClaudeDevs)

Claude Code v2.1.152 更新发布

Claude Code:GitHub Releases(RSS)

OpenAI产品支持私有MCP服务器安全连接

X:OpenAI Developers (@OpenAIDevs)

Replit 应用添加登录的两种方式

X:Replit (@Replit)

MiMo 2.5 Pro大幅降价,与DeepSeek V4 Pro同价

X:Kim (@kimmonismus)

OpenRouter完成1.13亿美元B轮融资

04

端侧模型与芯片创新

3 篇

端侧AI模型取得进展:面壁智能联合清华等开源基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN,以及MiniCPM5-1B(INT4量化后仅0.5GB,可运行于手机和浏览器)。华为何庭波在ISCAS 2026提出“韬定律”和逻辑折叠技术,将麒麟2026芯片晶体管密度提升至238 MTr/mm²,性能核心能效提高41%,并规划了麒麟2028、2029及昇腾990芯片路线。

面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

IT之家(RSS)

面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

IT之家(RSS)

华为何庭波“韬定律”论文发布,逻辑折叠技术提升芯片性能

IT之家(RSS)
05

AI智能体与工具链进化

6 篇

AI智能体领域持续演进:Cognition成为全球最大独立智能体实验室,估值260亿美元;蚂蚁百灵推出KPop方法,使Ring-2.6-1T在SWE-bench上突破76分;Peter开源skill-cleaner工具优化智能体技能提示词;Anthropic详解Claude智能体隔离控制机制;Greg Brockman发布面向Codex的自我优化提示词框架;Harness与Scaffold术语辨析文章厘清智能体架构。

Cognition成为全球最大独立智能体实验室

X:swyx (@swyx)

KPop 新方法让 Ring-2.6-1T 在 SWE-bench Verified 上突破 76 分

X:蚂蚁百灵 (@AntLingAGI)

“龙虾之父”Peter 开源 skill-cleaner,为 AI 智能体技能“做体检”

IT之家(RSS)

我们如何对不同产品中的Claude进行隔离控制

Anthropic:Engineering(事故复盘 + 工程实践 · 网页)

面向 Codex 的自我优化提示词框架

X:Greg Brockman (@gdb)

Harness、Scaffold 与 AI 智能体术语辨析

Hugging Face:Blog(RSS)
X:OpenRouter (@OpenRouter)