VOL.2026.05.02·17 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年五月二日 星期六DAILY · 每早八时
01

模型发布/更新

Model Releases
1

GPT-5.5发布一周创营收新高

官方·XX:OpenAI (@OpenAI)

GPT-5.5发布已有一周,这已经是我们迄今为止最强大的模型发布。 API收入增长速度比以往任何版本都快两倍以上,而随着企业对智能编码工具的需求持续攀升,Codex在不到七天内收入翻倍。

02

产品发布/更新

Product
6

可用ChatGPT账户登录OpenClaw

X·KOLX:Sam Altman (@sama)

现在你可以用你的ChatGPT账户登录OpenClaw,并在那里使用你的订阅服务! 祝你捕龙虾愉快。

Introducing Dynamic Workflows:可随租户流转的持久执行功能

官方Cloudflare Blog

Dynamic Workflows 是一个函数库,支持将持久执行实时路由至租户提供的代码。该库基于 Dynamic Workers 构建,使平台能够以近乎零闲置成本为数百万个独特工作流提供服务。它允许平台根据租户需求动态分配执行资源,实现了工作流与特定租户代码的即时绑定,大幅降低了多租户场景下的运营开销和资源浪费。

为高频聊天主题创建专属笔记本

官方·XX:Gemini (@GeminiApp)

为你最常聊的话题安个家。🗂️ 滑动了解如何在Gemini中使用记事本保持条理,并在回复中告诉我们你如何使用它们。

Claude Desktop v2.1.126 版本更新

官方Claude Code:GitHub Releases(RSS)

本次更新增强了模型网关集成,当配置指向兼容网关时,可直接在模型选择器中列出可用模型。新增了 `claude project purge` 命令,用于彻底清理项目状态数据。OAuth登录流程得到优化,支持在浏览器回调失败时手动粘贴授权码,并修复了多种网络环境下的登录问题。安全方面,修复了 `allowManagedDomainsOnly` 等设置可能被忽略的漏洞。此外,还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。

03

行业动态

Industry
2

Claude开发者大会下周回归

官方·XX:Claude (@claudeai)

Code with Claude,我们的开发者大会,下周回归。 无论你是刚刚开始使用 Claude Code,还是已经构建了一段时间,都有适合你的环节。 注册观看直播:http://claude.com/code-with-claude

谷歌I/O舞台征集创意编程作品

官方·XX:Google DeepMind (@GoogleDeepMind)

认为你的氛围编程和创意能登上#GoogleIO主舞台吗?展示给我们看。 随着我们进入节目开始的倒计时,使用@GeminiApp或@GoogleAIStudio构建的最佳创意将被重点展示——比如蛋白质模拟器、物理引擎或基于数学的艺术。🔢

04

论文研究

Research
1

强化智能体:面向工具调用智能体的推理时反馈机制

学术机构Apple Machine Learning Research(RSS)

本文提出一种将评估机制嵌入工具调用智能体实时执行循环的新方法。通过引入一个专门的评审员智能体,在推理时对主智能体的中间决策轨迹进行即时评估,并生成结构化反馈。这使得主智能体能在单次运行中动态调整其工具选择与参数调用,无需依赖传统的提示调整或模型重训练。该实时干预机制旨在直接纠正错误,提升了工具使用的准确性与可靠性,突破了传统后验评估无法在运行中修正行为的局限。本工作已被ACL 2026的自然语言生成、评估与指标研讨会接收。

05

技巧与观点

Tips & Takes
7

2026 年的 AI 提示方式与 2022 年 ChatGPT 推出时大不相同。

X·KOLX:小北 (@frxiaobei)

吴恩达(Andrew Ng)推出新课程《人人皆可的 AI 提示技巧》,旨在帮助不同水平的用户成为 AI 高级使用者。课程教授适用于 ChatGPT、Gemini、Claude 等工具的通用提示技巧,核心内容包括:利用深度研究模式生成复杂问题的详尽报告;为 AI 提供远超常人认知的丰富文档与图像上下文;在重要决策时让 AI 进行长时间深度思考;以及使用 AI 生成图像、分析数据、构建简单游戏和网站。课程还将剖析大模型的工作原理,帮助学员判断何时可信赖 AI 的答案。

GPT-Image-2.0反讽提示词爆红,模仿拙劣鼠标绘图

X·KOLX:歸藏 (@op7418)

GPT-Image-2.0近期因一系列提示词再度引发关注,其中一条要求AI以“笨拙、潦草、极其拙劣”的方式重绘图像,并模仿MS Paint鼠标绘图的低质量像素感,形成刻意粗糙的反差效果。该提示词通过强调“糟糕到可笑”的指令,利用AI精准执行反讽式需求,迅速在社交平台形成病毒式传播,展现了用户对AI图像生成工具创意玩法的探索。

强化学习双刃剑效应:已知领域提升性能,未知领域易致模型幻觉

X·KOLX:Francois Chollet (@fchollet)

强化学习在已知领域能提升模型性能,但在未知领域可能导致模型产生幻觉,误以为在执行其他训练过的任务。这一现象在GPT-5.5等大模型的ARC AGI 3基准测试中有所体现,其得分仅为0.43%,与Claude 4.6、Gemini 3.1等模型表现相近。分析指出GPT-5.5的主要失败原因包括:局部效应正确但世界模型错误、从训练数据中提取的抽象层级不当,以及虽解决问题却未强化奖励机制。深入分析此类失败案例,有助于全面理解大模型在特定模态上的能力局限与改进方向。

玻璃骏马展现超现实艺术境界

官方·XX:PixVerse (@PixVerse_)

哇,这匹玻璃马简直达到了不同层次的超现实感 🐴🤯 顺便特别感谢 @MrDasOnX 在 PixVerse 上用 HappyHorse 完美创作了这件马主题作品!☺️

本周的积极信号:AI在医疗、教育、农业与科研领域的突破性进展

大咖博客Tomer Tunguz 博客(VC 分析)

近期多项进展展现了AI的巨大积极影响。医疗领域,Mayo Clinic的AI能通过常规CT提前最多三年检测胰腺癌,强生利用AI将新药线索生成时间减半。教育方面,哈佛研究显示AI导师使学生学习效果翻倍,泰国培训16万名教师惠及330万学生。农业上,AI能以约88%准确率预测害虫爆发。科研中,AI快速筛查NASA数据,新发现超一万颗系外行星候选。此外,香港推出AI洪水预报系统,Atlassian和Twilio等公司也因AI驱动业绩增长并上调预期。这些案例平衡了AI风险,凸显其创新潜力。

能生成通过测试的代码模型,不等于能产出正确、安全、可维护、架构良好软件的模型

大咖博客Gary Marcus:The Road to AI We Can Trust(RSS)

当前大量代码由AI生成,但其实际意义需审慎评估。能生成可通过给定测试的代码模型,与能产出真正正确、安全、可维护且架构良好软件的模型存在本质区别。AI生成的代码可能在特定测试用例下运行成功,却未必满足软件工程对长期维护性、安全性、架构设计及潜在边界情况处理的高标准要求。这一差距揭示了当前AI编程工具的核心局限,提醒开发者需以批判性眼光看待其输出,而非完全替代专业开发实践。

17
今日事件
13
一手报道
1
新模型
16
信源
AI HOT · 编辑系统自动生成