AIHOT

5月3日

08:49

Peter Steinberger 🦞@steipete

45

OpenClaw 2026.5.2 版本核心解决了通过 npm 安装时的依赖问题和速度缓慢现象。本次更新通过将大部分功能移至扩展插件，显著精简了主软件包。主要更新内容包括：集成 xAI Grok 4.3 模型，增强插件安装与更新的稳定性，优化 Gateway 和 agent 关键路径的性能。此外，还修复了 Discord、Slack、Telegram、WhatsApp 等通讯工具的集成问题，并对 TTS、实时功能、网络搜索及语音通话进行了优化打磨。此次发布旨在减少系统故障，提升整体稳定性和运行时间。

智能体GitHubxAI产品更新

08:47

Greg Brockman@gdb

55

ChatGPT Images 真的在起飞

OpenAI图像生成行业动态

08:19

Orange AI@oran_ge

15

我的 AI 已经被我逼疯了，第一次说这个字。。。

其他

08:12

Berryxia.AI@berryxia

68

20 个提升效率的 Claude Code 使用技巧

本文介绍了20项Claude Code的核心使用技巧，旨在优化开发工作流。关键功能包括：通过Esc+Esc或/rewind命令回退到历史检查点，实现“撤销”与选择性总结；利用快捷键直接粘贴截图或打开编辑器编写长提示；通过管道命令传输错误日志，为模型提供丰富上下文。此外，用户可借助.claudeignore文件排除路径、用#保存持久指令、或输入“ultrathink”提升模型处理复杂任务的努力等级。高级功能涵盖生成使用报告、保存个人偏好、查看上下文用量，以及在隔离环境或云端运行任务。语音输入功能允许通过按住空格键进行口述提示。

智能体Anthropic教程/实践编码

08:12

IT之家（RSS）

34

OpenAI CEO 奥尔特曼向马斯克示好，欢迎其参加 GPT-5.5 庆功宴

OpenAI CEO 萨姆·奥尔特曼向长期对立的埃隆·马斯克发出示好信号，公开欢迎其参加计划于5月5日举行的GPT-5.5庆功宴。奥尔特曼在线发布了报名表，并表示将由Codex帮助挑选参加者。针对作家安德鲁·库兰的调侃，奥尔特曼回应称“他如果想来的话，可以来。世界需要更多的爱”。两人关系始于2015年共同创立OpenAI，但马斯克于2018年因价值观分歧离开，此后多次批评OpenAI的商业化转向，并于2024年3月起诉OpenAI偏离协议。目前案件已进入庭审阶段，现场气氛紧张，法官曾警告双方控制社交媒体言论。

OpenAI行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

34

TCDA：面向对话情感四元分析的线程约束语篇感知建模

研究提出了一种结合线程约束有向无环图（TC-DAG）与语篇感知旋转位置编码（D-RoPE）的新框架，用于对话方面级情感四元分析。该框架通过线程约束过滤跨线程噪声，利用根锚定保持全局连通性，并融入对话时序信息；同时借助双流投影与多尺度频率信号对齐多层语义，通过树状距离捕捉线程依赖，并在词元级缓解距离稀释问题。在两个基准数据集上的实验表明，该框架实现了最先进的性能。

论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

61

Linear-Time Global Visual Modeling without Explicit Attention

研究提出新视角，将注意力机制数学重构为具有动态预测参数的多层感知机，从而解释其全局建模能力源于动态参数对全局上下文的隐式压缩表征。基于此，研究探索能否完全通过动态参数化实现Transformer级别的序列全局建模，同时保持线性复杂度以替代显式注意力。通过在视觉模型上进行大量实证研究，证实动态参数化确实可以作为一种高效、线性复杂度的显式注意力替代方案，为高效序列建模开辟了新途径。相关代码已开源。

arXivGitHub推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

61

计数能力：探测语言模型可靠性的最小化测试

研究引入“稳定计数能力”评估法，通过让大语言模型重复计数符号直至出错，检验其程序性可靠性。该方法避免了知识依赖、语义模糊和分词干扰。对超100个模型变体的测试显示，其稳定计数能力远低于宣传的上下文长度上限。模型行为表明其依赖于有限的内部计数状态，类似“掰手指”计数；一旦该资源耗尽，规则遵循表象便消失，精确执行退化为随机猜测，即使增加计算资源也无改善。这表明当前模型的流畅表现并不等同于普遍可靠的规则遵循能力。

推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

65

面向高效自回归视频生成的运动感知缓存框架

自回归视频生成因顺序去噪计算负担重而面临部署挑战。现有缓存重用方法采用粗粒度的块级跳过，无法捕捉细粒度像素动态。为此，研究提出MotionCache运动感知缓存框架，其核心是利用帧间差异作为像素级运动特征的轻量级代理。该方法采用从粗到细的策略：初始预热阶段建立语义连贯性，随后根据运动权重动态调整每个令牌的缓存更新频率。在SkyReels-V2和MAGI-1等先进模型上的实验表明，MotionCache分别实现了6.28倍和1.64倍的显著加速，同时有效保持了生成质量（VBench指标下降分别仅为1%和0.01%）。该框架代码已开源。

GitHub视频论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

68

从上下文到技能：语言模型能否从上下文中巧妙学习？

针对语言模型需从复杂上下文中学习的问题，本文提出Ctx2Skill自进化框架。该框架通过多智能体自我博弈（挑战者生成探测任务、推理者运用技能集解题、评判者提供反馈）实现无需人工监督的技能自主发现与优化。关键设计包括分析失败案例以针对性更新技能的提议者与生成者，以及防止对抗性崩溃的跨时间重放机制，确保技能集在代表性案例上达到平衡。在CL-bench的四个上下文学习任务上的评估表明，该框架能持续提升不同骨干模型的解题成功率。

智能体推理论文/研究

关联讨论 1 条

07:12

IT之家（RSS）

47

跨越百亿里程碑：华为乾崑 4 月安全出行报告发布，累计辅助驾驶里程 104.7 亿公里

华为乾崑智能汽车解决方案发布4月安全出行报告，其累计辅助驾驶里程已达104.7亿公里，跨越百亿里程碑。月度辅助驾驶里程为9.1亿公里，智驾辅助月活用户数达143万，用户占比94.8%，月度人均辅助驾驶里程637公里。具体功能上，车位到车位功能使用956万次，辅助泊车达6548万次。此前，华为已发布乾崑智驾ADS 5.0系统，首发防误打方向盘与车位到车位3.0版本，并推出了乾崑OS与迭代至3.0版本的乾崑XMC车辆控制技术。

具身智能行业动态

07:12

IT之家（RSS）

25

苹果 iOS 27 系统前瞻：卫星通信新增多项功能、全新虚拟键盘，预计 WWDC 26 亮相

苹果 iOS 27 系统预计于 WWDC 26 大会亮相，9月正式推送。新系统将推出独立 Siri 应用，支持类 ChatGPT 的交互，并新增灵动岛界面。卫星通信功能迎来重大升级，包括通过卫星使用 Apple Maps、收发 iMessage 图片等四项新功能，可能为搭载 C2 基带的 iPhone 18 Pro 系列机型独占。系统将效仿“雪豹”策略，专注于质量修复与性能提升。此外，还正在测试具备增强自动纠错功能的全新虚拟键盘，并可能引入系统级 UI 透明度调整滑块等智能新功能。

产品更新端侧

06:50

TestingCatalog News 🗞@testingcatalog

58

谷歌I/O动态：Gemini测试用于视频生成的新Omni模型

谷歌正在其Gemini平台测试一款名为“Omni”的新模型，专注于视频生成功能。泄露信息显示，该模型的界面提示用户“从一个想法开始或尝试一个模板”，并注明“由Omni驱动”。这一模型可能与内部代号“Toucan”的视频生成工具密切相关，后者目前由Veo驱动。如果谷歌计划正式发布用于视频生成的Gemini Omni，其性能很可能超越当前的Veo 3.1版本。若消息属实，Gemini将成为首个具备视频输出能力的顶级Omni模型，这标志着谷歌在视频生成领域的重大技术进展，并可能为未来的Google I/O 2026活动预热。此举显示了谷歌在人工智能视频生成方面的持续创新和竞争态势。

Google多模态模型发布视频

06:19

Orange AI@oran_ge

34

做马桶的 Toto 也是 AI 概念股了但做智能马桶的做芯片好像也挑不出毛病？

端侧行业动态

06:19

Replit ⠕@Replit

49

自由球员日+黑客马拉松办公时间 https：//x.com/i/broadcasts/1nGeLymadnRKX

其他行业动态

06:17

Eric@ericmitchellai

50

用户通过对比GPT-5.4和GPT-5.5的教学效果，指出两者在解释概念时存在关键差异。GPT-5.4倾向于先阐述概念，再让学习者回溯关联标签，增加了认知负担。而GPT-5.5采用更清晰的方式：先给出明确标签（如"导数"），再立即附上概念解释（如"描述变化速率"）。这种"标签优先"的结构使解释流畅连贯，无需大脑反复回溯重组信息，从而在长期教学对话中能更好地维持学习者的注意力。

OpenAI评测/基准

06:13

Marc Andreessen 🇺🇸@pmarca

52

针对中美AI模型性能差距被放大的图表，推文指出其误解了IRT ELO评分机制。ELO分数并非来自模型直接对抗，而是基于基准测试成绩推算。关键问题在于，当基准测试准确率接近100%时，微小的百分比提升会导致ELO分数急剧膨胀。因此，所谓中美模型"差距拉大"，并非美国模型大幅领先，而是所有模型都在更多基准上趋近满分，美国模型仅略早达到而已。

大佬观点评测/基准

06:13

Marc Andreessen 🇺🇸@pmarca

31

推文指出，"技术焦虑"是一种惊人一致且不断重复的历史循环模式。它通过一系列案例揭示了这一规律：从1482年约翰内斯·特里特米乌斯对印刷术威胁手抄传统的担忧，到1858年《纽约时报》社论警告电报会侵蚀深思能力；从1986年《华盛顿邮报》报道计算器进入课堂引发的数学教育争议，到2008年《大西洋月刊》探讨"谷歌是否让我们变笨"。这些跨越数个世纪的例子共同表明，每当颠覆性新技术出现，社会总会产生对其冲击传统技能、思维习惯和知识体系的深层忧虑，这种反应模式贯穿始终。

大佬观点现象/趋势

05:50

dax@thdxr

43

环顾四周，你会发现所有人都完全困惑于究竟是一：每个产品都需要一个智能体还是二：每个产品都需要接入用户已在使用的智能体每个人都在选择1或2并为此搭建基础设施，同时祈祷自己的选择是正确的

智能体大佬观点

05:49

Hacker News 热门（buzzing.cc 中文翻译）

55

VS 代码在提交中插入 "Co-Authored-by Copilot"（无论使用情况如何

Visual Studio Code 在提交信息中自动添加“Co-Authored-by: Copilot”标签，无论开发者是否实际使用了GitHub Copilot生成代码。这一改动由微软在GitHub的相关拉取请求中引入，引发了开发者社区的关注与讨论。该行为可能导致代码提交历史中出现不准确的贡献者信息，涉及开发工具伦理与透明度问题。相关话题在Hacker News上获得了超过130个讨论点数。

Microsoft开源生态行业动态

05:47

elvis@omarsar0

59

Claude Opus 4.7自主构建AlphaZero风格训练管道并在四子棋中击败专业求解器

本研究提出评估编程智能体的新范式：要求其在有限预算下，仅凭简要任务描述自主重建一项著名机器学习突破。首个测试案例为四子棋AlphaZero系统，其规模适于笔记本电脑运行，但复杂度要求完成完整的研究工程闭环。Claude Opus 4.7在三小时内从零构建了自博弈训练管道，并作为先手以7:1的成绩击败了Pascal Pons求解器，而其他前沿智能体均未通过2/8的测试。这标志着评估标准已从代码补全提升为端到端构建非平凡机器学习系统的能力。

智能体Anthropic编码论文/研究

05:19

Hacker News 热门（buzzing.cc 中文翻译）

63

优步希望将其司机转变为自动驾驶公司的传感器网络

优步计划利用其平台上数百万司机和配送员的车辆，通过安装传感器设备，为自动驾驶公司构建一个庞大的实时传感器网络。该网络将收集道路环境数据，用于训练和优化自动驾驶系统。此举旨在将优步的运营车队转化为数据采集基础设施，为自动驾驶技术开发提供关键支持，可能改变行业数据获取方式。

行业动态

05:16

PixVerse@PixVerse_

15

疲惫的时候，就用@Kawaiizice 的酷炫作品来refresh一下吧✨ 要想度过最棒的周末，就在PixVerse上用高画质Seedance享受创作的乐趣！😺🚀

其他视频

04:45

Chubby♨️@kimmonismus

13

我希望 Sonnet 4.8 能成为我期待 Opus 4.7 成为的那种模型。

Anthropic大佬观点

04:21

Yann LeCun@ylecun

26

视频演示了 GPT-4o 和 Claude 3.5 Sonnet 的并列对比 https：//youtu.be/kYkIdXwW2AE？si=hV2ANEl-wPh1MSU1

Meta大佬观点

04:19

Sam Altman@sama

49

我一直在想，比起让模型变得更聪明，我更希望它们能更便宜/更快但似乎，仅仅变得更聪明仍然是最重要的事

OpenAI大佬观点

04:19

Hacker News 热门（buzzing.cc 中文翻译）

61

加州将开始对违反交通法规的无人驾驶汽车开具罚单

加州宣布将开始对违反交通法规的无人驾驶汽车开具罚单，标志着自动驾驶汽车监管迈出关键一步。新政策下，无人驾驶车辆在道路上违规时，将像人类驾驶员一样收到罚单，旨在加强道路安全并规范行业测试。加州作为全球自动驾驶技术测试热点，此举可能影响相关公司的运营和未来发展。

政策/监管

04:17

Greg Brockman@gdb

19

用于改善人体工学的codex 【引用 @jxnlco】：有了codex我不需要第二台显示器我把它变成了站立式办公桌

OpenAI大佬观点编码

04:13

Marc Andreessen 🇺🇸@pmarca

15

其他大佬观点

04:12

Rohan Paul@rohanpaul_ai

33

从倒垃圾到扫地，川崎的Kaleido正在展示它能够处理普通的日常任务。这些机器人专为救援任务设计，然而它的动作却让人感到与家庭生活出奇地相似。

具身智能现象/趋势

04:12

Rohan Paul@rohanpaul_ai

43

Nvidia CEO Jensen Huang 对 AI 就业影响的精彩解释：在软件领域，AI 让编码更快，但这并不意味着需要更少的工程师。在 AI 之前，我们能写 10 亿行代码；现在有了 AI，我们可以瞄准 1 万亿行。

大佬观点编码

03:49

Sam Altman@sama

48

5.5 xhigh 在快速模式下真的很棒我想我在推特上被 medium 模式给心理操纵了一阵子

OpenAI大佬观点模型发布

03:19

Sam Altman@sama

45

OpenAI大佬观点安全/对齐

03:17

DogeDesigner@cb_doge

12

未来始于Optimus在月球上。

其他具身智能

03:13

Marc Andreessen 🇺🇸@pmarca

24

但说真的。

其他

02:49

OpenCode@opencode

46

我们在 OpenCode Go 上遇到了 Kimi 2.6 的间歇性问题我们正在与供应商一起调查，对此表示抱歉希望在此期间可以暂时使用其他模型之一

产品更新编码

02:41

Rohan Paul@rohanpaul_ai

48

Chatly发布Omni Agent，从聊天转向工作流组装

Chatly近日发布Omni Agent，其核心理念是超越聊天，转向工作流组装。该产品采用多智能体路由机制，可将用户设定的目标自动分解，并分配给不同的专业智能体协同完成多元化任务，如邮件营销、演示文稿、落地页设计等。它具备强大的记忆层，能持续学习并复用用户的品牌信息、偏好、项目规则等上下文。通过原生工作空间集成，AI可直接在用户现有的文件、任务和活动环境中操作。产品提供Think、Pro、Ultra三个层级，旨在通过统一界面整合深度研究、多媒体生成与记忆功能，让用户从使用工具转向指挥智能体。

智能体产品更新多模态

02:20

dax@thdxr

42

不同的用户和场景需要不同形态的编程代理，例如 - CLI - TUI - SDK - Web - 桌面应用针对每种形态，你只需尽力做到最好事情就这么简单，伙计们，我不懂你们为何总想争论 TUI 与 GUI 孰优孰劣

智能体大佬观点编码

02:18

宝玉@dotey

67

Codex实验功能分析Chronicle数据优化电脑操作习惯

Codex 可利用 Chronicle 记录的电脑操作数据，分析用户习惯并识别效率低下之处，提供直接改进建议。用户通过输入特定提示（如询问低效操作），即可获得忠言逆耳式的优化反馈。该功能虽处于实验阶段且被隐藏，但具有试用价值，能帮助提升工作习惯和操作效率。引用推文关键点指出，此功能是实验性的，并提供了英文输入示例以触发分析。

OpenAI教程/实践编码

02:17

Greg Brockman@gdb

精选72

codex宠物分享的图库：提交入口已开放，可通过下方链接提交👇

智能体OpenAI开源/仓库编码

推荐理由：Greg Brockman 亲自转发的社区画廊，把 Codex pets 的发现和安装简化成一条 curl 命令，对于正在玩 Codex Agent 的开发者来说是个实用的工具箱。