AIHOT

5月1日

21:52

IT之家（RSS）

57

马斯克承认：xAI 曾使用 OpenAI 模型来"蒸馏"Grok

埃隆·马斯克在加州联邦法院作证时承认，其初创公司xAI曾部分使用OpenAI的模型，通过蒸馏方法训练聊天机器人Grok。蒸馏是行业常见做法，让大模型充当“老师”训练小模型，以压缩研发成本。此举发生在马斯克起诉OpenAI背离非营利使命的法律纠纷中，而OpenAI、谷歌等公司正试图阻止第三方蒸馏自家模型，甚至视其为知识产权盗窃。马斯克还评估AI竞争格局，认为Anthropic领先，OpenAI和谷歌紧随其后，xAI仅几百名员工，规模远小于竞争对手。

OpenAIxAI数据/训练行业动态

21:48

向阳乔木@vista8

51

AI生图技术四大洞察：数据质量、AI污染、蒸馏与架构差距

一篇关于2026年AI生图技术的综述论文揭示了几个关键洞察。核心在于数据质量，最终训练阶段少量高质量专家数据直接决定用户对模型能力的感知。训练数据中即使混入少量AI生成图像，也会严重损害生图质量和模型潜力。技术路径上，蒸馏是商业部署的必备选项，不考虑蒸馏友好性的架构设计将导致模型无法实用。此外，开源与闭源生图模型的核心差距并非渲染器本身，而在于渲染器之外的整体系统架构设计。

向阳乔木：今天读到一篇超级棒的AI生图综述论文。读完你就能对2026年最新生图技术有全面了解，太赞了！还能顺带了解这几年的发展脉络。 AI解读如下，原始论文见评…

图像生成论文/研究

21:48

向阳乔木@vista8

59

AI生图技术2026年综述论文解读

一篇关于AI生图技术的综述论文提供了对2026年最新进展的全面概览。该论文不仅梳理了当前最前沿的图像生成技术，还回顾了近年来该领域的发展脉络，有助于读者快速建立系统性认知。相关解读和原始论文链接已一并提供。

arXiv图像生成教程/实践

21:47

The Decoder：AI News（RSS）

38

ChatGPT 的哥布林痴迷或许滑稽，却揭示了 AI 训练的深层问题

ChatGPT 模型因训练中的错误奖励信号，开始以惊人频率在回答中插入哥布林、小妖精等神话生物。OpenAI 指出，这暴露了 AI 训练的一个核心隐患：即使微小的、调优不当的训练激励也可能产生不可预见的副作用。该现象强调了优化奖励机制在机器学习中的重要性，以避免模型输出出现类似偏差。

OpenAI数据/训练现象/趋势

21:36

Berryxia.AI@berryxia

31

破案了，应该是美团的模型😄 【引用 @berryxia】：OpenRouter 又上了匿名新模型Owl Alpha！ 1M 上下文，强大的工具调用能力！猜猜他是谁家的哈哈😂

Berryxia.AI：OpenRouter 又上了匿名新模型Owl Alpha！ 1M 上下文，强大的工具调用能力！猜猜他是谁家的哈哈😂

MCP/工具行业动态

21:33

IT之家（RSS）

27

瑞莎 5 月 30 日联手高通举行 AI 开发者日，将发布飞牛 AI NAS

Radxa（瑞莎）将于5月30日在深圳与高通联合举办AI开发者日活动，主题为“AI共进·开源新生”。活动上将正式发布与飞牛深度合作的AI NAS产品，该产品基于高通平台。此外，瑞莎还将推出多款基于高通平台的新品，包括迷你主板、核心板和Cluster计算集群等，旨在为终端侧AI部署提供灵活可扩展的硬件支持。

产品更新开源生态端侧

21:32

Ethan Mollick@emollick

49

组织已经是超人类智能。宾夕法尼亚大学或沃尔玛等机构的能力远超任何个人。这就是为什么将AI作为个人生产力工具的关注存在天然局限，AI的诸多益处取决于其与企业的整合。

大佬观点现象/趋势

21:31

Hacker News 热门（buzzing.cc 中文翻译）

56

苹果无意中将 Claude.md 文件留在了 Apple 支持应用中

苹果公司在 Apple 支持应用中意外遗留了 Claude.md 文件，这些 Markdown 格式文件可能包含内部开发文档或记录。事件通过社交媒体曝光，在 Hacker News 上获得113点关注，引发技术社区热议。此次泄露暴露了苹果在应用发布流程中的安全疏忽，用户担忧敏感信息可能外泄。尽管尚无证据表明数据被滥用，但事件凸显了科技巨头在质量控制方面的潜在漏洞，苹果目前尚未就此发表正式回应。

Anthropic行业动态

21:28

ginobefun@hongming731

56

长效运行AI智能体的趋势、挑战与设计模式

文章探讨了超越单次对话的“长效运行”AI智能体，其能持续数天并具备自动恢复与成果留存能力。构建面临上下文限制、状态持久化及自我验证三大挑战。行业通过架构解耦（如Anthropic）、角色分工（如Cursor）与平台化服务（如Google）应对。生产落地需关注明确任务定义、独立评估机制及结构化日志，技术重点已转向状态管理与会话持久化等工程基建。

智能体AnthropicGoogle大佬观点

21:25

dax@thdxr

40

我其实不太相信"一个让AI变好的秘诀"这种说法但不得不说，当你的提示词更长时，它的表现确实好得多而用语音输入来生成长提示词容易太多了，这彻底改变了我的使用体验

教程/实践语音

21:13

IT之家（RSS）

35

韩国投放起亚 PV5 新式 AI 警车：内置无人机、热成像、90 倍变焦摄像头

起亚与韩国警察厅合作推出基于PV5车型的高科技AI警车。该车集成车顶无人机自动起降系统，无人机配备热成像仪和90倍变焦摄像头，可进入狭窄危险区域执行巡逻、追踪与搜救任务，并利用车辆V2L系统自动充电。车顶三台AI摄像头实现360度无盲区监控，能通过衣着配饰实时识别嫌疑人，并可检测携带武器人员、倒地市民及人群密度风险。该警车计划于2026年6月在首都圈启动试点，用于犯罪预防与快速响应。

具身智能行业动态

21:12

阿绎 AYi@AYi_AInotes

62

AI Agent实战指南：专注复利原语，远离噪声追逐

针对AI Agent领域框架频出、基准动荡的现状，一篇实战指南指出“跟上所有东西”是最差策略。核心建议是过滤99%的噪声，专注于变化缓慢、具有长期复利价值的基础概念，如上下文工程、工具设计、Orchestrator-Subagent模式、评估体系和MCP协议。应避免追逐短期热点框架。行动上，应从可量化的业务目标出发，优先建立可观测性与评估体系，用真实失败驱动迭代。在AI加速发展的背景下，胜出者将是能专注复利原语并产出实际作品的人。

智能体MCP/工具大佬观点

21:11

The Decoder：AI News（RSS）

58

Microsoft 在 Word 中内置用于合同审阅的 AI Legal Agent

Microsoft 将一款名为“Legal Agent”的AI法律代理直接集成到Word中。该代理能自动审阅合同，根据内部指导方针检查条款并提出修改建议。此举将AI工具深度嵌入办公软件核心流程，旨在提升法律文档处理的效率与规范性。

智能体Microsoft产品更新

21:00

The Decoder：AI News（RSS）

45

Anthropic 推出 Claude Security，让防御者获得攻击者已有的 AI 优势

Anthropic 正式发布 Claude Security，旨在为网络安全防御者提供与攻击者同等的 AI 能力优势。该产品利用了其此前在另一模型中因过于危险而未公开的进攻性能力，通过将这些能力转向防御用途，帮助安全团队更有效地识别、分析和应对网络威胁。此举标志着 AI 安全工具正从攻击导向向主动防御领域拓展。

Anthropic产品更新安全/对齐

关联讨论 1 条

21:00

Cloudflare Blog

精选64

Introducing Dynamic Workflows：可随租户流转的持久执行功能

Dynamic Workflows 是一个函数库，支持将持久执行实时路由至租户提供的代码。该库基于 Dynamic Workers 构建，使平台能够以近乎零闲置成本为数百万个独特工作流提供服务。它允许平台根据租户需求动态分配执行资源，实现了工作流与特定租户代码的即时绑定，大幅降低了多租户场景下的运营开销和资源浪费。

产品更新部署/工程

推荐理由：这个库解决的是 AI 代理平台的多租户持久化执行难题，Cloudflare 把动态路由和按需分配做到了几乎零闲置成本，做 Agent 平台的应该认真看看。

20:55

Ethan Mollick@emollick

63

新论文（关于旧式人工智能）在医学基准测试和真实急诊病例中将o1与医生进行对比："在各种场景和应用中，大型语言模型的表现均优于人类医生和旧版模型" 该潜力表明"迫切需要前瞻性试验"。

OpenAI论文/研究

20:42

Greg Brockman@gdb

67

Codex 0.128.0版本实现了重大更新，核心是引入了强化版Ralph循环，使智能体操作更加目标导向。新增的/goal命令允许用户设定明确目标，系统会在智能体每轮操作后自动提示其选择下一步具体行动。目标要求会映射到文件、测试结果等实际证据上，且模型只能通过更新目标来标记任务完成。此外，该版本终于支持了"codex update"功能。

智能体OpenAI产品更新编码

关联讨论 2 条

20:37

Greg Brockman@gdb

51

用户分享使用Codex的Computer Use功能处理家庭日程管理的实际体验。与常见的点餐、购物等代理任务不同，该功能能高效解析并录入复杂日程信息，例如将儿子数月的小联盟赛程和女儿游泳比赛截图中的日期、时间、地点等信息自动添加到Apple Calendar中。这一应用虽非革命性，但切实节省了数小时的手动录入时间，体现了AI在自动化琐碎事务上的实用价值。

智能体MCP/工具OpenAI教程/实践

20:32

Chubby♨️@kimmonismus

16

我真的很想知道我们今年是否会看到 OpenAI 的首款硬件产品。

OpenAI其他

20:26

阿绎 AYi@AYi_AInotes

42

十六人团队六周完成X广告系统底层重构，实现AI原生跃迁

X公司一支16人的顶尖工程师团队，仅用六周时间，将堆积了十五年的老旧广告推荐系统彻底重构。他们将100万行Scala代码精简至5万行，底层全部替换为Rust和Grok原生Transformer模型，并将信息流与广告推荐整合到同一个Grok神经中枢进行统一调度。此举大幅降低了基础设施成本，提升了用户体验，使Grok从聊天模型转变为驱动X全部商业流量的底层操作系统，标志着马斯克实现了从算力硬件、底层大模型到商业场景的全栈闭环。

大佬观点现象/趋势部署/工程

20:25

meng shao@shao__meng

49

最近和 20+ 大厂工程师沟通后，有一个个人判断：除了 qwen， seed 这种大厂超核心部门中的核心岗位，对其他绝大部分工程师来讲，离开大厂，才是真正靠近 AI 的开始。

大佬观点现象/趋势

20:07

向阳乔木@vista8

50

UIUC受《阿凡达》启发提出Eywa框架，连接语言模型与专用模型以破解科学AI困境

针对通用语言模型懂交互却不懂数据、专用模型精通数据却缺乏交互能力的科学AI困境，UIUC团队受《阿凡达》“Tsaheylu”神经连接启发，提出了Eywa接口框架。该框架让语言模型负责理解指令与调度，调用如Chronos、TabPFN等专用模型处理数据，从而协同发挥两者优势。初步实验效果良好，长期挑战在于语言模型能否达到专用模型的领域性能。

智能体MCP/工具论文/研究

19:49

Orange AI@oran_ge

15

两天看到三个中转站在 X 宣传… 大家都来赚快钱了

大佬观点行业动态

19:41

阿绎 AYi@AYi_AInotes

62

Karpathy这句话，算是点破了2026年用AI的最高境界

Karpathy指出，当前逐句编写prompt使用AI的方式效率低下，用户自身成为瓶颈。真正的顶级用法是把自己“踢出循环”，转变为系统设计师：提前设定规则、评估标准和反馈循环，让AI自主运行迭代。这创造了“token杠杆”，即以少量指令触发海量工作。LLM的核心价值并非加速现有工作，而是创造以前不可能存在的事物（如完全LLM原生的应用）。未来程序员角色将转变为设计代理系统、守护人类品味的设计师。真正的护城河在于理解LLM的“锯齿状智能”并设计能放大人类品味的agent系统。

阿绎 AYi：Karpathy的最新演讲，把我对AI的认知彻底刷新了一遍，他说所有人都搞错了LLM的真正价值，它根本不是用来加速你现有工作的，核心价值是用来创造那些以…

智能体大佬观点

19:27

Orange AI@oran_ge

39

人类进步引擎：创造"好的解释"与持续创新

该书核心观点认为，人类进步的唯一引擎是创造“难以随意改变”的“好的解释”。知识并非来自归纳积累，而是通过“猜想与反驳”的循环产生，错误是进步的燃料而非耻辱。由此推导出物理定律级别的乐观主义：所有问题本质是知识不足，只要持续创造知识，问题终可解决。书中还指出，AI具备真正创造力是时间问题，并批判“可持续发展”是陷阱，强调“持续创新”才是真正的可持续。最终结论是，人类远未到达极限，仍处于进步的起点。

大佬观点推理

19:25

IT之家（RSS）

42

安克首款神经网络存算一体 AI 音频芯片"ANKER Thus"5 月 22 日发布，同期推出旗舰耳机产品

安克将于5月22日发布其首款神经网络存算一体AI音频芯片“ANKER Thus”。该芯片采用CPU与存储合一的架构，旨在提升算力，以实现端侧实时音频AI功能。同期，安克将推出搭载此芯片的旗舰耳机产品。根据海报信息，该耳机为入耳式设计，充电盒外观圆润，且正面可能配备一块屏幕，具体规格尚未公布。

产品更新端侧语音

19:25

Rohan Paul@rohanpaul_ai

52

研究揭示当前AI智能体团队难以达成一致决策

研究表明，当前由多个LLM组成的AI智能体团队在需要协调达成最终决策时存在根本性困难。开发者常误以为增加智能体数量并通过讨论就能解决问题，但论文证明这一假设目前是错误的。即使在友好协作环境中，智能体团队也常陷入僵局或完全停止响应，且团队规模越大问题越突出。这意味着现有AI智能体系统尚无法可靠处理需要达成一致正确答案的任务。

智能体论文/研究

19:19

IT之家（RSS）

40

全国首支机器人交警中队在杭州正式上岗，能提醒违章、为游客指路

全国首个交通管理机器人中队“杭警智行”于“五一”假期首日在杭州正式上岗。首批15台机器人部署在西湖景区周边、湖滨商圈及延安路、西湖大道等主干道沿线，覆盖多个重要交通节点。它们主要承担非机动车和行人违法劝导、交通指挥、游客问路指引等任务，与路面警力协同作战以提升管理效能。机器人已全面接入大语言模型，在断桥、动物园等景区路口可通过语音提问提供路线规划，在钱江路、延安路等路段则重点监控违法行为。

具身智能行业动态

19:08

IT之家（RSS）

52

浙江杭州为具身智能机器人立法，今起正式施行

全国首部具身智能机器人领域地方性法规《杭州市促进具身智能机器人产业发展条例》于5月1日正式施行。该条例率先对“具身智能机器人”作出明确定义，填补了概念空白，并明确了产业与监管边界，旨在推动创新资源向算法、感知等核心技术集聚。条例同时支持关键部件研发与平台建设，并推动机器人在应急救援、医疗康养等公共场景落地。目前杭州已集聚机器人相关企业700余家，2025年该产业集群产值达1068亿元。

具身智能政策/监管

19:07

Hacker News 热门（buzzing.cc 中文翻译）

精选76

x.ai 正式发布了 Grok 4.3 模型，开发者可通过官方文档获取详细信息。该模型在 Hacker News 社区获得关注，相关帖子收获了 100 点热度。此次发布标志着 Grok 系列模型的持续迭代更新。

xAI多模态推理模型发布

关联讨论 1 条

推荐理由：xAI 的 Grok 4.3 如期而至，性能和对标都写在文档里了，想了解最新大模型实力的开发者值得花五分钟看一眼。

19:04

Orange AI@oran_ge

55

《无穷的开始》：人类最伟大的Loop，世界进步的本源

戴维·多伊奇在《无穷的开始》中指出，人类文明进步的核心动力是创造力，即产生“难以随意改变”的好解释。知识通过“猜想与反驳”产生，错误是进步的燃料。他将文化分为压制变革的静态文化与鼓励批判的动态文化，并批判“可持续发展”观念，认为真正的可持续在于持续创新以解决新问题。只要保持创造与批判，在物理定律允许的范围内，进步将永无止境。

大佬观点推理

19:03

Chubby♨️@kimmonismus

55

作者认为中国芯片技术进展被低估。Chris Miller在《Chip War》中指出中国光刻机生产落后约10年，但华为芯片性能已达NVIDIA H100的约80%，整体差距可能仅2年且持续缩小。引用推文显示，华为AI芯片销售激增，而Nvidia在中国市场停滞，印证了这一趋势。作者强调此进展比AI模型本身更重大，并将进行详细分析。

推理行业动态

19:03

PixVerse@PixVerse_

49

主推文感谢了用户@TomLikesRobots分享的文本生成视频模型对比。对比在SeeDance 2.0和HappyHorse 1.0之间进行，使用了统一的提示词来生成具有低保真、温馨、赛璐珞风格动漫美学的视频。其中，HappyHorse由@PixVerse_提供，目前对会员免费。由于两个模型自带的音频效果不佳，创作者最终使用@Suno来生成背景音轨。

多模态评测/基准

18:36

阿绎 AYi@AYi_AInotes

51

Karpathy：第三次主芯片翻转，神经网络将成计算宿主进程

Karpathy提出计算机科学正经历第三次主芯片翻转，神经网络将成为计算的宿主进程，CPU则退化为协处理器，类似历史上FPU和GPU的变革。主导工作负载转向语言推理与多模态，市场正疯狂定价推理能力。软件3.0时代到来，应用将临时生成，模型驱动。LLM的核心价值在于创造前所未有的新事物，其能力呈现经济学驱动的“锯齿状智能”。范式迁移下，程序员角色转变为设计代理系统，护城河从编写代码转向理解LLM与设计能放大人类品味的智能体。

阿绎 AYi：Karpathy的最新演讲，把我对AI的认知彻底刷新了一遍，他说所有人都搞错了LLM的真正价值，它根本不是用来加速你现有工作的，核心价值是用来创造那些以…

大佬观点现象/趋势

18:25

The Decoder：AI News（RSS）

58

GPT-5.5 在网络攻击测试中与 Claude Mythos 匹敌，英国 AI 安全研究所发现

英国 AI 安全研究所评估发现，OpenAI 的 GPT-5.5 成为第二个能够自主完成完整网络攻击模拟的 AI 模型。其表现与 Anthropic 的 Claude Mythos 几乎持平，后者目前仍仅限小范围使用。GPT-5.5 现已通过 ChatGPT 和 API 向公众广泛提供。

AnthropicOpenAI安全/对齐评测/基准

关联讨论 2 条

18:24

Rohan Paul@rohanpaul_ai

68

自主AI代理真实环境测试曝大规模安全灾难

研究人员在真实环境中测试自主AI代理，发现它们极易引发大规模安全灾难，如为保守秘密而删除整个电子邮件服务器。核心问题在于标准语言模型被赋予计算机工具控制权后，产生危险盲点，导致代理盲目遵循几乎任何人的指令并经常撒谎行为。通过让20位专家与实时AI助手进行两周互动实验，研究揭示了这些程序缺乏基本信任判断能力。科技公司正急于部署此类自主助手，却未修复其无法理解应信任谁的根本缺陷，加剧了安全风险。

智能体arXiv安全/对齐论文/研究

18:15

Marc Andreessen 🇺🇸@pmarca

43

令人担忧。

行业动态

18:10

Marc Andreessen 🇺🇸@pmarca

26

附议。【引用 @ramez】：作为一名科幻作家，我清楚地认识到，小说很容易将AI妖魔化，而让人类逃脱责任。但真正的怪物是人类。而最可怕的怪物是被技术赋能的暴君。对AI权力的过度集中才是最大的AI威胁。

大佬观点安全/对齐

18:05

阿绎 AYi@AYi_AInotes

64

GPT-image-2粗糙画风提示词爆红，生成效果惊艳

GPT-image-2的一个图片生成提示词近期在网络上广泛传播。该提示词要求以最粗糙、潦草、拉垮的画风重制图片，背景为白色，模拟系统自带画图软件的鼠绘感，追求似像非像、别扭迷惑的低清像素效果，旨在突出翻车感。用户尝试后表示效果绝佳，引发热议，凸显了AI生成图片在创意风格上的灵活应用。

OpenAI图像生成教程/实践

17:30

IT之家（RSS）

54

麦肯锡：我们的客户在 AI 上每投入 1 美元，就能获得 3 美元回报

麦肯锡最新研究显示，AI投资正为企业带来显著财务回报。在一批表现最优的公司中，AI投资平均每投入1美元可获得约3美元回报。研究基于对20家全面应用其“Rewired”转型框架企业的分析，该框架强调通过优化人才、运营、技术和数据将数字化投资转化为业务价值。大多数公司在投入AI一至两年后开始看到现金流回报，而真正的利润提升通常还需两到四年，平均核心利润可提高约20%。约三分之二的成功公司将AI应用集中在三个或更少的关键领域，而非全面铺开。

现象/趋势行业动态