AIHOT

5月1日

01:57

Rohan Paul@rohanpaul_ai

《时代》杂志指出，谷歌在人工智能领域的领先地位，源于CEO桑达尔·皮查伊早期对DeepMind、TPU芯片、云基础设施及AI产品的一系列长期投资，而非对ChatGPT的仓促反应。其核心优势在于对研究、芯片、云服务、产品和覆盖数十亿用户的分发渠道实现全栈控制。通过将定制芯片制造与统一的研究实验室深度融合，谷歌获得了对AI架构的绝对控制权，能利用自研TPU高效执行复杂计算，同时让工程师得以低成本大规模扩展模型预训练，而无需像竞争对手那样承受高昂的外部芯片采购成本。

DeepMindGoogle大佬观点搜索

01:55

Ant Ling@AntLingAGI

精选76

AntLingAGI团队宣布Ling-2.6-1T模型正式开源，已登陆Hugging Face平台，并通过Novita Labs提供官方推理体验。该模型采用混合专家架构，总参数1万亿、激活参数630亿，核心优化方向为"令牌效率"以满足真实生产需求。具体表现为：低令牌开销，能在无需冗长推理链的情况下保持强大智能；可靠的多步执行能力，提升指令、工具、上下文和工作流的控制水平；生产就绪的部署特性，覆盖从代码生成到错误修复的任务，并广泛兼容各类智能体框架。团队旨在通过降低测试、部署、定制和构建的难度，为开发者创造价值。

智能体Hugging Face模型发布部署/工程

关联讨论 3 条

推荐理由：1T参数开源模型不是天天有，蚂蚁这个Ling-2.6-1T强调token效率和Agent能力，做Agent的可以直接去Hugging Face上跑一下，看看是不是真的在生产环境省token。

01:50

阿绎 AYi@AYi_AInotes

GPT与Claude官方提示指南理念相反，提示工程核心转向使用者思考清晰度

OpenAI与Anthropic同天发布官方提示指南，核心理念截然相反。OpenAI建议为GPT-5.5明确目标而非步骤，让其自主选择路径；Anthropic则要求对Claude Opus 4.7清晰说明意图、格式与成功标准。这导致旧提示方法失效：模糊指令使Claude输出变窄，而详细流程成为GPT的噪声。这反映出提示工程的核心已从“教模型做事”转变为“使用者自身思考的结构化”，真正的瓶颈可能在于人的思考清晰度，而非模型能力。

阿绎 AYi：我终于明白为啥最近很多人都在说，GPT和Claude突然变笨了，昨天OpenAI和Anthropic同时发布了官方提示工程指南，看完我才发现，并不是模型变…

AnthropicOpenAI大佬观点推理

01:49

The Decoder：AI News（RSS）

Microsoft CEO Satya Nadella 表示，AI 成功的关键在于获取"深度用户和高强度使用"，而非用户数量

微软首席执行官萨提亚·纳德拉强调，衡量人工智能业务成功的关键指标应是“深度用户和高强度使用”，而非简单的用户席位数量。尽管微软公布了创纪录的利润和强劲的云业务增长，但其生成式AI业务的具体业绩细节仍未对外披露。这一表态反映了科技巨头在AI商业化初期，更侧重于用户参与质量和实际使用深度，而非单纯追求用户规模扩张。

Microsoft大佬观点

01:46

阿绎 AYi@AYi_AInotes

Anthropic被曝检测用户代码提交历史以打压第三方工具，引发社区强烈抗议

Anthropic被曝通过其官方Claude Code工具检测用户Git提交历史，若发现包含“openclaw”字符串，便将该用户识别为第三方工具使用者，并触发“out of extra usage”错误，导致服务被拒或强制额外收费。开发者实验证实此为人为设置的字符串匹配规则。此举被视为Anthropic为将用户锁定在自家生态、打压更灵活的第三方竞品而采取的粗暴手段，与其此前塑造的开放、不监控形象相悖，引发了开发者社区的强烈不满和抗议。

阿绎 AYi：卧槽，Anthropic这次真把开发者当傻子。知名开发者Theo做了个实验：建了个空Git仓库，只commit一行JSON {"schema": "open…

AnthropicMCP/工具大佬观点开源生态

01:44

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

精选71

英国政府向商界领袖发出紧急警告，指出AI网络能力正以前所未有的速度加速发展。英国人工智能安全研究所（AISI）的评估显示，前沿模型的能力翻倍周期已从原先的八个月缩短至四个月。这一结论基于对Anthropic的Mythos等先进模型的测试，表明AI网络威胁的演变速度远超先前预估。政府强调，拥有先进国家AI评估能力的官方机构确认此趋势，证明相关风险并非夸大，各界需高度重视这一急速变化的威胁态势。

Anthropic安全/对齐政策/监管

推荐理由：英国政府公开信透露，前沿AI模型能力翻倍周期从8个月缩短到4个月，这是AISI评估Anthropic Mythos后的定论。做安全的人该认真看看原文。

01:43

Rohan Paul@rohanpaul_ai

Bloomberg：1X 刚刚在加利福尼亚开设了一家 58，000 平方英尺的工厂，并表示将在第一年制造 10，000 台家用仿人机器人。计划到 2027 年底达到 100，000 台机器人，并于 2026 年底开始发货， --- bloomberg.com/news/articles/2026-04-30/humanoid-maker-1x-opens-us-factory-plans-to-make-10-000-home-robots-this-year

具身智能行业动态

01:43

Andrej Karpathy@karpathy

这是我一直以来经常引用的那句话。

大佬观点

01:41

Chubby♨️@kimmonismus

现在您可以使用LTX-2.3将现有的SDR素材升级至HDR。因为它基于MP4压缩伪影进行训练，所以能实际应用于真实世界的压缩视频。它输出场景线性EXR格式，为DaVinci Resolve提供真实的浮点数据，而非在调色中容易损坏的脆弱图像。

教程/实践视频

01:35

TestingCatalog News 🗞@testingcatalog

苹果 🍎： "AFM Plus 150B Instruct" Apple Foundation Model 在内部的 AFM Playground 应用中被发现。这个应用正在被苹果员工内部使用，以测试 Apple Foundation 模型。 WWDC26 将会很火爆 🔥

端侧行业动态

01:30

Replit ⠕@Replit

集成开发环境已死。当编码模型的发展趋于平缓，竞争壁垒便向技术栈上游转移。@amasad 在 @twentyminutevc 节目中与 @HarryStebbings 深入探讨了 SaaS 行业的剧变、为何 Cursor 的赌注每周都显得更加动摇，以及真正保持十步领先需要什么。完整对话 ⬇️

大佬观点现象/趋势编码

01:30

NotebookLM@NotebookLM

精选64

Gemini App中的Notebooks功能现已正式在移动端向免费和付费用户开放，并计划很快扩展至更多欧洲国家。此次更新标志着NotebookLM与Gemini的深度集成，用户现可直接在Gemini App内访问所有个人未共享的笔记本，并能将Gemini的聊天记录用作新笔记本或现有笔记本的资料来源。功能推出将分阶段进行：首先面向网页版的Google AI Ultra、Pro和Plus订阅用户，未来几周将逐步覆盖移动端用户、更多欧洲地区以及免费用户。

Google产品更新

关联讨论 1 条

推荐理由：NotebookLM的笔记功能终于彻底住进了Gemini App，免费用户也能用。这一步让Google AI助理从“外脑”变成了“内脑”，虽然不算惊天动地，但整合的体验提升是实打实的。

01:29

Sam Altman@sama

lisan 多说点我们的坏话你太客气了【引用 @scaling01】：GPT-5.5 is on par with Claude Mythos - GPT-5.5 平均通过率 71.4% （±8.0%） - Mythos Preview 68.6% （±8.7%） - GPT-5.5 在 11 分钟内以 1.73 美元成本完成了一项人类专家需约 12 小时的任务

OpenAI大佬观点评测/基准

01:28

Andrej Karpathy@karpathy

红杉Ascent 2026炉边谈话：LLM的新视野、能力不均衡与智能体原生经济

谈话指出LLM的核心价值在于开启全新可能，如完全由LLM驱动的应用、用自然语言描述替代脚本安装、以及处理传统代码无法应对的非结构化知识库。其次，探讨了LLM能力“锯齿状”不均衡现象，认为这与领域可验证性及经济利益影响训练数据分布有关。最后，话题转向智能体原生经济，涉及将产品服务分解为传感器、执行器和逻辑模块，使信息对LLM高度可读，并讨论了新兴的智能体工程及相关技能。谈话强调，从“氛围编程”到“智能体工程”的转变，不仅是提升效率，更是拓展能力上限，旨在智能体时代构建全新事物。

智能体大佬观点现象/趋势

关联讨论 2 条

01:28

Google AI@GoogleAI

精选69

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

谷歌上周正式向公众发布了其首个原生多模态嵌入模型Gemini Embedding 2。该模型如同“通用翻译器”，能将文本、图像、视频和音频数据转化为独特的数字向量。其核心突破在于不再依赖关键词匹配，而是基于语义将不同模态的数据映射到同一空间，从而理解内容间的深层联系。开发者已利用该模型构建视频分析工具、视觉购物助手等应用，实现通过拍照或描述场景进行智能搜索的功能。模型现可通过Gemini API或Gemini Enterprise Agent平台使用。

Google多模态搜索模型发布

关联讨论 1 条

推荐理由：Google 第一个原生多模态嵌入模型，把文本、图像、视频拉到同一个向量空间，做跨模态搜索的开发者可以不用再手动打标签了，但离「无感理解」还有距离。

01:25

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

庭审中，Elon不断警告AI会毁灭全人类，于是法官禁止讨论灭绝这个话题我们现在的处境完全正常

安全/对齐行业动态

01:25

Google AI Developers@googleaidevs

既然Gemini Embedding 2已正式发布，让我们探索该模型解锁的功能--从智能多模态RAG到视觉搜索--因为它能将文本、图像、视频、音频和文档映射到统一的嵌入空间。

Google检索增强多模态模型发布

01:23

TestingCatalog News 🗞@testingcatalog

Anthropic 面向企业客户公开测试 Claude Security。我也希望至少团队用户最终也能用上。一些旧截图 👀

Anthropic产品更新安全/对齐

01:23

OpenAI@OpenAI

现已为ChatGPT账户推出高级账户安全功能，这是一项面向数字攻击高风险人群的新可选设置，提供更强大的保护措施，包括防钓鱼登录和更安全的账户恢复流程。 https：//openai.com/index/advanced-account-security/

OpenAI产品更新

01:21

Chubby♨️@kimmonismus

Anthropic发布了Claude Security，这是一个面向企业客户的独立代码漏洞扫描工具，由Opus 4.7驱动。它能扫描代码库、验证发现以减少误报，并建议可审查的补丁。Claude Security现已对Claude Enterprise客户开放公开测试。此举直接进入代码安全市场，与Snyk、Semgrep、SonarQube等现有工具竞争，可能对相关市场格局和公司股价产生影响。

Anthropic产品更新编码

01:08

Claude@claudeai

Claude Security 现已面向 Claude Enterprise 客户开启公开测试版。 Claude 会扫描您的代码库以查找漏洞，验证每个发现以减少误报，并建议您可以审查和批准的补丁。

Anthropic产品更新安全/对齐部署/工程

01:07

MiniMax (official)@MiniMax_AI

在旧金山举行的AI Champions Dinner上，与会者围绕AI的发展方向展开关键讨论。核心议题是如何将AI从单纯的产品协作工具，转变为能驱动真实人际连接的平台。@Wati_io团队阐述了其构建理念：由AI处理复杂事务，从而让人能够实现大规模的人际沟通与连接。活动由@boltdotnew组织，@UnicornerNews联合主办，@MiniMax_AI等机构共同促成此次聚会。

行业动态

01:06

阿绎 AYi@AYi_AInotes

模型进化方向相反，提示工程核心转向结构化思考

近期用户感觉GPT和Claude“变笨”，实因模型能力进化导致提示工程要求改变。官方指南揭示，两大模型进化方向相反：Claude Opus 4.7趋向字面执行指令，而GPT-5.5则更自主，能根据目标自行选择路径。因此，旧提示失效原因也相反——模糊提示在Claude上输出变窄，详细步骤在GPT上反成噪声。提示工程的核心已从“教模型做事”转变为“先结构化人类思考”，未来优势将属于思考最清晰、最明确自身需求的人。

AnthropicOpenAI大佬观点

01:01

TestingCatalog News 🗞@testingcatalog

ANTHROPIC 🚨： Anthropic 已开始与红队测试新的 "claude-jupiter-v1-p" 模型。下一个会是谁？👀

Anthropic安全/对齐行业动态

00:50

Ethan Mollick@emollick

"承重结构"、"我总会反复提及"、"不是X，而是Y" 频繁使用AI的一个诅咒是，你会意识到周围有多少文字现在只是AI生成的不使用AI的人无法一眼识别AI文本，但经常使用的人能轻易察觉其痕迹

大佬观点

00:50

MiniMax (official)@MiniMax_AI

在@stripe Sessions的第一天真是🔥 我们的展位全天都挤满了精彩的对话。感谢大家的热情参与！第二天已经开始。来604号展位找我们吧👋

行业动态

00:50

Rohan Paul@rohanpaul_ai

Jensen Huang 谈 OpenClaw。 "OpenClaw 可能是最重要的软件发布，你知道的，或许是有史以来最重要的。" Nvidia 每月花费 100 万美元运行这些智能体，因为每个提示的令牌使用量增长了 1000 倍。

智能体大佬观点

00:45

宝玉@dotey

CodexPotter 是一个命令行工具，通过后台启动 Codex CLI 并采用“Ralph Loop”机制执行任务。它先将用户目标写入 MAIN.md 文件，随后在全新上下文中反复启动 Codex 会话，对照该文件检查并修正代码，直至输出与目标一致，默认最多进行 6 轮迭代。该工具适用于目标明确的任务（如按文档实现功能），而非交互式讨论。其名称灵感来源于《辛普森一家》中爱重复说话的 Ralph Wiggum。作者推荐此工具，以回应寻找类似 Claude Code 中 Ralph 插件的需求，并指出其不会像某些插件那样修改用户配置。

宝玉：请问有没有好用的 Ralph Loop for Codex？类似于 Claude Code 的 Ralph Wiggum Plugin https://git…

GitHub开源/仓库编码

00:44

Hacker News 热门（buzzing.cc 中文翻译）

DataCenter.FM - 一款以"AI泡沫"之声为特色的背景噪音应用

DataCenter.FM是一款以“AI泡沫”之声为特色的背景噪音应用。该应用将数据中心服务器风扇的持续嗡鸣、硬盘读写声以及网络设备指示灯闪烁的轻微滴答声混合，生成了模拟AI热潮下数据中心繁忙运转的环境音。这款应用在Hacker News上获得了103个投票，反映了科技社区对当前AI投资与基础设施扩张热潮的一种趣味性听觉呈现。

产品更新语音

00:44

Chubby♨️@kimmonismus

"claude-jupiter" 会是 Anthropic 的下一个 Sonnet 级模型吗？ Sonnet 4.8 与 Opus 4.7 以及 Mythos/Capybara 的引用一同出现在 Claude 代码源泄露中--所以这可能是一个内部代号，而非随机的 Discord 传闻。

Anthropic行业动态

00:42

向阳乔木@vista8

DeepSeek-VL：面向真实场景的视觉语言模型

DeepSeek-VL旨在解决开源视觉模型在真实场景中应用效果不佳的问题。其核心方案是系统性地从数据、架构与训练三方面进行设计：数据构建强调从真实用户需求出发，并包含70%的纯文本以保留语言能力；模型架构创新性地采用SigLIP与SAM-B混合视觉编码器，兼顾高层语义与低层细节；训练策略则通过三阶段渐进式训练与模态平衡技术，有效缓解了视觉训练对语言能力的侵蚀，最终在同等规模下达到开源模型的顶尖水平。

DeepSeek多模态教程/实践

00:36

向阳乔木@vista8

DeepSeek论文AI解读：独立思考与数据清洗亮点

作者完成DeepSeek最新论文的AI解读，指出论文在独立思考方面表现突出，闪耀创新光辉。数据清洗过程细致严谨，通过多条件过滤将数据规模从近10万缩减至3万条。训练数据构建设计巧妙，例如大量迷宫题等趣味方法，体现了研究团队的创意。整体而言，论文在AI领域具有重要价值，获得高度评价。

DeepSeek教程/实践论文/研究

00:35

Rohan Paul@rohanpaul_ai

这里有个有趣的想法。 Mark Cuban 购买了一台 Mac Mini 用于智能体 AI，以应对海量的 AI 生成的冷邮件和垃圾邮件。他正在训练该系统通过 Gmail 自动取消订阅。 "你用 AI 攻击我，我立刻就用 AI 回击你。"

智能体大佬观点

00:31

Chubby♨️@kimmonismus

太好了！OpenAI 即将 🚢 【引用 @thsottiaux】：今天感觉很有编程灵感

OpenAI大佬观点

00:30

向阳乔木@vista8

DeepSeek提出"视觉原语"多模态推理框架，用"指"的方式思考

DeepSeek团队提出全新多模态推理框架“Thinking with Visual Primitives”，核心是让模型在推理过程中像人类一样，使用“点”和“边界框”这类视觉原语来指代图像中的具体位置，以此作为思维的最小单位，旨在解决语言在精确描述空间位置时的“指代鸿沟”问题。模型采用DeepSeek-V4-Flash作为语言骨干，并设计了极致的视觉Token压缩流水线，将视觉Token用量压缩至其他前沿模型的十分之一。尽管视觉信息被大幅压缩，模型在空间推理、计数等任务上仍达到或超越了GPT-5.4、Claude-Sonnet-4.6等模型的性能。

DeepSeek多模态推理论文/研究

关联讨论 2 条

00:28

宝玉@dotey

Agent产品交互的两类主流模式与设计关键

当前AI Agent产品的交互主要分为两类：一是以Agent为中心，如Cursor的Agent模式和Codex，界面以对话列表指挥AI为主，手动修改为辅；二是以人操作为主、Agent为辅助，如GitHub Copilot，在传统软件界面旁增设侧边栏。设计者需首先明确软件是以Agent为核心还是辅助，否则易导致交互混乱。有观点指出，交互形式三年多来革新缓慢，关键在于缺乏对Agent从“无状态”到“有状态”处理的基础设施支持，状态机抽象有望推动交互设计丰富化。

Yangyi：为什么从gpt到现在已经三年多了还是这种交互侧边栏会话记录+对话详情+artifact 再多一点儿可能再分一个层级出四栏或者上下再分层级tab 之所以没…