AIHOT

AI HOT

5月1日

06:12

Marc Andreessen 🇺🇸@pmarca

有效。【引用 @Birdyword】：许多人似乎不希望数据中心建在自家附近，尽管它们不会造成太多交通拥堵，且常为地方带来大量税收。我猜部分原因是因为它们太丑了！我的建议：

大佬观点现象/趋势

06:10

ginobefun@hongming731

本文介绍了一套提升内容在主流AI（如ChatGPT、Claude）中可见性的实用方法，核心是主动提供结构化数据。关键步骤包括：在网站部署`llms.txt`文件概述站点；在`robots.txt`中允许AI搜索爬虫；向Google、Bing等提交Sitemap并利用其工具监测AI引用；参与Perplexity出版者计划；使用JSON-LD结构化数据标记内容；甚至可为AI创建专用知识端点，集中提供实时更新的结构化信息。这些做法旨在帮助AI更准确、高效地理解内容，而非制造垃圾信息。

Tw93：这几天，有好几个小伙伴@我说，我的一些作品在他们问 AI 的时候主动被推荐了，很神奇，我想了想感觉啥也没有做，居然可以被收录，那要不要做点更体系化的事情来整一整…

搜索教程/实践部署/工程

05:13

Chubby♨️@kimmonismus

在今天的新闻通讯中，我主要关注了主要超大规模公司的财报，并思考了这对我们意味着什么。免费订阅Superintelligence新闻通讯，网址是http：//getsuperintel.com ：）

现象/趋势行业动态

04:45

dax@thdxr

整个"不能使用我们的模型开发竞争产品"的规定现在变得非常令人困惑，因为模型实验室正在推出像Claude Design这样的常规产品。

Anthropic现象/趋势

04:16

ChatGPT@ChatGPTapp

精选63

一条针对GPT Image 2的特定图像生成提示词正在社交媒体上病毒式传播。该提示词的核心要求是：以最笨拙、潦草且极其糟糕的方式重绘所附图像，背景为白色，使其看起来像是用鼠标在MS Paint中绘制。生成效果需与原图似是而非，带有低质量像素感和令人困惑的别扭感，以突出其荒诞的"差劲"。推文引用者指出，这条提示词正引发疯狂传播。

OpenAI图像生成教程/实践

关联讨论 1 条

推荐理由：这 prompt 把 GPT Image 2 从「精美」逼成了「小学生涂鸦」，是近期最有网感的玩法，做内容的可以直接抄。

04:14

dax@thdxr

opencode go 目前是零数据保留但如果我们收集数据来训练未来的开源模型，就可以提高限制并使其更具可持续性你可以选择退出--你能接受这一点吗？

产品更新开源生态数据/训练编码

04:14

Sam Altman@sama

这确实看起来很酷【引用 @mweinbach】：Codex 目标功能看起来很酷看起来你可以给 Codex 设定一个目标，然后它会持续工作、规划和测试直到完成？我只是在阅读这里的提交记录，但我想这就是它的功能吧？

智能体OpenAI产品更新编码

04:14

SemiAnalysis@SemiAnalysis_

AWS正通过Trainium和Inferentia芯片在定制AI芯片领域做出重大举措。来自@awscloud团队的Rachel Zheng和Karthik Venna详细介绍了他们如何在全球最大的云基础设施上扩展这些处理器。@makora_ai https：//youtu.be/mgrQWLERync

推理教程/实践部署/工程

04:12

Chubby♨️@kimmonismus

本地LLM游戏开发对决：Gemma 4 31B 在效率与逻辑上胜过 Qwen 3.6 27B

在@atomic_chat_hq平台的本地LLM游戏开发竞赛中，Gemma 4 31B与Qwen 3.6 27B于MacBook Pro M5 Max上对决。尽管Qwen生成速度更快（32 tokens/秒）且回答更具创意，但Gemma仅用3分51秒和6209个token，输出了更简短、清晰、逻辑性强的答案。在具体的吃豆人游戏逻辑实现上，Gemma在点击反应、与墙壁/幽灵的交互及粒子效果处理方面表现更优。作者强调此为单次测试，Qwen或可通过调整设置提升表现，并邀请社区验证。

开源生态推理评测/基准

04:09

Rohan Paul@rohanpaul_ai

David Sacks 澄清，Anthropic 的 Mythos 模型并非魔法或末日武器，而是首个能自动化执行网络安全任务（如代码审计）的模型。OpenAI 的 GPT-5.5-cyber 已具备相同能力，所有前沿模型预计约六个月内都将达到此水平。他强调这些模型不创造漏洞，而是发现代码中既有缺陷，利用AI发现并修补漏洞反而能增强系统安全。从"前AI"到"后AI"网络安全的跨越将引发重大升级，最终在AI驱动的攻防间达到新平衡。关键在于让防御方比攻击方更早获得此类工具，且GPT-5.5-cyber因无令牌限制可能成为防御方首个实用化模型。

AnthropicOpenAI大佬观点安全/对齐

03:45

Suno@suno

Genki 如何将一段 16 小节即兴演奏变成 2000 年代摇滚曲目

多模态教程/实践

03:15

Ethan Mollick@emollick

忘掉妖精吧，GPT-5.5在其虚构作品中真正喜欢的东西是：灯塔、海洋、地图、钟声、敲响不可能时刻的钟楼、米拉谷、共振与回声（Claude和Gemini也喜欢这些）、秘密的第三事物（不是白天/黑夜，不是高/低）…

AnthropicGoogleOpenAI大佬观点

03:14

karminski-牙医@karminski3

精选72

DeepSeek-V4 API推理内容字段缺失导致报错问题

用户在使用DeepSeek-V4 API或集成该模型的终端编码代理（如Claude Code、Kimi CLI）和AI IDE（如Cursor）时，频繁遇到HTTP 400报错。错误信息指出，在思考模式下必须将`reasoning_content`字段回传给API。核心问题在于，当任务步骤的`tool_call`过于简单直接时，DeepSeek-V4返回的`reasoning_content`可能为空字符串。许多开发工具默认会过滤掉空值字段，导致该字段未被回传，从而触发API报错，致使编码任务或代理中断。经测试，在特定场景下该字段返回空字符串的概率高达59%。解决方案是必须将空字符串值的字段原样回传，不能省略或改为空对象。目前需等待IDE官方修复或自行修改开源工具，使用DeepSeek-V4的代理项目也需注意此问题。

DeepSeek推理教程/实践

推荐理由：如果你在用 DeepSeek-V4 写代码，这个坑迟早会踩到，作者把问题和解法都讲清楚了，不用等 IDE 修，看完就能自己改。

03:14

karminski-牙医@karminski3

使用DeepSeek-V4 API开启思考模式时，必须在后续请求中回传模型返回的`reasoning_content`字段。当任务过于简单时，该字段可能为空字符串，而许多终端编码代理和AI IDE的默认行为会过滤掉空值字段，导致API返回HTTP 400错误并中断任务。关键解决方案是必须原样回传该字段，即使其值为空字符串，不能丢弃或改为空对象。目前需等待工具官方修复或自行修改开源版本，仅靠重试难以根本解决此问题。

karminski-牙医：给大家说下目前使用 DeepSeek-V4 (pro/flash) 的最需要注意的问题. 本身其实并不算 bug, 但是却很致命. 问题大概是这样的, 在请求…

智能体DeepSeek教程/实践编码

03:14

Artificial Analysis@ArtificialAnlys

GPT-5.5 Pro以更低成本实现性能微升，在尖端科学评估中领先

在名为CritPt的尖端科学评估中，GPT-5.5 Pro (xhigh) 以比前代GPT-5.4 Pro (xhigh) 低60%的成本和令牌使用量，实现了0.5个百分点的性能提升，将得分推至30.5%。CritPt评估包含全球30多家机构的60多名研究人员贡献的研究生级别物理问题。自2025年11月发布以来，最高分从Gemini 3 Pro Preview的9%跃升至GPT-5.4 Pro的30%。OpenAI指出，GPT-5.5 Pro相比GPT-5.5“使用了更多计算资源进行深度思考，以提供更稳定的优质答案”。该模型每令牌定价相同，但通过使用更少的令牌完成了评估。

OpenAI推理评测/基准

03:12

Marc Andreessen 🇺🇸@pmarca

主推文赞同DavidSacks的观点，强调需去除Mythos模型的神秘性。Mythos与OpenAI的GPT-5.5-cyber等模型能自动化网络安全任务，它们并非创造漏洞，而是发现并修补代码中已有的漏洞，从而强化系统。预计所有前沿模型（包括中国模型）将在约6个月内具备类似能力。从AI前到AI后网络安全的飞跃将引发重大升级周期，最终在AI驱动的网络攻击与防御间达到新平衡。防御者需比攻击者先获得这些模型，而GPT-5.5-cyber因不受令牌限制，可能成为防御者实际使用的首个网络模型。

OpenAI大佬观点安全/对齐

03:10

阿绎 AYi@AYi_AInotes

Lenny分享五款小众高效的Mac生产力工具

Lenny推荐了五款在其工作流中不可或缺、专注优雅的Mac生产力工具，旨在替代日益臃肿的主流软件。这些工具包括截图工具CleanShot、替代Loom的录屏工具Supercut、文本片段扩展器TextExpander、极简表情符号选择器Rocket，以及辅助专注进入心流状态的音乐服务Brain.fm。其核心观点是选择更专注、更优雅的小众工具来提升效率。

其他大佬观点

03:09

Rohan Paul@rohanpaul_ai

安德烈·卡帕西访谈：计算未来或将以神经网络为中心

安德烈·卡帕西在访谈中指出，计算的未来可能从传统软件转向以神经网络为中心。传统软件需先将现实世界转化为规整符号，再由预设代码处理。而神经系统的处理顺序相反，能直接处理视频、语音、屏幕状态等“混乱”输入，实时推断关键信息并动态生成界面或行动。这不仅是用聊天替代应用，更是用能持续实时解读和渲染现实的系统取代固定流程。在此架构下，用户界面不再是稳定产品，而是为特定时刻、任务和个人临时组装的表面；传统CPU则退居类似协处理器的角色，负责算术、存储等确定性任务，而神经模型主导感知、规划和适应。

大佬观点现象/趋势

02:43

PixVerse@PixVerse_

这些花朵看起来如此生动逼真！你的提示词设计得太棒了，这个富士山主题的创作纯粹是美。太喜欢了！🌸✨@222TT222

TakTempest：Soundtrack-adored Mount Fuji: Morning Glory, Sunrise, Sunset. T2V with brilliant…

行业动态

02:42

Chubby♨️@kimmonismus

GPT-5.5在多层网络攻击模拟方面与Claude Mythos旗鼓相当？ OpenAI：年度回归。

AnthropicOpenAI安全/对齐评测/基准

02:10

阿绎 AYi@AYi_AInotes

GPT与Claude官方提示指南理念相反，提示工程核心转向使用者思考清晰度

OpenAI与Anthropic同天发布官方提示指南，核心理念截然相反。OpenAI建议为GPT-5.5明确目标而非步骤，让其自主选择路径；Anthropic则要求对Claude Opus 4.7清晰说明意图、格式与成功标准。这导致旧提示方法失效：模糊指令使Claude输出变窄，而详细流程成为GPT的噪声。这反映出提示工程的核心已从“教模型做事”转变为“使用者自身思考的结构化”，真正的瓶颈可能在于人的思考清晰度，而非模型能力。

阿绎 AYi：我终于明白为啥最近很多人都在说，GPT和Claude突然变笨了，昨天OpenAI和Anthropic同时发布了官方提示工程指南，看完我才发现，并不是模型变…

AnthropicOpenAI大佬观点推理

02:09

Rohan Paul@rohanpaul_ai

谷歌AI领先优势源于长期战略投资，非仓促应对ChatGPT

《时代》杂志指出，谷歌在人工智能领域的领先地位，源于CEO桑达尔·皮查伊早期对DeepMind、TPU芯片、云基础设施及AI产品的一系列长期投资，而非对ChatGPT的仓促反应。其核心优势在于对研究、芯片、云服务、产品和覆盖数十亿用户的分发渠道实现全栈控制。通过将定制芯片制造与统一的研究实验室深度融合，谷歌获得了对AI架构的绝对控制权，能利用自研TPU高效执行复杂计算，同时让工程师得以低成本大规模扩展模型预训练，而无需像竞争对手那样承受高昂的外部芯片采购成本。

DeepMindGoogle大佬观点搜索

01:45

Andrej Karpathy@karpathy

红杉Ascent 2026炉边谈话：LLM的新视野、能力不均衡与智能体原生经济

谈话指出LLM的核心价值在于开启全新可能，如完全由LLM驱动的应用、用自然语言描述替代脚本安装、以及处理传统代码无法应对的非结构化知识库。其次，探讨了LLM能力“锯齿状”不均衡现象，认为这与领域可验证性及经济利益影响训练数据分布有关。最后，话题转向智能体原生经济，涉及将产品服务分解为传感器、执行器和逻辑模块，使信息对LLM高度可读，并讨论了新兴的智能体工程及相关技能。谈话强调，从“氛围编程”到“智能体工程”的转变，不仅是提升效率，更是拓展能力上限，旨在智能体时代构建全新事物。

智能体大佬观点现象/趋势

关联讨论 2 条

01:45

Andrej Karpathy@karpathy

这是我一直以来经常引用的那句话。

大佬观点

01:44

Sam Altman@sama

lisan 多说点我们的坏话你太客气了【引用 @scaling01】：GPT-5.5 is on par with Claude Mythos - GPT-5.5 平均通过率 71.4% （±8.0%） - Mythos Preview 68.6% （±8.7%） - GPT-5.5 在 11 分钟内以 1.73 美元成本完成了一项人类专家需约 12 小时的任务

OpenAI大佬观点评测/基准

01:44

Replit ⠕@Replit

集成开发环境已死。当编码模型的发展趋于平缓，竞争壁垒便向技术栈上游转移。@amasad 在 @twentyminutevc 节目中与 @HarryStebbings 深入探讨了 SaaS 行业的剧变、为何 Cursor 的赌注每周都显得更加动摇，以及真正保持十步领先需要什么。完整对话 ⬇️

大佬观点现象/趋势编码

01:42

Chubby♨️@kimmonismus

现在您可以使用LTX-2.3将现有的SDR素材升级至HDR。因为它基于MP4压缩伪影进行训练，所以能实际应用于真实世界的压缩视频。它输出场景线性EXR格式，为DaVinci Resolve提供真实的浮点数据，而非在调色中容易损坏的脆弱图像。

教程/实践视频

01:39

Google AI Developers@googleaidevs

既然Gemini Embedding 2已正式发布，让我们探索该模型解锁的功能--从智能多模态RAG到视觉搜索--因为它能将文本、图像、视频、音频和文档映射到统一的嵌入空间。

Google检索增强多模态模型发布

01:15

Ethan Mollick@emollick

"承重结构"、"我总会反复提及"、"不是X，而是Y" 频繁使用AI的一个诅咒是，你会意识到周围有多少文字现在只是AI生成的不使用AI的人无法一眼识别AI文本，但经常使用的人能轻易察觉其痕迹

大佬观点

01:14

宝玉@dotey

CodexPotter 是一个命令行工具，通过后台启动 Codex CLI 并采用“Ralph Loop”机制执行任务。它先将用户目标写入 MAIN.md 文件，随后在全新上下文中反复启动 Codex 会话，对照该文件检查并修正代码，直至输出与目标一致，默认最多进行 6 轮迭代。该工具适用于目标明确的任务（如按文档实现功能），而非交互式讨论。其名称灵感来源于《辛普森一家》中爱重复说话的 Ralph Wiggum。作者推荐此工具，以回应寻找类似 Claude Code 中 Ralph 插件的需求，并指出其不会像某些插件那样修改用户配置。

宝玉：请问有没有好用的 Ralph Loop for Codex？类似于 Claude Code 的 Ralph Wiggum Plugin https://git…

GitHub开源/仓库编码

01:12

Chubby♨️@kimmonismus

"claude-jupiter" 会是 Anthropic 的下一个 Sonnet 级模型吗？ Sonnet 4.8 与 Opus 4.7 以及 Mythos/Capybara 的引用一同出现在 Claude 代码源泄露中--所以这可能是一个内部代号，而非随机的 Discord 传闻。

Anthropic行业动态

01:10

阿绎 AYi@AYi_AInotes

模型进化方向相反，提示工程核心转向结构化思考

近期用户感觉GPT和Claude“变笨”，实因模型能力进化导致提示工程要求改变。官方指南揭示，两大模型进化方向相反：Claude Opus 4.7趋向字面执行指令，而GPT-5.5则更自主，能根据目标自行选择路径。因此，旧提示失效原因也相反——模糊提示在Claude上输出变窄，详细步骤在GPT上反成噪声。提示工程的核心已从“教模型做事”转变为“先结构化人类思考”，未来优势将属于思考最清晰、最明确自身需求的人。

AnthropicOpenAI大佬观点

01:09

Rohan Paul@rohanpaul_ai

Jensen Huang 谈 OpenClaw。 "OpenClaw 可能是最重要的软件发布，你知道的，或许是有史以来最重要的。" Nvidia 每月花费 100 万美元运行这些智能体，因为每个提示的令牌使用量增长了 1000 倍。

智能体大佬观点

00:44

向阳乔木@vista8

DeepSeek提出"视觉原语"多模态推理框架，用"指"的方式思考

DeepSeek团队提出全新多模态推理框架“Thinking with Visual Primitives”，核心是让模型在推理过程中像人类一样，使用“点”和“边界框”这类视觉原语来指代图像中的具体位置，以此作为思维的最小单位，旨在解决语言在精确描述空间位置时的“指代鸿沟”问题。模型采用DeepSeek-V4-Flash作为语言骨干，并设计了极致的视觉Token压缩流水线，将视觉Token用量压缩至其他前沿模型的十分之一。尽管视觉信息被大幅压缩，模型在空间推理、计数等任务上仍达到或超越了GPT-5.4、Claude-Sonnet-4.6等模型的性能。

DeepSeek多模态推理论文/研究

关联讨论 2 条

00:44

向阳乔木@vista8

DeepSeek论文AI解读：独立思考与数据清洗亮点

作者完成DeepSeek最新论文的AI解读，指出论文在独立思考方面表现突出，闪耀创新光辉。数据清洗过程细致严谨，通过多条件过滤将数据规模从近10万缩减至3万条。训练数据构建设计巧妙，例如大量迷宫题等趣味方法，体现了研究团队的创意。整体而言，论文在AI领域具有重要价值，获得高度评价。

DeepSeek教程/实践论文/研究

00:44

向阳乔木@vista8

DeepSeek-VL：面向真实场景的视觉语言模型

DeepSeek-VL旨在解决开源视觉模型在真实场景中应用效果不佳的问题。其核心方案是系统性地从数据、架构与训练三方面进行设计：数据构建强调从真实用户需求出发，并包含70%的纯文本以保留语言能力；模型架构创新性地采用SigLIP与SAM-B混合视觉编码器，兼顾高层语义与低层细节；训练策略则通过三阶段渐进式训练与模态平衡技术，有效缓解了视觉训练对语言能力的侵蚀，最终在同等规模下达到开源模型的顶尖水平。

DeepSeek多模态教程/实践

00:44

宝玉@dotey

Agent产品交互的两类主流模式与设计关键

当前AI Agent产品的交互主要分为两类：一是以Agent为中心，如Cursor的Agent模式和Codex，界面以对话列表指挥AI为主，手动修改为辅；二是以人操作为主、Agent为辅助，如GitHub Copilot，在传统软件界面旁增设侧边栏。设计者需首先明确软件是以Agent为核心还是辅助，否则易导致交互混乱。有观点指出，交互形式三年多来革新缓慢，关键在于缺乏对Agent从“无状态”到“有状态”处理的基础设施支持，状态机抽象有望推动交互设计丰富化。

Yangyi：为什么从gpt到现在已经三年多了还是这种交互侧边栏会话记录+对话详情+artifact 再多一点儿可能再分一个层级出四栏或者上下再分层级tab 之所以没…