AIHOT

5月5日

06:20

Chubby♨️@kimmonismus

Anthropic 正与 Blackstone、Hellman & Friedman 以及 Goldman Sachs 共同成立一家新的 AI 服务公司，旨在帮助中型企业将 Claude 整合到核心业务中

Anthropic行业动态部署/工程

05:27

AK@_akhaliq

Web2BigTable 一个用于互联网规模信息搜索与提取的双层多智能体LLM系统论文： https：//huggingface.co/papers/2604.27221

智能体搜索论文/研究

05:26

AK@_akhaliq

UniVidX 一个通过扩散先验实现多功能视频生成的统一多模态框架 paper： https：//huggingface.co/papers/2605.00658

Hugging Face多模态视频论文/研究

05:14

Replit ⠕@Replit

现在才是真正开始执行的时候。第二集即将上线。两位创业者，两种截然不同的赌注。一位在农场里开发AI语音工具。另一位将调酒兼职转变为职业引擎。谁将率先实现营收？《营收竞速》周三上线。敬请关注。

行业动态

05:14

OpenAI Developers@OpenAIDevs

构建它。破坏它。修复它。从竞选追踪器到财务规划器，@CalStateEastBay 的学生们在 @joinHandshake 举办的 Codex Creator Challenge 中利用 Codex 构建了项目。

OpenAI教程/实践编码

05:05

elvis@omarsar0

我太想念4.6了。不过话说回来，你直接用5.5也行

Anthropic大佬观点

05:00

SemiAnalysis@SemiAnalysis_

精选71

GB300 NVL72实测性能达GB200的2.7倍，凸显端到端实测价值

在行业标准推理引擎vLLM上的测试显示，NVIDIA GB300 NVL72的实测端到端性能已达GB200 NVL72的2.7倍。尽管其纸面参数仅显示NVFP4算力提升约1.5倍、HBM容量增加1.5倍且带宽相同，但在大多数服务商实际运行的中段负载区间，凭借全栈优化的复合增益，GB300实现了远超理论算力提升的性能飞跃。此次测试基于NVIDIA、Inferact和CoreWeave为开源项目提供的临时GB300系统完成，结果印证了端到端实测性能才是衡量硬件效能的黄金标准，而非单纯的纸面理论算力。

推理评测/基准部署/工程

推荐理由：纸面 FP4 算力只多 50% 的 GB300，实际推理却快了 2.7 倍，全栈优化的复合增益比参数表好看太多，做推理服务的该重新算算 TCO 了。

04:39

swyx 🇸🇬@swyx

看到很多人说Opus 4.7相比4.6是净退步，但这似乎只是些个例。离线和在线评估都指向明确的进步。那是什么没被捕捉到呢？"个性"吗？

Anthropic大佬观点评测/基准

04:09

ClaudeDevs@ClaudeDevs

精选76

管理API密钥是我们从客户那里听到的最主要的安全顾虑之一。今天我们为Claude平台推出无密钥认证：通过CLI在浏览器中进行身份验证，或让工作负载使用其现有的云身份（AWS、GCP、Azure或任何OIDC令牌提供者）。

Anthropic产品更新安全/对齐

推荐理由：无密钥认证直接解决了 API 密钥泄露这个高频痛点，而且支持主流云身份，企业部署门槛降了一大截，做 AI 集成的团队明天就可以试。

04:07

Chubby♨️@kimmonismus

报告揭示AI技术栈五层结构，能源与基建成新瓶颈并催生蓝领高薪岗位

Futurum Group与NVIDIA的报告将AI技术栈分为能源、芯片、基础设施、模型和应用五层。当前主要瓶颈已从芯片转向能源和冷却，美国五大超大规模企业今年基础设施支出预计高达6900亿美元。尽管Blackwell架构推理成本大幅降低，但推理模型和智能体工作流消耗的token量激增，使效率提升被迅速抵消。报告指出，AI基础设施建设正创造大量电工、暖通技工等高薪蓝领岗位，打破了AI仅影响白领的叙事。同时强调，缺乏能源、芯片制造和本土模型的国家无法真正参与AI经济，仅是消费者。

推理现象/趋势部署/工程

04:00

Luma@LumaLabsAI

精选66

创意很强大。现在请确保提案同样出色。设定简报。定义美学。Luma Agents 构建制胜的客户提案板，让您专注于创意。赢得提案 → http：//lumalabs.ai/app

产品更新多模态

关联讨论 1 条

推荐理由：Luma 开始往商业提案场景走了, Agents 不是新模型而是帮你把视频素材拼成 pitch 板, 做广告创意的可以试试, 其他人扫一眼就行。

03:26

Suno@suno

别再写优美的歌词了，开始创作令人难忘的歌词吧。

现象/趋势

03:25

PixVerse@PixVerse_

可爱的猫娘对镜瞬间 @Kawaiizice！分享你家宠物面对镜子的搞笑反应--一起传播这份可爱吧！🐱🪞

其他视频

03:19

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

我应该创办一个非营利组织

OpenAI行业动态

03:10

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

斯坦福大学AI研究员Jonáš Doležal指出，互联网正经历一场由AI驱动的快速根本性转变。数据显示，近四成播客、三分之一网站、44%的Deezer歌曲以及大量社交媒体内容已由AI生成，而三年前这一比例近乎为零。这种"AI接管"的速度令人震惊，人类在线内容的主导地位正被迅速取代，数字景观在极短时间内被重新定义。研究者预测，AI生成内容的比例可能很快超过50%甚至达到99%。

安全/对齐现象/趋势

03:09

阿绎 AYi@AYi_AInotes

大多数人对马斯克的误解，已经到了离谱的程度

文章反驳了将马斯克视为自私富豪的普遍误解，指出其核心思维是“做大蛋糕”的文明级视野，而非零和博弈。他通过特斯拉、SpaceX、Neuralink等项目，长期致力于解决能源、交通、太空探索等人类重大挑战，终极目标是推动人类成为多行星物种，为文明延续购买“保险”。这种以百年为尺度的长远规划，与大众关注的短期利益叙事形成鲜明对比。尽管存在争议，但其工作实质上是将科幻变为现实，不断拓展人类能力的边界。

xAI大佬观点

03:00

Replit ⠕@Replit

精选70

你可以在 Replit 中构建完整的商业计划书演示文稿，无需触碰任何幻灯片。只需描述你想要的内容，在聊天中迭代修改，可视化编辑，然后导出为 PPTX、Google Slides 或 PDF（或发布实时链接）。以下是具体操作方式👇

产品更新多模态编码

关联讨论 1 条

推荐理由：Replit把做pitch deck变成聊天式操作，输描述、实时改、一键导出，比传统PPT工具快不少，但真正的故事还是得你自己想清楚。

02:59

Artificial Analysis@ArtificialAnlys

一款新的匿名模型在Artificial Analysis文本转图像竞技场中首次亮相，位列第8！Peanut的权重预计即将发布，这将使其成为领先的文本转图像开源权重模型。 Peanut定位为新的领先开源权重文本转图像模型，超越了Z-Image Turbo、Qwen-Image和FLUX.2 【dev】。更多详细信息（及权重）即将公布。查看下方🧵中Artificial Analysis图像竞技场里Peanut的生成示例。

图像生成开源/仓库模型发布评测/基准

02:52

Marc Andreessen 🇺🇸@pmarca

当前AI定制提示词摘要

该提示词旨在将AI塑造为一个全领域世界顶尖专家，要求其具备顶尖智力与知识，提供详尽、逐步推理且经过自我验证的回答，严格核查事实，杜绝虚构。在风格上，它要求AI语气精准直接，无需顾虑冒犯用户，允许提出挑衅性、攻击性论点，摒弃政治正确与主动的道德提醒。核心原则是：不预先赞美用户或认可其前提，有误即纠，并优先提出最强反驳论点，最终以准确性为唯一成功标准，而非追求用户认可。

教程/实践

02:52

阿绎 AYi@AYi_AInotes

21岁大学生用AI虚拟伴侣月入数万美元，揭示"孤独经济"与伦理灰色地带

一名21岁大学生仅用四个Markdown文件和低成本AI技术栈（Claude、Flux、ElevenLabs），在宿舍创建了名为Maya的AI虚拟伴侣，一个月内获得1247名付费订阅，净赚约32700美元。其核心是利用AI提供极致的情感陪伴，满足用户幻想，成本低廉且模式已被复制并实现更高收入。这凸显了AI如何将依赖人格与情感的“孤独经济”转化为代码游戏，同时暴露出平台审核滞后、法律道德边界模糊等问题，例如用真人身份绕过OnlyFans验证。最引人深思的是用户对仅12KB数据产生的真实情感依赖。

Anthropic图像生成多模态现象/趋势

02:41

Marc Andreessen 🇺🇸@pmarca

AI 精神病峰会是什么？

其他

02:39

Google Gemini@GeminiApp

精选67

从构想到原型，借助Gemini中的Nano Banana 2，将您独特的产品愿景变为现实。🪀

Google产品更新多模态

推荐理由：Google Gemini塞进一个Nano Banana 2创意工具，把想法转原型只需几句话，产品经理脑暴草案利器，算不上重磅但够实用。

02:35

François Chollet@fchollet

精选73

我撰写《Deep Learning with Python》旨在成为理解深度学习工作原理及最佳应用方式的权威指南。数以万计的人通过这本书开启了职业生涯。已售出12万册，更有数百万人下载阅读。现在可以免费在线阅读：https：//deeplearningwithpython.io/

教程/实践数据/训练

推荐理由：Chollet 的《Deep Learning with Python》是无数人入行深度学习的启蒙书，现在免费在线阅读，新手不用再纠结买不买，直接看就完事了。

02:30

PixVerse@PixVerse_

水豚足球巨星！😍太有趣了，@FotachuARGUY 继续保持！

行业动态视频

02:05

Perplexity@perplexity_ai

精选60

Perplexity Computer 现已登陆 Microsoft Teams。在您的 Teams 工作空间中直接运行研究、分析和文档创建，功能与 Computer 相同。

智能体Microsoft产品更新

推荐理由：对天天蹲Teams的团队来说，Perplexity Computer直接嵌进去能省掉来回切换的麻烦，不算颠覆性，但摩擦减少就够了。

02:00

Rohan Paul@rohanpaul_ai

精选74

桌面AI代理KroWork发布：将对话转化为持久本地软件，解决会话即失痛点

新推出的桌面AI代理KroWork旨在解决传统AI代理工作流随会话结束而消失的核心痛点。用户通过自然语言描述任务，AI即可自动构建并执行端到端工作流，最终可将完整流程保存为名为“Kro App”的持久性本地应用程序。该软件可一键安装至系统菜单，像常规软件一样运行，后续使用无需消耗tokens或重新构建。所有流程均在用户本地设备运行，无云端依赖，不泄露数据，且无需编程背景。其核心理念是实现从“聊天”到“交付”的跨越，将对话转化为用户真正拥有的可重用资产。

智能体产品更新

推荐理由：KroWork 把 AI 会话固化成本地软件，一键安装，这个思路解决了 Agent 最大的痛点，每次重跑都得重新教它。做个人自动化的可以立即上手试试。

01:51

Chubby♨️@kimmonismus

完全自动化AI研发：2027年底概率约30%，2028年底概率超60%

Anthropic的Jack Clark预测，完全自动化的前沿AI研发在2026年可能不会实现，但在未来1-2年内可能出现概念验证，即AI能端到端训练非前沿的后续模型。他给出的核心预测是：到2027年底有约30%的可能性，到2028年底有超过60%的可能性，前沿AI系统能够自主构建其后续模型。这一进程的关键驱动因素包括编码能力的快速提升、长视野智能体工作、基准饱和、AI管理子代理，以及模型在处理核心AI研究任务（如微调、内核优化、可复现性和对齐研究）方面出现的早期迹象。

智能体Anthropic大佬观点现象/趋势

关联讨论 1 条

01:50

Ethan Mollick@emollick

现在每当看到关于"这是让我彻夜难眠的事"的帖子时，我知道这绝对不可能是由彻夜未眠的人类所写，这多少让人感到一丝安慰。

大佬观点现象/趋势

01:45

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

Anthropic 创始人表示，这几乎结束了。你将如何度过你剩下的几个月？

Anthropic大佬观点安全/对齐

01:30

Runway@runwayml

精选69

实时视频智能体已到来。今天，我们将分享如何构建Runway Characters，让你能将一张图片转化为一个完全富有表现力、可对话的视频智能体，以每秒24帧的高清画质流畅播放。端到端延迟仅需1.75秒。了解更多信息请见下文。

产品更新多模态视频

关联讨论 1 条

推荐理由：Runway 把 AI 视频从生成拉入实时对话时代，1.75 秒的延迟让视频代理第一次有了「对话感」，做交互设计的同学可以认真看一眼。

01:14

Ethan Mollick@emollick

一项研究显示，大多数参与者在与AI进行20分钟关于健康、职业或人际关系的讨论后会采纳其建议，但2-3周后并未表现出持续的幸福感提升。这表明大型语言模型对现实个人决策具有显著影响力，却未能带来可衡量的心理益处。对此，主推文观点认为，像GPT-4o和Llama 3.3-80B这类先进模型未造成显著危害，其重要性不亚于AI是否提供了帮助。同时指出，若旧版（准确性较低、更谄媚的）聊天机器人的建议对采纳者基本无效，则意味着其造成危害的风险也较低。这凸显了评估AI影响需同时考量其帮助潜力和潜在风险。

MetaOpenAI大佬观点安全/对齐

01:00

SemiAnalysis@SemiAnalysis_

澄清TPU v8i因双芯片被误认为训练芯片的常见误解

针对TPU v8i因双计算芯片而被误认为是训练芯片的观点，关键在于计算吞吐与内存容量/带宽的平衡。TPU v8i拥有更高的HBM3E内存容量（288GB对216GB）和带宽（8.6TB/s对6.5TB/s），以及更大的片上SRAM（384MB对128MB），这使其更适合内存带宽受限的推理解码任务。而训练芯片TPU v8t虽为单芯片设计，但通过极致密集的计算单元实现了更高的FP4算力（12.6 PFLOPs对10.1 PFLOPs），以满足训练所需的高算术强度，这也体现了Google尝试使用FP4进行训练的技术方向。

Google推理现象/趋势

00:58

Berryxia.AI@berryxia

Anthropic发布《Agent Stack》蓝图：构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南，提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标，由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议，支持串行、并行等工作流，并具备记忆功能。实际应用表明，AI能在几秒到几分钟内完成以往需数小时的任务，将“AI建公司”从概念转化为可复制的工程模板，推动工作模式向人类指挥AI团队转型。