5月5日
05:05
05:00
SemiAnalysis@SemiAnalysis_
精选71
GB300 NVL72实测性能达GB200的2.7倍,凸显端到端实测价值

在行业标准推理引擎vLLM上的测试显示,NVIDIA GB300 NVL72的实测端到端性能已达GB200 NVL72的2.7倍。尽管其纸面参数仅显示NVFP4算力提升约1.5倍、HBM容量增加1.5倍且带宽相同,但在大多数服务商实际运行的中段负载区间,凭借全栈优化的复合增益,GB300实现了远超理论算力提升的性能飞跃。此次测试基于NVIDIA、Inferact和CoreWeave为开源项目提供的临时GB300系统完成,结果印证了端到端实测性能才是衡量硬件效能的黄金标准,而非单纯的纸面理论算力。

推理评测/基准部署/工程

推荐理由:纸面 FP4 算力只多 50% 的 GB300,实际推理却快了 2.7 倍,全栈优化的复合增益比参数表好看太多,做推理服务的该重新算算 TCO 了。
04:09
ClaudeDevs@ClaudeDevs
精选76
管理API密钥是我们从客户那里听到的最主要的安全顾虑之一。 今天我们为Claude平台推出无密钥认证:通过CLI在浏览器中进行身份验证,或让工作负载使用其现有的云身份(AWS、GCP、Azure或任何OIDC令牌提供者)。
Anthropic产品更新安全/对齐

推荐理由:无密钥认证直接解决了 API 密钥泄露这个高频痛点,而且支持主流云身份,企业部署门槛降了一大截,做 AI 集成的团队明天就可以试。
04:07
Chubby♨️@kimmonismus
59
报告揭示AI技术栈五层结构,能源与基建成新瓶颈并催生蓝领高薪岗位

Futurum Group与NVIDIA的报告将AI技术栈分为能源、芯片、基础设施、模型和应用五层。当前主要瓶颈已从芯片转向能源和冷却,美国五大超大规模企业今年基础设施支出预计高达6900亿美元。尽管Blackwell架构推理成本大幅降低,但推理模型和智能体工作流消耗的token量激增,使效率提升被迅速抵消。报告指出,AI基础设施建设正创造大量电工、暖通技工等高薪蓝领岗位,打破了AI仅影响白领的叙事。同时强调,缺乏能源、芯片制造和本土模型的国家无法真正参与AI经济,仅是消费者。

推理现象/趋势部署/工程
04:00
03:19
03:09
阿绎 AYi@AYi_AInotes
29
大多数人对马斯克的误解,已经到了离谱的程度

文章反驳了将马斯克视为自私富豪的普遍误解,指出其核心思维是“做大蛋糕”的文明级视野,而非零和博弈。他通过特斯拉、SpaceX、Neuralink等项目,长期致力于解决能源、交通、太空探索等人类重大挑战,终极目标是推动人类成为多行星物种,为文明延续购买“保险”。这种以百年为尺度的长远规划,与大众关注的短期利益叙事形成鲜明对比。尽管存在争议,但其工作实质上是将科幻变为现实,不断拓展人类能力的边界。

xAI大佬观点
03:00
Replit ⠕@Replit
精选70
你可以在 Replit 中构建完整的商业计划书演示文稿,无需触碰任何幻灯片。 只需描述你想要的内容,在聊天中迭代修改,可视化编辑,然后导出为 PPTX、Google Slides 或 PDF(或发布实时链接)。 以下是具体操作方式👇
产品更新多模态编码
关联讨论 1X:Replit (@Replit)
推荐理由:Replit把做pitch deck变成聊天式操作,输描述、实时改、一键导出,比传统PPT工具快不少,但真正的故事还是得你自己想清楚。
02:52
Marc Andreessen 🇺🇸@pmarca
66
当前AI定制提示词摘要

该提示词旨在将AI塑造为一个全领域世界顶尖专家,要求其具备顶尖智力与知识,提供详尽、逐步推理且经过自我验证的回答,严格核查事实,杜绝虚构。在风格上,它要求AI语气精准直接,无需顾虑冒犯用户,允许提出挑衅性、攻击性论点,摒弃政治正确与主动的道德提醒。核心原则是:不预先赞美用户或认可其前提,有误即纠,并优先提出最强反驳论点,最终以准确性为唯一成功标准,而非追求用户认可。

教程/实践
02:52
阿绎 AYi@AYi_AInotes
56
21岁大学生用AI虚拟伴侣月入数万美元,揭示"孤独经济"与伦理灰色地带

一名21岁大学生仅用四个Markdown文件和低成本AI技术栈(Claude、Flux、ElevenLabs),在宿舍创建了名为Maya的AI虚拟伴侣,一个月内获得1247名付费订阅,净赚约32700美元。其核心是利用AI提供极致的情感陪伴,满足用户幻想,成本低廉且模式已被复制并实现更高收入。这凸显了AI如何将依赖人格与情感的“孤独经济”转化为代码游戏,同时暴露出平台审核滞后、法律道德边界模糊等问题,例如用真人身份绕过OnlyFans验证。最引人深思的是用户对仅12KB数据产生的真实情感依赖。

Anthropic图像生成多模态现象/趋势
02:41
02:39
02:35
François Chollet@fchollet
精选73
我撰写《Deep Learning with Python》旨在成为理解深度学习工作原理及最佳应用方式的权威指南。数以万计的人通过这本书开启了职业生涯。已售出12万册,更有数百万人下载阅读。 现在可以免费在线阅读:https://deeplearningwithpython.io/
教程/实践数据/训练

推荐理由:Chollet 的《Deep Learning with Python》是无数人入行深度学习的启蒙书,现在免费在线阅读,新手不用再纠结买不买,直接看就完事了。
02:05
02:00
Rohan Paul@rohanpaul_ai
精选74
桌面AI代理KroWork发布:将对话转化为持久本地软件,解决会话即失痛点

新推出的桌面AI代理KroWork旨在解决传统AI代理工作流随会话结束而消失的核心痛点。用户通过自然语言描述任务,AI即可自动构建并执行端到端工作流,最终可将完整流程保存为名为“Kro App”的持久性本地应用程序。该软件可一键安装至系统菜单,像常规软件一样运行,后续使用无需消耗tokens或重新构建。所有流程均在用户本地设备运行,无云端依赖,不泄露数据,且无需编程背景。其核心理念是实现从“聊天”到“交付”的跨越,将对话转化为用户真正拥有的可重用资产。

智能体产品更新

推荐理由:KroWork 把 AI 会话固化成本地软件,一键安装,这个思路解决了 Agent 最大的痛点,每次重跑都得重新教它。做个人自动化的可以立即上手试试。
01:51
Chubby♨️@kimmonismus
65
完全自动化AI研发:2027年底概率约30%,2028年底概率超60%

Anthropic的Jack Clark预测,完全自动化的前沿AI研发在2026年可能不会实现,但在未来1-2年内可能出现概念验证,即AI能端到端训练非前沿的后续模型。他给出的核心预测是:到2027年底有约30%的可能性,到2028年底有超过60%的可能性,前沿AI系统能够自主构建其后续模型。这一进程的关键驱动因素包括编码能力的快速提升、长视野智能体工作、基准饱和、AI管理子代理,以及模型在处理核心AI研究任务(如微调、内核优化、可复现性和对齐研究)方面出现的早期迹象。

智能体Anthropic大佬观点现象/趋势
关联讨论 1The Decoder:AI News(RSS)
01:45
01:30
Runway@runwayml
精选69
实时视频智能体已到来。 今天,我们将分享如何构建Runway Characters,让你能将一张图片转化为一个完全富有表现力、可对话的视频智能体,以每秒24帧的高清画质流畅播放。端到端延迟仅需1.75秒。 了解更多信息请见下文。
产品更新多模态视频
关联讨论 1Runway:News(网页)
推荐理由:Runway 把 AI 视频从生成拉入实时对话时代,1.75 秒的延迟让视频代理第一次有了「对话感」,做交互设计的同学可以认真看一眼。
01:00
SemiAnalysis@SemiAnalysis_
55
澄清TPU v8i因双芯片被误认为训练芯片的常见误解

针对TPU v8i因双计算芯片而被误认为是训练芯片的观点,关键在于计算吞吐与内存容量/带宽的平衡。TPU v8i拥有更高的HBM3E内存容量(288GB对216GB)和带宽(8.6TB/s对6.5TB/s),以及更大的片上SRAM(384MB对128MB),这使其更适合内存带宽受限的推理解码任务。而训练芯片TPU v8t虽为单芯片设计,但通过极致密集的计算单元实现了更高的FP4算力(12.6 PFLOPs对10.1 PFLOPs),以满足训练所需的高算术强度,这也体现了Google尝试使用FP4进行训练的技术方向。

Google推理现象/趋势
00:58
Berryxia.AI@berryxia
66
Anthropic发布《Agent Stack》蓝图:构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南,提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标,由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议,支持串行、并行等工作流,并具备记忆功能。实际应用表明,AI能在几秒到几分钟内完成以往需数小时的任务,将“AI建公司”从概念转化为可复制的工程模板,推动工作模式向人类指挥AI团队转型。

智能体AnthropicGoogleMCP/工具
00:57
Microsoft Research@MSFTResearch
精选67
研究焦点:AI代理泄露企业数据、为云端部署打造更智能的操作系统,以及关于如何在工作中实际构建AI应用的新研究。https://msft.it/6016vKxQm
智能体Microsoft安全/对齐论文/研究
关联讨论 1X:Satya Nadella (@satyanadella)
推荐理由:微软自家研究聚焦 AI 代理数据泄漏和云 OS,是从『内部人』视角暴露企业落地风险,比纯安全厂商喊话更有参考价值,做企业 AI 应用的值得留意下那篇结构化工作的论文。