5月5日

13:14

Berryxia.AI@berryxia

斯坦福一门2小时公开课系统讲解了ChatGPT等大语言模型从零构建的全过程，涵盖Transformer架构、训练技巧、Scaling law等核心知识。课程免费且含金量高，揭示了AI时代的底层逻辑。相比之下，许多顶级AI公司的工程师仅专注于调提示词和刷基准测试，缺乏此类系统知识。课程为真正想理解AI的人提供了宝贵的学习机会。

教程/实践数据/训练

08:00

HuggingFace Daily Papers（社区热门论文）

CASCADE：大语言模型部署中的基于案例的持续适应

研究提出部署时学习作为大语言模型生命周期的第三阶段，并推出CASCADE框架。该框架使LLM智能体能在部署期间从经验中持续学习，而无需更新模型参数。其核心是为智能体配备一个显式、演进的情景记忆，将经验复用建模为上下文赌博机问题，从而实现探索与利用的权衡，并保证长期无悔性。在涵盖医疗、法律、代码生成等16项多样任务中，CASCADE将宏观平均成功率较零样本提示提升了20.9%，且持续优于多种基线方法。这项工作通过将部署重构为自适应学习过程，为持续改进的AI系统奠定了基础。

数据/训练论文/研究部署/工程

07:16

Simon Willison 博客

驳斥数据中心占用农田论：Andy Masley 的观点

Andy Masley 驳斥了关于数据中心建设导致农田耗尽的论点。他指出，2000年至2024年间，美国农民自愿出售的农田总面积相当于科罗拉多州，是2028年数据中心预计占地总面积的77倍，但剩余土地的粮食产量却创新高，未影响粮食供应。然而，当劳登县一位农民仅以十倍农业价值出售几英亩普通草场给数据中心运营商时，却引发了过度担忧。Masley 认为，这种对数据中心用地的担忧是夸大其词的。

数据/训练现象/趋势

02:48

François Chollet@fchollet

精选73

我撰写《Deep Learning with Python》旨在成为理解深度学习工作原理及最佳应用方式的权威指南。数以万计的人通过这本书开启了职业生涯。已售出12万册，更有数百万人下载阅读。现在可以免费在线阅读：https://deeplearningwithpython.io/

教程/实践数据/训练

推荐理由：Chollet 的《Deep Learning with Python》是无数人入行深度学习的启蒙书，现在免费在线阅读，新手不用再纠结买不买，直接看就完事了。

00:56

Nathan Lambert@natolambert

我们需要为某些中国实验室对API进行的攻击创造一个新术语，以区别于蒸馏，否则我们可能会玷污一项对AI扩散、学术研究和开源生态系统至关重要的关键技术。 https://www.interconnects.ai/p/the-distillation-panic

大佬观点安全/对齐数据/训练

00:26

Epoch AI@EpochAIResearch

探讨AI基准测试的困境与未来方向

针对“AI基准测试是否已失效”的悲观论调，讨论者进行了反驳，并深入探讨下一代AI基准测试的可能形态。核心议题包括基准测试开发的成本与收益、可扩展基准（如MirrorCode）的构建、AI技术对基准开发本身的加速作用，以及当前基准测试与现实应用能力之间存在的差距。对话还触及了构建通用人工智能（AGI）基准的可行性，并展望了超越自动化评分的更全面评估方法。

数据/训练评测/基准

00:14

IT之家（RSS）

精选71

Claude Token 榜：迪士尼「榜一大哥」9 天 46 万次，Meta 月烧 60 万亿

迪士尼内部上线AI使用看板，追踪员工调用Claude的频率和token消耗。数据显示，一名员工在9个工作日内调用Claude约46万次，平均每1.7秒一次。与此同时，迪士尼正裁员约1000人。硅谷正流行“tokenmaxxing”文化，比拼AI token消耗量。Meta内部统计显示，其8.5万名员工在30天内消耗了60万亿token，价值约900亿美元；Uber的年度34亿美元AI预算在4个月内耗尽。报告显示，Claude用户中非程序员用途已超半数。

Anthropic 数据/训练现象/趋势

推荐理由：迪士尼搞AI排行榜，Meta月烧60万亿token，这不是段子，是AI真实渗透的活证据。从律师到全职妈妈，所有人都开始用Claude打工，这股浪潮比任何财报都真实。