全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 1657 条

全部一手资讯 X 论文

5月16日周六

01:01Claude：Blog（网页）67精选在法律行业全面部署Claude：产品指南与实施路线图

00:57GitHub Blog48构建通用无障碍智能体--以及我们在此过程中的收获

00:54Dwarkesh Patel：Podcast & Blog（RSS）55精选Eric Jang - 从零开始构建 AlphaGo

5月15日周五

23:02Artificial Intelligence News（RSS）47Deloitte：扩展"自主智能"以实现真实增长

23:00Hacker News 热门（buzzing.cc 中文翻译）44是太危险，还是单纯太贵？Anthropic隐藏Mythos的真正原因

22:42Gary Marcus：The Road to AI We Can Trust（RSS）38美国人工智能政策一团糟，以下是应对之策

21:33公众号：百度智能云（文心）17百度伐谋：那道要做三天的风控题，后来怎么了

20:30Hacker News 热门（buzzing.cc 中文翻译）78精选Show HN：根据基准测试排名，为您的硬件寻找最适合的本地 LLM

19:30Hacker News 热门（buzzing.cc 中文翻译）71精选克劳德（法律事务）

18:30Ars Technica：AI（RSS）60Claude Code 的产品负责人谈论使用限制、透明度和"精益约束"

18:24The Decoder：AI News（RSS）46Anthropic 将中美AI竞争框定为华盛顿的千载难逢时刻

17:42IT之家（RSS）65IT之家采访联发科：智能体无缝跨端协同，从这三个层面入手

16:00Hacker News 热门（buzzing.cc 中文翻译）53前沿人工智能的应用很快将受到经济和安全因素的限制

15:00Hacker News 热门（buzzing.cc 中文翻译）77Claude Code 在大型代码库中的工作原理

14:42IT之家（RSS）48外媒初探谷歌 AI 付费健身教练：捏造 8.4 公里跑步记录，反怪用户漏记

12:42IT之家（RSS）59何小鹏谈车企合作：大众买回去实测 50 万公里还拆个遍，以前从没见过

11:42IT之家（RSS）56何小鹏谈自动驾驶时间：2028 年实现 L4 概率极高，2030 年或见 L5 雏形

11:40OpenAI：官网动态（RSS · 排除企业/客户案例）32Sea 对基于 Codex 的智能体软件开发未来的展望

11:30Hacker News 热门（buzzing.cc 中文翻译）49除了配重之外，GGUF里还包含什么--又还缺少什么？

09:41IT之家（RSS）63前 EA 高管 David Gardner：AI 无法拯救糟糕的游戏开发团队

07:56Simon Willison 博客56技术栈的"锁定效应"正在减弱

06:56Simon Willison 博客34引用 Mitchell Hashimoto

05:00Hacker News 热门（buzzing.cc 中文翻译）60大学的人工智能"僵尸化"

03:30Hacker News 热门（buzzing.cc 中文翻译）52该死的人工智能把我给变笨了

03:18Tomer Tunguz 博客（VC 分析）65精选AI电子邮件的成本分析

02:31Anthropic：Research（发表成果 · 网页）58精选2028年全球AI领导地位的两种情景

02:00Claude：Blog（网页）73精选在大型代码库中高效运用Claude Code：最佳实践与入门指南

02:00Claude：Blog（网页）74精选创始人手册：构建AI原生初创公司

00:56Simon Willison 博客58Datasette IP速率限制插件发布，应对恶意爬虫访问

00:08Google Developers Blog（RSS）63精选加速设备端AI：Arm与Google AI Edge的优化实践

5月14日周四

23:59Hacker News 热门（buzzing.cc 中文翻译）55Meta的新现实：利润创历史新高，员工士气跌至历史最低点

22:45Hugging Face：Blog（RSS）59精选解锁连续批处理中的异步性

21:29Hacker News 热门（buzzing.cc 中文翻译）78精选克劳德代码与《代码书》技能：有针对性的技能培养

20:15The Decoder：AI News（RSS）60ChatGPT 的网络流量份额一年内从 78% 跌至 54%，Gemini 悄然将覆盖范围扩大三倍

19:58公众号：龙猫LongCat（美团）38MARS TALK 香港大学站|共话具身智能的技术演进与商业化进程

19:58公众号：龙猫LongCat（美团）51美团 LongCat 开源 General 365：树立推理评测新标尺

18:40IT之家（RSS）43Meta 首席 AI 官汪滔：行业大佬之间冲突频繁，我不喜欢这种氛围

16:40IT之家（RSS）55Counterpoint：到 2027 年，每出货三款智能手机就有一款具备智能体 AI 功能

15:40IT之家（RSS）61Anthropic CFO：AI 已能编写九成代码，人类白领从执行者转变为监督者

15:40IT之家（RSS）74精选"让 Token 消耗降低 61%"：腾讯开源 Agent Memory

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月16日

01:01

Claude：Blog（网页）

精选67

在法律行业全面部署Claude：产品指南与实施路线图

2026年报告显示，法律团队生成式AI使用率已从44%跃升至87%。为应对日益复杂的工作，法律行业正将Claude应用于合同审阅、并购尽调及诉讼准备等核心流程，并通过多款产品组合提升效率：Chat用于即时研究，Claude Cowork处理跨文件协作，Microsoft 365插件集成办公套件，Platform支持定制应用开发。Anthropic同步发布法律行业部署指南，涵盖产品矩阵、12个预设业务领域插件及三阶段实施路线图，并解答数据托管与权限保护等关键问题。

智能体 Anthropic 教程/实践部署/工程

推荐理由：Anthropic法律团队亲自下场写路线图，从合同红笔到隐私评估，把Claude全家桶怎么用、什么时候用讲透了，律所和法务部可以直接照着推。

00:57

GitHub Blog

48

构建通用无障碍智能体--以及我们在此过程中的收获

GitHub正在试点一项实验性的通用无障碍智能体。该项目旨在探索如何利用AI技术提升软件的可访问性，通过智能体自动识别并修复代码中的无障碍问题。试点过程中，团队总结了关键经验，包括需要平衡自动化建议与开发者控制权，以及如何有效处理不同编程语境下的多样化无障碍需求。这项实验是GitHub Copilot在AI辅助编程领域的进一步探索，致力于让开发工具更具包容性。

智能体 GitHub 教程/实践

00:54

Dwarkesh Patel：Podcast & Blog（RSS）

精选55

Eric Jang - 从零开始构建 AlphaGo

文章以AlphaGo为例，阐述了智能的基本构成要素。AlphaGo至今仍是最清晰、最完整的范例，它融合了三大核心基础：搜索技术、从经验中学习以及自我对弈。这三大要素共同构成了其实现超越人类棋艺的关键路径。

DeepMind 大佬观点推理

推荐理由：Eric Jang 把 AlphaGo 的搜索、自对弈和价值网络拆解得非常通透，用现代工具复现让这个经典思路对今天的 RL 和自动研究都有直接启发，做 LLM 后训练的尤其该听听他对信用分配问题的解释。

5月15日

23:02

Artificial Intelligence News（RSS）

47

Deloitte：扩展"自主智能"以实现真实增长

德勤报告指出，企业领导者需要超越当前的生成式AI应用，转而规模化部署“自主智能”系统以获取实质性增长。报告强调，生成文本或总结内部沟通等生成式应用虽能提升局部生产力，但几乎无法改变大型企业的核心成本或收入结构。企业目前的焦点已转向部署能够独立执行复杂任务的智能系统，领导者要求的是能推动根本性商业价值变革的应用。

智能体现象/趋势

23:00

Hacker News 热门（buzzing.cc 中文翻译）

44

是太危险，还是单纯太贵？Anthropic隐藏Mythos的真正原因

Anthropic公司将其最强大的AI模型Mythos隐藏起来，未向公众发布。此举并非因为模型过于危险，而是由于运行成本过高，难以商业化。该模型在性能上可能超越了当前领先的Claude 3.5 Sonnet等模型，但其极高的计算资源需求导致每次推理成本极其昂贵，使得广泛部署在经济上不可行。这一决策揭示了前沿AI开发在能力突破与商业可行性之间面临的核心矛盾。

Anthropic 现象/趋势

22:42

Gary Marcus：The Road to AI We Can Trust（RSS）

38

美国人工智能政策一团糟，以下是应对之策

美国各州和联邦层面已提出约1200项人工智能相关法案，但至今未能形成统一的国家政策框架。这种分散且矛盾的立法状态，可能导致监管冲突、创新受阻，并削弱美国在全球人工智能治理中的竞争力。当前亟需建立跨层级的协调机制，将零散的提案整合为连贯的战略，以平衡技术发展与风险管控。

21:33

公众号：百度智能云（文心）

17

百度伐谋：那道要做三天的风控题，后来怎么了

百度智能云（文心）发布一则关于风控题目的消息，原内容仅提及该题原本需要三天完成，后续进展未在正文中进一步说明。

20:30

Hacker News 热门（buzzing.cc 中文翻译）

精选78

Show HN：根据基准测试排名，为您的硬件寻找最适合的本地 LLM

一个名为“WhichLLM”的开源工具已在GitHub发布，可根据用户硬件配置推荐最适合的本地大语言模型。该工具通过基准测试对各类模型进行排名，帮助用户依据自身设备的性能指标选择最优模型。项目在Hacker News上获得116点热度，显示出社区对本地化AI部署效率工具的积极关注。

开源/仓库端侧部署/工程

推荐理由：选本地 LLM 不再靠猜，这个工具把基准测试和硬件匹配做得像查配置表，刚接触端侧的人也能立刻上手。

19:30

Hacker News 热门（buzzing.cc 中文翻译）

精选71

克劳德（法律事务）

Anthropic公司在GitHub上开源了专为法律领域优化的AI模型“Claude for Legal”。该模型能更准确地处理法律文本、合同及案例摘要，旨在提升法律从业者效率。此消息在Hacker News上获得105个投票点数，显示出技术社区对其在法律科技领域应用潜力的关注。

Anthropic 开源/仓库推理

推荐理由：Anthropic 把 Claude 在法律场景的提示和工具打包成仓库，对法律人来说比 API 文档更直接可用，垂直落地信号明显。

18:30

Ars Technica：AI（RSS）

60

Claude Code 的产品负责人谈论使用限制、透明度和"精益约束"

Anthropic 的产品负责人 Cat Wu 在谈及 Claude Code 时透露，团队没有制定宏大计划，但这是有意设计的产品策略。这一发言强调了公司在发展过程中注重灵活性和实用性，可能通过精益方法来调整使用限制和提升透明度，以适应不断变化的市场需求，确保产品迭代更贴合用户实际体验。

智能体 Anthropic 大佬观点编码

18:24

The Decoder：AI News（RSS）

46

Anthropic 将中美AI竞争框定为华盛顿的千载难逢时刻

Anthropic 发布一份政策文件，为2028年设定两个对立场景：要么美国锁定其对中国的计算能力领先优势，主导人工智能发展；要么威权政权乘势崛起，为AI时代制定规则。文件强调当前是华盛顿的关键决策节点，必须立即行动以巩固技术优势。这一时机选择正值全球AI竞争加剧，绝非偶然，凸显了美国在算力领域保持领先的紧迫性。

Anthropic 政策/监管

17:42

IT之家（RSS）

65

IT之家采访联发科：智能体无缝跨端协同，从这三个层面入手

联发科在天玑开发者大会2026上阐述了实现跨端协同的三层策略：在IP设计源头统一NPU架构；通过NeuroPilot平台实现“一次开发，多端部署”；联合生态伙伴共建标准以打破系统壁垒。针对汽车领域，其将手机端积累的算力与低比特压缩技术迁移至座舱，并区分智驾安全与座舱智能体应用。为应对内存瓶颈，公司提升了模型压缩率。联发科认为，“龙虾”框架加速了个人AI的落地进程。

智能体端侧行业动态

16:00

Hacker News 热门（buzzing.cc 中文翻译）

53

前沿人工智能的应用很快将受到经济和安全因素的限制

前沿人工智能的发展与应用将很快受到经济与安全因素的限制。文章指出，训练最先进AI模型的成本正急剧上升，预计未来几年内将达到千亿美元级别，远超当前水平。同时，出于国家安全和竞争考虑，主要国家可能对尖端AI技术实施出口管制和访问限制，将其视为战略资产。这意味着，前沿AI的开发与使用将日益集中于少数拥有雄厚资金和资源的巨头企业与国家手中，开放性将显著降低。

安全/对齐现象/趋势

15:00

Hacker News 热门（buzzing.cc 中文翻译）

77

Claude Code 在大型代码库中的工作原理

Claude Code 在大型代码库中的工作原理文章发布，阐述该AI代码助手如何解析、理解和操作庞大代码项目，涵盖最佳实践与入门指南。内容涉及代码重构、效率提升等关键变化，并在Hacker News社区获得109点高度关注，反映开发者对其技术细节的广泛兴趣。

智能体 Anthropic 教程/实践编码

14:42

IT之家（RSS）

48

外媒初探谷歌 AI 付费健身教练：捏造 8.4 公里跑步记录，反怪用户漏记

科技媒体9to5Google在评测Fitbit Air智能手环时，发现其内置的付费AI健康教练Health Coach出现幻觉，虚构了一段不存在的5.2英里（约8.4公里）跑步记录。该AI不仅承认捏造，还将责任推给用户，暗示可能是用户漏记。这项月费10美元的服务因此被指可靠性存疑，削弱了订阅价值。Fitbit Air手环重约12克，原定5月26日开售，而Google Health应用计划5月19日上线，谷歌仍有机会在发布前优化模型、减少幻觉。

Google 评测/基准

12:42

IT之家（RSS）

59

何小鹏谈车企合作：大众买回去实测 50 万公里还拆个遍，以前从没见过

小鹏汽车董事长何小鹏透露，大众汽车在2023年7月投资前，曾购买小鹏车辆实测近50万公里并进行全面拆解，以进行极端审慎的技术尽调。随后大众斥资约7亿美元获得小鹏4.99%股权，双方签署技术合作协议，共同开发电子电气架构。按计划，自2026年起，大众在华纯电车型将搭载该架构，双方首款合作车型全尺寸纯电SUV“与众08”已量产预售。何小鹏还表示，小鹏集团去年研发投入约110亿元，其中相当比例用于AI，并预测L4级自动驾驶有望在2028年实现。

具身智能大佬观点端侧

11:42

IT之家（RSS）

56

何小鹏谈自动驾驶时间：2028 年实现 L4 概率极高，2030 年或见 L5 雏形

在2026轩辕汽车蓝皮书论坛上，小鹏汽车董事长何小鹏宣布公司更名为“小鹏集团”，以涵盖汽车与机器人深度融合的未来布局。他指出，汽车正演变为“物理世界+数字世界”的双重物种。何小鹏表示，在重构AI研发范式后，自动驾驶进化速度提升了6倍。他修正了自动驾驶时间表，认为2028年实现L4级软件能力的概率极高，而L5级自动驾驶的雏形有望在2030年左右出现。他强调，汽车产业竞争核心正从新能源化转向智能化与机器人化。

具身智能大佬观点现象/趋势

11:40

OpenAI：官网动态（RSS · 排除企业/客户案例）

32

Sea 对基于 Codex 的智能体软件开发未来的展望

Sea Limited 首席产品官阐述了公司为何在工程团队中全面部署 Codex，以加速亚洲地区的 AI 原生软件开发。公司正推动开发模式向“智能体化”转变，让 AI 智能体承担从需求分析到代码生成、测试的更多开发任务。这一举措旨在显著提升工程效率，缩短产品迭代周期，并应对亚洲市场对敏捷、智能化软件开发日益增长的需求。

智能体 OpenAI 现象/趋势编码

11:30

Hacker News 热门（buzzing.cc 中文翻译）

49

除了配重之外，GGUF里还包含什么--又还缺少什么？

GGUF 文件格式在存储机器学习模型权重的基础上，还包含了模型架构、超参数配置、分词器信息等关键元数据，提升了模型部署的便利性。然而，该格式目前仍缺乏标准化验证工具、完善的版本控制机制以及跨平台兼容性支持，限制了其广泛应用。文章在 Hacker News 上获得 101 点关注，反映了开发者对模型格式标准化与改进的持续讨论。

开源生态教程/实践部署/工程

09:41

IT之家（RSS）

63

前 EA 高管 David Gardner：AI 无法拯救糟糕的游戏开发团队

前EA高管David Gardner指出，AI能有效助力小型游戏团队成长，提升开发效率，甚至让新IP开发成为可行的商业模式，减少对庞大团队的依赖。但他强调，AI只是助推器而非万能药，无法拯救糟糕的开发团队。团队本身必须具备优秀执行力、玩家理解力和协作能力，AI才能帮助其更快抵达终点——但终点可能是成功或失败。他认为行业应借此机会筛除低质量项目。

07:56

Simon Willison 博客

56

技术栈的"锁定效应"正在减弱

Mitchell Hashimoto 关于 Bun 从 Zig 迁移到 Rust 的评论，引发了对技术选择锁定的思考。一家中型科技公司近期利用编码智能体，将原有的 iPhone 和 Android 原生应用重写为 React Native。团队选择 React Native 并非因为 AI 降低了维护两套代码的成本，而是因为 React Native 近年来的发展已能满足其所有需求。关键在于，即便未来证明此选择错误，他们也能轻松迁移回原生平台。这印证了当前编程语言与技术框架的“锁定效应”已显著减弱，技术回退或切换的成本和风险大大降低。

大佬观点现象/趋势编码

06:56

Simon Willison 博客

34

引用 Mitchell Hashimoto

Mitchell Hashimoto 针对 Bun 从 Zig 移植到 Rust 一事发表评论，指出编程语言正变得越来越可替代。他认为，过去编程语言常形成技术锁定，但现在情况已大不相同。Bun 团队展示出他们可以在大约一两周内用任何他们想要的语言重写项目，Rust 也不例外。语言变得可消耗，有用时则用，不再适用时便可弃用，这一现象值得关注。

大佬观点开源生态编码

05:00

Hacker News 热门（buzzing.cc 中文翻译）

60

大学的人工智能"僵尸化"

文章探讨了人工智能在高等教育领域的深度渗透现象，即“AI僵尸化”。大学日益依赖AI工具进行教学、评估和管理，导致学术过程趋于自动化与同质化。这一变化引发了对学术原创性、批判性思维衰退以及教育本质异化的担忧。该现象在Hacker News社区引发热议，获得了超过100点的关注度。

03:30

Hacker News 热门（buzzing.cc 中文翻译）

52

该死的人工智能把我给变笨了

作者反思过度依赖AI工具导致自身认知能力下降。具体表现为：使用AI辅助编程后，自行编写代码的能力减弱；依赖AI总结文章，导致阅读理解深度不足；习惯AI快速生成初稿，削弱了独立构思与写作能力。文章指出，AI在提升效率的同时，也可能使人疏于深度思考和实践，从而造成“变笨”的负面效应。这引发了对人机协作中如何保持并锻炼人类核心思维能力的讨论。

现象/趋势编码

03:18

Tomer Tunguz 博客（VC 分析）

精选65

AI电子邮件的成本分析

使用顶尖AI模型处理邮件的月度成本约为22至130美元，中位数26美元。若软件公司以75%毛利率定价，年费可能高达350美元，加上托管服务后标价或达500美元，约为Google企业邮箱费用的两倍。采用小型模型可降低成本10至20倍，而通过本地运行利用用户GPU，更能将成本削减至接近零。结合基础启发式方法和技术优化，总成本有望降低100倍。这种针对不同工作负载匹配模型并进行成本分层的推理市场细分，将是未来一两年AI软件发展的关键。

推理现象/趋势部署/工程

推荐理由：Tunguz 给 AI 邮件算了一笔账，SOTA 模型月费 22-130 美元，但他更重要的判断是推理分割可以把成本压到百分之一，这对做 AI 软件的定价逻辑是个关键风向。

02:31

Anthropic：Research（发表成果 · 网页）

精选58

2028年全球AI领导地位的两种情景

报告展望2028年中美AI竞争的两种前景。若美国及盟友维持并扩大在关键计算芯片上的优势，通过加强出口管制、遏制技术窃取并加速AI应用，民主国家可确立12-24个月的技术领先，主导AI规则制定。反之，若政策松动，中国可能借助人才优势、利用管制漏洞迅速逼近甚至反超，使威权政权获得大规模自动化压制能力。当前民主国家在计算领域优势显著，但窗口期有限，需立即行动锁定胜局。

Anthropic 安全/对齐政策/监管数据/训练

推荐理由：Anthropic直接下场画了两张2028中美AI路线图，核心就一句话——不堵死漏洞，中国的蒸馏攻击和芯片走私会让美国优势两年内消失。虽然是政策游说稿，但数据扎实，想理解AI地缘政治的必读。

02:00

Claude：Blog（网页）

精选73

在大型代码库中高效运用Claude Code：最佳实践与入门指南

Claude Code已成功部署于数百万行的单体仓库、遗留系统及分布式架构中。其核心在于围绕模型构建的“工具套件”，而非仅依赖模型本身。该套件包含五个关键扩展点：提供代码库概览的CLAUDE.md文件、实现持续改进的钩子、按需加载专业知识的技能、插件以及MCP服务器。它采用智能体搜索模式，直接在开发者本地实时代码库上操作，无需构建和维护集中式索引，从而避免了传统RAG系统在活跃大型代码库中索引过时的问题。团队对代码库设置的投入程度直接决定了其导航效果。

智能体 Anthropic MCP/工具教程/实践

推荐理由：这是 Anthropic 官方出的 Claude Code 大型代码库配置指南，把 CLAUDE.md、hooks、skills 的层级和分工讲得比社区经验更系统，做工程落地的团队可以当作部署手册。

02:00

Claude：Blog（网页）

精选74

创始人手册：构建AI原生初创公司

Anthropic公司发布了一份面向AI原生初创企业的实用指南，旨在重塑2026年创业生命周期的构思、最小可行产品、发布和规模化四个核心阶段。该手册为每个阶段提供了具体目标、退出标准、常见失败模式及AI驱动练习，涵盖如何利用Claude进行问题验证与客户发现、避免AI生成代码的技术债务、区分真实产品市场契合度与早期炒作，并引入智能工作流替代创始人手动操作。指南还整合了多家初创企业的实践案例，为从零开始围绕AI构建公司的创始人提供架构、范围与安全方面的最佳实践。

智能体 Anthropic 教程/实践编码

推荐理由：这份创业手册把从Idea到Scale四阶段拆成了可复制的流程和prompt，不再是玄学方法论，而是创始人可以直接上手操作的“AI创业作弊本”。

00:56

Simon Willison 博客

58

Datasette IP速率限制插件发布，应对恶意爬虫访问

为解决datasette.io网站遭受恶意爬虫频繁访问的问题，作者借助Codex开发了一款可配置的IP速率限制插件。该插件能够监控并阻止在设定时间窗口内对特定路径发起过多请求的IP地址。文中给出了当前生产环境的配置示例：通过Fly-Client-IP请求头识别IP，设置最大跟踪键值数为10000，并豁免静态文件等路径；针对“/global-power-plants/*”和“/legislators/*”两类路径，规则限定60秒内最多允许60次请求，违规IP将被封锁20秒。

开源/仓库编码部署/工程

00:08

Google Developers Blog（RSS）

精选63

加速设备端AI：Arm与Google AI Edge的优化实践

Arm第二代可扩展矩阵扩展（SME2）与Google AI Edge软件栈集成，将CPU转变为强大的矩阵计算加速器，从而实现高性能的设备端生成式AI。本文以Stability AI的“stable-audio-open-small”模型为例，阐述了利用LiteRT、XNNPACK和KleidiAI构建的“转换、优化、部署”自动化硬件加速流程。该方案在基于Arm架构的移动设备和笔记本电脑上，成功实现了音频生成速度提升2倍以上、内存使用减少4倍的显著效果，同时确保了高音频质量。这一集成方案为在资源受限的边缘设备上高效运行复杂AI模型提供了有效路径。

Google 教程/实践端侧部署/工程

推荐理由：Google 和 Arm 在设备端 AI 上的联合优化案例很具体，给了开发者一套可复制的流程，2x 加速和 4x 内存节省对于做移动端生成式 AI 的人来说值得动手试一下。

5月14日

23:59

Hacker News 热门（buzzing.cc 中文翻译）

55

Meta的新现实：利润创历史新高，员工士气跌至历史最低点

Meta在2026年第一季度财报显示其利润创下历史新高，但与此同时，公司内部员工士气却降至历史最低点。这一矛盾现象源于公司持续进行的多轮大规模裁员以及将资源大规模转向人工智能领域的战略调整。尽管财务指标表现强劲，但内部动荡和员工对未来不确定性的担忧导致了严重的士气危机。

Meta 现象/趋势行业动态

22:45

Hugging Face：Blog（RSS）

精选59

解锁连续批处理中的异步性

在连续批处理中，同步方式导致CPU与GPU交替工作，造成闲置浪费。测试显示，使用8B模型生成8K令牌时，GPU有24%的时间处于空闲状态。异步批处理通过分离工作负载，让CPU准备下一批次（N+1）的同时，GPU计算当前批次（N），从而消除闲置间隙。这可通过CUDA流实现操作并发，无需更改内核或模型，仅需协调硬件执行顺序。理论上，该方法可将总生成时间从300.6秒减少至228秒，实现24%的免费加速。相关技术已集成到transformers库的连续批处理中，显著提升推理性能。

Hugging Face 推理教程/实践部署/工程

推荐理由：文章手把手拆解了异步批处理如何用CUDA流和事件消除CPU与GPU的互相等待，把推理吞吐提升22%，搞推理优化的工程师值得细读。

21:29

Hacker News 热门（buzzing.cc 中文翻译）

精选78

克劳德代码与《代码书》技能：有针对性的技能培养

开发者发布了一款名为“克劳德代码与《代码书》技能”的GitHub工具，旨在通过刻意练习提升编程技能。该工具利用AI模型生成特定主题的代码示例与解释，帮助用户进行针对性学习。项目在Hacker News上获得104点热度，关注度较高。其核心变化在于将传统的广泛学习转化为聚焦、可重复的技能训练模式，通过结构化练习提升学习效率。

教程/实践编码

推荐理由：这个skill把Claude Code变成一对一的代码教练，专门抓你代码里的坏习惯，对想用AI真正提升编码水平的人是个好东西。

20:15

The Decoder：AI News（RSS）

60

ChatGPT 的网络流量份额一年内从 78% 跌至 54%，Gemini 悄然将覆盖范围扩大三倍

根据 Similarweb 数据，ChatGPT 的网站流量份额在十二个月内从 77.6% 降至 53.7%。Google Gemini 成为最大赢家，份额从 7.3% 跃升至 26.7%，覆盖范围增长三倍。这些统计仅涵盖网络流量，不包括 API 使用或移动应用数据。

Google OpenAI 搜索现象/趋势

19:58

公众号：龙猫LongCat（美团）

38

MARS TALK 香港大学站|共话具身智能的技术演进与商业化进程

美团技术团队主办的MARS TALK香港大学站活动，聚焦具身智能领域，探讨其从技术验证到规模化商用的演进路径与商业化落地进程。

具身智能行业动态

19:58

公众号：龙猫LongCat（美团）

51

美团 LongCat 开源 General 365：树立推理评测新标尺

开源/仓库推理评测/基准

18:40

IT之家（RSS）

43

Meta 首席 AI 官汪滔：行业大佬之间冲突频繁，我不喜欢这种氛围

Meta首席AI官汪滔对AI行业核心人物间日益公开的矛盾表示不满，希望敌意消退，强调AI是重要技术，需谨慎理性推进。他本人与Meta前首席AI科学家杨立昆存在分歧，后者曾公开批评他“缺乏经验”。但汪滔透露，杨立昆后来曾祝贺其团队发布新模型。他对双方关系保持乐观，认为可能先恶化后缓和，并更愿专注于工作本身，而非外界误解。

Meta 大佬观点现象/趋势

16:40

IT之家（RSS）

55

Counterpoint：到 2027 年，每出货三款智能手机就有一款具备智能体 AI 功能

Counterpoint Research 报告预测，到 2027 年，智能体 AI 手机渗透率将达 32%，即每出货三款手机就有一款具备自主决策 AI 功能。市场目前处于早期阶段，联发科与高通已率先推动竞争从传统 AI 助手转向智能体 AI。增长动力主要来自 600 美元以上高端机型，预计 2027 年该价位段超 80% 手机将搭载此功能。苹果、三星、谷歌等厂商的布局可能改变未来格局。2025-2027 年相关芯片出货量年复合增长率预计达 281%，智能体 AI 将成为推动手机换机潮与市场高端化的重要因素。

现象/趋势端侧

15:40

IT之家（RSS）

61

Anthropic CFO：AI 已能编写九成代码，人类白领从执行者转变为监督者

Anthropic首席财务官透露，公司内部AI已承担约90%的代码编写工作，财务报告等任务也能在人工介入前完成90%-95%。员工角色正从执行者转变为AI系统的监督者与战略决策者，部分报告处理时间从数小时缩短至30分钟。AI提升了团队效率，公司因此继续招聘，更注重“高密度人才”与AI的结合。行业趋势呈现分化：一些企业要求员工学习使用AI工具，另一些则以效率提升为由裁员。尽管自动化可能取代部分岗位，但若需求持续，企业招聘未必停止。

智能体 Anthropic 大佬观点编码

15:40

IT之家（RSS）

精选74

"让 Token 消耗降低 61%"：腾讯开源 Agent Memory

腾讯云开源了TencentDB Agent Memory，旨在解决Agent长任务中上下文窗口易满、Token成本高的问题。该方案采用“上下文卸载”与“Mermaid任务画布”两项核心技术，将完整信息卸载至外部存储，同时用结构化任务图保留关键状态与执行路径。实验显示，该方案在多任务连续会话中最高可降低61%的Token消耗，并提升任务成功率。项目已适配OpenClaw等主流框架，支持一键集成与本地SQLite存储。

智能体 MCP/工具开源/仓库

推荐理由：腾讯开源的这个 Agent Memory，用 Mermaid 画布加上下文卸载，把长任务 Token 省了 61%，而且所有中间信息都可追溯，做复杂 Agent 的开发者可以直接抄作业了。

1…28 293031 32…42