5月4日
23:59
IT之家(RSS)
精选71
Claude Token 榜:迪士尼「榜一大哥」9 天 46 万次,Meta 月烧 60 万亿

迪士尼内部上线AI使用看板,追踪员工调用Claude的频率和token消耗。数据显示,一名员工在9个工作日内调用Claude约46万次,平均每1.7秒一次。与此同时,迪士尼正裁员约1000人。硅谷正流行“tokenmaxxing”文化,比拼AI token消耗量。Meta内部统计显示,其8.5万名员工在30天内消耗了60万亿token,价值约900亿美元;Uber的年度34亿美元AI预算在4个月内耗尽。报告显示,Claude用户中非程序员用途已超半数。

Anthropic数据/训练现象/趋势

推荐理由:迪士尼搞AI排行榜,Meta月烧60万亿token,这不是段子,是AI真实渗透的活证据。从律师到全职妈妈,所有人都开始用Claude打工,这股浪潮比任何财报都真实。
23:58
Epoch AI@EpochAIResearch
46
探讨AI基准测试的困境与未来方向

针对“AI基准测试是否已失效”的悲观论调,讨论者进行了反驳,并深入探讨下一代AI基准测试的可能形态。核心议题包括基准测试开发的成本与收益、可扩展基准(如MirrorCode)的构建、AI技术对基准开发本身的加速作用,以及当前基准测试与现实应用能力之间存在的差距。对话还触及了构建通用人工智能(AGI)基准的可行性,并展望了超越自动化评分的更全面评估方法。

数据/训练评测/基准
23:56
Nathan Lambert:Interconnects(RSS)
47
蒸馏恐慌

AI领域出现“蒸馏攻击”现象,即利用GPT-4等闭源模型的输出训练更小的开源模型。这引发了关于知识产权与创新平衡的激烈争论。支持者视其为技术民主化途径,反对者则谴责其侵犯版权并可能损害模型质量。目前,部分开源模型性能已快速逼近顶级闭源模型,迫使行业重新审视数据使用边界与合规框架。

大佬观点数据/训练现象/趋势
关联讨论 1X:Nathan Lambert (@natolambert)
23:56
IT之家(RSS)
29
倍耐力把传感器塞进轮胎,力图让车辆知道自身精确位置、应对周边环境

倍耐力与瑞典科技公司Univrses合作,持有其30%股权,以强化Cyber Tyre智能轮胎技术。该系统将传感器集成于轮胎内部,结合外部摄像头和AI计算机视觉,使车辆能精确感知自身位置并实时应对环境变化。2025年,双方在意大利普利亚大区启动道路监测试点,利用轮胎数据与视觉技术构建持续更新的道路地图。该技术仍处概念验证阶段,但已进入深入开发,未来轮胎有望成为互联出行中的重要数据源。

端侧行业动态
23:53
Simon Willison 博客
精选75
Redis 数组类型交互式体验平台上线

Redis创始人Salvatore Sanfilippo提交了为Redis新增数组数据类型的PR,引入了包括ARCOUNT、ARDEL、ARGREP等在内的18个新命令。其中最引人注目的是ARGREP命令,它利用新集成的TRE正则表达式库,可直接在服务器端对数组值进行正则搜索。目前该功能已在一个分支中实现,开发者Simon Willison借助Claude Code构建了一个交互式在线沙盒,通过运行在浏览器中的WASM版Redis子集,供用户体验这些新命令。Salvatore还撰文详细介绍了在AI辅助下开发此功能的历程。

智能体开源生态教程/实践

推荐理由:Redis 加数组类型可能改变很多缓存设计,Simon 这个 WASM playground 是把 PR 变成可试产品的最快路径,后端同学可以直接上手体会 ARGREP 的快乐。
23:52
Berryxia.AI@berryxia
47
DeepMind CEO将AGI实现时间表明确设定于2030年

DeepMind CEO Demis Hassabis在AI Ascent 2026上明确将AGI实现时间定于2030年,并指出AI将极大加速药物发现、材料科学等“慢科学”领域,把研发周期从数年压缩至数天。他强调,未来1-2年是关键拐点,真正改变世界的将是AI推动科学迭代速度的指数级加速,而非AGI降临的瞬间。

DeepMind大佬观点现象/趋势
23:30
Google Blog:AI(RSS)
精选71
通过 Gemini API 中的 Webhooks 减少长时任务的摩擦与延迟

Gemini API 引入了事件驱动的 Webhook 功能,这是一种基于推送的通知系统。它旨在消除低效的轮询需求,为长时运行的任务(如文件处理或复杂推理)提供更优的解决方案。当任务完成时,系统会自动将结果推送到用户指定的端点,从而显著降低延迟并减少资源消耗,提升开发效率与响应速度。

Google产品更新部署/工程
关联讨论 1X:Google AI for Developers (@googleaidevs)
推荐理由:Gemini API 终于补上 Webhooks 这块拼图,长任务不用再轮询等待,对做自动化流程和 Agent 的开发者是实打实的效率提升。
23:23
Hacker News 热门(buzzing.cc 中文翻译)
精选72
Show HN: Ableton Live MCP

这是一个名为 Ableton Live MCP 的开源项目,它通过模型上下文协议(MCP)将 Ableton Live 音乐制作软件与大型语言模型(如 GPT、Claude)连接起来。该项目在 Hacker News 上获得了 100 点热度,其核心功能是让 LLM 能够读取和控制 Ableton Live 的会话数据,从而可能实现基于自然语言指令的音乐创作与自动化流程。

MCP/工具开源/仓库

推荐理由:给 Ableton Live 接上了 LLM 的大脑,让 AI 能直接操作 DAW,虽然还只是原型,但已经能看到未来音乐制作的人机协作模式。做音频 Agent 的可以拿来玩。
23:23
阿绎 AYi@AYi_AInotes
精选71
一个100行的文件,干翻了所有LLM编码prompt

一个名为CLAUDE.md的百行文件在GitHub上迅速走红,一周内获得超4.4万星。它没有依赖和配置,仅将Andrej Karpathy总结的LLM编码坏习惯浓缩为四条核心规则:先思考再编码、简约至上、手术式修改、目标驱动执行。开发者只需将其置于项目根目录,Claude Code等工具便能自动读取并遵循,从而显著提升代码质量,减少返工和token浪费。此举被视为对当前需要反复纠正AI模型的开发体验的集体反叛,以零成本方案为AI编码设定明确规范。

MCP/工具教程/实践编码

推荐理由:一个100行文件干翻一堆Agent框架,本质是开发者受够了哄模型,不如直接定规矩。如果你也用Claude Code,花一分钟扔进去,Token浪费砍半不是夸张。
23:00
GitHub Blog
37
立即注册 OpenClaw: After Hours @ GitHub

OpenClaw 社区将于微软 Build 2026 大会期间,在 GitHub 总部举办线下聚会。活动将包含项目演示和交流环节。参与者可选择亲临现场,或通过 Twitch 平台观看线上直播。

GitHub行业动态
22:40
Rohan Paul@rohanpaul_ai
67
路透:AI芯片制造商Cerebras瞄准35亿美元美国IPO,每股定价115-125美元

AI芯片制造商Cerebras正计划在美国进行IPO,目标融资高达35亿美元,每股定价区间为115至125美元。该公司采用独特的晶圆级芯片技术,将几乎整个硅晶圆集成为一个巨型处理器,旨在通过将海量计算和内存置于单一硅片上,减少芯片间数据移动的瓶颈,从而为特定大型AI工作负载加速训练和推理过程。其技术路线与依赖多GPU协作、受限于数据移动速度的传统AI硬件形成对比。此次IPO是公司在撤回先前尝试后的新一轮努力,其竞争对手包括英伟达和AMD,后者同时也是其支持者。

行业动态部署/工程
22:37
Rohan Paul@rohanpaul_ai
精选71
OpenAI启动百亿美元合资公司"部署公司"加速企业AI应用

OpenAI成立了名为“部署公司”的百亿美元合资公司,筹集超40亿美元,旨在帮助企业克服AI部署障碍。核心观点是,当前企业采用AI的主要瓶颈已非模型质量,而是缺乏整合团队、工作流程、数据访问和安全规则的能力。该公司通过联合TPG、Brookfield等私募股权投资者,打包软件、咨询和部署方案,直接触达超2000家投资组合公司,实现规模化分发。同时,Anthropic也正与Blackstone、Goldman Sachs等华尔街机构组建类似合资公司,为私募股权支持的企业部署Claude并重建工作流程。这标志着AI实验室的竞争焦点正从模型性能演示转向工业化部署速度与路径控制的争夺。

AnthropicOpenAI行业动态部署/工程

推荐理由:OpenAI和Anthropic几乎同时拉上黑石、高盛成立合资公司,把模型部署包装成服务卖给数千家企业。模型竞争正在降级,谁能最快把AI塞进真实业务流程才是下一阶段的王。
22:32
Gary Marcus:The Road to AI We Can Trust(RSS)
32
日益增长的 AI 抵制浪潮

由于您提供的正文内容仅为开篇句“Nobody should be surprised”,缺乏具体论述与事实细节,无法据此生成符合要求的摘要。摘要需要基于文章主体内容,提取如“发布了什么”、“具体变化”、“关键数据”等核心信息。建议提供完整的文章内容,以便撰写准确、信息量充足的摘要。

大佬观点现象/趋势
22:27
IT之家(RSS)
55
被"AI 教父"辛顿"判死刑"十年后,美国放射科医生平均年薪达 57.1 万美元

“AI教父”辛顿十年前预言AI将在5-10年内取代放射科医生,但现实恰恰相反。过去十年美国放射科医生数量增长约10%,目前仍供不应求,平均年薪高达57.1万美元。AI并未取代该职业,而是成为协作工具,帮助医生提升效率。同时,影像检查需求激增也增加了工作量。专家指出,AI自动化了流程化任务,但放射科医生将更多时间转向需要人性化沟通的临床工作,而共情、安慰等能力是AI无法替代的。这一案例表明,AI更可能改变而非消除复杂职业。

Anthropic现象/趋势
22:23
elvis@omarsar0
精选71
Sakana AI提出新型7B"指挥者"模型,通过协同多个智能体实现性能突破

Sakana AI在ICLR 2026上发表研究,提出一个仅70亿参数的“指挥者”模型。该模型不直接解决问题,而是通过强化学习训练,专注于为混合开源与闭源模型的工作者智能体设计通信拓扑结构,并为每个工作者生成精准指令以发挥其特长。经随机化智能体池训练后,它能在推理时适应任意智能体组合。其关键创新在于,当允许指挥模型将自己也选为工作者时,系统会形成递归拓扑,实现动态测试时扩展。该模型在GPQA-Diamond和LiveCodeBench上达到SOTA水平,在AIME25和GPQA-D上的性能比最佳单体工作者提升约3%,这相当于前沿模型一个代际的改进幅度,且增益完全来源于协同优化。

智能体arXivMCP/工具推理

推荐理由:Sakana AI 这篇 ICLR 论文把 Agent 之间的通信拓扑和提示词一起做成可训练的,协调本身变成模型,做多 Agent 系统的人真该重新想想架构了。
22:20
IT之家(RSS)
57
英国警方扩大 AI 人脸识别应用,利用手机等设备实时比对数据库确认人员身份

英国警方正扩大AI人脸识别技术的应用范围,将系统整合至手机和执法记录仪等移动设备中,实现实时画面与警方数据库的比对,以快速确认人员身份。该技术从固定监控摄像头延伸至街头巡逻、大型活动安保及高风险区域执法等一线场景,旨在缩短身份核查时间并提升响应效率。外界担忧此举可能导致过度监控和误识别问题,警方回应称技术将持续完善,并承诺遵循现有数据保护与法律框架以平衡安全与隐私。

政策/监管行业动态
22:13
Berryxia.AI@berryxia
19
Nori AI发起母亲节AI产品挑战赛,奖金千元

Nori AI推出“Mom Dreams It, We Create It with AI”挑战赛,庆祝母亲节,旨在鼓励构建AI产品解决忙碌妈妈的痛点或实现其梦想工具,优胜者可获1000美元奖金,并由社区投票选出。Nori AI被描述为世界首个家庭AI,能通过自然语言命令处理日程、任务、餐计划等家庭事务。挑战赛和产品链接已提供,呼吁开发者参与构建帮助妈妈的AI产品。

智能体行业动态
22:09
meng shao@shao__meng
精选72
Cursor团队发布官方工作流插件,集成17项核心开发技能

Cursor官方团队将其内部使用的开发工作流打包成名为“cursor-team-kit”的插件。该插件集成了17个核心Skills、1个Agent和2条Rules,旨在提升团队协作与代码质量。核心Skills涵盖五大领域:CI/合并循环自动化、PR全流程管理、验证与测试、总结复盘以及代码治理。其中,ci-watcher Agent可后台监听CI状态,而两条Rules则强制规定了TypeScript的代码风格。该插件是团队用于构建Cursor产品自身经验的封装,专注于验证变更、驱动本地工具和交付可评审的PR。

智能体产品更新编码

推荐理由:Cursor 把自己的开发流程开源成插件了,这一套 17 个 skill 从 CI 盯盘到写周报全包,最牛的 verify-this 把 debug 变成了科学实验,装了立刻就能用。
22:08
Berryxia.AI@berryxia
精选70
Sam Altman驳斥AI"抢饭碗"论:真正风险是效率鸿沟

Sam Altman批评一些CEO宣称AI将导致大规模失业的言论是“不懂人情”。他引用案例指出,GPT-5.5的Codex版本能将耗时数周的工作压缩至一小时,但结果却是使用者“前所未有的忙碌”。AI并未消灭工作,而是极大提升个人产能,使功能开发和试错速度呈指数增长,导致拥抱AI者因生产力暴增而承担更多任务,其野心也随之扩张。当前AI时代的核心分化在于“善用AI者”与“拒绝AI者”之间不断扩大的效率鸿沟。真正的淘汰风险在于旁观而非主动利用工具。

OpenAI大佬观点现象/趋势

推荐理由:Sam Altman这回应干脆,但更值得琢磨的是那个案例,一个人用GPT-5.5 Codex之后反而更忙了。生产力暴增时,野心也暴增。这可能是未来五年每个人都要面对的真实处境。
22:03
向阳乔木@vista8
58
躺平神器开源!Xbox手柄秒变Mac万能遥控器~

一款名为“xbox-mac-ctrl”的开源工具,可将Xbox手柄转变为Mac电脑的通用遥控器。用户能通过手柄控制YouTube、B站等视频播放(全屏、快进、音量调节),并操作微信读书、浏览器及任意Mac软件(如Tab切换、滚动翻页)。该项目由开发者借助DeepSeek v4 Pro通过几轮对话编程实现,旨在满足躺卧时遥控刷小说、看视频的需求,并鼓励开发者fork以适配Switch手柄等其他硬件。

向阳乔木DeepSeek v4 Pro还是可以的。 几轮对话,实现一个工具,用xbox手柄控制电脑应用和浏览器。 当遥控器,躺床上刷小说和看视频。

MCP/工具开源/仓库教程/实践
22:03
IT之家(RSS)
54
"AI 面试"逐渐受企业追捧,近四成求职者因此主动选择放弃机会

AI面试在美国招聘中应用迅速扩大,约63%的求职者经历过,但正引发显著反弹:约38%的候选人因此主动退出流程。即便完成面试,约51%的人未收到或仍在等待反馈。专家指出,糟糕的AI面试体验会让候选人感到被“流程化处理”,可能损害雇主品牌。当前招聘陷入“军备竞赛”,候选人海投简历,招聘方依赖技术筛选。建议企业明确告知AI评估结果将由真人审阅,并提供真人面试选项,以避免加剧求职不平等。

其他现象/趋势
22:02
The Decoder:AI News(RSS)
62
OpenAI 为新企业部署合资公司筹集超40亿美元

OpenAI 已为一家名为“The Deployment Company”的新合资企业筹集了超过40亿美元资金。这笔巨额融资旨在专门推动企业级AI解决方案的部署与应用,标志着OpenAI正加速其商业化和规模化进程。

OpenAI行业动态
22:00
Orange AI@oran_ge
37
近期有文章揭露,部分AI模型token中转服务存在欺诈行为,即在后台替换为劣质模型,却以高价模型名义收费。这一现象已被广泛传播和讨论。然而,当前中文社交平台上却出现大量将此类中转站宣传为"好生意"的言论。作者对此种降低行业标准、混淆视听的趋势表示难以理解和强烈不满。

马东锡 NLP前几周在 x 上,有篇文章已经完全证实了, token 中转就是背后换模型,以次充好,挂着羊牛卖狗肉,骗用户,大几十万阅读,似乎人人皆知了。 现在简中推,到处…

现象/趋势部署/工程
21:25
小互@xiaohu
精选72
为AI编程立规矩:CLAUDE.md文档的四条核心原则

针对AI编程工具常犯的“默默假设”、“过度自信”和“无效重构”等问题,一份名为CLAUDE.md的文档被整理出来,旨在为AI设定工程纪律。其核心四条原则是:编码前先思考并澄清歧义;优先用最简代码实现需求;仅修改与需求直接相关的代码;为任务设定明确、可验证的目标。这套规则旨在约束AI行为,使其更接近靠谱工程师的作风,解决其“太积极、太爱脑补、太喜欢顺手优化”的痛点。

智能体教程/实践编码

推荐理由:把 Karpathy 的观察变成可执行的 CLAUDE.md,直接解决了 Claude Code 太爱脑补、乱改代码的臭毛病,对日常用 AI 编程的人很管用,放进项目就能让 AI 少犯傻。
21:25
叫我阿杭@Astronaut_1216
54
先探索边界,再优化成本:从OpenClaw看工程化思维

对话中提到使用OpenClaw时,初期不应先计较成本,而应全力探索其能力边界与可能场景,甚至不惜高投入。这种思维同样适用于创业与工程化:先通过大量实践摸清所有模式、陷阱与机会,将工具或业务转化为可重复执行的系统。只有在完整认知边界后,再回头优化时间、经济与认知成本,此时的决策才是基于已验证的系统,而非模糊想法。核心在于“先探索,后优化”,以实现规模化路径。

MCP/工具大佬观点现象/趋势
21:21
The Decoder:AI News(RSS)
54
建设AI数据中心正成为对银行的压力测试

新建AI数据中心正吞噬数十亿美元的借贷资本。摩根大通和摩根士丹利等主要银行正在寻求将日益增长的信贷风险转移给其他投资者。这一趋势表明,为满足人工智能基础设施的巨大资金需求,银行业正面临严峻的信贷风险压力测试,并试图通过风险转移机制来应对挑战。

现象/趋势行业动态
21:15
Anthropic:Newsroom(网页)
精选68
Anthropic联合多家顶级投资机构成立新公司,专注企业AI服务

Anthropic联合黑石、Hellman & Friedman和高盛等顶级投资机构,共同成立一家专注于企业AI服务的新公司。该公司旨在帮助各行业的中型企业将其Claude AI深度集成至核心运营流程,弥补其缺乏前沿AI部署能力的缺口。Anthropic的应用AI工程师将与客户紧密合作,定制开发解决方案并提供长期支持。此举与现有面向大型企业的Claude合作伙伴网络形成互补,首例应用已涉及医疗健康领域的自动化文档处理,以提升诊疗效率。

Anthropic行业动态
关联讨论 1X:Rohan Paul (@rohanpaul_ai)
推荐理由:Anthropic 联合黑石、高盛等成立专攻中型企业的 AI 服务公司,算是 Claude 生态从大企业向中腰部渗透的关键布局。对做垂直应用的来说,这是一个明确的信号:模型厂商开始亲自下场做交付了。
21:11
IT之家(RSS)
52
Red Hat 红帽推出 Tank OS 开源项目,将 OpenClaw 运行环境封装为专用容器以提升安全

红帽公司近日公布了名为 Tank OS 的开源项目,旨在通过容器化技术提升 OpenClaw 运行环境的安全性。该项目将 OpenClaw 封装在专用容器中,采用无 root 权限架构,以防止宿主系统权限被滥用。Tank OS 基于 Fedora Linux 和 fedora-bootc 技术构建,支持在同一设备上运行多个相互隔离的 AI 智能体实例,各实例间不共享凭据和系统资源。此外,系统采用不可变操作系统设计,内核、运行环境及服务均预定义在镜像中,文件系统大部分为只读,从而进一步增强安全防护。

智能体安全/对齐开源生态部署/工程