4月24日

09:08

IT之家（RSS）

马斯克在特斯拉财报会上表示，从长期看，除全新Roadster外，特斯拉全系产品都将转向自动驾驶。这意味着公司战略重心已几乎完全押注于自动驾驶，而Roadster的角色则转变为专为想亲自驾驶的用户保留的“光环车型”。然而，该车型自2017年亮相后屡次延期，最新股东文件显示其生产设施“待定”、处于“设计开发阶段”，距离真正投产仍需多年。

现象/趋势行业动态

08:08

IT之家（RSS）

IT早报 0424：华为乾崑智驾 ADS 5 发布；苹果 iPhone 18 Pro Max 金属机模曝光；去机顶盒，一体化电视全国推广启动；爱奇艺回应暂停页广告"不当内容争议"…

华为在乾崑技术大会上发布面向自动驾驶的乾崑智驾ADS 5系统，奕境汽车首款旗舰SUV奕境X9及全新红旗H9将搭载该系统。苹果iPhone 18 Pro Max金属机模曝光。全国范围启动一体化电视推广，电视机将内置机顶盒功能。爱奇艺回应剧集暂停页广告争议，称已下架相关广告并加强审核。淘宝天猫上线售后AI假图识别模型，以应对利用AI生成虚假凭证的恶意退款行为。此外，日本福岛核电站2号机组测得“极高”水平核辐射，蔡磊透露部分渐冻症药物已进入临床试验。

其他行业动态

05:54

Simon Willison 博客

在浏览器中提取PDF文本：LiteParse推出网页版

LlamaIndex开源项目LiteParse现已推出网页版，用户可直接在浏览器中上传PDF并提取文本，所有处理均在本地完成，无需上传服务器。该工具基于PDF.js和Tesseract.js，采用空间文本解析技术，能智能识别多列布局等复杂格式，并支持OCR和非OCR两种模式。作者在原Node.js CLI工具基础上，借助Claude AI辅助开发，成功将其迁移至浏览器环境。示例显示，一个86页的PDF文件可被快速解析，输出文本及包含位置、字体等元数据的JSON结果。

智能体大佬观点教程/实践编码

03:59

Simon Willison 博客

精选74

通过半官方Codex后门API为GPT-5.5生成"骑自行车的鹈鹕"

尽管GPT-5.5的官方API尚未发布，但作者利用OpenAI为OpenClaw等工具开放的订阅集成机制，通过反向工程开源Codex CLI，开发了一个LLM插件。该插件允许付费订阅用户通过Codex后端API调用GPT-5.5模型。文章以生成“骑自行车的鹈鹕”SVG图像为例，展示了其使用效果，并指出高推理强度设置能显著提升输出质量，但耗时更长。目前，OpenAI表示正与合作伙伴制定API大规模服务的安全要求。

OpenAI 大佬观点模型发布评测/基准

关联讨论 1 条

推荐理由：Simon Willison 不只评测 GPT-5.5，还顺手逆向 Codex 做了个用订阅跑 API 的插件。定价翻倍、xhigh 模式四分钟出图这些细节，比官方通稿有用十倍，做选型的人该看这篇而不是 OpenAI 博客。

03:22

Simon Willison 博客

llm-openai-via-codex 0.1a0 发布

开发者 Simon Willison 发布了 llm-openai-via-codex 工具的 0.1a0 版本。该工具能够劫持用户的 Codex CLI 凭证，转而通过 LLM 工具来调用 OpenAI API。这一功能在其关于 GPT-5.5 的博客文章中有所描述。发布版本标签包括 openai、llm 和 codex-cli。

OpenAI 教程/实践编码

4月23日

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选63

如何使用Codex进行日常工作

该内容探索了10个实用的ChatGPT Codex用例，旨在自动化任务、创建交付物，并将真实的输入转化为跨工具、文件和工作流的输出。

OpenAI 教程/实践编码

推荐理由：虽然发布一月有余，但官方整理的十个 Codex 日常自动化用例依然是最佳上手模板，从邮件整理到数据报表，产品人和运营可以直接抄作业。

08:00

Hugging Face：Blog（RSS）

精选57

如何在 Chrome 扩展中使用 Transformers.js

本文介绍在 Chrome 扩展中集成 Transformers.js 库的具体方法，涵盖从环境配置、模型加载到前后端通信的关键步骤。通过示例代码演示了如何利用该库在扩展中实现本地机器学习推理，同时处理扩展权限限制与安全策略。文中还对比了 Web Worker 与 Service Worker 两种部署方案，并提供了性能优化建议，帮助开发者在浏览器扩展环境中高效运行 Transformer 模型。

开源生态教程/实践端侧

推荐理由：Hugging Face 官方出的 Transformers.js 浏览器插件教程，想在 Chrome 里跑端侧推理的前端开发者可以直接抄，省掉自己踩坑的时间。

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选72

关于近期 Claude Code 质量报告的更新说明

Anthropic 确认并解决了过去一个月影响 Claude Code、Claude Agent SDK 和 Claude Cowork 的三个问题，所有问题已于 4 月 20 日修复。具体包括：3月4日将 Claude Code 的默认推理强度从“高”改为“中”，导致用户感知智能下降，已于4月7日回滚；3月26日一项缓存优化存在缺陷，导致会话恢复后模型“健忘”和重复，4月10日修复；4月16日一项旨在减少冗余的系统提示指令意外损害了代码质量，4月20日撤销。这些问题影响了 Sonnet 4.6 和 Opus 4.6/4.7 模型，但 API 未受影响。公司已重置所有订阅用户的使用限额，并承诺改进流程以防止类似问题。

Anthropic 安全/对齐编码行业动态

推荐理由：Anthropic 把 Claude Code 连续一个月质量下滑的三个 bug 全部摊开讲，这种级别的工程复盘在大模型公司里极少见。做 Agent 产品的人该认真读，因为这三个坑你迟早也会踩。

4月21日

20:00

Cursor Blog

精选55

保持 Cursor 应用稳定

Cursor 团队针对用户全天依赖应用、崩溃影响严重的问题，聚焦内存不足导致的崩溃。通过为多进程架构设计细粒度监控系统，实时追踪版本发布后的崩溃指标。采用双重调试策略：自上而下关联功能与崩溃数据，监控大消息负载；自下而上通过崩溃观察服务、堆快照等定位根本原因。自2月底以来，全版本会话OOM率下降80%，自3月1日起请求OOM率下降73%。具体措施包括处理大文件加载和修复资源泄漏，以应对突发与渐进性内存耗尽。

现象/趋势编码部署/工程

推荐理由：Cursor 把自家 OOM 问题的排查方法论完整公开了，自顶向下加自底向上的双线调试思路对做桌面端 Agent 产品的人有参考价值，但本质上是工程复盘而非行业事件。

4月15日

18:00

公众号：生数科技（Vidu·视频）

生数科技Vidu发布《AI漫剧视频模型行业白皮书V1.0》

生数科技Vidu正式发布《AI漫剧视频模型行业白皮书V1.0》，该白皮书已上市。

图像生成行业动态视频

11:00

公众号：小红书技术（dots.llm）

小红书 Relax 开源发布：面向全模态 Agentic 的异步 RL 训练引擎

小红书开源发布Relax，一个为全模态数据、Agentic工作流和大规模异步训练Co-Design的RL训练引擎。

智能体开源/仓库开源生态

4月14日

20:00

Cursor Blog

精选62

多智能体系统将GPU内核性能提升38%

我们与NVIDIA合作，利用自主运行的多智能体系统，在为期三周内对235个真实CUDA内核进行了优化。该系统从零开始构建并优化Blackwell GPU内核直至汇编级别，实现了38%的几何平均速度提升，其中63%的问题超越基线，19%实现超2倍优化。这些内核直接影响AI训练与推理效率，传统上需资深工程师耗时数月乃至数年的优化工作，该系统在数周内即自主完成，并能探索更广阔解决方案空间，突破了人工逐项优化的限制。

智能体现象/趋势编码部署/工程

推荐理由：Cursor 把自家多 Agent 系统拉去优化 CUDA 内核，38% 的 geomean 提速不算炸裂，但真正值得看的是它证明了 Agent 可以在无人干预下跑三周啃硬骨头，这对做 Agent 产品的人是个强信号。

08:00

HuggingFace Daily Papers（社区热门论文）

精选76

AI Index Report 2026 发布

第九版 AI 指数报告新增多项追踪维度：AI 在推理、安全及真实任务执行上的测试范围扩大，但测量手段的可靠性正在下降；首次提供生成式 AI 的经济价值估计及其劳动力市场影响的初步证据；提出 AI 主权分析框架；与 Schmidt Sciences 合作新增科学章节，并首次设立 AI 在科学与医学中的独立章节，反映 AI 在这两个领域日益增长的影响力。

安全/对齐现象/趋势行业动态

推荐理由：斯坦福这份年度报告是 AI 行业最全面的体检单，今年首次把科学和医学独立成章，说明 AI 正从实验性工具变成基础设施，治理和评估跟不上进度的矛盾贯穿始终。

4月10日

12:20

公众号：昆仑万维（天工）

昆仑万维方汉：「一人公司」时代全面到来，你能干什么？

昆仑万维创始人方汉在文中指出，「一人公司」时代已全面到来，并抛出个人在此趋势下如何定位与行动的核心问题。

其他大佬观点

08:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

AI fundamentals

文章是一份面向初学者的清晰指南，旨在解释人工智能的基本概念与工作原理。它阐述了什么是人工智能，并重点说明了以ChatGPT为代表的工具如何利用大型语言模型（LLM）来运作。内容涵盖了AI的核心定义、运作机制，以及具体工具的应用方式，为读者理解这一技术提供了基础框架。

其他教程/实践

4月8日

18:00

公众号：蚂蚁百灵（Ling）

cuLA：用 CUDA 重写线性注意力

推理教程/实践