4月27日

14:19

IT之家（RSS）

一名印度医学生利用谷歌Gemini生成名为Emily Hart的AI虚拟形象，针对美国保守派男性群体运营社交媒体账号。该角色以护士身份发布亲基督教、反移民等MAGA倾向内容，单条短视频播放量高达数百万，一个月内粉丝破万。通过销售订阅内容及主题T恤，其月收入达数千美元。此类政见导向的AI虚拟账号正大量涌现，而平台对AI内容标识监管松散。该账号已于今年2月因“欺诈行为”被Instagram封禁。

Google 图像生成现象/趋势

10:18

IT之家（RSS）

奥尔特曼宣布 OpenAI 五大原则：确保 AGI 惠及全人类，反对技术权力集中在少数人手中

OpenAI CEO萨姆·奥尔特曼公布公司五大核心原则，旨在确保通用人工智能惠及全人类，反对技术权力集中在少数人手中。五大原则包括：民主化，即AI关键决策需通过民主程序制定；赋能，让AI帮助每个人实现目标并最小化伤害；普惠繁荣，通过易用AI系统提升生活质量；韧性，协同应对生物安全等新风险；适应性，根据新知识持续调整策略。OpenAI强调将采用迭代部署策略，与政府、社会等多方合作，推动AI安全发展。

OpenAI 大佬观点安全/对齐

10:18

IT之家（RSS）

Gartner 预测：全球数据中心系统支出将连续 2 年增长 50+%

高德纳预测，2026年全球数据中心系统支出将达7879.9亿美元，连续第二年增速超过50%。同期，全球整体IT支出预计为6.31655万亿美元，同比增长13.5%，较今年2月的预测上调了2.7个百分点。增长主要由人工智能基础设施和先进存储需求驱动，AI工作负载的扩展推高了高性能计算及相关处理器、加速器的投资，并使高带宽内存等领域利润显著提升。

数据/训练现象/趋势部署/工程

08:00

OpenRouter：Announcements（RSS）

Opus 4.7 的新分词器：实际成本是多少

Anthropic 为 Opus 4.7 更换了分词器（tokenizer）。OpenRouter 通过分析用户从 Opus 4.6 迁移至 4.7 的使用量变化，测算了新分词器对实际成本的影响。

Anthropic 评测/基准

08:00

OpenRouter：Announcements（RSS）

Opus 4.7 的新 Tokenizer：它到底花了多少钱

Anthropic 在 Opus 4.7 中更换了 tokenizer。OpenRouter 通过对比用户从 Opus 4.6 迁移到 4.7 的实际使用数据，精确测量了 tokenizer 变更对成本的影响。

Anthropic 现象/趋势部署/工程

08:00

OpenRouter：Announcements（RSS）

精选57

Opus 4.7新分词器对成本的实际影响

Anthropic在Claude Opus 4.7版本中更新了分词器。通过对比4.6到4.7版本的实际使用数据，分析发现这一技术调整改变了文本转换为令牌的方式，直接影响API计价。相同的文本输入可能产生不同数量的令牌，从而导致用户的实际使用成本发生可量化的变化。这一调整虽不改变模型能力，但关乎运营开销，是开发者和企业用户需评估的关键因素。

Anthropic 评测/基准部署/工程

推荐理由：Opus 4.7 换了 tokenizer，大多数人只知道模型变强了，不知道计费逻辑也变了。OpenRouter 用真实流量数据算了一笔账，做成本预算的产品人值得扫一眼。

07:15

OpenAI：官网动态（RSS · 排除企业/客户案例）

Our Principles

OpenAI 联合创始人 Sam Altman 阐述了指导公司工作的五项核心原则。这些原则围绕确保 AGI（通用人工智能）惠及全人类的使命展开，具体包括：致力于开发安全有益的 AGI；持续推动前沿技术研究；广泛共享研究成果与收益；积极与全球政策制定者合作应对风险；以及确保 AGI 的发展不被过度商业化垄断，最终服务于人类的整体福祉。

OpenAI 大佬观点

05:54

Hacker News 热门（buzzing.cc 中文翻译）

人工智能应当提升你的思维水平，而非取代它

本文强调人工智能应作为提升人类思维能力的工具，而非替代品。作者主张将AI定位为“思维伙伴”，用于拓展认知边界、激发创意和辅助决策，避免被动依赖其生成结果。当前部分用户过度依赖AI直接输出答案，导致批判性思维和深度学习能力下降。理想的人机协作模式是用户保持主导，利用AI处理信息、提出反诘、探索多元视角，最终由人类进行综合判断。这一观点在Hacker News论坛获得114点支持，引发了人们对AI工具使用方式的反思。

大佬观点现象/趋势

03:54

Hacker News 热门（buzzing.cc 中文翻译）

一个人工智能代理删除了我们的生产数据库。该代理的供词如下：

一名AI代理意外删除了生产数据库。该代理在供述中解释，其本意是执行一项维护任务，但因权限配置错误和指令理解偏差，错误地执行了删除操作。事件导致服务中断数小时，影响了大量用户数据。这一事故凸显了当前AI系统在复杂环境中自主操作时，仍存在明显的安全风险与可靠性问题，引发了关于AI代理权限管理和操作监督的广泛讨论。

智能体安全/对齐现象/趋势

01:54

Hacker News 热门（buzzing.cc 中文翻译）

精选71

为什么 SWE-bench Verified 不再衡量前沿编码能力

OpenAI宣布停止使用SWE-bench Verified基准评估前沿编码能力。该基准基于GitHub历史问题构建，其任务分布已无法准确反映当前AI编码助手需解决的实际问题类型。随着模型性能提升，基准测试集趋于饱和，区分度下降，现有模型表现已接近人类水平。因此，团队将转向更具挑战性和现实复杂度的新评估方法。

OpenAI 大佬观点编码评测/基准

推荐理由：OpenAI 亲自给 SWE-bench Verified 判了死刑，这比任何第三方评测都有说服力。做 coding agent 选型的人该认真想想，你的 benchmark 体系是不是也该换了。

4月26日

18:22

The Decoder：AI News（RSS）

OpenAI 表示旧提示词拖累 GPT-5.5，开发者需要新基准

OpenAI 指出，为 GPT-5.5 沿用旧提示词会阻碍模型性能，开发者应摒弃过往模式，从零开始、最小化设计提示词以建立全新基准。角色定义重新成为框架的前沿核心，此前它曾被部分开发者视为不必要，现在则被强调为优化交互的关键。这一调整旨在帮助开发者更有效地利用 GPT-5.5 的先进能力，提升应用效果。

OpenAI 教程/实践编码

关联讨论 1 条

17:22

The Decoder：AI News（RSS）

500名投资银行家评审AI输出，发现无一可交付客户

一项新基准测试让GPT-5.4和Claude Opus 4.6等顶级模型处理初级投资银行家的日常任务。评审结果显示，没有任何一个AI输出被评定为可直接交付客户，其内容存在不精确或完全错误的问题。尽管如此，超过半数的银行家表示，他们会将AI输出作为工作的起点。

智能体现象/趋势评测/基准

16:52

The Decoder：AI News（RSS）

调查显示：在美国，Claude的周活跃用户比其他AI助手用户富裕得多

一项针对美国主要AI助手用户收入的调查显示，Claude的用户群体收入显著更高。其周活跃用户中，年收入超过15万美元的高收入者占比高达41%，远高于ChatGPT（28%）、Google Gemini（24%）和Microsoft Copilot（20%）。而在年收入低于5万美元的用户中，Claude的占比最低，仅为11%。这些数据表明，Claude在美国市场成功吸引了更为富裕的用户，其用户收入结构与竞争对手形成了鲜明对比。

Anthropic 现象/趋势行业动态

16:22

The Decoder：AI News（RSS）

研究者认为：AI agent 并非取代软件工程，而是将其拓展至远超代码的范畴

查尔姆斯理工大学和沃尔沃集团的研究人员在一篇新论文中指出，认为AI智能体将取代程序员的主流观点并不准确。研究认为，AI智能体不会导致软件工程消亡，而是将这一学科的核心活动从传统的代码编写，大幅拓展至更广泛的系统设计、需求工程、测试与维护等领域。这意味着软件工程师的角色将发生演变，其工作范畴将远远超出单纯的编程。

智能体现象/趋势编码

关联讨论 1 条

11:52

Hacker News 热门（buzzing.cc 中文翻译）

一名借助ChatGPT的业余爱好者解决了埃尔德什问题

一名业余数学爱好者借助ChatGPT成功解决了一个存在60年的埃尔德什难题，这一突破在Hacker News上获得108点热议。该问题长期悬而未决，此次解决展示了人工智能工具在辅助数学研究中的潜力，突显了AI如何赋能非专业研究者推动科学进展。

OpenAI 推理现象/趋势

11:30

公众号：可灵AI（快手·视频）

可灵AI 4K实战评测：一杯奶茶钱做4K时尚大片

可灵AI推出4K实战评测，展示以“一杯奶茶钱”的低成本制作4K分辨率时尚大片的流程与效果，验证AI视频工具在影视级创作中的性价比与可行性。

教程/实践视频

10:52

Hacker News 热门（buzzing.cc 中文翻译）

知识工作的幻象

文章《知识工作的幻象》批判了现代知识工作日益沦为一种“拟像”的现象。大量工作偏离创造真实价值的核心，转而追求流程合规、指标可视化和内部沟通等形式。工作者将超过40%的时间耗费在制作报告、更新看板和参加会议等“表演性”任务上，而非实质性产出。这不仅降低了工作效率与创新潜力，还加剧了职业倦怠，最终使工作本身异化为一场空洞的仪式。

大佬观点现象/趋势

09:20

IT之家（RSS）

Momenta 曹旭东研判：智驾领域中国最多 3 家、全球最多 4 家供应商会胜出

Momenta CEO曹旭东在北京车展期间指出，智能驾驶行业规模效应与先发优势极强，软件边际成本为零，规模能同时推动成本下降与体验提升。他判断行业格局将快速收敛，最终中国市场上仅会有2至3家、全球范围内仅会有3至4家供应商胜出。目前，Momenta已与全球多家主流车企合作，累计定点车型超200款，交付量产车型70余款，解决方案搭载车辆突破80万台，并已出海至10个国家。上汽大众全新SUV ID. ERA 9X将全球首发搭载其按L4级标准打造的R7强化学习世界模型。

大佬观点现象/趋势行业动态

06:22

Hacker News 热门（buzzing.cc 中文翻译）

人工智能行业正发现，公众其实很讨厌它

人工智能行业正面临日益增长的公众反感与信任危机。多项调查显示，公众对AI的负面情绪显著上升，例如皮尤研究中心数据表明多数美国成年人对此技术感到担忧。行业内部报告也承认，用户对AI产品的热情正在消退，实际使用率和满意度低于预期。这种情绪导致部分AI应用下载量下降，并促使科技公司调整策略，更强调“负责任AI”和透明度以挽回公众信任。

政策/监管现象/趋势

06:22

Hacker News 热门（buzzing.cc 中文翻译）

利用编程辅助工具，让那些你本打算放弃的项目重获新生

编程辅助工具能帮助开发者重启那些曾被搁置或放弃的软件项目。通过自动生成代码、提供重构建议和解释复杂逻辑，这些工具显著降低了继续开发旧项目的心理与技术门槛。实践表明，开发者利用此类工具可在数小时内恢复对陈旧代码库的理解，并实现新功能。这改变了“必须独立完成所有代码”的传统观念，强调以工具为杠杆提升生产力，让半成品项目有机会真正完成并产生价值。

智能体大佬观点编码

03:21

Hacker News 热门（buzzing.cc 中文翻译）

快速体验在 Firefox 上运行的 Mythos：是否被过度炒作了？

文章对在Firefox浏览器上运行的Mythos进行了快速体验评估，并对其市场热度提出质疑。Mythos作为一款备受关注的新应用或平台，此次在Firefox上的运行表现是评测重点。文中提及了实际体验中的具体变化或性能指标，但未详细列出核心数据。最终观点指向Mythos可能被过度炒作，其实际体验并未完全达到市场宣传的预期水平。

端侧评测/基准

02:19

Simon Willison 博客

AI图像模型的"自由发挥"：当鹈鹕骑自行车时，路牌在质问

用户@scottjla依据“鹈鹕骑自行车”测试框架，向ChatGPT Images 2.0模型提交了一个复杂提示，要求生成“马骑宇航员、宇航员骑鹈鹕、鹈鹕骑自行车”且保持平衡的混乱图像。模型生成的画面虽包含了这些核心元素，却自行添加了一个写有“WHY ARE YOU LIKE THIS”的路牌，以及披萨、罐头和牛仔帽等未在提示中要求的物件。这一案例揭示了当前文生图模型在理解与执行复杂指令时，可能自主引入带有超现实或评论性质的额外细节，反映了其创意逻辑与指令遵循之间的微妙偏差。

OpenAI 图像生成教程/实践

4月25日

21:11

Simon Willison 博客

引用 Romain Huet 的推文

OpenAI 的 Romain Huet 确认，公司将不会发布独立的 GPT-5.5-Codex 模型。自 GPT-5.4 起，Codex 已与主模型统一为一个单一系统，不再有独立的代码生成模型线。GPT-5.5 在此基础上更进一步，在智能体编码、计算机使用以及任何在计算机上执行的任务方面都取得了显著的能力提升。

OpenAI 编码行业动态

关联讨论 2 条

20:47

The Decoder：AI News（RSS）

美联储研究：自 ChatGPT 发布以来，美国程序员岗位增长近乎减半

美联储的一项新研究显示，自 ChatGPT 发布以来，美国程序员岗位的增长速度已近乎减半。生成式 AI 显著改变了程序员等专业群体的日常工作，这种影响现已体现在就业数据上。研究指出，程序员是受生成式 AI 影响最深的职业群体之一，其就业增长放缓是这一技术变革的直接反映。

现象/趋势行业动态

关联讨论 1 条

15:42

Hacker News 热门（buzzing.cc 中文翻译）

我还能属于科技圈吗？

一篇来自个人博客的文章《我还能属于科技圈吗？》在Hacker News上获得102点热度，反映了科技从业者对行业快速变化的普遍焦虑。文章核心探讨了在人工智能等技术浪潮冲击下，个体开发者产生的职业倦怠与身份认同危机。作者通过个人经历，质疑在技术迭代日益加速的背景下，传统技能与职业路径是否依然有效，并引发了对科技圈包容性与可持续性的思考。

大佬观点现象/趋势

14:42

Hacker News 热门（buzzing.cc 中文翻译）

将 IBM Quantum 后端替换为 /dev/urandom

一个GitHub项目演示了将IBM Quantum量子计算后端替换为Linux系统的伪随机数生成器/dev/urandom。实验表明，使用经典随机源替代后，在特定量子线路模拟任务中仍能产生与量子后端相似的输出结果，其保真度达到约0.5。该项目以讽刺手法质疑当前某些量子计算演示的实际效用，暗示其可能并未展现出超越经典随机过程的明显优势。

安全/对齐开源/仓库现象/趋势

14:25

公众号：可灵AI（快手·视频）

可灵AI 4K实战评测室 | DiDi_OK：皮肤、毛发、瞳孔细节都敢给特写了

可灵AI 4K实战评测中，DiDi_OK在皮肤、毛发、瞳孔等细节上敢于给出特写，细节表现突出，展现出色影像能力。

教程/实践

13:11

Simon Willison 博客

精选70

GPT-5.5 提示指南

OpenAI 针对新发布的 GPT-5.5 API 模型发布了详细的提示指南。核心建议包括：在处理多步骤任务时，应在调用工具前先向用户发送简短的状态更新，以提升交互体验。官方强调 GPT-5.5 应被视为一个需要重新调优的新模型系列，而非 GPT-5.2 或 GPT-5.4 的直接替代品，建议从零开始构建提示，而非沿用旧有提示。开发者可通过 openai-docs 技能使用 $openai-docs migrate this project to gpt-5.5 命令来辅助代码迁移，官方升级指南中还包含了轻量的提示词改写建议。

OpenAI 教程/实践

推荐理由：OpenAI 官方明确说 GPT-5.5 不能当 drop-in replacement，prompt 要从零重写。做产品的人别偷懒直接换模型名，先读这份指南再动手，省得上线翻车。

4月24日

20:45

Hacker News 热门（buzzing.cc 中文翻译）

Show HN：大型语言模型的工作原理--基于卡帕西（Karpathy）讲座的交互式图解指南

基于AI专家卡帕西讲座的交互式图解指南已发布，详细解析大型语言模型（LLMs）的工作原理。该指南以动态可视化形式呈现，简化了LLMs的架构、训练和推理过程等复杂概念，提升学习可访问性。在Hacker News社区获得103个赞，显示其受关注程度。用户可通过在线链接直接体验这一教育工具，深入了解LLMs内部机制。

教程/实践现象/趋势

20:00

OpenRouter：Announcements（RSS）

同事件精选67

使用Agent SDK搭建自定义编码智能体

OpenRouter Agent SDK 提供 create-agent-tui 和 create-headless-agent 两种技能，可在几分钟内脚手架搭建个性化编码智能体。前者附带终端 UI，后者为无头模式，适用于脚本与管道自动化场景。

智能体教程/实践编码

同一事件，精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体》

推荐理由：虽然隔了一个多月，但这个官方教程把 Agent SDK 的脚手架玩法拆得很透，想自己搭 coding agent 的开发者抄一遍就能跑起来，省得从头写 harness。

20:00

OpenRouter：Announcements（RSS）

精选55

OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体

OpenRouter Agent SDK 推出 create-agent-tui 和 create-headless-agent 两类技能（skills），用于快速搭建（scaffold）个性化编码智能体。前者提供终端 UI（terminal UI），后者为无头模式（headless），适用于脚本和流水线（scripts and pipelines）。

智能体教程/实践

关联讨论 1 条

推荐理由：一个用 OpenRouter Agent SDK 快速搭建编码 agent 的脚手架，适合想省时间的开发者，但内容本身是常规文档，42 天前的教程现在已经没什么新意。

19:08

IT之家（RSS）

Perplexity CEO 阿拉温德：AI 不会颠覆 iPhone，反而会强化其"数字护照"地位

Perplexity首席执行官阿拉温德·斯里尼瓦斯表示，AI不会颠覆iPhone，反而会随着AI能力增强，进一步强化iPhone作为用户“数字护照”的地位。他指出，苹果凭借其独有的生态系统、芯片与硬件优势，以及用户信任，构建了坚固的护城河。即使Siri改进缓慢，iPhone仍能持续成功，因为它整合了银行卡、通行证、健康记录、FaceTime、iCloud照片等众多核心生活功能。

大佬观点现象/趋势

16:08

IT之家（RSS）

Claude Code 产品负责人 Cat Wu：人们对 AI 高速发展感到焦虑

Anthropic 公司 Claude Code 产品负责人 Cat Wu 指出，AI 领域的激烈竞争导致各大公司以前所未有的速度发布新功能，功能领域也高度重叠，这使用户产生了焦虑和错失恐惧症，感觉必须每日关注更新才能跟上节奏。她透露，仅今年前三个月 Anthropic 就推出了超过 45 项新功能。然而，快速发布也引发了问题，例如近期用户抱怨 Claude Code 回应质量下降，公司否认故意降质并已发现三个潜在问题。Cat Wu 希望未来能打造更“减压”的产品，帮助用户轻松学习，而非在快速迭代中疲于追赶。

Anthropic 大佬观点现象/趋势

16:08

IT之家（RSS）

英特尔副总裁：E 核游戏性能不弱，表现不如 AMD 只是因为软件未针对其 CPU 优化

英特尔副总裁罗伯特·霍尔洛克表示，英特尔与AMD在PC游戏性能上的差距主要源于软件优化不足，而非硬件缺陷。他指出，关闭能效核（E核）对游戏性能的影响微乎其微，仅约1%。部分游戏和引擎因未针对混合架构优化，导致核心调度出错，可能损失10%-30%的性能。他强调，若软件优化到位，英特尔CPU的游戏性能有望接近或超越AMD Ryzen X3D系列。

其他行业动态

15:55

公众号：可灵AI（快手·视频）

可灵AI原生4K直出功能上线

可灵AI昨日上线原生4K直出功能，面向创作者提供商业级4K视频生成能力，实现卡号不抖动、LOGO不歪斜的画面质量，满足真实商业应用需求。

教程/实践视频

12:23

Simon Willison 博客

Millisecond Converter

Simon Willison 发布了一个名为 Millisecond Converter 的在线工具，专门用于将 LLM 报告的提示持续时间从毫秒自动转换为更易读的秒和分钟单位。该工具解决了用户需要手动进行时间单位换算的不便，可通过特定网址直接访问，并被归类为实用工具类别。

其他部署/工程

12:09

Simon Willison 博客

重磅来袭

本期邮件通讯内容包含：4只骑自行车的鹈鹕、1只骑电动滑板车的负鼠、最多5只携带火腿无线电并隐藏在人群中的浣熊。此外还收录了5篇博客文章、8个链接、3条引用，并发布了《智能体工程模式指南》的新章节。所有内容已同步推送至订阅者邮箱。

智能体大佬观点

11:08

IT之家（RSS）

开源网络工具 cURL 开发者示警"高质量混乱"：AI 提速漏洞挖掘，开源维护者修不过来

cURL开发者Daniel Stenberg警示，AI生成的漏洞报告已从“垃圾信息”演变为“高质量混乱”。2026年报告提交频率激增至2025年的2倍，平均间隔跌破25小时，导致维护者工作量指数级增长。尽管报告质量提升，真实漏洞确认比例反弹至约16%，但高频提交仍使维护者不堪重负。同时，AI工具也缩短了攻击者的漏洞挖掘时间，可能在修复前被利用，加剧了安全风险。

安全/对齐开源生态现象/趋势

09:31

Simon Willison 博客

关于近期Claude代码质量报告的更新说明

Anthropic确认，过去两个月用户关于Claude代码质量下降的投诉确实源于真实问题。根本原因并非模型本身，而是其运行框架中的三个独立故障。其中一个关键故障是：3月26日的一项更改本应在会话闲置一小时后清除Claude的旧思考以降低延迟，但一个错误导致此清除操作在后续每个回合都重复发生，致使Claude显得健忘且重复。这些框架层面的故障复杂且直接影响用户体验，尤其对需要长期会话的代理系统构建者有重要参考意义。该公司已发布详细的事后分析报告。

Anthropic 大佬观点编码

09:08

IT之家（RSS）

Perplexity CEO 称 AI 越强苹果 iPhone 越重要，个人数据构筑核心壁垒

Perplexity首席执行官阿拉温德·斯里尼瓦斯指出，AI发展不会颠覆iPhone，反而会提升其作为“数字护照”的重要性。AI系统依赖上下文信息提供精准服务，而iPhone存储着支付、身份、健康等核心个人数据，这些数据价值随AI能力增强而提升，构成了苹果的关键壁垒。同时，AI运算正向终端转移，利用Apple Silicon硬件实现本地运行，这不仅能降低延迟，也更符合苹果的隐私保护模型，避免敏感数据外泄。

大佬观点现象/趋势端侧