# AI重塑研发组织与Claude Code的HTML优势

- 来源：ginobefun (@hongming731)
- 发布时间：2026-05-10 07:23
- AIHOT 分数：63
- AIHOT 链接：https://aihot.virxact.com/items/cmoyzqmhw0dx9sllhbbtfaz8y
- 原文链接：https://x.com/hongming731/status/2053254639899017490

## AI 摘要

阿里技术访谈显示，深度使用AI的工程师写代码时间占比从30%降至5%，与AI对话时间升至60%，标志着AI成为新协作主体，正瓦解传统组织基于“人是唯一协作主体”的前提。组织形态从汇报关系的结构图转向由人、智能体、数据等节点构成的“执行图”。新瓶颈在于信息不够结构化，先锋团队采用“Harness层+Hive Mind层”架构应对。同时，Claude Code核心成员分享实践发现，在AI生成场景中，HTML比Markdown更具优势，因其信息密度高、视觉清晰、易于分享并支持交互。

## 正文

http://x.com/i/article/2053253887273091072

# EP53 · AI Native 时代：组织变革、Claude Code HTML 奇效与语音 AI 突破 · 05.10 早报

在线阅读和收听早报：https://www.bestblogs.dev/explore/brief/2026-05-10

> EP53 · 2026-05-10 | BestBlogs 每日精选，聚焦 AI Native 研发组织变革、Claude Code 在 HTML 中的意外突破、以及语音 AI 迈向「Her」时刻的技术路径。

## 导语

AI 正在改变组织本身的形态和运作节奏，从研发协作到语音交互再到代码生成，每个环节都在重新定义效率的上限。

阿里技术的一份内部访谈揭示了一个有点出乎意料的数字：深度使用 AI 的工程师，写代码的时间占比从 30% 降到了 5%，而和 Agent 对话的时间从 5% 升到了 60%。更值得停下来想的不是数字，是节奏--一个工程师上午 10 点上线一个新功能、中午做 A/B 测试、下午 3 点根据数据下线、5 点上线更好的版本，同一天内完成了过去 6 周才能完成的迭代。这意味着什么？传统组织的假设，从沟通机制到管理跨度，都建立在「人是唯一协作主体」的前提上。这个前提，正在被 AI 逐步瓦解。

今天精讲三篇来自一线的深度思考：阿里如何重塑研发组织应对 AI 时代，Claude Code 核心成员分享 HTML 格式在 AI 生成场景的意外优势，以及语音 AI 要突破「Her」时刻面临的三道技术障碍。速览 7 篇涵盖 SDD 方法论、Token 经济学、YC CEO 的开发者哲学、上下文工程、Anthropic 增长等话题，扩展阅读则带来大模型 token 遗忘机制、AI 医疗智能体和 AI 对工程师价值分布影响这三个角度的补充视野。

## 精讲一：AI Native 时代 -- 研发组织何去何从

来源：阿里技术

这是一篇来自阿里技术内部访谈与行业研究的深度复盘，核心论断直接而有力：AI 不是新工具，是新协作主体。

两千年的协调问题，被一个前提打破

从罗马军团到普鲁士总参谋部，从美国铁路到 Spotify 的 Squad 模型，两千年的组织演化围绕同一个约束：人的管理跨度。一个人能直接管理的下属在 3 到 8 之间--这不是文化决定的，是人类这个生物的硬限制。所有的组织形态，本质上都是在这个限制上做妥协。

康威定律（组织结构决定系统结构）、《人月神话》（加人无法加速延期项目）、manager 评价制，这些我们习以为常的管理原则，都不是抽象工程哲学，而是人作为协作主体的「协作物理学」的具体实现。

而 AI 的特点，正好是人的镜像反面：

- 人有沟通衰减，AI 没有

- 人需要激励，AI 不需要

- 人有 context switching 成本，AI 极小

- 人的记忆和注意力有限，AI 几乎无限

这意味着，过去围绕「人形约束」设计的整个组织体系，其前提正在失效。

从 Org Chart 到 Execution Graph

文章引用了 Ken Huang 的一句话，值得反复咀嚼：「Once AI becomes agentic， the organization stops being accurately described by an org chart. It becomes an execution graph.」

当 AI 真的能行动、能调用工具、能修改系统，你的公司就不再是一张汇报关系的 org chart，而变成了一张把人、agents、数据、权限、工具、审批关系作为同等节点的「执行图」。

旧问题是 ownership--「谁拥有这件事？」新问题是 routing 加 governance--「意图从哪里进入系统？怎么被翻译成行动？什么约束让这个行动是安全的？」

这个范式转换最实际的红利是：组织重组的成本可以从季度级压到 week 级。旧组织的最小单元是「人 + 长期关系网」，粘性极高，每次重组都在重建信任、重新切割身份归属；而 Execution Graph 把最小单元换成了「任务 + 上下文 + 权限 + 工具」，大部分依赖是机器可读的 artifact，不是人脑里的隐性关系。

新瓶颈：信息形态的人形偏置

文章最深刻的洞察之一在「人既是瓶颈，也是兜底」这一节。

协作的本质是消除理解不一致性的成本，这个成本过去一直是人在扛--开个会问一下、走过去问老王、凭经验猜一下、跑去预发环境试一试。这些动作发生得太自然，自然到我们不再把它看作「工作」。

但它们是工作。 整个研发系统长期容忍着大量不规范、不结构化、不完整的信息，只要人足够聪明、熟悉，这些缺陷就不会上升为瓶颈。

AI 接管执行之后，这一面翻过来了。AI 没有「猜」和「问老王」的能力，它需要结构化、可查询、确定性的信息。公司内部调研显示，在大量使用 AI 工具的员工中，提及频次最高的痛点不是「模型能力不够」，而是「系统打通与数据整合」--员工在做「人肉中间件」，从各系统手动导出数据、粘贴进 AI、再把 AI 输出搬回业务系统。

新瓶颈的真相：不是 AI 能力不够，是系统的信息形态不够--过去被人吸收的所有「信息隐性化」成本，第一次以瓶颈的形式暴露出来。

双层架构：Harness + Hive Mind

文章描述了真正在做 AI Native 的团队（包括 Anthropic、CREAO 和阿里内部先锋小组）的共同形态：工作分两层，两层的运作逻辑甚至是相反的。

底层是极度结构化的 Harness 层：代码、测试、流水线、文档、世界模型，所有信息都被做成 AI 友好的形态，这一层越结构化越好，AI 主导。

上层是极度松散的 Hive Mind 层：对话、试错、idea 涌现、Yes-and，这一层越松散越好，人主导。

Anthropic 几乎肯定有比任何公司都精密的 Harness，但它在 Harness 之上选择运行混乱的文化--这两件事不是替代，是叠加。结构化是为了释放无结构的协作，不是用结构控制一切。这个洞察对于很多习惯于「要么全盘控制，要么完全放权」思维模式的管理者来说，是真正值得停下来思考的。

为什么值得读，以及怎么读

这篇文章对工程师和管理者理解 AI 时代的组织演进具有极高参考价值。它不是在讲「AI 会替代谁」，而是在讲组织结构本身的物理定律因为 AI 的出现正在改变。建议完整阅读，尤其是「Harness 层 + Hive Mind 层」的双层架构部分，以及关于「三柱架构」的论述--这对于思考如何重设计研发体系非常有帮助。

与今天速览中的 SDD 方法论（阿里云开发者的 5 人 7 天案例）形成很好的呼应：SDD 正是在 Harness 层引入结构化 Spec 的具体实践。阅读路径建议：先读本文建立概念框架，再读 SDD 案例看具体落地。

## 精讲二：使用 Claude Code：HTML 难以置信的奇效

来源：宝玉的分享

这是 Claude Code 核心成员 Thariq 的实践分享，讲了一个出乎很多人意料的发现：在 AI 生成为主的场景，HTML 比 Markdown 更适合作为输出格式。

为什么 Markdown 开始变成束缚

Markdown 简单、便携、易于人工编辑--这是它的核心优势。但 Thariq 发现，随着 AI 越来越强，他越来越少去亲自编辑这些文件了。他更多把它们当作需求文档、参考资料或头脑风暴的输出，需要修改时直接写提示词让 Claude 去改。

这就让 Markdown 最核心的优势「易于人工编辑」荡然无存。与此同时，面对动辄上百行的 Markdown 文件，他根本没有耐心读下去。

HTML 的四个实际优势

信息密度：HTML 能传达丰富得多的信息--用表格展示数据列、用 CSS 展现设计细节、用 SVG 绘制插图、用 JavaScript 实现动态交互。如果无法用 HTML，模型往往会在 Markdown 里做极其低效的「骚操作」，比如硬用 ASCII 字符画图表，或者用 Unicode 字符生硬地模拟颜色色块。

视觉清晰度：HTML 文档通过选项卡、插图、链接等视觉元素把结构整理得一目了然，甚至能做到移动端自适应。超过 100 行的 Markdown 文件，Thariq 基本不会去读；但 HTML 就好读多了。

易于分享：Markdown 通常只能当附件发送；HTML 上传到云端后可直接分享链接，同事随时用任何设备打开。如果需求文档是用 HTML 写的，别人真正去耐心阅读它的概率会大幅提升。

双向交互：HTML 允许与文档进行真实互动。比如让 Claude 在页面上加几个滑块调整设计效果，或者提供选项微调算法参数，甚至加一个按钮把微调后的完美参数「一键复制」为提示词，直接粘贴回 Claude Code 里。

HN 社区的批判性反馈

这篇文章获得了 HN 社区的广泛讨论，也指出了 HTML 方式的局限：

- token 消耗高 2-4 倍：HTML 标签本身的 overhead 不小

- JavaScript 引入 XSS 风险：在企业环境需要格外注意

- git diff 杂乱：版本控制的可读性下降

社区的共识是混合策略：展示型输出（报告、设计稿、分析文档）用 HTML，指令文件和协作文档仍首选 Markdown。

如何开始尝试

Thariq 特别提醒：不需要复杂的配置，只需告诉 Claude「给我做一个 HTML 文件」或「生成一个 HTML Artifact」就可以开始。真正的诀窍在于清楚自己希望这个文件能做什么。他建议先去示例页面看看实际效果，形成直观感受，再考虑是否适合自己的工作场景。

与今天主题的关联

这篇文章和「精讲一」关于 Harness 层的论述有一个有趣的交汇点：结构化的信息形态是让 AI 发挥更大价值的前提。HTML 在 AI 生成场景提供的正是更丰富的信息结构--它把文档的交互性和可读性提升到了一个新层次，让人和 AI 都能更高效地使用同一份文档。建议工程师和产品经理批判性地参考这篇文章，尤其是那些经常需要把 AI 输出分享给团队的人，HTML 格式可能会显著改善沟通效率。

## 精讲三：Voice AI 何时迎来「Her」时刻？

来源：AI Engineer

这是 Gradium AI 联合创始人 Neil Zeghidour 的演讲，难得之处在于：技术诚实地量化了语音 AI 距离「Her」时刻还差多远。

三道尚未完全跨越的技术障碍

第一道：延迟。人类对话要求约 200 毫秒的往返响应时间。在传统级联系统（STT → LLM → TTS 串行）中，仅 TTS 生成一步就常常超过 200 毫秒，还不算 LLM 推理和转录的时间。当 LLM 触发背景工具调用时，延迟可能飙升至 500 毫秒到 4 秒，彻底破坏自然对话节奏。

目前的临时解法是「语言填充词」：当 AI 等待工具调用返回时，LLM 继续用自然的过渡语句与用户聊天（如「东京是个很棒的选择！让我帮您查一下选项……」），等后台数据返回后再无缝衔接。这是有效的，但本质上是在掩盖延迟，不是解决它。

第二道：半双工到全双工的跃迁。现有大多数语音 AI 是半双工的--要么在听，要么在说，不能同时进行。这导致体验很生硬：用户插话或者有背景噪音，系统就可能提前停止响应。

全双工系统能够同时听和说，能预测并提前开口，能处理用户打断而不忽略它，能把语音重叠当作自然对话特征而非错误。但实现全双工的同时保持 LLM 级别的智能和工具调用能力，是另一个难题。

第三道：成本与规模化。即便延迟和对话流都解决了，在生产环境大规模部署语音 AI 面临巨大的财务和隐私挑战。

Gradium 的本地化路径：Phoneon

Gradium 的商业化方向之一是端侧 Phoneon 模型--参数量低于 10 亿，普通手机 CPU 即可运行，开辟了零 API 成本的本地化路径。这意味着语音 AI 不必总是依赖云端推理，在隐私敏感场景（医疗、金融）和网络受限环境下有重要意义。

Gradium 的背景与技术脉络

Gradium AI 的前身是一个由 Eric Schmidt 等慈善家资助的开源非营利实验室，他们开发了 Moshi--第一个开源的语音对语音对话模型。商业化后，Gradium 专注于构建底层语音 AI 基础设施（STT、TTS、端到端对话模型），刻意不做垂直产品和编排层，为其他开发者提供底层能力。

这个定位让他们对技术现状的判断更加中立和量化：他们的收入来自基础设施，所以没有动力夸大技术的成熟度。Zeghidour 在演讲中明确说，有些人宣称「Her 时刻已经到来」，但从技术指标来看，我们离那个时刻还有三道坎没有完全跨越。

为什么这份技术路线图值得读

语音 AI 领域充斥着「时刻已到」的声音，但 Zeghidour 提供的是量化的差距分析：具体是哪些技术指标尚未达标，每道障碍的当前状态是什么，以及 Gradium 选择从哪个角度切入。对于在语音 AI 场景做产品或技术选型的读者，这篇是值得仔细阅读的诚实参考。今天「精讲一」提到的「AI 作为新协作主体」在语音场景的最终形态，正是需要跨越这三道技术障碍之后才能真正实现的。

## 速览

5 人 7 天干完 20 人数周的活：Spec-Driven Development 如何重新定义 AI 编程

来源：阿里云开发者 | 评分：91

阿里云开发者团队用一个震撼案例系统阐述了 SDD（Spec-Driven Development）方法论：5 人、7 天，用 Qoder 完成了传统需要 20 人数周的工作量。核心理念一句话概括：将规格说明作为唯一真实来源，代码作为其派生产物--先定义 WHAT，再让 AI 做 HOW。DAY 0 不写一行代码，只写 Spec，这一天的决定影响了后面 6 天的一切。文章还对比了 GitHub Spec Kit、AWS Kiro、阿里 QoderWork 等工具生态，并详细分析了常见陷阱。与「精讲一」关于 Harness 层结构化的讨论形成直接呼应，是理解 AI 编程范式转变的必读实战案例。

DeepSeek 降价背后：Token 生意在重新洗牌

来源：腾讯科技 | 评分：91

GPT-5.5 大幅涨价，DeepSeek 大幅降价，为什么同一产业里会出现截然相反的价格信号，而且两端都站满了买家？本文从产业经济学视角系统分析 Token 市场的定价逻辑：OpenAI 以竞争对手价格为锚做市场渗透 + 分层定价，Anthropic 以自身价值为锚强调品质溢价，Google 以生态效益为锚打包 GCP 整体价值。「Token 经济学」系列第八期，适合关注 AI 商业格局演化的读者。

精简接口，丰富技能：Gary Tan 谈 400 倍 AI 开发者

来源：Y Combinator | 评分：92

YC CEO Gary Tan 重返编程后，用 Claude Code 在 5 天内、花 200 美元重建了他的第一个创业公司 Posterous。他提出「Thin Harness， Fat Skills」心智模型：精简的 AI 接口（如 Claude Code）搭配丰富的人工指令和上下文，Markdown 是新的代码，用来编码人类意图并让 AI 编译成软件。他还提出「Token Maxing」概念--在强大模型上投入高质量提示词，实现 400 倍生产力提升。观点鲜明，适合思考 AI 时代开发者角色转变的读者。

智能体搜索与上下文工程

来源：AI Engineer | 评分：92

Elastic 的 Leonie Monigatti 在 AI Engineer 会议上系统梳理了智能体搜索和上下文工程的关系：传统 RAG 用固定管线，每次查询都触发搜索，容易引入无关上下文；智能体 RAG 把搜索决策权交给模型，让 agent 自己决定是否搜索、何时搜索。她指出上下文工程本质上有 80% 是智能体搜索，并强调详细的工具描述是构建可靠 AI agent 的关键--工具描述不清楚，agent 要么幻觉、要么选错工具。配合今天「精讲一」的 Execution Graph 概念理解效果更好，推荐正在构建 AI agent 的工程师观看。

【AINews】 Anthropic 年增长 10 倍，而其他公司裁员超 10%

来源：Latent Space | 评分：90

Anthropic 经历「奇迹 Q1」--单月 ARR 增长 150 亿美元--后，估值已达 1-1.2 万亿美元，正式超越 OpenAI 成为全球最有价值公司之一。与此同时，Block 裁员 40%、Coinbase 裁员 14%、Cloudflare 裁员 20%，都以「AI 就绪」为由。文章直接指出：很难判断这到底是「AI 驱动的裁员」还是「借 AI 名义的正常瘦身」。强公司（如 Linear）因 AI 而增长，弱公司因 AI 而收缩，这一极化趋势正在加速。本期 AI 新闻摘要还涵盖模型、基础设施、智能体、对齐研究等多个领域的最新进展，是快速了解行业动态的高效选择。

Claude Co-work 入门指南

来源：Claude | 评分：91

Claude 官方教程，介绍 Co-work 功能如何将 Claude 转化为一个能执行复杂任务的 AI 智能体--通过授权本地文件夹访问、连接 Google Drive / Notion / Slack 等云服务、配置全局指令，实现「交付目标」而不仅是「回答问题」的模式切换。从描述目标到 Claude 制定计划再到执行，Co-work 的核心价值在于「handoff」而非「问答」：你描述一个目标，Claude 制定完整计划，你审批后它自动执行。当前支持 macOS 和 Windows 上的 Claude 桌面应用（Pro/Max/Team/Enterprise 用户）。适合想快速上手 Claude 智能体工作流、减少手动在不同工具间切换的用户。

OpenAI 翁家翌：梯度之外，下一个 AI 训练范式有着落了？

来源：机器之心 | 评分：90

OpenAI 后训练 RL 基础设施的核心工程师翁家翌（Jiayi Weng）分享了一个出人意料的实验：一套由 coding agent 持续迭代的纯手写规则系统（没有神经网络、没有梯度下降），在经典游戏中打出了理论最高分，在机器人控制中媲美 Deep RL。他由此提出 Heuristic Learning 可能是继 Pretrain、RLHF、大规模 RL 之后的下一个训练范式--凡是可以被持续迭代的，都开始能被解决。技术含量高，适合 AI 研究者和工程师阅读。

## 扩展阅读

大模型不认识马嘉祺？我们做了一次全链路排查

来源：MiniMax 稀宇科技 | 评分：90

MiniMax 团队系统排查了「模型无法输出马嘉祺」的问题，最终定位根因：分词器将「嘉祺」合并为独立 token，但该 token 在后训练数据中出现频次极低（不到 5 条样本），导致生成能力被遗忘--模型转而选了发音相近的「佳琪」「琪琪」。排查方法涵盖分词器版本对齐、embedding 统计分布、语义近邻检索、few-shot 对比实验等多个维度，最终通过 lm_head 权重变化排序扫描锁定根因。这不是一个偶然 bug，而是揭示了低频 token 在后训练中被高频 token 挤压这一系统性问题。对关注大模型训练机制、tokenizer 设计的读者很有价值，是一篇难得的团队公开技术复盘。

OncoAgent：一种用于隐私保护肿瘤临床决策支持的双层多智能体框架

来源：Hugging Face Blog | 评分：91

来自 Hugging Face 博客的技术预印本。OncoAgent 是一个开源、隐私保护的肿瘤临床决策支持系统，结合了双层微调 LLM 架构、多智能体 LangGraph 拓扑、四阶段纠正性 RAG 流水线（覆盖 70 多份 NCCN/ESMO 指南），并在 AMD MI300X 硬件上实现了 56 倍的吞吐量加速。关注 AI 医疗应用、多智能体系统或 RAG 工程实践的读者可以深入阅读。

AI 让弱工程师的危害变小了

来源：Sean Goedecke | 评分：90

软件工程能力是强重尾分布的：最强的工程师产出远超平均，而弱工程师往往是净负贡献者--不仅没有推进项目，还制造需要同事花时间清理的问题。这也是很多顶尖科技公司选择打造一支小而精、薪资极高的团队的原因。Sean Goedecke 认为，Claude Code 等 AI 编程助手显著提升了弱工程师产出的下限，将他们从净负贡献者转变为功能有限但尚可协作的伙伴。值得注意的是，他并不认为 AI 能让弱工程师达到强工程师的水平--强工程师因为能更好地利用 AI 工具，优势反而可能进一步扩大。这对团队组建和人才策略都有实际影响。观点直接，适合对 AI 如何重塑工程师价值分布感兴趣的读者。

## 今日阅读路径

时间有限？建议按以下顺序阅读三篇：

首选：AI Native 时代 -- 研发组织何去何从 这是今天最有思想密度的一篇。从组织演化的历史逻辑出发，论证为什么 AI 时代的组织必须从 Org Chart 转向 Execution Graph，以及新瓶颈在哪里。无论你是工程师还是管理者，这篇都会改变你看待当前工作的视角。阅读时间约 25 分钟，是一篇值得找一段完整时间认真读的文章。

次选：5 人 7 天干完 20 人数周的活：SDD 如何重新定义 AI 编程 「精讲一」讲了理论框架，这篇给你一个具体的实战案例。SDD 方法论是当前 AI 编程语境下把「信息结构化」落到实处的最系统的做法之一，DAY 0 只写 Spec 不写代码的实践值得每个团队认真参考。如果你正在思考怎么让团队在 AI 工具上真正提速，从这篇开始是个好选择。

三选：DeepSeek 降价背后：Token 生意在重新洗牌 同样在 AI 时代，商业维度同样在剧变。理解 Token 市场的定价逻辑，有助于做出更好的技术选型和商业判断。这篇从产业经济学视角分析，视角独特，读完会对 AI 行业的价格信号有更清晰的认知。今天 Anthropic 增长的新闻恰好也提供了佐证--强者愈强的格局在 Token 市场同样适用。

-----------

BestBlogs Pro 早鸟内测开放：你可以自定义订阅源、配置兴趣标签，每天获得一份属于自己的头条早报。欢迎抢先体验，并把反馈发回给我们：https://bestblogs.dev