拒绝“聊天式”编程 - 深度解析 Claude Code 之父的系统化开发流

在 AI 辅助编程领域，我们通常只把 AI 当作一个更聪明的自动补全工具。然而，Claude Code 的创造者 Boris Cherny 展示了一种完全不同的维度：他通过构建一套严密的系统工程，将自己从“代码撰写者”转变为“AI 军团指挥官”，实现了月产 4 万行高质量代码的惊人效率。

本文将基于 Boris Cherny 的实战演示，详细复盘他的 13 步工作流，并补充我们对于高阶技能定制的第 14 步实践，深入剖析这套范式背后的技术哲学。

01. 并发多线程 (Parallelization)

🎥 Boris 的实战现场

Boris 的终端界面就像一个繁忙的指挥塔。他通常会同时开启 5 个并行的 Claude 会话（Tabs 1-5），每个 Tab 都有明确的职责划分：

Tab 1：专注于数据库层面的重构任务。
Tab 2：处理前端组件的视觉调整。
Tab 3：运行单元测试并修复回归错误。

为了解决“等待 AI 生成”的时间浪费，他利用系统的“通知铃声”功能。当后台某个 Tab 完成任务时，会发出提示音，他便立即切换上下文进行确认。这种方式消除了人类在等待 AI 思考时的闲置时间。

🧠 技术视点：工程师的“调度器化”

这标志着工程师的核心能力正在发生代际转移。

过去，我们的核心能力是“专注力”和“手速”；而在 Boris 的模式下，核心能力变成了任务架构拆解（Architecture Decomposition）*与*上下文切换（Context Switching）。如果不具备良好的架构思维，无法将一个大需求拆解为 5 个低耦合的子任务，那么开启 5 个窗口只会带来 5 倍的混乱。并发的前提，是解耦。

02. 端云协同 (Teleport)

🎥 Boris 的实战现场

Boris 演示了如何打破“本地终端”与“云端网页”的物理隔阂。他使用 teleport 命令配合后台任务符 &，将本地正在进行的终端会话“瞬移”到浏览器端的 Claude 界面。

场景切换：当需要处理复杂的长文本阅读、查看图表或进行更自然的对话交互时，他切换到网页端。
状态同步：在网页端确认好思路或生成文案后，所有的上下文和结果又能反向同步回本地终端，继续执行代码命令。

🧠 技术视点：交互模态的流动性

未来的开发环境将不再固守单一的 IDE，而是“数据流”的载体。

CLI（命令行）适合执行和精确控制，GUI（网页）适合阅读、规划和视觉反馈。Boris 的实践告诉我们：上下文（Context）应当像流体一样，根据开发者的认知需求，在不同的容器之间自由流转，而不是被锁死在某个软件窗口里。

03. 慢思考 (Thinking Models)

🎥 Boris 的实战现场

在处理复杂的逻辑重构时，Boris 并没有选择响应最快的模型，而是强制指定带有思维链（Chain of Thought）的 Opus 4.5 模型。

尽管这需要等待数分钟才能看到结果，但他强调，对于核心逻辑，必须让 AI 像人类高级工程师一样进行深度的推理。他宁愿花时间等待一个准确的方案，也不愿快速得到一个充满 Bug 的代码块。

🧠 技术视点：算力换人力的经济账

这是一个关于“信噪比”的决策。

在软件工程中，生成速度 $\neq$ 开发效率。修复一个由快速模型产生的幻觉 Bug，其耗时（定位、调试、修改）往往是生成时间的 10 倍以上。这里的策略是典型的“慢即是快”：用昂贵的推理算力，去置换昂贵的人类调试时间。准确率（Precision）远比延迟（Latency）重要。

04. 共享大脑 (CLAUDE.md)

🎥 Boris 的实战现场

Boris 展示了他在项目根目录维护的核心文件：CLAUDE.md。

这不是给人类看的 Readme，而是给 AI 看的“宪法”。文件中定义了：

架构规范：如“本项目使用 MVC 模式，Service 层不应直接返回 DTO”。
编码细节：如“日期必须使用 ISO8601 格式”、“禁止使用 eval 函数”。
路径映射：解释项目特有的黑话和目录结构。

每次启动 Claude，它都会预加载这份文件，从而让一个通用的 AI 瞬间变成最懂该项目的“资深员工”。

🧠 技术视点：隐性知识的显性化

这是文档工程（Documentation Engineering）在 AI 时代的复兴。

传统团队中存在大量“部落知识（Tribal Knowledge）”，它们只存在于老员工的脑子里。CLAUDE.md 迫使我们将这些隐性知识显性化。这本质上是一种轻量级的 RAG（检索增强生成），它解决了 LLM 的无状态问题，让项目具备了可传承的“记忆”。

05. 复利工程 (Compounding Engineering)

🎥 Boris 的实战现场

当 Claude 犯错（例如引入了一个被禁用的库）时，Boris 的做法令人印象深刻：他不仅仅是纠正代码，而是直接在 GitHub 评论区 @claude 下达指令：“你犯了一个错误，请把这条新规则更新到 CLAUDE.md 中，以后不要再犯。”

通过这种方式，每一次错误都转化为了文档中的一条新规则，确保 AI 不会在同一个地方跌倒两次。

🧠 技术视点：错误的资产化

我们正在目睹一种全新的“资产积累”方式。

在传统开发中，踩过的坑容易被遗忘；而在这种模式下，错误被提炼成了系统的“养料”。随着项目推进，CLAUDE.md 越来越完善，AI 越来越聪明。这不仅仅是在写代码，更是在训练一个不断自我进化、不断增值的数字资产。

06. 计划模式 (Plan Mode)

🎥 Boris 的实战现场

Boris 通过双击 Shift+Tab 进入一个特殊的“计划模式”。在此模式下，AI 被禁止写一行代码。

他和 AI 像两个在白板前的架构师一样，纯粹通过自然语言反复推演：“如果我们要改这个 API，会影响哪些文件？”、“数据库 Schema 需要怎么变？”。只有当计划被彻底确认无误后，他才会切换回执行模式让 AI 动手。

🧠 技术视点：决策层与执行层的分离

这解决了新手使用 AI 最容易犯的错：过早陷入细节。

Plan Mode 强行将设计（Design）*与*实现（Implementation） 剥离。这不仅通过思维链（CoT）降低了 AI 的幻觉风险，更重要的是，它强制人类保持在“决策层”。AI 是手，你是脑，动手之前先动脑。

07. 斜杠命令 (Slash Commands)

🎥 Boris 的实战现场

Boris 演示了他自定义的 /commit-push-pr 命令。

只需输入这一个指令，Claude 就会在后台自动执行一系列复杂的动作：检查 Git 状态 -> 分析变更内容 -> 生成符合规范的 Commit Message -> 推送到远程分支 -> 调用 GitHub API 创建 PR。原本需要敲击十几次键盘的流程，被压缩成了一次指令。

🧠 技术视点：流程的“模糊自动化”

这是对传统 Shell 脚本的降维打击。

传统的脚本是僵化的，参数必须精确匹配。而挂载了 AI 的 Slash 命令是**基于意图（Intent-based）**的。开发者只需要发出意图，AI 负责填充参数、处理异常。我们正在从“自动化（Automation）”向“自主化（Autonomy）”过渡。

08. 子智能体 (Sub-agents)

🎥 Boris 的实战现场

在处理特定任务时，Boris 会调用专门的“子智能体”。例如：

code-simplifier：这是一个被设定了极强约束的 Agent，它只负责简化代码语法，绝不修改业务逻辑。
verify-app：专门负责按照测试手册运行端到端测试的 Agent。

主 AI 负责攻坚，子 Agent 负责扫尾，分工明确。

🧠 技术视点：单一职责原则 (SRP) 的 AI 实践

我们写代码遵循 SRP 原则，使用 AI Agent 也应如此。

一个通用的“全能 Agent”往往表现平庸。通过构建专门的 Sub-agents，我们可以针对特定任务（如安全审计、性能优化、文档生成）微调 Prompt 和工具集。这是多智能体协作（Multi-Agent Systems） 的实战雏形。

09. 钩子 (Hooks)

🎥 Boris 的实战现场

Boris 配置了严格的 Pre/Post-execution Hooks。每当 AI 生成代码准备写入文件之前，系统会自动触发 Prettier 或 Linter。

无论 AI 生成的代码格式多么混乱，在写入磁盘的那一刻，它都会被强制格式化为团队标准风格。

🧠 技术视点：最后一道防线

这是防御性编程在 AI 时代的必要延伸。

我们不能无条件信任 AI 的输出质量。Hooks 建立了一个不依赖于 AI 自身道德约束的外部质量门禁。这不仅解决了 AI 代码“能跑但很难看”的顽疾，更守住了代码库整洁度的底线。

10. 权限管理 (Permissions)

🎥 Boris 的实战现场

Boris 并没有让 AI 处于完全的“裸奔”状态（dangerously-skip-permissions）。相反，他精心设置了白名单：

读取类命令（ls, cat, git status）：默认允许，无需人类确认，保证交互流畅。
破坏类命令（rm, upload, deploy）：必须弹窗询问，且高危操作会被钩子拦截。

🧠 技术视点：基于行为的零信任架构

信任，但要验证（Trust but Verify）。

在 AI 能够自主执行命令的时代，安全架构必须从“基于身份”转向“基于行为”。这种配置既保证了探索性任务的效率，又锁死了破坏性操作的风险。

11. 万物互联 (MCP)

🎥 Boris 的实战现场

通过 Model Context Protocol (MCP)，Boris 让 Claude 连接到了 IDE 之外的世界。

他展示了 AI 如何直接读取 Slack 中的讨论记录来理解需求背景，或者直接查询 BigQuery 数据库来验证业务逻辑，甚至连接 Sentry 查看线上的实时报错日志。

🧠 技术视点：打破 IDE 的“数据孤岛”

当 AI 开始感知业务数据时，它才真正成为了“全栈”。

这预示着 AIOps 的到来——AI 不再仅仅处理代码文本，而是能够感知线上状态、用户反馈和业务数据。它正在从一个“编码工具”进化为一个能够感知上下文的“业务伙伴”。

12. 长任务管理 (Ralph Wiggum)

🎥 Boris 的实战现场

对于那些极度耗时的任务（如全项目大规模重构、运行数小时的回归测试），Boris 使用了一个被称为 "Ralph Wiggum" 的后台挂机插件。

他将任务扔给这个后台进程，配置好“完成强提醒”，然后就去处理其他事情，甚至睡觉。在这些隔离环境中，他给予 AI 更高的自主权。

🧠 技术视点：异步生产力的解放

人类的时间是线性的，但算力是可以并发的。

通过将长耗时任务剥离给后台 AI，工程师实现了算力与人力的解耦。你不再需要盯着进度条发呆，这是对人类注意力的极致保护。

13. 反馈闭环 (Feedback Loop)

🎥 Boris 的实战现场

这是 Boris 演示中最精彩的部分：赋予 AI 眼睛。

当 AI 修改了前端代码后，它会自动启动一个浏览器实例，像真实用户一样点击按钮、输入表单、截图并分析控制台报错。如果发现页面崩溃或报错，AI 会根据错误信息自动修正代码，直到通过验证。

🧠 技术视点：从“开环”到“闭环”

这不仅仅是自动化测试，这是“自主纠错”。

目前的 AI 编程多是“开环”的（AI 写完 -> 人去测 -> 人反馈）。Boris 构建的是闭环系统（AI 写 -> AI 测 -> AI 改）。只要有了可靠的反馈机制（视觉验证、测试套件），AI 就能在不断的试错中收敛到正确结果，这才是 AI 能够独立完成任务的关键。

SKILL.md (大脑)：核心指令文件。包含 YAML Frontmatter（元数据）定义 name 和 description，以及 Markdown 格式的操作指南。这是 Claude 唯一“必读”的部分。
scripts/ (肢体)：存放 Python/Bash 脚本。用于处理需要精确执行、容错率低的逻辑（如数据清洗、格式转换）。这比让 LLM 自己写代码执行要稳定得多。
references/ (海马体)：存放 PDF 规范、API 文档或模版。这些是 AI 按需查阅的知识库。

2. 利用“渐进式披露”机制 (Progressive Disclosure)

这是该架构最精妙的技术设计，旨在解决上下文窗口（Context Window）的限制：

静默态：Claude 启动时，只加载所有 Skills 的 name 和 description（约 100 tokens），极度节省资源。
激活态：只有当 Claude 判定当前任务需要该技能时（例如你提到“处理这个 PDF”），它才会动态加载该技能完整的 SKILL.md 指令。
执行态：只有在真正执行细节时，才会去读取 scripts/ 或 references/ 中的具体文件。

3. 设定“自由度” (Degrees of Freedom)

我们在编写 SKILL.md 时遵循“窄桥原则”：

低自由度：对于发布生产环境的操作，我们提供固死的 scripts/，不给 AI 自由发挥的空间，确保 100% 的一致性。
高自由度：对于“代码优化建议”类技能，我们只提供 Markdown 文本指导，让 Claude 发挥它的创造力。

🧠 技术视点：AI 的“Docker 化”时刻

Agent Skills 的出现意味着 AI 能力的标准化和模块化。

可移植性：你可以把一个写好的 data-analysis Skill 文件夹打包发给同事，他的 Claude 瞬间就学会了如何分析公司特有的数据格式，无需任何 Prompt 调试。
程序性记忆：以前我们通过 RAG 给 AI 陈述性记忆（知识），现在我们通过 Skills 给 AI 程序性记忆（方法）。

结语

Boris Cherny 的 13 步工作流，配合最新的 Agent Skills 架构，本质上是将程序员从代码的实现者，升级为了代码生产系统的设计者与监督者。