拒绝“聊天式”编程 - 深度解析 Claude Code 之父的系统化开发流

匿名作者
2026-01-09 12:29209

在 AI 辅助编程领域,我们通常只把 AI 当作一个更聪明的自动补全工具。然而,Claude Code 的创造者 Boris Cherny 展示了一种完全不同的维度:他通过构建一套严密的系统工程,将自己从“代码撰写者”转变为“AI 军团指挥官”,实现了月产 4 万行高质量代码的惊人效率。

本文将基于 Boris Cherny 的实战演示,详细复盘他的 13 步工作流,并补充我们对于高阶技能定制的第 14 步实践,深入剖析这套范式背后的技术哲学。


01. 并发多线程 (Parallelization)

🎥 Boris 的实战现场

Boris 的终端界面就像一个繁忙的指挥塔。他通常会同时开启 5 个并行的 Claude 会话(Tabs 1-5),每个 Tab 都有明确的职责划分:

  • Tab 1:专注于数据库层面的重构任务。

  • Tab 2:处理前端组件的视觉调整。

  • Tab 3:运行单元测试并修复回归错误。

    为了解决“等待 AI 生成”的时间浪费,他利用系统的“通知铃声”功能。当后台某个 Tab 完成任务时,会发出提示音,他便立即切换上下文进行确认。这种方式消除了人类在等待 AI 思考时的闲置时间。

🧠 技术视点:工程师的“调度器化”

这标志着工程师的核心能力正在发生代际转移。

过去,我们的核心能力是“专注力”和“手速”;而在 Boris 的模式下,核心能力变成了任务架构拆解(Architecture Decomposition)*与*上下文切换(Context Switching)。如果不具备良好的架构思维,无法将一个大需求拆解为 5 个低耦合的子任务,那么开启 5 个窗口只会带来 5 倍的混乱。并发的前提,是解耦。


02. 端云协同 (Teleport)

🎥 Boris 的实战现场

Boris 演示了如何打破“本地终端”与“云端网页”的物理隔阂。他使用 teleport 命令配合后台任务符 &,将本地正在进行的终端会话“瞬移”到浏览器端的 Claude 界面。

  • 场景切换:当需要处理复杂的长文本阅读、查看图表或进行更自然的对话交互时,他切换到网页端。
  • 状态同步:在网页端确认好思路或生成文案后,所有的上下文和结果又能反向同步回本地终端,继续执行代码命令。

🧠 技术视点:交互模态的流动性

未来的开发环境将不再固守单一的 IDE,而是“数据流”的载体。

CLI(命令行)适合执行和精确控制,GUI(网页)适合阅读、规划和视觉反馈。Boris 的实践告诉我们:上下文(Context)应当像流体一样,根据开发者的认知需求,在不同的容器之间自由流转,而不是被锁死在某个软件窗口里。


03. 慢思考 (Thinking Models)

🎥 Boris 的实战现场

在处理复杂的逻辑重构时,Boris 并没有选择响应最快的模型,而是强制指定带有思维链(Chain of Thought)的 Opus 4.5 模型。

尽管这需要等待数分钟才能看到结果,但他强调,对于核心逻辑,必须让 AI 像人类高级工程师一样进行深度的推理。他宁愿花时间等待一个准确的方案,也不愿快速得到一个充满 Bug 的代码块。

🧠 技术视点:算力换人力的经济账

这是一个关于“信噪比”的决策。

在软件工程中,生成速度 $\neq$ 开发效率。修复一个由快速模型产生的幻觉 Bug,其耗时(定位、调试、修改)往往是生成时间的 10 倍以上。这里的策略是典型的“慢即是快”:用昂贵的推理算力,去置换昂贵的人类调试时间。准确率(Precision)远比延迟(Latency)重要。


04. 共享大脑 (CLAUDE.md)

🎥 Boris 的实战现场

Boris 展示了他在项目根目录维护的核心文件:CLAUDE.md。

这不是给人类看的 Readme,而是给 AI 看的“宪法”。文件中定义了:

  • 架构规范:如“本项目使用 MVC 模式,Service 层不应直接返回 DTO”。

  • 编码细节:如“日期必须使用 ISO8601 格式”、“禁止使用 eval 函数”。

  • 路径映射:解释项目特有的黑话和目录结构。

    每次启动 Claude,它都会预加载这份文件,从而让一个通用的 AI 瞬间变成最懂该项目的“资深员工”。

🧠 技术视点:隐性知识的显性化

这是文档工程(Documentation Engineering)在 AI 时代的复兴。

传统团队中存在大量“部落知识(Tribal Knowledge)”,它们只存在于老员工的脑子里。CLAUDE.md 迫使我们将这些隐性知识显性化。这本质上是一种轻量级的 RAG(检索增强生成),它解决了 LLM 的无状态问题,让项目具备了可传承的“记忆”。


05. 复利工程 (Compounding Engineering)

🎥 Boris 的实战现场

当 Claude 犯错(例如引入了一个被禁用的库)时,Boris 的做法令人印象深刻:他不仅仅是纠正代码,而是直接在 GitHub 评论区 @claude 下达指令:“你犯了一个错误,请把这条新规则更新到 CLAUDE.md 中,以后不要再犯。”

通过这种方式,每一次错误都转化为了文档中的一条新规则,确保 AI 不会在同一个地方跌倒两次。

🧠 技术视点:错误的资产化

我们正在目睹一种全新的“资产积累”方式。

在传统开发中,踩过的坑容易被遗忘;而在这种模式下,错误被提炼成了系统的“养料”。随着项目推进,CLAUDE.md 越来越完善,AI 越来越聪明。这不仅仅是在写代码,更是在训练一个不断自我进化、不断增值的数字资产。


06. 计划模式 (Plan Mode)

🎥 Boris 的实战现场

Boris 通过双击 Shift+Tab 进入一个特殊的“计划模式”。在此模式下,AI 被禁止写一行代码。

他和 AI 像两个在白板前的架构师一样,纯粹通过自然语言反复推演:“如果我们要改这个 API,会影响哪些文件?”、“数据库 Schema 需要怎么变?”。只有当计划被彻底确认无误后,他才会切换回执行模式让 AI 动手。

🧠 技术视点:决策层与执行层的分离

这解决了新手使用 AI 最容易犯的错:过早陷入细节。

Plan Mode 强行将设计(Design)*与*实现(Implementation) 剥离。这不仅通过思维链(CoT)降低了 AI 的幻觉风险,更重要的是,它强制人类保持在“决策层”。AI 是手,你是脑,动手之前先动脑。


07. 斜杠命令 (Slash Commands)

🎥 Boris 的实战现场

Boris 演示了他自定义的 /commit-push-pr 命令。

只需输入这一个指令,Claude 就会在后台自动执行一系列复杂的动作:检查 Git 状态 -> 分析变更内容 -> 生成符合规范的 Commit Message -> 推送到远程分支 -> 调用 GitHub API 创建 PR。原本需要敲击十几次键盘的流程,被压缩成了一次指令。

🧠 技术视点:流程的“模糊自动化”

这是对传统 Shell 脚本的降维打击。

传统的脚本是僵化的,参数必须精确匹配。而挂载了 AI 的 Slash 命令是**基于意图(Intent-based)**的。开发者只需要发出意图,AI 负责填充参数、处理异常。我们正在从“自动化(Automation)”向“自主化(Autonomy)”过渡。


08. 子智能体 (Sub-agents)

🎥 Boris 的实战现场

在处理特定任务时,Boris 会调用专门的“子智能体”。例如:

  • code-simplifier:这是一个被设定了极强约束的 Agent,它只负责简化代码语法,绝不修改业务逻辑。

  • verify-app:专门负责按照测试手册运行端到端测试的 Agent。

    主 AI 负责攻坚,子 Agent 负责扫尾,分工明确。

🧠 技术视点:单一职责原则 (SRP) 的 AI 实践

我们写代码遵循 SRP 原则,使用 AI Agent 也应如此。

一个通用的“全能 Agent”往往表现平庸。通过构建专门的 Sub-agents,我们可以针对特定任务(如安全审计、性能优化、文档生成)微调 Prompt 和工具集。这是多智能体协作(Multi-Agent Systems) 的实战雏形。


09. 钩子 (Hooks)

🎥 Boris 的实战现场

Boris 配置了严格的 Pre/Post-execution Hooks。每当 AI 生成代码准备写入文件之前,系统会自动触发 Prettier 或 Linter。

无论 AI 生成的代码格式多么混乱,在写入磁盘的那一刻,它都会被强制格式化为团队标准风格。

🧠 技术视点:最后一道防线

这是防御性编程在 AI 时代的必要延伸。

我们不能无条件信任 AI 的输出质量。Hooks 建立了一个不依赖于 AI 自身道德约束的外部质量门禁。这不仅解决了 AI 代码“能跑但很难看”的顽疾,更守住了代码库整洁度的底线。


10. 权限管理 (Permissions)

🎥 Boris 的实战现场

Boris 并没有让 AI 处于完全的“裸奔”状态(dangerously-skip-permissions)。相反,他精心设置了白名单:

  • 读取类命令(ls, cat, git status):默认允许,无需人类确认,保证交互流畅。
  • 破坏类命令(rm, upload, deploy):必须弹窗询问,且高危操作会被钩子拦截。

🧠 技术视点:基于行为的零信任架构

信任,但要验证(Trust but Verify)。

在 AI 能够自主执行命令的时代,安全架构必须从“基于身份”转向“基于行为”。这种配置既保证了探索性任务的效率,又锁死了破坏性操作的风险。


11. 万物互联 (MCP)

🎥 Boris 的实战现场

通过 Model Context Protocol (MCP),Boris 让 Claude 连接到了 IDE 之外的世界。

他展示了 AI 如何直接读取 Slack 中的讨论记录来理解需求背景,或者直接查询 BigQuery 数据库来验证业务逻辑,甚至连接 Sentry 查看线上的实时报错日志。

🧠 技术视点:打破 IDE 的“数据孤岛”

当 AI 开始感知业务数据时,它才真正成为了“全栈”。

这预示着 AIOps 的到来——AI 不再仅仅处理代码文本,而是能够感知线上状态、用户反馈和业务数据。它正在从一个“编码工具”进化为一个能够感知上下文的“业务伙伴”。


12. 长任务管理 (Ralph Wiggum)

🎥 Boris 的实战现场

对于那些极度耗时的任务(如全项目大规模重构、运行数小时的回归测试),Boris 使用了一个被称为 "Ralph Wiggum" 的后台挂机插件。

他将任务扔给这个后台进程,配置好“完成强提醒”,然后就去处理其他事情,甚至睡觉。在这些隔离环境中,他给予 AI 更高的自主权。

🧠 技术视点:异步生产力的解放

人类的时间是线性的,但算力是可以并发的。

通过将长耗时任务剥离给后台 AI,工程师实现了算力与人力的解耦。你不再需要盯着进度条发呆,这是对人类注意力的极致保护。


13. 反馈闭环 (Feedback Loop)

🎥 Boris 的实战现场

这是 Boris 演示中最精彩的部分:赋予 AI 眼睛。

当 AI 修改了前端代码后,它会自动启动一个浏览器实例,像真实用户一样点击按钮、输入表单、截图并分析控制台报错。如果发现页面崩溃或报错,AI 会根据错误信息自动修正代码,直到通过验证。

🧠 技术视点:从“开环”到“闭环”

这不仅仅是自动化测试,这是“自主纠错”。

目前的 AI 编程多是“开环”的(AI 写完 -> 人去测 -> 人反馈)。Boris 构建的是闭环系统(AI 写 -> AI 测 -> AI 改)。只要有了可靠的反馈机制(视觉验证、测试套件),AI 就能在不断的试错中收敛到正确结果,这才是 AI 能够独立完成任务的关键。


14. claude Code Skills 进阶实践

🚀 超越脚本的终极形态

Boris 展示了如何用 Slash Commands 和 MCP 连接工具,但这依然是零散的。通过研究 Anthropic 最新的官方规范,我们发现 Claude Code 真正的杀手锏其实是:Agent Skills(代理技能架构)

这不是简单的写个脚本,而是定义了一种标准化的能力封装协议。如果说 CLAUDE.md 是公司的“宪法”,那么 Agent Skills 就是 Claude 的“岗位技能手册”。

🛠️ 我们的实践:构建标准化的 Skill 目录

我们不应满足于散落在各处的 Prompt,而应按照官方规范,构建可复用的 Skill 文件夹结构:

1. 采用“三位一体”的目录结构

一个标准的 Skill 不是一个文件,而是一个目录:

  • SKILL.md (大脑):核心指令文件。包含 YAML Frontmatter(元数据)定义 namedescription,以及 Markdown 格式的操作指南。这是 Claude 唯一“必读”的部分。
  • scripts/ (肢体):存放 Python/Bash 脚本。用于处理需要精确执行、容错率低的逻辑(如数据清洗、格式转换)。这比让 LLM 自己写代码执行要稳定得多。
  • references/ (海马体):存放 PDF 规范、API 文档或模版。这些是 AI 按需查阅的知识库。

2. 利用“渐进式披露”机制 (Progressive Disclosure)

这是该架构最精妙的技术设计,旨在解决上下文窗口(Context Window)的限制:

  • 静默态:Claude 启动时,只加载所有 Skills 的 namedescription(约 100 tokens),极度节省资源。
  • 激活态:只有当 Claude 判定当前任务需要该技能时(例如你提到“处理这个 PDF”),它才会动态加载该技能完整的 SKILL.md 指令。
  • 执行态:只有在真正执行细节时,才会去读取 scripts/references/ 中的具体文件。

3. 设定“自由度” (Degrees of Freedom)

我们在编写 SKILL.md 时遵循“窄桥原则”:

  • 低自由度:对于发布生产环境的操作,我们提供固死的 scripts/,不给 AI 自由发挥的空间,确保 100% 的一致性。
  • 高自由度:对于“代码优化建议”类技能,我们只提供 Markdown 文本指导,让 Claude 发挥它的创造力。

🧠 技术视点:AI 的“Docker 化”时刻

Agent Skills 的出现意味着 AI 能力的标准化和模块化

  • 可移植性:你可以把一个写好的 data-analysis Skill 文件夹打包发给同事,他的 Claude 瞬间就学会了如何分析公司特有的数据格式,无需任何 Prompt 调试。
  • 程序性记忆:以前我们通过 RAG 给 AI 陈述性记忆(知识),现在我们通过 Skills 给 AI 程序性记忆(方法)。

结语

Boris Cherny 的 13 步工作流,配合最新的 Agent Skills 架构,本质上是将程序员从代码的实现者,升级为了代码生产系统的设计者与监督者

评论 (0)

暂无评论,快来发表第一条评论吧!

AI 技术峰会

2025 AI 技术峰会

AI 实战课程

AI 实战课程

热门工具

AI 助手

智能对话,提升效率

智能图像处理

一键美化,智能修图

AI 翻译

多语言实时翻译