Spec-First 文章库

Spec Coding 博客

面向工程落地的 Spec-First 系列长文。每篇都围绕“如何写出可测试、可评审、可交付的规格”,直接解决规格、联调、验收和上线中的真实问题。

38 篇覆盖规格写作、API 契约、流程治理、案例复盘与模板资源
7 个主题按基础概念、写作、接口、流程、案例、资源和 AI 编程组织
4 篇 / 页分页阅读,避免长列表压迫感

全部文章

先按标签筛,再一次扫 4 篇。优先打开和当前交付风险最接近的文章,需要更多背景时再看下方推荐路径。

更新日期:2026-05-11 · 共 38 篇深度文章

按标签浏览

OpenSpec、Superpowers 和 Spec Kit:SDD 实践模式

对比 OpenSpec、Superpowers 与 GitHub Spec Kit,总结 SDD 中可复用的规格、计划、任务、测试、评审和证据模式。

阅读文章

AI 编码前的规格包:先给边界,再让它写代码

围绕「AI 编码前的规格包:先给边界,再让它写代码」展开,说明可测试输入、预期结果、边界条件和评审标准,帮助 QA 与开发提前对齐,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

同一个退款功能,Vibe Coding 和 Spec Coding 的结局截然不同

同一个订单退款功能,分别用 vibe coding 和 spec coding 两种方式实现。前者 10 分钟出活却花两周修 bug,后者 90 分钟写 spec 后零线上事故。完整对比。

阅读文章

验收标准示例——20 个可直接复制的真实模板

网上大多数验收标准示例都太浅,没法直接用到实际项目中。本文给你 20 个生产级的真实示例,覆盖认证、电商、API、数据处理和通知五大领域——全部采用 Given/When/Then 格式,可以直接复制到你的规格文档里。

阅读文章

如何编写技术规格——模板、示例与免费生成器

技术规格(spec)是软件工程中最被低估的工具。这篇文章带你逐一拆解 spec 的每个部分,展示一份完整的真实案例,并给你一个可以直接复制使用的模板——还有一个免费的在线生成器。

阅读文章

为 API 服务搭建测试 Harness

写测试和搭建测试 Harness 是两种截然不同的工程工作。测试验证行为,而 Harness 是让这些测试在成百上千次运行、数十位工程师协作中保持确定性、快速且可维护的基础设施。

阅读文章

Superpowers:一个用规格驱动 AI 编码智能体的开源技能框架

Superpowers 是一个开源框架,为 AI 编码智能体强制执行 Spec-First 纪律。了解其强制流水线——头脑风暴、规格、计划、TDD、验证——如何在 AI 辅助工程时代验证规格驱动开发的价值。

阅读文章

向后兼容规格:如何规划废弃路径与破坏性变更

你在周五下午发布了 API 的新版本。到周一早上,三个下游团队已经提交了故障工单,因为他们的集成全部崩溃了。他们依赖的字段被重命名了,一个枚举新增了一个值但他们的 switch 语句没有 default 分支,一个之前返回 null 的

阅读文章

如何在编写迁移之前先规格化数据库模式

迁移文件是永久性的。一旦它在生产环境中运行,你无法撤销它,只能再写一个迁移来修正。然而大多数团队写迁移的方式和写应用代码一样:打开编辑器,开始敲列定义,约束条件边写边想。

阅读文章

如何编写遵守规格的 AI 编程提示词

为什么 AI 编程工具会加上你根本没要求的校验逻辑,把下游还有消费者的字段随手重命名,还生成一堆超出任务范围的辅助函数?因为你丢给它的是一个"要解决的问题",而不是一份"要遵守的 spec"。

阅读文章

AI 编码治理:用规格驱动的 Prompt 设立边界

用 spec-driven prompts 治理 AI 辅助编程:提示词必须包含什么、AI 必须遵守哪些边界,以及让“这是 AI 写的”变成可核验声明的审计链。

阅读文章

AI 编码 PR 评审:用验收标准衡量通过与否

围绕「AI 编码 PR 评审:用验收标准衡量通过与否」展开,说明可测试输入、预期结果、边界条件和评审标准,帮助 QA 与开发提前对齐,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

AI 编码合并前风险登记:merge 之前要追踪的条目

围绕「AI 编码合并前风险登记:merge 之前要追踪的条目」展开,说明如何用规格约束 AI 编码、保留人工评审点,并用证据判断实现是否达标,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

AI 编码的测试证据门禁:为什么通过用例还不够

AI 写出的代码读起来都像能跑。有时候它甚至能通过自己写的那套测试。我现在的规矩是:不信代码,不信测试,只信"这些测试真的能抓住真实 bug"的证据。下面讲的,就是我在合并前如何把这份证据落成具体文件。

阅读文章

AI 生成客户端下的 API 变更治理

上个季度打到我 API 上的集成,有一半是那种从来没读过我文档的人写出来的。开发者在 Cursor 里敲一句含糊的提示词,Claude 或 Copilot 给什么就接什么,接完就上线。

阅读文章

AI 集成场景下的 API 错误分类体系

怎样设计一份 AI 生成的客户端真正用得上的 API 错误分类:稳定的 error code、机器可读的 category,以及区分可重试失败和永久失败的关键字段。

阅读文章

API Schema Diff 上线前评审实战

上线前如何做 API schema diff 评审:自动化 diff 工具能抓到什么、漏掉什么,以及 OpenAPI 和 GraphQL 仍然需要人工检查的那些点。

阅读文章

为 Agentic 客户端设计 API 规格

围绕「为 Agentic 客户端设计 API 规格」展开,说明契约字段、兼容边界、失败路径和评审检查点,帮助团队在上线前减少集成风险,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

Spec Skills 案例:从工单到规格的完整链路

围绕「Spec Skills 案例:从工单到规格的完整链路」展开,说明如何用规格约束 AI 编码、保留人工评审点,并用证据判断实现是否达标,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

Spec Skills 与 Spec-First 交付:实际如何结合

大多数 AI 编码工具都在为一个目标做优化:让东西在未来十分钟内跑起来。Spec Skills 优化的是另一件事——确保生成出来的代码,就是你当初真正要的那个东西。

阅读文章

AI 辅助开发下的规格质量门禁

围绕「AI 辅助开发下的规格质量门禁」展开,说明如何用规格约束 AI 编码、保留人工评审点,并用证据判断实现是否达标,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

实时协作规格:冲突解决策略

围绕「实时协作规格:冲突解决策略」展开,说明规格边界、评审问题、示例写法和落地检查,帮助团队在实现前统一行为预期,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

契约测试计划:从 OpenAPI 到 CI

围绕「契约测试计划:从 OpenAPI 到 CI」展开,说明契约字段、兼容边界、失败路径和评审检查点,帮助团队在上线前减少集成风险,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

跨服务数据同步规格:一致性设计与取舍

我见过的每一份失败的跨服务同步规格都长得一个样:它把 happy path 写完就算交差。真正出事的地方,永远是作者没想到要写下来的那些——顺序、迟到事件、部分失败,以及上线第二天需要回填时到底要怎么办。

阅读文章

用规格设计幂等工作流

幂等性就是那种在规格里看起来只值一行字、一旦写错就能吞掉你一整周调试时间的特性。下面是我写"幂等性"章节的方式——让重试、崩溃、用户连点两下在生产环境里全都表现出同一种行为。

阅读文章

事件驱动系统的规格模式:契约与消费语义

事件驱动系统的规格范式:事件 schema 版本化、command 与 fact 事件的区分、choreography 与 orchestration 的取舍、幂等处理器,以及最终一致性边界的明确表达。

阅读文章

如何在技术规格中定义非目标

项目能否按时交付,最大的预测指标不是目标清单——而是非目标清单。写了明确非目标的团队,大致能按计划完成。没写的团队,往往在三周后还在争论某件事到底算不算在范围内。我见过的每一个延期的项目,非目标章节要么缺失,要么就只有孤零零一行字。

阅读文章

移动端离线模式 API 规格:同步与冲突解决

围绕「移动端离线模式 API 规格:同步与冲突解决」展开,说明契约字段、兼容边界、失败路径和评审检查点,帮助团队在上线前减少集成风险,可直接用于规格评审、实现前对齐和测试计划补充。

阅读文章

支付链路规格:失败场景与重试矩阵

我评审过的大多数支付规格,都用三页篇幅描写 happy path,再用一句话描写失败行为:“出错时重试”。生产环境里 80% 的事故,就是从这一句话里冒出来的。

阅读文章

高风险发布的上线与回滚设计

一个团队的工程成熟度,最能看出来的时刻不是 code review,而是他们怎么描述凌晨三点出事之后的应对流程。大多数上线计划死在"我们会密切监控"这句话上——这话从来没救过谁。

阅读文章

Webhook 消费者规格:签名、重试与顺序

我评审过的绝大多数 webhook 消费端规格,覆盖的内容只有一个端点、几乎别无其他:URL、JSON 结构,再加一句含糊其辞的“校验签名”。那不是规格。

阅读文章

编写 QA 可以实际测试的边界条件

"合理处理边界情况。"我几乎每周都能在 spec 里看到这句话。它什么都没说。QA 没法测试"合理"——他们需要具体的输入、具体的触发条件、具体的预期结果。下面是我写边界情况的方式,让 QA 不用追问一句就能把它们变成测试用例。

阅读文章

软件规格中的 10 个常见错误

我评审过的每一个失败项目都有 spec。问题是 spec 里没写真正重要的那些事。下面这十个错误在我评审过的 spec 里反复出现——我自己写的也不例外。它们都不难修,但在截止日期的压力下,每一个都容易被漏掉。

阅读文章

如何在团队中推行 Spec-First(30 天计划)

在团队里推 Spec-First,本质上是个组织问题,不是技术问题。模板是最容易做的事,难的是养成习惯。如果你是那个想说服团队开始写规格的人,你大部分精力都会花在证明"它能省时间"上,而不是教大家怎么写。

阅读文章

如何编写可测试的软件规格

"可测试"的规格并不是用某种特殊语言写成的规格。它是一份每一条声明都能由未参与撰写的人来核验的规格。这个门槛听起来不高,其实不然。我审阅过的大多数规格在第一轮就过不了这关——包括我自己写的。

阅读文章

PRD 与技术规格的区别

把 PRD 和技术规格混为一谈的团队,最后写出来的文档两头不讨好。PRD 是一份给人看的产品文档,用来判断一件事 值不值得做 。技术规格是一份给人看的工程文档,用来决定 怎么做 以及 到底做成什么样 。

阅读文章

编码前的规格评审清单

大多数规格评审只是走过场。三个人扫一眼文档,有人写一句"LGTM",然后所有人带着同样的模糊地带继续往前走。真正的规格评审,会抓住那些一周之后会让你付出代价的东西。下面这份清单,是我在放任何规格通过评审之前都会过一遍的。

阅读文章

什么是 Spec-First 开发?(完整指南)

一个团队如果交付很快但不断返工,并不是在跑得更快——而是在烧跑道。问题几乎总是一样的:没人在编码之前写清楚"完成"是什么意思。Spec-First 开发解决这个问题——在实现之前定义验收标准,而不是之后。

阅读文章

静态分页 · 第 1/10 页 · 38 篇文章

入门必读

什么是 Spec-First 开发?(完整指南)

如果你想先建立整体方法论,这篇会把定义、适用场景、优缺点和真实团队收益讲清楚。

阅读完整导览
最常用

如何编写技术规格——模板、示例与免费生成器

直接拿到可复制模板,再按你团队的评审、测试和发布流程去改。

打开模板文章
团队落地

如何在团队中推行 Spec-First(30 天计划)

如果你已经不是单人试点,这篇给你完整的团队导入节奏和衡量方式。

查看 30 天计划

按学习路径进入

不要从完整列表里硬找。先选当前要解决的问题:理解方法、写出规格、保护接口与数据,或约束 AI 编码输出。

适合读者、评审者和 AI 辅助团队

刚开始了解

先理解方法,再改团队流程

从完整指南开始,再看 Spec-First 与敏捷的关系,最后用 30 天计划判断团队该怎么试点。

进入基础路径
规格写作

把模糊需求改成可测试标准

适合 ticket 太宽、验收不清、QA 需要追问的场景。先看技术规格模板,再看验收标准和边界情况。

进入写作路径
接口与数据

保护契约、迁移和回滚路径

当改动涉及外部消费者、数据库结构、幂等性、兼容性或发布安全时,从这条路径开始。

进入契约路径
AI 编码

让 AI 输出有边界、能评审

先用规格包写清任务边界,再进入提示词、风险登记、PR 评审门禁和测试证据。

进入 AI 路径

主题 Hub

如果你不想一篇篇扫文章,可以从主题 Hub 进入。每个 Hub 都提供决策表、可复制片段和下一步文章。

4 条实用路径

基础

Spec-First 开发主题 Hub

从方法、关键决策、评审门禁和证据习惯开始。

打开 Hub
契约

API 契约主题 Hub

用于 schema diff、兼容性、版本策略、Webhook 和废弃计划。

打开 Hub
测试

验收标准主题 Hub

把成功描述改成可测试标准,补上失败路径和证据。

打开 Hub
AI 交付

AI 编码治理主题 Hub

连接提示词、风险登记、验收映射和测试证据。

打开 Hub