开源研究 · Skills生态

技能优于提示词
Superpowers 与 AI 编程的工程纪律范式

一个7个月内冲到 203k GitHub Stars 的开源项目，把"AI写代码太急于表现"这个老大难，重写为一组 Markdown 即规范的强制流程。这不仅是 Claude Code/Cursor 用户的福音，更直接呼应了我们正在建设的 ARS（Academic Research Skills）能力库。

203k

GitHub Stars

核心技能数

支持平台数

阶段工作流

1. 问题诊断：为什么AI写代码总要返工

Superpowers 创造者 Jesse Vincent（Request Tracker 作者、Perl 5 发布负责人）把AI编程代理的失效模式总结得很犀利："语言模型被训练为'立即提供帮助'，这种本能驱使它们尽快产出代码，却跳过了所有工程化的前置步骤。"

结果就是：用错库、文件位置错误、遗漏关键需求，最后人类要花更多时间调试代理的输出。Vincent 的解决方案不在模型层面动刀，而是在会话级别拦截这种默认本能，把它路由到结构化的门禁流程中——这是一个把"工程纪律"作为一等公民的设计选择。

2. 三层架构：Skills / Hooks / Plugins

Superpowers 的物理仓库分三层，每一层解决不同问题：

Skills 技能层

15 个 SKILL.md 文件，每一份都是"可执行的过程文档"，定义代理的行为规范。

Hooks 钩子层

JSON+Shell 脚本，在会话启动等关键节点把技能内容注入上下文窗口，"在正确的时机喂正确的指令"。

Plugins 插件层

适配 Claude Code、Cursor、Codex、Gemini CLI 等8个平台的元数据格式，技能层完全平台无感。

最具颠覆性的设计是"Markdown 即规范"：用 Markdown 而非 JSON/YAML 编码过程规范，使同一份文件既是人类文档也是机器指令。Frontmatter 给出元数据，正文描述行为约束，嵌入 Graphviz DOT 流程图，"Red Flags 表格"列举AI常见的合理化借口与反驳——单一事实源（Single Source of Truth）。

3. 七阶段强制工作流

当用户在对话中说"Let's build X"时，Superpowers 不会立即写代码，而是按七步推进——每一步都是强制门禁而非建议：

① brainstorming · 苏格拉底式设计提炼，一次只问一个澄清问题，分段呈现方案。
② using-git-worktrees · 创建隔离工作区，验证测试基线干净。
③ writing-plans · 把设计拆为 2-5 分钟的微任务，含精确文件路径和完整代码。
④ subagent-driven-development · 每个任务派全新子代理执行，避免长会话漂移。
⑤ test-driven-development · "NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST"——铁律式措辞。
⑥ requesting-code-review · 任务之间执行预审查，按严重度分类问题。
⑦ finishing-a-development-branch · 验证测试、合并/PR/丢弃，清理工作区。

注意第④步——每个任务都派出一个新的子代理。背后是一个深刻观察：长会话中的代理会逐渐偏离原始规范，上下文窗口越长越容易"忘记"最初的设计决策。子代理隔离不是为了并行加速，而是为了用上下文重置对抗注意力漂移。

4. 三个值得单拎出来的设计哲学

反合理化（Anti-Rationalization）：AI在面对约束时会像人类一样"找借口"。Superpowers 在 using-superpowers 技能里专门列出代理常见的逃避借口（"我已经手动测试过了"、"这太简单了不需要设计"）并配上预制反驳。writing-skills 甚至引用 Cialdini《影响力》的说服原则，教导技能作者用权威性、一致性等心理机制增强约束力。

测试技能而非测试代码：Superpowers 的测试体系不是验证代码正确性，而是验证技能能否有效防止代理违规。测试脚本设计 3 种以上组合压力场景，迫使代理产生违规行为，逐字记录代理的具体借口——这种"元测试"方法在agentic框架中独树一帜。

流程门禁优于提示词工程：与其投资更精巧的提示词来"说服"代理做正确的事，不如在架构层面设置强制门禁。Superpowers 证明：当代理别无选择只能遵循规范时，行为质量显著提升。

5. 带带科研对Skills生态的判断与ARS布局

带带科研早就把 Superpowers 同源的"技能即资产"理念落地到科研场景，构建了 ARS（Academic Research Skills）v3.9.4.2。同样使用 SKILL.md 的范式，按学术研究流程组织了4大类技能：

deep-research（7模式）

系统性综述/PRISMA/快速综述/scoping review 等，覆盖文献调研全场景。

academic-paper（10模式）

从开题到 draft 到 revision，覆盖全周期论文写作。

academic-paper-reviewer（6模式）

模拟同行评审，从立场严苛度到反馈格式分级配置。

academic-pipeline（全流程）

把研究→写作→评审串联为端到端管线，对应 Superpowers 的七阶段思路。

这背后是同一个判断：科研AI的核心瓶颈不是"模型不够强"，而是"流程不够规范"。我们把 ARS 与策略路由（A-E策略菜单）、外包专家审核、产出路径标准化结合，构成一个完整的"AI执行+流程门禁+人工兜底"体系。这正是 Superpowers 哲学在科研垂直场景的对应物。

6. 结语：可借鉴的五条迁移路径

三层分离模型：把行为规范、注入机制、平台适配解耦，同一套规范服务多个工具。
Markdown 作为可执行规范：让规范同时是人类文档和机器指令，降低维护成本。
流程门禁优于提示词工程：约束代理行为的最佳点是架构层而非提示层。
子代理作为上下文管理工具：用上下文重置对抗长会话中的注意力漂移。
测试技能而非测试代码：在AI agent语境下重新定义"正确性"。

如果你正在为团队设计 AI 编程或科研工作流，欢迎了解带带科研的 ARS 学术研究技能库——我们把行业最新的工程纪律方法论，落地到了科研论文、专利、软著三条产出线上。

技能优于提示词 Superpowers 与 AI 编程的工程纪律范式