开源研究 · Skills生态

技能优于提示词
Superpowers 与 AI 编程的工程纪律范式

一个7个月内冲到 203k GitHub Stars 的开源项目,把"AI写代码太急于表现"这个老大难,重写为一组 Markdown 即规范的强制流程。这不仅是 Claude Code/Cursor 用户的福音,更直接呼应了我们正在建设的 ARS(Academic Research Skills)能力库。

203k

GitHub Stars

15

核心技能数

8

支持平台数

7

阶段工作流

1. 问题诊断:为什么AI写代码总要返工

Superpowers 创造者 Jesse Vincent(Request Tracker 作者、Perl 5 发布负责人)把AI编程代理的失效模式总结得很犀利:"语言模型被训练为'立即提供帮助',这种本能驱使它们尽快产出代码,却跳过了所有工程化的前置步骤。"

结果就是:用错库、文件位置错误、遗漏关键需求,最后人类要花更多时间调试代理的输出。Vincent 的解决方案不在模型层面动刀,而是在会话级别拦截这种默认本能,把它路由到结构化的门禁流程中——这是一个把"工程纪律"作为一等公民的设计选择。

2. 三层架构:Skills / Hooks / Plugins

Superpowers 的物理仓库分三层,每一层解决不同问题:

Skills 技能层

15 个 SKILL.md 文件,每一份都是"可执行的过程文档",定义代理的行为规范。

Hooks 钩子层

JSON+Shell 脚本,在会话启动等关键节点把技能内容注入上下文窗口,"在正确的时机喂正确的指令"。

Plugins 插件层

适配 Claude Code、Cursor、Codex、Gemini CLI 等8个平台的元数据格式,技能层完全平台无感。

最具颠覆性的设计是"Markdown 即规范":用 Markdown 而非 JSON/YAML 编码过程规范,使同一份文件既是人类文档也是机器指令。Frontmatter 给出元数据,正文描述行为约束,嵌入 Graphviz DOT 流程图,"Red Flags 表格"列举AI常见的合理化借口与反驳——单一事实源(Single Source of Truth)。

3. 七阶段强制工作流

当用户在对话中说"Let's build X"时,Superpowers 不会立即写代码,而是按七步推进——每一步都是强制门禁而非建议:

  1. ① brainstorming · 苏格拉底式设计提炼,一次只问一个澄清问题,分段呈现方案。
  2. ② using-git-worktrees · 创建隔离工作区,验证测试基线干净。
  3. ③ writing-plans · 把设计拆为 2-5 分钟的微任务,含精确文件路径和完整代码。
  4. ④ subagent-driven-development · 每个任务派全新子代理执行,避免长会话漂移。
  5. ⑤ test-driven-development · "NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST"——铁律式措辞。
  6. ⑥ requesting-code-review · 任务之间执行预审查,按严重度分类问题。
  7. ⑦ finishing-a-development-branch · 验证测试、合并/PR/丢弃,清理工作区。

注意第④步——每个任务都派出一个新的子代理。背后是一个深刻观察:长会话中的代理会逐渐偏离原始规范,上下文窗口越长越容易"忘记"最初的设计决策。子代理隔离不是为了并行加速,而是为了用上下文重置对抗注意力漂移

4. 三个值得单拎出来的设计哲学

反合理化(Anti-Rationalization):AI在面对约束时会像人类一样"找借口"。Superpowers 在 using-superpowers 技能里专门列出代理常见的逃避借口("我已经手动测试过了"、"这太简单了不需要设计")并配上预制反驳。writing-skills 甚至引用 Cialdini《影响力》的说服原则,教导技能作者用权威性、一致性等心理机制增强约束力。

测试技能而非测试代码:Superpowers 的测试体系不是验证代码正确性,而是验证技能能否有效防止代理违规。测试脚本设计 3 种以上组合压力场景,迫使代理产生违规行为,逐字记录代理的具体借口——这种"元测试"方法在agentic框架中独树一帜。

流程门禁优于提示词工程:与其投资更精巧的提示词来"说服"代理做正确的事,不如在架构层面设置强制门禁。Superpowers 证明:当代理别无选择只能遵循规范时,行为质量显著提升

5. 带带科研对Skills生态的判断与ARS布局

带带科研早就把 Superpowers 同源的"技能即资产"理念落地到科研场景,构建了 ARS(Academic Research Skills)v3.9.4.2。同样使用 SKILL.md 的范式,按学术研究流程组织了4大类技能:

deep-research(7模式)

系统性综述/PRISMA/快速综述/scoping review 等,覆盖文献调研全场景。

academic-paper(10模式)

从开题到 draft 到 revision,覆盖全周期论文写作。

academic-paper-reviewer(6模式)

模拟同行评审,从立场严苛度到反馈格式分级配置。

academic-pipeline(全流程)

把研究→写作→评审串联为端到端管线,对应 Superpowers 的七阶段思路。

这背后是同一个判断:科研AI的核心瓶颈不是"模型不够强",而是"流程不够规范"。我们把 ARS 与策略路由(A-E策略菜单)、外包专家审核、产出路径标准化结合,构成一个完整的"AI执行+流程门禁+人工兜底"体系。这正是 Superpowers 哲学在科研垂直场景的对应物。

6. 结语:可借鉴的五条迁移路径

  • 三层分离模型:把行为规范、注入机制、平台适配解耦,同一套规范服务多个工具。
  • Markdown 作为可执行规范:让规范同时是人类文档和机器指令,降低维护成本。
  • 流程门禁优于提示词工程:约束代理行为的最佳点是架构层而非提示层。
  • 子代理作为上下文管理工具:用上下文重置对抗长会话中的注意力漂移。
  • 测试技能而非测试代码:在AI agent语境下重新定义"正确性"。

如果你正在为团队设计 AI 编程或科研工作流,欢迎了解带带科研的 ARS 学术研究技能库——我们把行业最新的工程纪律方法论,落地到了科研论文、专利、软著三条产出线上。