与仓库权威一致:docs/superpowers/specs/2026-03-24-core-architecture-design.md(完整设计规范)。下表为站内浓缩版。
RAG 分两层介绍:L0 与 MVP 同交付;L1 在 MVP 验证通过后再引入。当前仓库中另有实验性草案(如
rag-optimization-strategy.md)讨论更细的工程优化,但产品口径以 L0 / L1 两层为准。
| 层级 |
名称 |
阶段 |
一句话 |
| L0 |
结构化正典召回 |
MVP,第一天 |
无向量 / 无嵌入;已确认正典的结构化存储 + 场景卡元数据驱动的精确 ID/键查询 |
| L1 |
语义检索 |
MVP 之后 |
基于 embedding 的搜索,补「键匹配找不到」的概念关联;与 L0 并存,只补充、不替代 |
L0 — 结构化正典召回(MVP)
它是什么
不是通用向量 RAG。正典(Canon)以结构化 JSON 存在于 Canon Store;场景卡(scene
cards)上的结构化注释(characters、locations、threads、callbacks
等)作为数据库查询键,由 Packet Compiler 发起查询,取回匹配的人物状态、世界规则、线程状态等,再按 token 预算装入各 Worker 的 packet。
L0 从中取什么(仅已确认)
- 故事圣经 / 世界规则条目
- 人物卡与人物状态摘要
- 章摘要(Layer 0:每章)
- 卷摘要(Layer 1:约每 100 章;MVP 验收五章时可为占位,规范见设计文档)
- 时间线事件、未解决线程、发展链
Token 预算机制(P0–P4)
每次 Worker 调用有固定上下文预算;Packet Compiler 按优先级填充直至用尽:
P0 — Hard constraints(必须包含:当前场景卡、章目标、风格约束、输出契约等)
P1 — Current state(几乎总是包含:本章涉及人物/关系状态、活跃线程等)
P2 — Recent context(重要:近 3 章摘要 L0、当前卷摘要 L1、近期时间线等)
P3 — Distant reference(按需:历史卷摘要、完整世界规则、历史关系变化)
P4 — Supplementary(有余量再填:发展链、历史 QA 共性问题等)
各工人类型的字段细分以设计规范与 docs/api-spec.md 为准。
为何 L0 足以覆盖 MVP 长篇语境
规范中的关键洞察:靠分层摘要 + 状态表,而不是靠 MVP 阶段上向量。
示例(第 350 章、Writer packet 量级示意):
卷 1–3 卷摘要(Layer 1) 各约 1500 字
近 3 章章摘要(Layer 0) 合计约 1500 字
相关人物状态(实时层) 约 1000 字
活跃线程等 约 500 字
────────────────────────────────────
合计约 8000 字 ≈ 约 12K tokens 量级的正典语境
即用约 12K token 量级的正典上下文覆盖极长连载历史;场景卡注释提供了「检索什么」的信号,在 MVP 中替代语义搜索的职责。
L1 — 语义检索(MVP 之后)
目标
增加基于 embedding 的搜索,发现精确键匹配无法覆盖的概念关联。
L1 解决的问题(示例)
- 遥远章节中与当前章相关的伏笔 / 回调模式
- 概念上相似的冲突或母题
- 主题层面的联系
- 场景卡未显式标注时,仍相关的发展链节点
启动 L1 的前置条件(规范要求)
在以下条件满足前不启动 L1 实现,避免在管线未稳时堆复杂度:
- 制品(artifact)模式已稳定
- 章摘要存在且质量可靠
- 正典读取模型已在生产路径上被证明
- QA 报告 / 契约 schema 稳定
- L0 packet 组装已在至少连续多章(规范示例:5 章以上)充分测试
L0 与 L1 并存:迁移策略(规范)
L1 补充 L0,不取代 L0。Packet Compiler 流水线约定为:
1. L0:按场景卡键做结构化查询(始终执行)
2. L1:用语义搜索填充「剩余预算内」的补充语境
3. 合并与去重
4. 在总 token 预算内截断并写入最终 packet
上线 L1 后,若工程上再叠加关键词重排、QA 触发的窄域二次查询等,均视为L1 层内的实现细节,不改变「先 L0、后 L1、再合并」的产品两层口径。
按 Worker 的检索用例(规范)
| 角色 |
检索 |
说明 |
| Chat Agent |
不直接使用 RAG |
从 Canon Store 取项目摘要等轻量视图,用于对话与意图分类 |
| Planner |
L0(+ 未来 L1) |
下一章规划:依赖、callbacks、未解决线程、发展链节点等 |
| Writer |
L0(+ 未来 L1) |
当前场景相关正典与近期故事状态;侧重场景内人物状态、关系状态、活跃线程 |
| QA |
L0(+ 未来 L1) |
为潜在冲突拉取证据来源;将稿面主张与已确认正典条目对照 |
| Summarizer |
不使用检索 |
输入为完整章文本(+ 规范中要求的角色列表等),由 LLM 压缩并结构化输出 |
MVP 边界(与设计规范对齐)
核心规范明确:MVP 不包含嵌入 / 向量检索(即不含产品意义上的 L1);包含 L0 场景卡驱动召回、章级摘要管线、制品版本与状态机等。验收要求包括:第 5 章的上下文 packet 能正确引用第 1 章起已确认设定,且草稿与拒稿不得进入后续 packet。
本站「进行中」指:主线已实现 L0 链路;L1 与更复杂的工程化检索在通过上述门禁后推进,与仓库实现进度以 docs/mvp-todolist.md 为准。