Skip to content

5 角色 SOP 教程 · 面向组织人员

版本: v0.5-alpha · 2026-06-13 用途: 不同角色按章节读, 1 个角色 30 分钟读完上手


角色 1 · 出题人 (第一类业务)

1.1 你是谁

把甲方"行业出题需求"变成 12 个真实案例主稿 + 50 份真实附件, 训练 LLM 答题。

1.2 你的工具链

工具 用法
skill: ecc-vert-case "我要做 vert 出题" 触发
9 脚本 ~/.claude/skills/ecc-vert-case/scripts/
references 8类目配比.md / 历次踩坑.md / 甲方要求模板.md
飞书多维表格 "生产进度表"每脚本更新

1.3 你的 1 天

09:00 翻甲方 docx, 飞书"需求接入表"建项
09:30 跑 01_fix_p0_history_dates.py
10:00 跑 02_diverse_core_constraints.py
11:00 写 1 个主稿
14:00 写 3 份附件
17:00 跑 audit_code_reviewer.py
17:30 飞书更新

1.4 你的"3 不做"

  • ❌ "ChatGPT 一键生成附件" — P0-1 触红线
  • ❌ "数字 0.85/0.90/0.95 工整" — AI 痕迹
  • ❌ "12 案例同主题" — 多样性触红线

1.5 你的考核

  • 多样性 ≥9.0
  • 真实数据源 100% 可点
  • review 缺陷率 ≤10%
  • 周期 ≤21 天

角色 2 · 教案人 (第二类业务)

2.1 你是谁

把"agent 训练需求"变成 6 领域 × 200-500 条知识教案

2.2 你的工具链

工具 用法
skill: agent-knowledge-task "我要做 CAD 知识教案"
8 脚本 01-08.py
references 6领域分类表.md

2.3 你的 1 天

09:00 跑 01_read_需求.py 提 6 表格
10:00 跑 02_写领域分类.py 规划
11:00 写 1 份完整示范 (4 段)
14:00 写 50 条领域知识 (≥5 kp/条)
17:00 跑 06_知识密度审计.py + 07_推理链审计.py

2.4 你的"3 不做"

  • ❌ AI 模拟数据
  • ❌ <5 知识点/条
  • ❌ 4 段缺一段

2.5 你的考核

  • 06 退出码 0
  • 07 退出码 0
  • 术语规范 ≥95%
  • 周期 ≤14 天

角色 3 · 评测人 (第三类业务)

3.1 你是谁

6 类 L3 基准 + 18 task_spec, 产出端到端评测报告。

3.2 你的工具链

工具 用法
skill: agent-benchmark-lab "我要做 agent 端到端基准评测"
8 脚本 01-08.py
Docker docker build -t agent-bench ./env

3.3 你的 2 天

Day1:
 09:00 01_read_benchmark.py 解包
 10:00 02_audit_5P0.py
 11:00 06_docker_isolation.py
 14:00 03_9score.py 打分
 15:00 04_run_eval.py
 17:00 07_pass_at_k_harness.py

Day2:
 09:00 12 行业专家 review
 14:00 修订重跑
 17:00 08_交付打包.py

3.4 你的"3 不做"

  • ❌ 裸 Python 跑 scenario.py
  • ❌ 评测题给 agent 看过
  • ❌ 无隐藏种子

3.5 你的考核

  • 5 P0 全过
  • 6 类 L3 跑通
  • pass@k 公式正确
  • 真实事件源 100% 可点

角色 4 · 审核人 (跨业务)

4.1 你是谁

对三类业务产出逐条 review, 红 / 黄 / 绿三级响应。

4.2 你的工具链

工具 用法
sop/02_甲方需求与审核要点.md 速查手册
自审脚本 看初步
飞书"真人 review 表" 每条打分
飞书"P0 红线表" 触红线建项

4.3 你的 1 天

08:00 接手, 飞书建项
08:30 跑自审脚本看初步
09:00 逐条 review:
       一类: 12 主稿+50 附件 (1 天)
       二类: 200-500 条/天
       三类: 评测报告 (半天)
16:00 缺陷反馈生产
17:00 收工

4.4 红黄绿响应

等级 触发 动作
🔴 5 P0 触红线 "P0 红线表"建项, 24h 整改
🟡 9 维度 <7.0 / 缺陷率 >15% 48h 整改
🟢 全过 通知 PM 交付

4.5 你的"3 不做"

  • ❌ 抽样 review (P0-1 必须逐条)
  • ❌ 凭印象打分
  • ❌ 个人偏好

4.6 你的考核

  • review 完整性 100%
  • 留痕率 100%
  • 漏报率 ≤5%

角色 5 · 项目经理 (PM)

5.1 你是谁

全流程: 立项 → 生产 → 自审 → review → 交付 → 复盘。

5.2 你的工具链

工具 用法
sop/01_统一SOP主文档.md 主参考
sop/03_项目管理_甘特+checklist.md 4 阶段
toolbox/01_方法论与工具箱.md 方法论
飞书 7 主表 + 3 辅助表 全流程

5.3 你的 1 天

09:00 飞书"风险红黄绿视图" 扫
09:30 在跑项目核对进度
10:00 周一: 提交周报
11:00 与生产/审核站会 (10 min)
14:00 风险预警表巡检
15:00 立项准入会议
17:00 复盘会议

5.4 你的"3 不做"

  • ❌ 细节微管
  • ❌ 信息黑箱
  • ❌ 省略复盘

5.5 你的考核

  • 周期偏差 ≤10%
  • 风险提前发现率 ≥90%
  • 复盘归档率 100%
  • 季度交付 ≥20

跨角色协作矩阵

节点 出题 教案 评测 审核 PM
立项 估工时 估工时 估工时 排期 拍板
生产 执行 执行 执行 待命 监控
自审 跑脚本 跑脚本 跑脚本 看初步 看 P0
review 等返工 等返工 等返工 执行 监控
修订 执行 执行 执行 复审 监控
交付 配合 配合 配合 终验 拍板
复盘 谈坑 谈坑 谈坑 谈漏报 主持

1 人多岗规则

  • 出题 / 教案 / 评测 三者只担 1 个角色 / 项目 (避免同质化)
  • 审核人不能审自己稿 (P0-1 失效)
  • PM 可同时管 3-5 个

归属: ~/.claude/skills/ecc-shared/sop/04_5角色SOP教程.md 配套: 每角色 30 分钟读完