5 角色 SOP 教程 · 面向组织人员¶
版本: v0.5-alpha · 2026-06-13 用途: 不同角色按章节读, 1 个角色 30 分钟读完上手
角色 1 · 出题人 (第一类业务)¶
1.1 你是谁¶
把甲方"行业出题需求"变成 12 个真实案例主稿 + 50 份真实附件, 训练 LLM 答题。
1.2 你的工具链¶
| 工具 | 用法 |
|---|---|
skill: ecc-vert-case |
"我要做 vert 出题" 触发 |
| 9 脚本 | ~/.claude/skills/ecc-vert-case/scripts/ |
| references | 8类目配比.md / 历次踩坑.md / 甲方要求模板.md |
| 飞书多维表格 | "生产进度表"每脚本更新 |
1.3 你的 1 天¶
09:00 翻甲方 docx, 飞书"需求接入表"建项
09:30 跑 01_fix_p0_history_dates.py
10:00 跑 02_diverse_core_constraints.py
11:00 写 1 个主稿
14:00 写 3 份附件
17:00 跑 audit_code_reviewer.py
17:30 飞书更新
1.4 你的"3 不做"¶
- ❌ "ChatGPT 一键生成附件" — P0-1 触红线
- ❌ "数字 0.85/0.90/0.95 工整" — AI 痕迹
- ❌ "12 案例同主题" — 多样性触红线
1.5 你的考核¶
- 多样性 ≥9.0
- 真实数据源 100% 可点
- review 缺陷率 ≤10%
- 周期 ≤21 天
角色 2 · 教案人 (第二类业务)¶
2.1 你是谁¶
把"agent 训练需求"变成 6 领域 × 200-500 条知识教案。
2.2 你的工具链¶
| 工具 | 用法 |
|---|---|
skill: agent-knowledge-task |
"我要做 CAD 知识教案" |
| 8 脚本 | 01-08.py |
| references | 6领域分类表.md |
2.3 你的 1 天¶
09:00 跑 01_read_需求.py 提 6 表格
10:00 跑 02_写领域分类.py 规划
11:00 写 1 份完整示范 (4 段)
14:00 写 50 条领域知识 (≥5 kp/条)
17:00 跑 06_知识密度审计.py + 07_推理链审计.py
2.4 你的"3 不做"¶
- ❌ AI 模拟数据
- ❌ <5 知识点/条
- ❌ 4 段缺一段
2.5 你的考核¶
- 06 退出码 0
- 07 退出码 0
- 术语规范 ≥95%
- 周期 ≤14 天
角色 3 · 评测人 (第三类业务)¶
3.1 你是谁¶
跑 6 类 L3 基准 + 18 task_spec, 产出端到端评测报告。
3.2 你的工具链¶
| 工具 | 用法 |
|---|---|
skill: agent-benchmark-lab |
"我要做 agent 端到端基准评测" |
| 8 脚本 | 01-08.py |
| Docker | docker build -t agent-bench ./env |
3.3 你的 2 天¶
Day1:
09:00 01_read_benchmark.py 解包
10:00 02_audit_5P0.py
11:00 06_docker_isolation.py
14:00 03_9score.py 打分
15:00 04_run_eval.py
17:00 07_pass_at_k_harness.py
Day2:
09:00 12 行业专家 review
14:00 修订重跑
17:00 08_交付打包.py
3.4 你的"3 不做"¶
- ❌ 裸 Python 跑 scenario.py
- ❌ 评测题给 agent 看过
- ❌ 无隐藏种子
3.5 你的考核¶
- 5 P0 全过
- 6 类 L3 跑通
- pass@k 公式正确
- 真实事件源 100% 可点
角色 4 · 审核人 (跨业务)¶
4.1 你是谁¶
对三类业务产出逐条 review, 红 / 黄 / 绿三级响应。
4.2 你的工具链¶
| 工具 | 用法 |
|---|---|
sop/02_甲方需求与审核要点.md |
速查手册 |
| 自审脚本 | 看初步 |
| 飞书"真人 review 表" | 每条打分 |
| 飞书"P0 红线表" | 触红线建项 |
4.3 你的 1 天¶
08:00 接手, 飞书建项
08:30 跑自审脚本看初步
09:00 逐条 review:
一类: 12 主稿+50 附件 (1 天)
二类: 200-500 条/天
三类: 评测报告 (半天)
16:00 缺陷反馈生产
17:00 收工
4.4 红黄绿响应¶
| 等级 | 触发 | 动作 |
|---|---|---|
| 🔴 | 5 P0 触红线 | "P0 红线表"建项, 24h 整改 |
| 🟡 | 9 维度 <7.0 / 缺陷率 >15% | 48h 整改 |
| 🟢 | 全过 | 通知 PM 交付 |
4.5 你的"3 不做"¶
- ❌ 抽样 review (P0-1 必须逐条)
- ❌ 凭印象打分
- ❌ 个人偏好
4.6 你的考核¶
- review 完整性 100%
- 留痕率 100%
- 漏报率 ≤5%
角色 5 · 项目经理 (PM)¶
5.1 你是谁¶
全流程: 立项 → 生产 → 自审 → review → 交付 → 复盘。
5.2 你的工具链¶
| 工具 | 用法 |
|---|---|
sop/01_统一SOP主文档.md |
主参考 |
sop/03_项目管理_甘特+checklist.md |
4 阶段 |
toolbox/01_方法论与工具箱.md |
方法论 |
| 飞书 7 主表 + 3 辅助表 | 全流程 |
5.3 你的 1 天¶
09:00 飞书"风险红黄绿视图" 扫
09:30 在跑项目核对进度
10:00 周一: 提交周报
11:00 与生产/审核站会 (10 min)
14:00 风险预警表巡检
15:00 立项准入会议
17:00 复盘会议
5.4 你的"3 不做"¶
- ❌ 细节微管
- ❌ 信息黑箱
- ❌ 省略复盘
5.5 你的考核¶
- 周期偏差 ≤10%
- 风险提前发现率 ≥90%
- 复盘归档率 100%
- 季度交付 ≥20
跨角色协作矩阵¶
| 节点 | 出题 | 教案 | 评测 | 审核 | PM |
|---|---|---|---|---|---|
| 立项 | 估工时 | 估工时 | 估工时 | 排期 | 拍板 |
| 生产 | 执行 | 执行 | 执行 | 待命 | 监控 |
| 自审 | 跑脚本 | 跑脚本 | 跑脚本 | 看初步 | 看 P0 |
| review | 等返工 | 等返工 | 等返工 | 执行 | 监控 |
| 修订 | 执行 | 执行 | 执行 | 复审 | 监控 |
| 交付 | 配合 | 配合 | 配合 | 终验 | 拍板 |
| 复盘 | 谈坑 | 谈坑 | 谈坑 | 谈漏报 | 主持 |
1 人多岗规则¶
- 出题 / 教案 / 评测 三者只担 1 个角色 / 项目 (避免同质化)
- 审核人不能审自己稿 (P0-1 失效)
- PM 可同时管 3-5 个
归属: ~/.claude/skills/ecc-shared/sop/04_5角色SOP教程.md
配套: 每角色 30 分钟读完