智能客服流程质检系统设计方案 (Quality Inspection System Design)

版本: v1.0 日期: 2026-02-08 状态: 设计归档 -> 开发实施

1. 建设背景与目标

随着 AI 客服（数字员工）处理的会话量日益增长，人工复盘所有对话已不现实。我们需要构建一套 “AI 流程质检系统” (Automated Quality Assurance)，利用大模型作为裁判 (LLM-as-a-Judge)，对每一场历史会话进行多维度的自动化评分与诊断。

核心目标:

采用 "Async Batch Evaluation" (异步批量评估) 模式：

触发: 系统定时（如每日凌晨）或实时（会话结束检测）触发质检任务。
判卷 (Judge): 读取完整的 BrainSession 上下文，将其连同 QualityRules (质检标准) 一起发送给高智商 LLM (如 GPT-4, Qwen-Max)。
输出: LLM 返回类似于 JSON 的结构化评价，包含总分、扣分项、改进建议。
落库: 将结果存入 InspectionRecord 表。

需在 database/shared_models.py 中扩展以下模型：

定义“什么是一场好的对话”。

字段名	类型	说明
`id`	Integer	主键
`name`	String	规则名称 (e.g., "礼貌用语规范")
`description`	Text	给 LLM 看的判分 Prompt (e.g., "客服必须使用'您'，禁止使用'你'...")
`weight`	Float	权重 (1-10)
`is_active`	Boolean	开关

存储每次评分的详细结果。

字段名	类型	说明
`id`	Integer	主键
`session_id`	Integer	关联的会话 ID (FK)
`total_score`	Float	综合得分 (0-100)
`status`	String	状态 (Excellent, Pass, Warning, Critical)
`issues`	JSON	违规项详情列表 `[{rule: "礼貌", deduction: 5, reason: "使用了反问句"}]`
`suggestion`	Text	AI 给出的整体改进建议
`created_at`	DateTime	质检时间