技术架构文档数字员工系统设计
数字员工系统设计
数字员工(Digital Employee)模块详细设计与实施方案
版本: v1.0 日期: 2026-01-22 状态: 规划完成 -> 开发实施
1. 模块概述 (Module Overview)
数字员工不仅仅是简单的聊天机器人,而是具备**“记忆”、“技能”和“执行力”**的自主智能体。该模块旨在通过标准化的人设定义与工具挂载,将 AI 转化为企业真实的劳动力,处理从信息调研到业务操作的复杂任务。
2. 核心功能清单 (Feature List)
| 模块 | 功能点 | 描述 | 优先级 |
|---|---|---|---|
| 员工管理 | 员工创建与定岗 | 定义员工姓名、头像、职位(如:高级分析师、内容小编)及人设 Prompt。 | P0 |
| 技能(Tool)配置 | 为员工挂载具体能力,如:Google搜索、RPA浏览器、数据库查询、发邮件。 | P0 | |
| 知识库绑定 | 绑定特定的知识库(RAG),使其具备垂直领域专业知识(如:只懂售后的客服)。 | P1 | |
| 任务中心 | 使命(Mission)下达 | 用户输入模糊的宏观指令(如:“调研竞品X的最新价格”),而非单轮对话。 | P0 |
| 任务拆解(Planning) | 自动将使命拆解为具体的执行步骤(Sub-tasks)。 | P1 | |
| 执行监控 | 实时查看员工的“思考过程”(Chain of Thought)和工具调用结果。 | P1 | |
| 工作台 | 人机协作(HIL) | 员工在执行关键步骤(如:发送公关稿)前请求人类审批。 | P2 |
| 短期/长期记忆 | 记住过往的任务结果和用户偏好,避免重复教导。 | P2 |
3. 技术实施方案 (Technical Implementation)
3.1 数据库模型设计 (Database Schema)
扩展现有的 database/models.py,新增以下实体:
3.2 后端架构 (Backend) - services/geo-brain
- Agent 核心引擎 (
core/agents/):- Planner (大脑):使用 ReAct 或 PDDL 思想,将用户
Objective拆解为Steps。建议初期使用简单的线性 Loop 结构,后续引入 LangGraph。 - Tool Registry (手脚):建立一个工具注册中心,映射
search_tool->GoogleSearchAPI,browser_tool->RPA-Worker。
- Planner (大脑):使用 ReAct 或 PDDL 思想,将用户
- API 接口 (
routers/agent_router.py):POST /agents/{id}/chat: 与数字员工直接对话(调试用)。POST /missions: 发布异步任务。GET /missions/{id}/logs: 获取执行日志流(Stream)。
3.3 前端交互 (Frontend) - apps/web-console
- 创建向导 (
/workforce/create):- 步骤1:人设设定。选择模板(如“品牌分析师”),系统自动填充 System Prompt。
- 步骤2:技能勾选。复选框形式选择该员工能用什么工具。
- 步骤3:知识库连接。下拉选择已上传的
docs或knowledge。
- 任务看板 (
/workforce/mission/{id}):- 左侧:任务拆解树(ToDo List)。
- 右侧:实时终端风格的日志输出("正在搜索..." -> "正在阅读页面..." -> "生成报告中...")。
3.4 执行层 (Execution)
- 轻量级任务:在
geo-brain容器内直接通过 LangChain/OpenAI Function Call 执行(如搜索、写文案)。 - 重量级任务 (RPA):通过消息队列将任务派发给
services/rpa-worker(如爬取动态网页、模拟登录操作)。
4. 下一步行动计划 (Action Plan)
- 完善模型 (Backend):
- 修改
models.py添加Mission和MissionLog表。
- 修改
- 实现规划器 (Backend):
- 在
core/agents/planner.py中编写一个基础的SimplePlanner,实现将简单指令拆解为3个步骤的能力。
- 在
- 开发创建页 (Frontend):
- 在前端实现创建员工的表单(人设+技能选择)。
- 联调任务流 (Integration):
- 实现点击“开始任务” -> 后端拆解 -> 前端展示进度条的闭环。