AI知识库

产品简介

AI Knowledge Brain (内部代号: Doc) 定位于企业的 首席知识官 (CKO)，而不仅仅是一个文档仓库。它将传统的“关键词检索”模式彻底革新为“语义理解与推理引擎”。它阅读过企业内的每一份文档，能够理解业务逻辑，处理跨部门的信息冲突，并主动为决策者提供情报。

核心理念

从管理员到 CKO: 不再是被动存储，而是主动理解。Doc 不仅仅是找文件，而是通过综合多个来源的信息来回答复杂问题。

核心能力

1. 全局中枢对话 (Global Chat Interface)

企业所有知识的统一入口。用户无需再去寻找特定的“人力资源库”或“技术文档库”。

意图路由: 系统自动识别用户提问的领域（如：“怎么报销？” -> 路由至财务库，“API 怎么调？” -> 路由至研发库）。
混合检索: 并行检索多个相关知识库，聚合 Top-K 最相关的切片。

2. 跨库检索与知识融合 (Cross-KB Fusion)

能够回答需要综合多个文档才能得出的结论。

多源推理: “对比一下2022年和2023年销售政策的主要变化。” (Doc 需要同时读取两份文档并进行对比总结)。
冲突检测: 当不同知识库中存在矛盾信息时（如旧版制度 vs 新版制度），自动提示风险。

3. 知识图谱与概念链接 (Concept Graph)

实体抽取: 自动从文档中提取关键实体（产品名、客户名、项目代号）。
关系发现: 建立跨文档的关联网络。例如点击“Project X”，自动关联出其《需求文档》（产品库）、《排期表》（项目库）和《验收报告》（测试库）。

4. 主动情报推送 (Proactive Insights)

变更通知: “您经常查阅的产品手册刚刚更新了。”
关联推荐: “您正在查看《产品手册》，以下是销售部门常用的《产品Q&A话术》，也许对您有用。”

运作流程

数据摄入与处理

文档 (PDF, Word, Markdown) 被上传至 Braindex 管道。经过 OCR、版面分析和语义分块 (Chunking) 后被向量化。

知识图谱构建

系统提取实体和关系，将孤立的文档切片链接成结构化的知识图谱 (SKG)，以支持更深层的推理。

推理与响应

当用户提问时，Brain Router 将问题分发给对应的检索器。Synthesis Engine (基于 GPT-4 等 LLM) 生成带有引用标注的精确答案。

反馈闭环

用户的互动（点赞、纠错）会被反馈到系统中，用于持续优化检索的相关性和知识库的准确性。

产品使用指南

1. 知识库管理

新建知识库: 进入控制台，点击“新建知识库”。选择“通用类型”或“问答类型”。
- SOP 知识库: 适合存放操作手册、规章制度。
- FAQ 知识库: 适合存放 Q&A 问答对。
上传与索引: 支持拖拽 PDF/Word/Markdown 文件上传。系统会自动进行解析 (ETL) -> 切片 (Chunking) -> 向量化 (Embedding)。
状态监控: 实时查看文档解析状态（排队中 -> 解析中 -> 索引完成）。

2. 调试与优化

切片预览: 点击文档详情，查看 AI 自动切分的段落。支持手动调整切片粒度（如：按标题切分 vs 按字符数切分）。
召回测试: 在右侧“调试窗口”输入问题，系统会展示检索到的 Top-K 知识片段及其相似度分数（Confidence Score）。
引用修正: 如果发现 AI 引用了错误的段落，可直接在调试窗口点击“修正”，人工指定正确答案，系统会自动生成一条测试用例。

最佳实践

文档规范: 建议上传结构清晰、带有标题层级的 Markdown 或 Word 文档。避免上传纯图片扫描件（虽然支持 OCR，但精度不如文本）。
问答对优化: 对于高频问题，建议直接上传 Excel 格式的 问题-答案 对，检索精度远高于长文档。
定期维护: 每月审查“低置信度”问题日志，针对 AI 回答不准的问题补充相应的知识文档。

常见问题 (FAQ)

Q: 上传的 PDF 文档解析失败怎么办？
- A: 请检查 PDF 是否为“纯图片扫描件”。如果是，请先使用 OCR 软件转为可编辑文本后再上传。单文件大小请控制在 50MB 以内。
Q: 为什么 AI 回答时引用了错误的段落？
- A: 可能是因为切片粒度设置不当。对于结构化强的文档，建议调大 chunk_size；对于碎片化信息，建议调小 chunk_size。您可以在“调试窗口”中微调。
Q: 知识库数据安全吗？
- A: 所有上传文档均经过 AES-256 加密存储。向量数据库部署在私有云/VPC 内，物理隔离，确保数据绝不外泄。

AI知识库

On this page