思渡AI Logo
产品手册AI知识库

AI知识库

企业知识大脑与首席知识官 (CKO) — 从文档存储走向智能认知引擎。

产品简介

AI Knowledge Brain (内部代号: Doc) 定位于企业的 首席知识官 (CKO),而不仅仅是一个文档仓库。它将传统的“关键词检索”模式彻底革新为“语义理解与推理引擎”。它阅读过企业内的每一份文档,能够理解业务逻辑,处理跨部门的信息冲突,并主动为决策者提供情报。

核心理念

从管理员到 CKO: 不再是被动存储,而是主动理解。Doc 不仅仅是找文件,而是通过综合多个来源的信息来回答复杂问题。

核心能力

1. 全局中枢对话 (Global Chat Interface)

企业所有知识的统一入口。用户无需再去寻找特定的“人力资源库”或“技术文档库”。

  • 意图路由: 系统自动识别用户提问的领域(如:“怎么报销?” -> 路由至财务库,“API 怎么调?” -> 路由至研发库)。
  • 混合检索: 并行检索多个相关知识库,聚合 Top-K 最相关的切片。

2. 跨库检索与知识融合 (Cross-KB Fusion)

能够回答需要综合多个文档才能得出的结论。

  • 多源推理: “对比一下2022年和2023年销售政策的主要变化。” (Doc 需要同时读取两份文档并进行对比总结)。
  • 冲突检测: 当不同知识库中存在矛盾信息时(如旧版制度 vs 新版制度),自动提示风险。

3. 知识图谱与概念链接 (Concept Graph)

  • 实体抽取: 自动从文档中提取关键实体(产品名、客户名、项目代号)。
  • 关系发现: 建立跨文档的关联网络。例如点击“Project X”,自动关联出其《需求文档》(产品库)、《排期表》(项目库)和《验收报告》(测试库)。

4. 主动情报推送 (Proactive Insights)

  • 变更通知: “您经常查阅的产品手册刚刚更新了。”
  • 关联推荐: “您正在查看《产品手册》,以下是销售部门常用的《产品Q&A话术》,也许对您有用。”

运作流程

数据摄入与处理

文档 (PDF, Word, Markdown) 被上传至 Braindex 管道。经过 OCR、版面分析和语义分块 (Chunking) 后被向量化。

知识图谱构建

系统提取实体和关系,将孤立的文档切片链接成结构化的知识图谱 (SKG),以支持更深层的推理。

推理与响应

当用户提问时,Brain Router 将问题分发给对应的检索器。Synthesis Engine (基于 GPT-4 等 LLM) 生成带有引用标注的精确答案。

反馈闭环

用户的互动(点赞、纠错)会被反馈到系统中,用于持续优化检索的相关性和知识库的准确性。

产品使用指南

1. 知识库管理

  • 新建知识库: 进入控制台,点击“新建知识库”。选择“通用类型”或“问答类型”。
    • SOP 知识库: 适合存放操作手册、规章制度。
    • FAQ 知识库: 适合存放 Q&A 问答对。
  • 上传与索引: 支持拖拽 PDF/Word/Markdown 文件上传。系统会自动进行解析 (ETL) -> 切片 (Chunking) -> 向量化 (Embedding)。
  • 状态监控: 实时查看文档解析状态(排队中 -> 解析中 -> 索引完成)。

2. 调试与优化

  • 切片预览: 点击文档详情,查看 AI 自动切分的段落。支持手动调整切片粒度(如:按标题切分 vs 按字符数切分)。
  • 召回测试: 在右侧“调试窗口”输入问题,系统会展示检索到的 Top-K 知识片段及其相似度分数(Confidence Score)。
  • 引用修正: 如果发现 AI 引用了错误的段落,可直接在调试窗口点击“修正”,人工指定正确答案,系统会自动生成一条测试用例。

最佳实践

  • 文档规范: 建议上传结构清晰、带有标题层级的 Markdown 或 Word 文档。避免上传纯图片扫描件(虽然支持 OCR,但精度不如文本)。
  • 问答对优化: 对于高频问题,建议直接上传 Excel 格式的 问题-答案 对,检索精度远高于长文档。
  • 定期维护: 每月审查“低置信度”问题日志,针对 AI 回答不准的问题补充相应的知识文档。

常见问题 (FAQ)

  • Q: 上传的 PDF 文档解析失败怎么办?
    • A: 请检查 PDF 是否为“纯图片扫描件”。如果是,请先使用 OCR 软件转为可编辑文本后再上传。单文件大小请控制在 50MB 以内。
  • Q: 为什么 AI 回答时引用了错误的段落?
    • A: 可能是因为切片粒度设置不当。对于结构化强的文档,建议调大 chunk_size;对于碎片化信息,建议调小 chunk_size。您可以在“调试窗口”中微调。
  • Q: 知识库数据安全吗?
    • A: 所有上传文档均经过 AES-256 加密存储。向量数据库部署在私有云/VPC 内,物理隔离,确保数据绝不外泄。