Workflow
执行步骤
01
确定首批业务场景
先选客服、销售、交付或内部制度中的一个高频场景,避免一开始导入全公司所有资料。
02
盘点文档和权限
整理文档来源、负责人、更新时间、可访问部门和敏感等级,为后续权限问答打基础。
03
清洗资料并建立测试集
删除重复、过期和无标题资料,补齐标准问题和正确答案,用来测试RAG效果。
04
配置检索、引用和拒答规则
设置文档切分、检索召回、引用来源、权限过滤和资料不足时的拒答方式。
05
上线灰度并持续更新
先给小范围用户使用,收集错误答案、缺失资料和高频问题,再建立固定更新机制。
Checklist
上线前检查清单
- 首批场景足够具体,不是一上来做全公司问答
- 每份文档有来源、更新时间和负责人
- 敏感文档有部门或角色权限边界
- 答案必须标注引用来源
- 资料不足时AI必须拒绝编造
Metrics
关键指标
命中率衡量检索能否找到相关资料
准确率衡量答案是否符合标准问答集
引用完整率衡量答案是否可追溯
人工转接率衡量知识库覆盖不足的部分
FAQ
常见问题
企业知识库上线前最容易忽略什么?
最容易忽略文档治理和权限边界。资料越乱,AI越容易答错;权限越模糊,越容易带来安全风险。
RAG知识库需要一次性导入所有文件吗?
不建议。先从一个高频业务场景开始,用测试集验证准确率,再逐步扩展文档范围。
如何判断RAG知识库是否可上线?
至少要验证高频问题准确率、引用来源、拒答边界、权限过滤和反馈修正流程。