Skip to content

知识库策略设置

在这里我们可以设置知识库的选库策略、召回策略以及召回后处理策略。

alt text

选库阶段

在这里你可以设置智能体所查询的知识库,可以多选。如果选择了多个知识库,可以配置以下选库策略:

  • 全部选择:所有选择的知识库都进行检索。
  • 评分排序选择top N:大语言模型根据知识库的描述进行评分排序,然后选择顶部的N个。
  • 分数阈值筛选:大语言模型根据知识库的描述进行评分排序,然后选择评分高于该阈值的知识库。

评分排序所使用的模型:设置用来选库的大语言模型,推荐使用一个尺寸小速度快的模型,比如GPT-4o mini

召回阶段

设置智能体的召回策略。

  • 每个知识库召回的文档数:从每个知识库里召回的文档分块数。
  • 向量相似度阈值:(仅对向量库有效)设置召回的文档分块的向量相似度的最大阈值,向量相似度越低越好,高于该阈值的文档分块将被排除。
  • 文件描述评分阈值:(仅对文件库有效)设置召回的文件描述的评分的最小阈值,评分越高越好,低于该阈值的文件将被排除。
  • 增强上下文:(仅对向量库有效)是否把命中的文档分块的前后分块一起召回。

召回文档后处理策略

设置召回后的处理策略。

  • 全部选择:召回的文档分块全部提交给大语言模型进行生成。
  • 评分排序top N:大语言模型把上下文的内容进行评分排序,然后选择顶部的N个。
  • 分数阈值筛选:大语言模型把上下文的内容进行评分排序,然后选择评分高于该阈值的知识库。

评分排序所使用的模型:设置用来评分筛选文档分块的大语言模型,推荐使用一个尺寸小速度快的模型,比如GPT-4o mini。

Last updated: