知识库策略设置
在这里我们可以设置知识库的选库策略、召回策略以及召回后处理策略。
选库阶段
在这里你可以设置智能体所查询的知识库,可以多选。如果选择了多个知识库,可以配置以下选库策略:
- 全部选择:所有选择的知识库都进行检索。
- 评分排序选择top N:大语言模型根据知识库的描述进行评分排序,然后选择顶部的N个。
- 分数阈值筛选:大语言模型根据知识库的描述进行评分排序,然后选择评分高于该阈值的知识库。
评分排序所使用的模型:设置用来选库的大语言模型,推荐使用一个尺寸小速度快的模型,比如GPT-4o mini
召回阶段
设置智能体的召回策略。
- 每个知识库召回的文档数:从每个知识库里召回的文档分块数。
- 向量相似度阈值:(仅对向量库有效)设置召回的文档分块的向量相似度的最大阈值,向量相似度越低越好,高于该阈值的文档分块将被排除。
- 文件描述评分阈值:(仅对文件库有效)设置召回的文件描述的评分的最小阈值,评分越高越好,低于该阈值的文件将被排除。
- 增强上下文:(仅对向量库有效)是否把命中的文档分块的前后分块一起召回。
召回文档后处理策略
设置召回后的处理策略。
- 全部选择:召回的文档分块全部提交给大语言模型进行生成。
- 评分排序top N:大语言模型把上下文的内容进行评分排序,然后选择顶部的N个。
- 分数阈值筛选:大语言模型把上下文的内容进行评分排序,然后选择评分高于该阈值的知识库。
评分排序所使用的模型:设置用来评分筛选文档分块的大语言模型,推荐使用一个尺寸小速度快的模型,比如GPT-4o mini。