RAG


3.3 RAG框架的评估与监控


文档摘要

3.3 RAG框架的评估与监控 3.3 RAG框架的评估与监控 3.3.1 评估指标 评估RAG框架的性能需要考虑多个维度,包括检索质量、生成质量以及整体的问答效果。以下是一些常用的评估指标: 检索质量: Recall@K: 在检索结果的前K个文档中,有多少比例的文档与答案相关。 Precision@K: 在检索结果的前K个文档中,有多少比例的文档是相关的。 NDCG@K (Normalized Discounted Cumulative Gain): 衡量检索结果排序质量的指标,考虑了相关文档的位置。 Mean Reciprocal Rank (MRR): 所有问题中,第一个相关文档排名的倒数的平均值。 生成质量: Fluency: 生成文本的流畅度和自然度。


发布者: 作者: 转发
评论区 (0)
U