3.3.3 运行与评估简单的 DSPy 程序 3.3.3 运行与评估简单的 DSPy 程序 在 DSPy 中,运行和评估程序是开发迭代过程中至关重要的环节。本节将深入探讨如何运行和评估一个简单的 DSPy 程序,涵盖从数据准备到指标分析的各个方面。我们将通过示例代码和图示,清晰地展示整个流程。 1. 数据准备 首先,我们需要准备用于训练和评估的数据。DSPy 接受多种数据格式,常见的包括列表、字典和 Pandas DataFrame。数据集中需要包含输入和期望输出(gold labels)。 例如,假设我们正在构建一个问答系统,可以使用以下格式的数据: 2. 定义评估指标 在运行程序之前,我们需要明确评估指标。评估指标用于衡量模型的性能,并指导优化过程。