10.2 偏见与公平性问题 10.2 大模型背景下的偏见与公平性问题 10.2.1 偏见与公平性的概念界定 在讨论LLMs的偏见与公平性问题之前,明确这两个概念至关重要。 偏见 (Bias) 在机器学习领域,尤其是在LLMs中,指的是模型在学习过程中系统性地倾向于某些结果或观点,而非客观、中立的立场。这种倾向性可能导致模型在面对不同群体或情境时产生不公正或歧视性的输出。偏见并非总是负面的,例如,归纳偏置是机器学习模型泛化能力的基础。然而,当偏见导致不公平结果时,就成为了需要解决的问题。 公平性 (Fairness) 在AI领域,公平性是一个多维度、复杂且充满争议的概念。它没有统一的定义,不同的应用场景和伦理视角下,公平性的内涵也各不相同。