5.4 预训练语言模型:BERT, GPT系列概述 5.4 预训练语言模型:BERT, GPT 系列概述 预训练语言模型 (Pre-trained Language Models, PLMs) 是近年来自然语言处理 (NLP) 领域取得突破性进展的关键技术。它们通过在大规模文本语料库上进行预训练,学习通用的语言表示,然后针对特定任务进行微调,从而在各种 NLP 任务上取得了显著的性能提升。本节将重点介绍两种最具代表性的预训练语言模型:BERT 和 GPT 系列。 5.4.1 预训练语言模型的概念与优势 传统的 NLP 模型通常需要针对每个特定任务从头开始训练,这需要大量的标注数据和计算资源。预训练语言模型则通过在大规模无标注数据上进行预训练,学习到通用的语言知识,例如词汇、语法、语义等。