3.3 聚类任务 3. Scikit-learn 实践应用领域:3.3 聚类任务详解 3.3.1 聚类任务概述 聚类 (Clustering) 是一种无监督学习 (Unsupervised Learning) 技术,旨在将数据集中的样本划分为若干个“簇”(cluster),使得同一簇内的样本彼此相似,而不同簇的样本彼此相异。在没有预先标记的类别信息的情况下,聚类算法通过数据自身的内在性质,发现数据分布的规律,并将相似的数据点归为一类。 聚类任务的核心目标: 簇内相似性 (Intra-cluster similarity): 同一簇内的样本尽可能相似。 簇间差异性 (Inter-cluster dissimilarity): 不同簇的样本尽可能相异。