3.3 聚类任务

文档摘要

3.3 聚类任务 3. Scikit-learn 实践应用领域：3.3 聚类任务详解 3.3.1 聚类任务概述聚类 (Clustering) 是一种无监督学习 (Unsupervised Learning) 技术，旨在将数据集中的样本划分为若干个“簇”(cluster)，使得同一簇内的样本彼此相似，而不同簇的样本彼此相异。在没有预先标记的类别信息的情况下，聚类算法通过数据自身的内在性质，发现数据分布的规律，并将相似的数据点归为一类。聚类任务的核心目标：簇内相似性 (Intra-cluster similarity)：同一簇内的样本尽可能相似。簇间差异性 (Inter-cluster dissimilarity)：不同簇的样本尽可能相异。