聚类算法的公式
2025-08-26
聚类的定义 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。聚类算法是无监督的算法。 常见的相似度计算方法 闵可夫斯基距离Minkowski/欧式距离 在上述的计算中,当p=1时,则是计算绝对值距离,通常叫做曼哈顿距离,当p=2时,表述的是欧式距离。 杰卡德相似系数(Jaccard)...
常见的六大聚类算法
2025-08-21
以下是常见的六大聚类算法: 1. K均值聚类算法:K均值聚类算法是一种基于距离度量的聚类方法,其目标是将数据分为K个簇,使得同一簇内的数据彼此相似度较高,而不同簇之间的数据相似度较低。 2. 层次聚类算法:层次聚类算法是一种基于树形结构的聚类方法,其目标是将数据分为一系列层次结构中的簇,每个簇都包含一个或多个数据点。层次聚类算法分为自上而下和自下而上两种类型。 3. 密度聚类算法...