type
status
password
date
slug
summary
category
URL
tags
icon
名称 | 类别 | 优点 | 缺点 |
kmeans | 划分聚类 | 1、原理比较简单,实现也是很容易,收敛速度快。 2、对处理大数据集,该算法保持可伸缩性和高效性。3、复杂度是相对可伸缩的和高效率的是,其中是所有对象的数目,是簇的数目,是迭代的次数。4、当簇是球状的,簇与簇之间区别明显时他的聚类效果很好。 | 1、对值敏感。2、对噪声和离群点比较敏感。3、初始聚类中心的选择,能够加快聚类速度。4、只能使用凸集,换句话说簇最好是球状的。 |
划分聚类 | 解决了kmeans对噪声异常点比较敏感的问题 | K值不好把握 | |
密度聚类 | 1、自适应的聚类,不需要设定k值。2、对噪声不敏感。3、能发现任意形状的簇。4、聚类结果没有偏倚,相对的K-Means之类的聚类算法初始值类结果有很大影响 | 1、对两个参数的设置敏感,即圆的半径eps、阈值MinPts。2、DBSCAN数量越大,收敛时间越长,算法复杂度是 找出 Eps 邻域中的点所需要的时间,是点的个数。最坏情况下,时间复杂度是,用 kd 树 可以降到 | |
层次聚类 | 1、距离和规则的相似度容易定义,限制比较少。2、不需要预先判断制定聚类数。3、可以发现类的层次关系 | 1、计算复杂度高,算法复杂度是 ,是点的个数。2、离散值能够产生很大影响。3、算法可能聚类成链状 | |
ㅤ | ㅤ | ㅤ |