FINCH:基于最近邻的无参数聚类方法
论文标题 | Efficient Parameter-free Clustering Using First Neighbor Relations
论文来源 | CVPR 2019
论文链接 | Efficient Parameter-free Clustering Using First Neighbor Relations
源码链接 | https://github.com/ssarfraz/FINCH-Clustering
TL;DR
本文中提出一种无超参、无需指定距离阈值或聚类数量的无监督聚类方法。整体思想感觉和层次聚类相差不大但使用了最近邻的样本点聚类。
Algorithm/Model
文中使用邻居矩阵来表示样本间的邻接关系,其定义如下:
其中 代表第 个点的最近邻点。 是数据的邻接矩阵。
以太阳系中行星属性聚类为例,如下图所示:
算法流程如下所示:
根据确定数量的聚类算法如下所示:
Experiment Detail
实验数据集如下表所示:
实验对比结果如下所示:
Thoughts
- FINCH方法不能发现单个样本点的簇
- FINCH如何确定最优的聚类簇数量?
联系作者
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 梦家博客!
评论
TwikooValine