IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:DBSCAN

共 1 篇相关文章

IT 累计浏览 3,399

密度聚类算法之OPTICS

这篇讲的是密度聚类算法OPTICS。它出发点是为了解决经典DBSCAN算法对邻域半径Eps和最小点数minPts这两个参数过于敏感的痛点。OPTICS作为DBSCAN的扩展,核心优势在于让聚类过程对半径参数Eps不再敏感,只需设定好minPts,轻微的Eps变化就不会干扰最终的聚类结构。 为了达成这一点,文章解释了两个关键新定义:核心距离和可达距离。核心距离是一个点成为核心对象所需的最小半径;可达距离则结合了核心距离,决定了点在排序中的位置。算法并不直接输出簇,而是通过维护“有序队列”和“结果队列”,生成一个基于可达距离的样本点排序。这个排序信息非常丰富,从它可以推导出在不同参数设置下DBSCAN的聚类结果。 最终,我们可以将这个排序可视化:以输出次序为横轴,可达距离为纵轴绘图。图中的“山谷”代表簇,谷越深簇越紧密;平坦区域或凸起则可能对应噪声。通过设定一个距离阈值切割这个图,就能灵活提取出聚类结构。文章最后还提及了OPTICS在异常检测、子空间聚类等方向的扩展算法。