标签：聚类算法

共 2 篇相关文章

IT 累计浏览 2,898

聚类算法之Mean Shift

这篇讲的是Mean Shift聚类算法。它从大家熟悉的K-Means算法出发，指出了其需要预先设定聚类个数k的局限，从而引出Mean Shift的核心优势：不需要预设类别数量，能自动发现数据的簇结构。文章梳理了算法的发展脉络，从Fukunage提出概念，到Yizong Cheng引入核函数与权重系数进行关键改进，使得算法能根据样本距离赋予不同权重，更加精确。接着，文章列举了Mean Shift在多个领域的成功应用，包括图像平滑、分割、目标跟踪等计算机视觉任务，以及常规的用户聚类等场景。其理论部分清晰地解释了Mean Shift向量的含义——即邻域内所有点相对于中心点的偏移均值，并通过迭代移动直至收敛来找到密度峰值。文章进一步阐述了核函数如何度量不同样本的贡献，使得算法原理更加完善。整体上，文章将Mean Shift定位为一种基于密度估计、迭代寻优的实用聚类工具，尤其适用于类别未知的复杂数据分析。

IT 累计浏览 3,123

基于用户尺度评价的人物角色分类方法与实践

这篇讲的是一种基于用户关注度的人物角色分类实践，以1688网站的供应商信息调研为具体案例。文章从“用户关注什么”这一核心目标出发，通过一份覆盖3032名有效用户的问卷，收集他们对17项供应商信息的5级关注度评分。接着，作者运用项目分析、信度检验和因子分析，将纷杂的信息项收敛为四个关键的评价维度：基本信息、客户满意度、供应能力和交易历史。基于这四个维度的因子得分，研究进一步对用户样本进行聚类，最终识别出三类典型角色：高度关注所有信息的“全面考察型”（占42.5%）、尤为看重满意度的“口碑驱动型”（占41.9%）以及关注度普遍较低的“轻度浏览型”（占15.7%）。这种划分直接揭示了不同用户群体在决策时的信息需求重心。文章的价值在于，它展示了一套从量化数据到设计洞察的完整流程。这些发现不仅为1688重构供应商信息页面的布局逻辑（如聚合关联信息）提供了依据，也说明了基于用户行为的分类如何辅助设计师识别核心用户，并理解其行为背后的动机，让设计决策更有据可依。