IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:聚类算法

共 2 篇相关文章

IT 累计浏览 2,898

聚类算法之Mean Shift

这篇讲的是Mean Shift聚类算法。它从大家熟悉的K-Means算法出发,指出了其需要预先设定聚类个数k的局限,从而引出Mean Shift的核心优势:不需要预设类别数量,能自动发现数据的簇结构。 文章梳理了算法的发展脉络,从Fukunage提出概念,到Yizong Cheng引入核函数与权重系数进行关键改进,使得算法能根据样本距离赋予不同权重,更加精确。接着,文章列举了Mean Shift在多个领域的成功应用,包括图像平滑、分割、目标跟踪等计算机视觉任务,以及常规的用户聚类等场景。 其理论部分清晰地解释了Mean Shift向量的含义——即邻域内所有点相对于中心点的偏移均值,并通过迭代移动直至收敛来找到密度峰值。文章进一步阐述了核函数如何度量不同样本的贡献,使得算法原理更加完善。整体上,文章将Mean Shift定位为一种基于密度估计、迭代寻优的实用聚类工具,尤其适用于类别未知的复杂数据分析。

IT 累计浏览 3,123

基于用户尺度评价的人物角色分类方法与实践

这篇讲的是一种基于用户关注度的人物角色分类实践,以1688网站的供应商信息调研为具体案例。 文章从“用户关注什么”这一核心目标出发,通过一份覆盖3032名有效用户的问卷,收集他们对17项供应商信息的5级关注度评分。接着,作者运用项目分析、信度检验和因子分析,将纷杂的信息项收敛为四个关键的评价维度:基本信息、客户满意度、供应能力和交易历史。 基于这四个维度的因子得分,研究进一步对用户样本进行聚类,最终识别出三类典型角色:高度关注所有信息的“全面考察型”(占42.5%)、尤为看重满意度的“口碑驱动型”(占41.9%)以及关注度普遍较低的“轻度浏览型”(占15.7%)。这种划分直接揭示了不同用户群体在决策时的信息需求重心。 文章的价值在于,它展示了一套从量化数据到设计洞察的完整流程。这些发现不仅为1688重构供应商信息页面的布局逻辑(如聚合关联信息)提供了依据,也说明了基于用户行为的分类如何辅助设计师识别核心用户,并理解其行为背后的动机,让设计决策更有据可依。