IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

数据分析中常用的数据模型

标点符 2011-07-30 21:32:23 累计浏览 7,824 次
本机暂存

    一、抽样分析模型

    原图已失效

    建模方法

    首先确定统计的时间段,暂定为15天;从数据库中随机抽取若干名用户作为分析样本建立分析模型,模型图中假定抽样人数为100人,15天内最高使用量为200最少为15,在横坐标轴依次画出每人的使用量立柱图;然后向右侧画出最高点和最低点的水平引线;然后垂直划线连接水平线,得到上下交点之间的线段,分别在线段的中点和三分点处水平画出“中分线”“上分线”“下分线”。

    分析方法

    根据立柱图的分布比率确定哪条线为“多”“少”的分割线;

  • 高柱和低柱比较均衡,则以中分线为分割线;
  • 普遍偏高,少量低柱,则以上分线为分割线;
  • 普遍偏低,少量高柱,则以下分线为分割线;
  •     优点:统计建模方便快捷;

        缺点:不能获得准确的宏观数据,仅获得近似的参考数据。

        二、数据区间对比分析模型

        原图已失效

        建模方法

        假定统计时间段为15天,抽取10000人,分别统计他们的使用量,假定最多使用量为200,最少使用量为0;模型的横坐标为使用量,纵坐标为发送人数;在横坐标上,以10条为量级,从少到多依次画出不同数量区间的发送人数立柱图,连接主图顶部重点,得到人数波动曲线。

        分析方法

  • 波动曲线的顶点和与顶点最近的最低点,即为使用量“多”和“少”的分水岭,连接两点,取中点画垂直线,即得到二分法的临界线,左侧为非活跃用户,右侧为活跃用户。如图示
  • 根据柱状图在不同量级的分布状况,也可以采用多分法细分用户类型,如图示。
  •     三、对比分析模型曲线类型分析

        利用“数量区间对比模型”分析,不仅能得到分类用户量级标准、人数、和使用量数据,通过分析使用量曲线类型,可以得到产品和运营的宏观印象。以下对四种典型的曲线类型进行分析。

        原图已失效

        常见状态(产品研发和市场发展的初期)

  • 有基本稳定的用户群
  • 缺少优质用户,拔高乏力
  • 缺少高粘度产品(功能)
  • 基本功能还行,除了基本功能,别的不爱用
  •     原图已失效

        维持状态(市场发展中后期)

  • 通过若干时间的经营,产品有一定影响,同时拥有少量fans
  • 对初级用户的引导不够,致使中间用户空虚
  • 产品本身或有某种缺陷,不为多数人接受,只有少数人突破瓶颈,习惯产品才成长成高级
  •     原图已失效

        理想状态(初、中、后期)

  • 市场发展势头良好,用户上手快,越用越熟练,越用越喜欢
  • 证明产品功能,用户教育俱佳
  • 需加大对潜在用户的宣传力度,扩大用户数
  •     原图已失效

        严峻状态(初、中、后期)

  • 市场发展形势不客观,用户浅尝辄止,流失严重
  • 产品存在重大缺陷或基本功能设计实现欠佳,无法留住用户
  • 宣传引导力度不够
  • 同分类推荐文章

    1. 第七章 事务 (2026-04-07 08:00:00)
    2. 第六章:分区 (2026-03-29 08:00:00)
    3. Neko Master: 从 0 到 1K+ Star 的 Vibe Coding 实践 (2026-03-01 08:00:00)

    查看更多 数据库 文章 →

    建议继续学习

    1. 我对技术方向的一些反思 (累计阅读 11,254)
    2. TT的作者出新作品鸟:kyoto tycoon (累计阅读 7,886)
    3. TinyURL设计方案 (累计阅读 7,269)
    4. 数学之美:Reddit评论排名算法 (累计阅读 5,956)
    5. 5分钟搞定你的Rest Server (累计阅读 5,690)
    6. 从Rails聊聊小公司的研发团队建设 (累计阅读 5,523)
    7. 老托的Oracle 数据库Patch概念性小常识 (累计阅读 5,478)
    8. 关于session和memcache的若干问题 (累计阅读 5,267)
    9. geohash:用字符串实现附近地点搜索 (累计阅读 5,089)
    10. Mysql中的分页写法 (累计阅读 4,769)