数据分析中常用的数据模型
浏览:7221次 出处信息
一、抽样分析模型

建模方法
首先确定统计的时间段,暂定为15天;从数据库中随机抽取若干名用户作为分析样本建立分析模型,模型图中假定抽样人数为100人,15天内最高使用量为200最少为15,在横坐标轴依次画出每人的使用量立柱图;然后向右侧画出最高点和最低点的水平引线;然后垂直划线连接水平线,得到上下交点之间的线段,分别在线段的中点和三分点处水平画出“中分线”“上分线”“下分线”。
分析方法
根据立柱图的分布比率确定哪条线为“多”“少”的分割线;
优点:统计建模方便快捷;
缺点:不能获得准确的宏观数据,仅获得近似的参考数据。
二、数据区间对比分析模型

建模方法
假定统计时间段为15天,抽取10000人,分别统计他们的使用量,假定最多使用量为200,最少使用量为0;模型的横坐标为使用量,纵坐标为发送人数;在横坐标上,以10条为量级,从少到多依次画出不同数量区间的发送人数立柱图,连接主图顶部重点,得到人数波动曲线。
分析方法
三、对比分析模型曲线类型分析
利用“数量区间对比模型”分析,不仅能得到分类用户量级标准、人数、和使用量数据,通过分析使用量曲线类型,可以得到产品和运营的宏观印象。以下对四种典型的曲线类型进行分析。

常见状态(产品研发和市场发展的初期)

维持状态(市场发展中后期)

理想状态(初、中、后期)

严峻状态(初、中、后期)
建议继续学习:
- 五个免费开源的数据挖掘软件 (阅读:5897)
- 谈谈与数据打交道的工作 (阅读:4851)
- 如何对统计数据进行分析 (阅读:4581)
- 页面停留时间和网站停留时间详解 (阅读:4478)
- 浅析十三种常用的数据挖掘的技术 (阅读:3946)
- 音乐智能推荐 (阅读:3845)
- 使用Weka进行数据挖掘 (阅读:3754)
- WEB数据挖掘相关术语整理 (阅读:3153)
- 如何萃取海量数据的价值 (阅读:2890)
- 网络数据的背后――网络日志的分析指标 (阅读:2677)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
扫一扫订阅我的微信号:IT技术博客大学习
<< 前一篇:简析搜索引擎中网络爬虫的搜索策略
文章信息
- 作者:标点符 来源: 标点符
- 标签: 数据分析 数据挖掘 数据模型
- 发布时间:2011-07-30 21:32:23
建议继续学习
近3天十大热文
-
[919] WordPress插件开发 -- 在插件使用 -
[134] 解决 nginx 反向代理网页首尾出现神秘字 -
[54] 整理了一份招PHP高级工程师的面试题 -
[52] 全站换域名时利用nginx和javascri -
[52] 海量小文件存储 -
[52] 如何保证一个程序在单台服务器上只有唯一实例( -
[51] Innodb分表太多或者表分区太多,会导致内 -
[50] 用 Jquery 模拟 select -
[49] CloudSMS:免费匿名的云短信 -
[48] jQuery性能优化指南
