IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

数据分析中位数的应用

数据抓取 2014-12-30 12:48:15 累计浏览 2,931 次
本机暂存

   过于平淡的折线图,总是觉得不能够更好的表达数据的内涵。如下做个对比

   A图

   1

   B图

   2

   对比A图和B图,哪个表达的重点更清晰呢?那必然是B图了,B图的特点是把最高的n个数字用不一样的图标展示了,起到了一目了然的效果。那么问题来来了?

   怎么从一组数据中计算出这个分界点呢?

   下面提供两个参考的算法:

   平均数:是指一组数据中所有数据之和再除以数据的个数,它是反映数据集中趋势的一项指标。

   中位数:把一组数据按从小到大的顺序排列,在中间的一个数字(或两个数字的平均值)叫做这组数据的中位数。

   但是我们会发现平均值可以被极端数据影响,表示平均水平,中位数表示中间水平。所以这里要用的是中位数的算法。

   写了一个中位数的函数

//中位数
 function mid_num($arr)
 {
	//排序 
         sort($data);
 
         $cnt=count($data);
 
         if($cnt%2==0)
         {
                 $x1=$cnt/2-1;
                 $x2=($cnt/2+1)-1;
                 return ($data[$x1]+$data[$x2])/2;
         }else{
                 $id=round($cnt/2);
                 return $data[$id-1];
         }
 }

同分类推荐文章

  1. 对基本有序的序列排序算法 (2026-06-11 17:46:49)
  2. Four Levels Of Customer Understanding (2026-05-22 21:00:00)
  3. 除法的意义 (2026-04-12 20:52:17)

查看更多 算法 文章 →

建议继续学习

  1. 关于memcache分布式一致性hash (累计阅读 11,820)
  2. 数学之美:StackOverflow问答排名算法 (累计阅读 11,442)
  3. 淘宝搜索:定向抓取网页技术漫谈 (累计阅读 9,531)
  4. PHP与递归Recursion (累计阅读 9,249)
  5. 你是那10%可以实现二分查找算法的程序员吗? (累计阅读 7,851)
  6. Hacker News 排名算法工作原理 (累计阅读 7,525)
  7. 神秘常量复出!用0x077CB531计算末尾0的个数 (累计阅读 6,561)
  8. 数学之美:Reddit评论排名算法 (累计阅读 6,026)
  9. 基于用户行为分析的搜索引擎自动性能评价 (累计阅读 5,780)
  10. 皮尔逊积矩相关系数的学习 (累计阅读 5,603)