关于绘制统计曲线算法的一些思考
浏览:1859次 出处信息
这篇文章还是关于fuload项目的问题,由于压力测试的结果最后是要给出可视化统计曲线及饼图的,所以这里就涉及到数据上报时间,格式,以及绘制算法的问题。
饼图比较简单,我们这里主要看调用时间的曲线图。
我们采用自顶向下的方法来分析,先分别来看输入和输出。
前提:
- 有多台机器(称为从机),同时想远程机器上报,由远程机器(称为主机)统一绘制。
输入:
- 一段时间内(如5分钟):起始时间,结束时间,总的调用时间,调用次数,平均调用时间。
输出:
- 根据平均响应时间,绘制时间为横轴,调用时间为纵轴的走势曲线图。
这里主要有几个难点:
- 1.对于这“一段时间”来说,每台从机是不一样的,即可能A机器报了7点5分~7点10分的数据,而B机器报了7点7分到7点12分的数据,也可以理解为主机端接收到每台从机上报数据时间点是不统一的。要解决这个问题,我们可以通过对上报数据做分片的处理,简单来说,既然我们选择了5分钟上报一次,那么统计图的X轴一定是5分钟一个统计点,比如拿7点5分~7点10分这段时间来说,7点7分~7点12分的数据有3/5落在了这个时间段(具体计算可以更精确),另外有2/5落在了7点10分~7点15分,这样统计曲线就可以绘制出来了。
- 2.相信从机时间还是主机时间。虽然每台从机都将自己的时间起始终止点报上来了,但是我们是否应该相信呢。如果我们选择相信,这里有一个风险就是每台从机之间及和主机之间可能时间不一致。但如果统一按照主机时间,则必须保证从机在收集完数据之后立即上传到主机,防止滞后。
这样解决方案就比较清楚了,我们来复述一下:
- a)从机上报格式为:
- 起始时间(暂时无用)
- 结束时间(暂时无用)
- 总调用时间
- 调用次数
- b)主机接收到数据之后,将数据按时间段分片。见上面的难点的第1条。
这只是今晚总结的一个思路,等代码开始写之后,再将绘制的图表发上来。
建议继续学习:
- 获取指定(访客)IP的所有信息,地址、邮政编码、国家、经纬度等的API (阅读:5354)
- 统计指标和术语汇总 (阅读:2721)
- 如何确定抽样统计的最小样本量 (阅读:2460)
- 统计数据背后的真相 ― 读《How to lie with statistics》 (阅读:2228)
- 我们需要什么样的网站数据 (阅读:2176)
- “破网”利器一箩筐——移动互联网分析工具推荐 (阅读:1723)
- 框计算垂直搜索之统计篇 (阅读:1547)
- 页面跳转时,统计数据丢失问题探讨 (阅读:1197)
- Oracle数据库升级迁移、SPA及统计信息 (阅读:854)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
扫一扫订阅我的微信号:IT技术博客大学习
<< 前一篇:多线程程序中操作的原子性
后一篇:Nginx的connections数组 >>
文章信息
- 作者:Dante 来源: Vimer
- 标签: 统计 统计曲线
- 发布时间:2010-12-02 22:29:52
建议继续学习
近3天十大热文
- [41] 界面设计速成
- [40] IOS安全–浅谈关于IOS加固的几种方法
- [38] 图书馆的世界纪录
- [38] Oracle MTS模式下 进程地址与会话信
- [37] 如何拿下简短的域名
- [37] android 开发入门
- [35] 【社会化设计】自我(self)部分――欢迎区
- [34] 视觉调整-设计师 vs. 逻辑
- [34] 程序员技术练级攻略
- [33] 读书笔记-壹百度:百度十年千倍的29条法则