技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 系统运维 --> storm集群的监控

storm集群的监控

浏览:3389次  出处信息

     所谓兵马未动,粮草先行,准备将storm用在某个项目中做实时数据分析。无论任何系统,一定要有监控系统并存,当故障发生的时候你能第一个知道,而不是让别人告诉你,那处理故障就很被动了。

     因此我写了这么个项目,取名叫storm-monitor,放在了github上

      https://github.com/killme2008/storm-monitor

     主要功能如下:

    1.监控supervisor数目是否正确,当supervisor挂掉的时候会发送警告。

    2.监控nimbus是否正常运行,monitor会尝试连接nimbus,如果连接失败就认为nimbus挂掉。

    3.监控topology是否正常运行,包括它是否正常部署,是否有运行中的任务。

     当故障发生的时候通过alarm方法警告用户,开放出去的只是简单地打日志。因为每个公司的告警接口不一样,所以你需要自己扩展,修改alarm.clj即可。我们这儿就支持旺旺告警和手机短信告警。

     基本的原理很简单,对supervisor和topology的监控是通过zookeeper来间接地监控,通过定期查看path是否存在。对nimbus的监控是每次起一个短连接连上去,连不上去即认为挂掉。

     整个项目也是用clojure写。你的机器需要安装leinexec插件,然后将你的storm.yaml拷贝到conf目录下,编辑monitor.yaml设定监控参数如检查间隔等,最后启动start.sh脚本即可。默认日志输出在logs/monitor.log。

    

    

dennis 2011-12-01 21:02 发表评论

建议继续学习:

  1. Mysql监控指南    (阅读:19803)
  2. 批量添加主机到cacti+nagios的监控报警系统中    (阅读:13286)
  3. 我常用的主机监控shell脚本    (阅读:11511)
  4. 7 天打造前端性能监控系统    (阅读:10136)
  5. 如何监控HP服务器硬件状态    (阅读:9114)
  6. Cacti 添加 Nginx 监控    (阅读:8925)
  7. Linux下三种常用的流量监控软件对比    (阅读:8694)
  8. Cacti 添加 Memcached 监控    (阅读:8125)
  9. Cacti 添加 Apache 监控    (阅读:7585)
  10. 你应该知道的16个Linux服务器监控命令    (阅读:6847)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
<< 前一篇:storm集群的监控
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1