IT技术博客大学习 共学习 共进步

谈谈服务器基础架构工具的选择

Codyy技术团队 2009-11-27 18:17:05 浏览 2,484 次

    监控工具软件

    监控服务器,也就是密切关注其运行。这样做的目的无外乎两个:发现并修理故障,优化系统。

    服务器运行过程中会出现很多问题:硬件有可能坏掉,软件有可能没有很好地运行,服务器可能完全宕机,还有更糟糕的情况,服务器看似运行但实际上已经不再履行任何“生活机能”!一个公司所管理的服务器越多,出现问题的可能性就越大,监控这些服务器的难度也就越大。必须时刻警惕,这些服务器是不是在很好地运行?这些服务器可靠吗?这些问题都属于服务器监控工具这一类特殊软件的范畴。

    监控工具所要监控的内容很多,总体可以分为三大块:监控服务器运行(运行状态)、监控服务器通信量(包括进和出)、监控服务器使用结果(日志、统计、分析)。用于以上各部分监控的产品也都包含很多功能,通常我们可以按照下面分类方式去考察监控软件:

    ● 物理硬件监控,即密切关注诸如硬盘等部件的温度、电源以及机能。所需监控的大都是相当关键的部件,它们一旦出现故障就意味着服务器死机。用于监控硬件的软件也都是特定的,如运行在IBM服务器上的软件可能就不能运行在Dell服务器上。

    ● 服务器性能监控,即监控服务器的CPU使用率、可用磁盘空间、存储等,特别是在服务器很多的情况下,这既可以帮助发现并修理故障,也可以优化系统资源。

    ● 服务监控,所有的服务器都运行着很多服务(如:DNS、POP3、TCP等),其中很多对于服务器运行都是至关重要的,如果它们出现问题,那服务器也就没有作用了,所以很多监控软件专门提供类似服务。

    ● 网络监控, 服务器监控的很多领域都会与操作网络有关,所以网络监控也经常被认为是监控软件的单独一类,当然很多通用服务器监控工具都包含有这样的功能。

    另外,很多服务器监控工具是为某一特定类别的服务器(如:Web或数据库服务器)而设计。我们也提供了服务器监控工具的功能列表,需要指出的是,尽管在该表中我们尽力列举出所有功能,但是对于监控Web服务器或网络的复杂特性还只是浅尝即止。

    总体来说,服务器监控软件种类很多,市场上的产品不下百种。大多提供实时监控,显示服务器的当前状态,也提供服务器性能的历史监控记录。服务器监控工具的打包方法也有多种:它们经常被包含在一些大型服务器管理套件中,如IBM Tivoli、CA Unicenter;也有大量通用服务器监控工具,如 GFI的Server Monitor、BMC的Server Monitoring and Management;一些专用产品的功能特点都是针对特定的操作系统和服务器类型提供。

    服务器监控工具的选择过程通常也就是匹配几个主要因素:硬件、操作系统、功能(如Web或数据库)以及企业的优先喜好(如:更喜欢提供强大报告和分析能力的软件)。很多企业会根据其硬件产品提供商选择相应监控软件,如使用IBM X系列服务器的用户大多选择Tivoli;还有一些企业会寻找具有特定功能特点或能够运行于不同类型服务器的产品,这通常是发生在web和数据库服务器的监控情况下。

    这里特别提醒一点,当对不同的服务器监控产品进行比较时,评估其通知管理员的方式也是很重要的,是不是支持SMS及e-mail等方法对一些企业非常重要;另外,诸如远程服务器关机这样的远程控制方法也是具有相当实用价值的。

    配置工具软件

    最理想的状态下,企业环境中的每一台服务器都是以最佳效率运行,并能够在必要的时候被重新配置以适应迁移、增加以及变更等需求。但不用说,现实的服务器表现并不能这样如人所愿。

    一般来说,装载服务器和调整服务器运行的作业就是由远程服务器配置软件赋予的任务。这类软件也是形式多样的,包括有变更管理、许可管理、目录控制、性能检测等任务软件。而且,这还不包括远程客户端配置(桌面或移动),尽管这也是这类软件的一部分功能。

    配置大量服务器的工作往往也是令人生畏的,通常分为三个步骤:

    1. 软件部署和安装――新软件安装、升级或修复;

    2. 服务器的实际配置――设置,规则,级别,事件行为;

    3. 对变化进行测试以确保它们正常运行。

    配置管理软件明显的优势体现在集中和远程管理方面,它使得管理员不必从物理上去访问每台需要配置的服务器,还可以达到手动配置很难达到的同步级别;另外一个重要好处是具有记录什么时间、谁、针对什么、做了什么事情的自动日志生成功能。

    远程设备的部署、配置以及测试是需要相当谨慎的,配置过程中很多地方比其他服务器管理领域更容易出错,例如,一台服务器可能宕机或从网络中拔出,在一个服务器上正常工作的某一个软件可能在其他服务器上甚至没有办法启动,或者在某一个厂商的服务器上所做的变更可能就不能在另外一个厂家的服务器上生效。配置管理过程出现问题的情况很多,因为一种管理行为实际上只是针对一种服务器及其上的软件,而且经常会包含一系列紧急的、同时发生的、连续的变更。

    需要指出的是,尽管配置管理可以承诺达到实际的和及时的效果,但是这类软件产品也是最难选择和实现的产品类别之一。或许就是因为做好所有的事情是很困难的,这类软件产品一般都有明确的指向性,有的针对特定操作系统,有的针对特定应用类型(最常见的是数据库),还有的是针对特定的硬件。

    通常诸如IBM Tivoli这样的服务器基础架构管理套件已经包含有服务器(以及基于服务器的软件)配置工具,但目前还是有很多通用的配置管理器,所以在选择这类软件的时候,必须根据自己可能存在的配置情况选择合适软件来满足这些功能。我们在随后的软件工具功能列表中对可能出现的配置特性进行了列举,企业用户可以藉此去市场上选择一些提供类似功能的工具产品。

    对于配置管理,人们经常忽略的是,它与系统安全措施之间存在的必然联系,防火墙、端口探测器、间谍软件和防病毒软件,甚至诸如意外口令更改等都会影响到服务器的配置过程。因此,配置管理软件能否提供有助于安全的特性至关重要。

    一旦某一变更被部署和配置,通常必须首先确保该变更正常工作,并能带来预期的改善,这通常会涉及分析日志、事件报告和性能测试。有些配置管理软件自身就包括有测试功能,尽管它们支持第三方测试和性能监测。当这些都妥当以后,接下来重要的一步是需要制定一种“成功”配置的标准,然后依据这些标准来衡量配置的结果。

    总之,管理、监控、配置服务器的工具种类繁多,特色各异,在选择的时候还是应该多做分析比对。

    b03_7t1

建议继续学习

  1. Mysql监控指南 (阅读 21,102)
  2. 批量添加主机到cacti+nagios的监控报警系统中 (阅读 14,683)
  3. 分享一个JQUERY颜色选择插件 (阅读 14,063)
  4. 我常用的主机监控shell脚本 (阅读 13,104)
  5. 7 天打造前端性能监控系统 (阅读 11,063)
  6. 如何监控HP服务器硬件状态 (阅读 10,505)
  7. Cacti 添加 Nginx 监控 (阅读 10,363)
  8. Linux下三种常用的流量监控软件对比 (阅读 9,984)
  9. Cacti 添加 Memcached 监控 (阅读 9,162)
  10. Cacti 添加 Apache 监控 (阅读 8,984)