7、报警和警报的管理
对数据中心基础设施集中监控的目的是最大限度地减少系统停机时间,及时有效地应对系统问题。集中报警管理系统为数据中心提供一个统一的运营窗口,对临界报警这种比较严重的事件可以做到优先处理。对多个同时报警的故障,可以根据对业务的影响度决定其处理顺序。
更近一步的说,管理人员可以根据监测系统的数据来分析设备的运行状况,并执行有效的维护计划。
8、监测能源使用效率
在大多数情况下,数据中心并不会安装相应的能源使用使用监测设施。很多数据中心的管理员觉得安装这样的设施很没有必要,这对提高数据中心的能源使用效率并没有多大的效果。其实并不是这样的,建立一套能源使用状况监测系统对于提高能源使用效率有着很好的激励作用,它能够很直观的显示出数据中心内部的能源状况。这可以提醒数据中心的管理员应该时刻关注数据中心的能源使用率并提高。
建立这样的能源监测系统,可以根据数据轻松算出PUE值,有利于IT经理跟踪能源消耗,从而分析和优化能源的使用。
9、电池监测
为了防止数据丢失和提高正常运行时间,大多数数据中心需要一个专用的电池监测系统。电池监测系统可以把电池的潜在故障通知给管理员,最好的做法是实施一个监测系统,并跟踪串联电池组中的每节电池的健康状况。有效的电池跟踪监测系统包括对内阻参数的测量和对蓄电池充放电情况的监测,以确保测量的准确度。
UPS的许多用户认为UPS本身已带蓄电池监测功能,无需再安装另外的蓄电池监测系统。确实,大部分UPS都带有一定的蓄电池监测功能,可以监测组压及记录放电曲线,但是对于准确掌握每节蓄电池的运行状况这些监测是远远不够的。UPS一般只能监测组压,不能监测每节电池的电压,一旦某节电池失效,组压往往还是正常的,而对于串接的电池组来说,这是非常危险的。
10、远程监控管理
在减少能耗的趋势下,数据中心远程监控和管理应运而生。你可以用最小的人力成本来执行关键任务工作,且不管你身在何处,这也就是无人值守的概念。
但无论如何,远程管理确实节约了大量的成本。一个数据中心的管理者,只须考虑机架上的虚拟主机、高效的安全人员以及他的数据中心的地理位置,然后用远程管理操作数据中心,所有他所要做的就是坐视成本的急剧下降。此外,限制访问的另外的好处是,实际进入数据中心接触到计算机的人少了,因此发生意外及安全漏洞的机会也少了。这种远程管理用远程输入输出系统访问数据中心的服务器,这种方式还可以提高反应时间。通过这个系统,也可以实现地理上的独立性。
三、基础设施监控的效益评估
通过这10个步骤,数据中心关键设施的可用性和效率是可以量化的。几乎每个步骤都有助于监测数据中心的可用性,并能分析系统潜在问题从而提高响应速度。从整个监控系统中,管理员可以准确知道任何一个机架在什么时候发生了什么事件,集中报警管理和电池监测等基础设施监控从根本上消除了数据中心停机最常见的原因。
在许多情况下,这些系统是相对容易实现的,而且一旦安装,可以对数据中心优化提供可视的和必要的控制。