查字典论文网 >> 机房集中监控系统维护方法探讨

机房集中监控系统维护方法探讨

小编:

摘 要: 对机房集中监控系统三级监控单元SU、SC、SS所使用的各种物理设备的类型及其原理进行分析,提出有针对性的物理设备故障检测技术及日常维护方法。所探讨的这些故障检测技术及维护方法,均经过实践证明具有高准确度,可以为机房维护人员准确分析设备故障状态提供参考,及时有效地采取措施,提高工作效率和降低维护费用。

关键词: 监控系统; SU; SC; SS; 检测; 维护

Discussion on methods of maintaining centralized computer room monitoring system

Yu Shanshan

(Dehong Normal College, Mangshi, Yunnan 678400, China)

Abstract: The types and principles of physical equipment used in the third level monitoring unit (SU, SC, SS) in centralized monitoring system in computer rooms are analyzed. Some fault detection technology as well as daily maintenance methods, which have been proved to have high accuracy, are given. With the methods mentioned in the paper, the maintenance workers can identify the state of the equipment failure accurately and take effective measures to improve work efficiency and lower maintenance cost.

Key words: maintaining centralized monitoring system; SU; SC; SS; detection; maintenance

0 引言

监控系统在结构上是一个多级的分布式计算机监控网络,一般可分为三级,即SC(监控中心),SS(区域监控中心),SU(监控单元)[1]。通过对这些设备日常故障维护手段的分析,使维护人员在接到第一次报警后就可以确认需要什么样的工具、配件,去什么地方解决什么问题;帮助维护人员分析故障状态,使维护人员在采取措施之前做出准确的、及时的判断,从而保障设备有效工作和大大降低维护费用。

三级监控系统的结构、运行方式如图1所示。

1 SU(监控单元)

1.1 传感器

各个监控系统集成商根据各自的特点所采用的传感器品牌和型号都不太一样,但同类传感器具有相同的原理。具有相同原理及工作方式的传感器有些可以互换,在维修和维护时可提高效率和降低成本。

在维护时查看传感器安装是否牢靠,是否存在烧过等现象,可用手感觉传感器发热的强度及倾听传感器内开关等发出的声音。

⑴ 烟雾传感器

⑵ 防盗传感器

防盗传感器可分为:门磁开关和红外探测器。门磁开关发生告警时(一般为两块感应磁铁分离时)―门开,输出干接点参数同上。维护时应注意门是否变形而导致磁铁不能有效吸合而长时间告警。

红外传感器通过检测带有热源的移动物体来发出告警,传感器本身有一定的角度,输出为干接点或电流。维护时应注意红外传感器是否存在死角,红外上的检测灯是否在闪亮,当有移动热源物体时,红外的检测灯是否一直亮着。

⑶ 环境温湿度传感器(包括温度和温湿度传感器)

环境温湿度传感器属于模拟量传感器,长时间运行在恶劣的环境下,感应元件非常容易老化,因此对于湿度较大的环境应缩短巡检周期。

⑷ 贴面温度传感器

贴面温度传感器常用在测量变压器温度、电池温度、机柜/箱温度上。测量温度量程通常比较大,比如为0℃->100℃,而环境温湿度传感器的量程通常为0℃->50℃。此类传感器同样也存在老化过快的缺点。

⑸ 液位传感器(检测油时,也可叫油压传感器)

液位传感器要注意经常清理油压检测孔,以确保油压检测孔不被堵塞。此类传感器应为无源传感器。

⑹ 电压传感器

电压传感器应安装在专门的模块箱里,以便做隔离和集中管理和维护。一些传感器上有电压信号指示灯,有电时灯是亮着的,若灯灭,则传感器或连线有问题,应检测传感器输出端是否存在一定的电压。

⑺ 电流传感器

电流传感器采集电流时一般用霍尔传感器,霍尔传感器感应回路应可靠接触,校准时可调节调零端子。

⑻ 智能电量监测仪

输出为智能口,检查通信线路及隔离器件是否正常工作,若监测仪上有LED可查看具体的参数,判断通信状态是否正常。

⑼ 熔丝采样传感器 熔丝采样传感器本身带有采样信号检测灯和工作灯。

当智能设备数据在监控业务台上不能显示时,首先检查智能设备投点是否正确,通道地址是否正确,然后检查智能设备通信参数是否正确,检查线路是否连接正常,检查隔离器件是否正常(隔离器件有信号灯),检查接智能设备的多用户卡上的灯是否在闪亮,通信链路连接是否正常,最后检查智能设备智能口输出端是否有电压。在现场可通过便携式计算机根据通信协议命令或设备专用软件可检验通信接口的好坏和通信协议是否正确。

当智能设备数据在监控业务台上显示有误时,检查投点是否有误,检查协议数据转换比率是否正确,检查数据输出格式是否符合要求(如:应为摄氏度,但被设定成了华氏度),智能设备中是否存在某些单元被人为现场关闭或做了不正确的设置(如:洲际开关电源,现场关断整流模块时,会出现模块通信异常告警)。

1.3 协议处理

对于需要进行通信协议转换的系统,比如:转换为标准的通信协议,需要增加相应的设备进行通信协议格式的转换。具体方法有:①以固化软件的形式烧到处理芯片中,如华为公司的OCI-6、大诚公司的MPC3;②直接下载到FLASH ROM中。相比之下,第二种方法具有远程下载的功能,不受读写次数的限制等优点。当扩容、更换智能设备时,需要根据智能设备的通信协议编写程序,重写寄存器。若存在一个局内普遍智能设备的数据无法上传,则可能是处理通信协议的器件出了问题,需要更换设备,重新写软件[2]。

2 SS(区域监控中心)

当区域监控中心出现死机时:⑴应立刻检查是否因为由SU上传的数据在写入数据库时出现了读写错误等问题。故障判断:①局域网上各节点计算机是否连通;②数据库服务是否正常运行;③数据传输端口的参数是否正常。⑵检查监控程序是否被非法操作。解决办法:重启监控服务软件。⑶检查是否存在外界侵入问题。系统的安全性能需不断地提高。对于IP可路由的网络,另外接一台计算机假设以各种方法进入系统。可供测试的方法大致有:拨打备份路由,PING系统中任意一台计算机,看是否能PING通,若能PING通,则表明系统内部没有设置必要的网关,路由器上没有分配路由表,或者需要增加必要的认证和权限;接入到同一个网络上,查找某个网络设备,若能查找到并能取得服务,则表示这台机器装载着其他通信协议(如NETBIOS、IPX/SPX、AppleTalk等协议),针对电源监控系统的安全性和系统维护的方便性,需要把这些可能带来安全隐患的协议删除。对于具体问题还需针对网络进行专门的测试,逐一排除隐患。

如果由于传输设备参数错误而导致传输中断,在更正后,锁住传输设备设置面板,并定期通过网络查看设置情况。如:基带MODEM参数设置,检查主从模式设置,通信速率设置;频带MODEM参数设置,由远端PC上进入TELNET IP(连接传输设备的那一台网络设备的IP) 2009(传输设备的端口号)即可进入查看MODEM的参数。

当区域监控中心无数据时:①查看传输设备是否工作正常;②对于判断链路故障问题,需寻求数据机房或传输机房工作人员的帮助,如对DDN做本地回环和远端回环测试;③在确保链路连通的情况下,查看链路协议是否启动。

当监控站数据库由于意外原因崩溃时,首先应恢复数据库系统、动态链接库、ODBC通道,然后恢复监控数据库结构,向空数据库分发丢掉的历史数据。检测监控业务台软件与数据库之间的连接是否畅通,是否有定期向SC数据库备份数据的功能。

对于有路由器的网络,如果全部主路由或全部备用路由都不通,则路由器存在故障。检查各端口的灯是否闪亮,若闪亮、则表示路由器路由协议(RIP)没有工作,否则可能是路由器硬件故障。

当网络不通时,应立即检查交换设备是否出了问题,当集线器或交换机上各口的灯出现黄色,则表示链路两端已经处在同一个电平,但通信线路有故障(3、6线未连通);若是绿色,则表示链路已经连通。若不能进行数据传输,则需要检查IP地址、网关等是否配对,若绿色的灯在没有传数据的时候一直在闪动,则表示IP地址可能存在冲突,需要更改IP地址;若长时间出现黄色灯和绿色灯交替闪动,则表示此端口的数据碰撞率过大,则需要更换此PC的网卡或另外增加一块网卡,以保证在数据量过大的情况下数据传输畅通。

3 SC(监控中心)

从管理上,SS叫局站监控管理中心,SC叫区域监控管理中心,它们在许多功能和管理维护方面具有相同之处,但SC的功能更强大。维护和维修过程中,对于相同之处,参照SS,以下讨论其不同之处。

3.1 服务器系统

机房监控系统有着大量数据需处理:实时数据,告警数据,历史统计数据,操作日志,系统运行日志等。服务器系统需满足这些数据处理和存储的功能。对于服务器-客户机系统,服务器和数据库尤为重要,这样的系统一般都配置了服务器双机热备份,采用RIAD5技术、磁盘冗余、多种冗错校验方式的磁盘阵列。这种系统在维护、故障诊断和维修上比较复杂。总的来说,作为一般性的维护可采取以下措施:

⑴ 保证双机系统双电源供电;

⑵ 划分比较大的数据存储空间和足够的数据日志空间,数据库满时应及时把数据倒入外存,妥善保存数据;

⑶ 备份数据库结构,以防万一数据库崩溃时能及时得到恢复。

参考文献:

[1] 张琳.通信电源监控系统传输方式的研究[D].山东大学硕士论文,

2007.4.

[2] 陈志锋.通信协议转换系统的实现[D].郑州大学硕士论文,

2005.7.

热点推荐

上一篇:事业单位内部会计控制常见问题及对策分析

下一篇:如何对幼儿进行德育教育论文 幼儿园关于德育教育之类的论文

2023年部队工作总结训练方面 年度工作总结部队(优质6篇) 教师个人月工作总结100字 教师个人工作月总结简短实用(7篇)