1 引言
随着UPS技术和IT技术的不断发展,UPS朝着智能化、高频化、网络化等方面发展,UPS已成为金融、电信、保险、交通、税务、证券、能源、制造、军队、教育等各行业的必要配置。如何对UPS设备实施统一、便捷、高效管理,实现对最感兴趣UPS信息的监视、分析,如何多途径报警、智能处理异常等,成为电源使用、管理必须面对和解决的问题。
本文对部队战术级指挥所多智能化UPS网络管理问题进行了研究,设计并实现了一种合理、实用、高效的智能UPS网络监控方案。该方案充分利用闲置的计算机串口资源,减轻了网关系统的工作量,实现了UPS的群组管理能力,具备了一定的事件智能化处理能力。
2战术级指挥所UPS使用现状
战术级指挥所(以下简称指挥所)是指部队师、旅级及其以下机关的指挥所,一般它是综合战术网的核心。为保障指挥所设备可靠运行、延长其使用寿命,保证指挥、控制、情报信息的畅通传输,所有指挥所均配备了高性能的UPS,这些不问断电源除了在市电异常时提供电压稳定、波形纯正的电能外,还具有通过自带电源监控软件监控自身状态,记录、测试、自动设置、远程遥控等功能。
指挥所一般拥有较多的计算机和通信设备,且大部分集中在一个或几个作战方向室(以下简称方向室)内,UPS的数量从几台到十几台,多数不间断电源具有RS232智能监控接口,少数具备SNMP(简单网络管理协议)接口,利用这些接口经过专用通信电缆同服务器、网关等设备相连,将电源与计算机网络构成一个具有监控功能的网络供电系统。这样的设计方案简单、易于管理,但一个突出缺点是占用了大量本来就比较紧张的服务器或网关资源,对于不同方向室的UPS设备,必须增加SNMP适配器,或者增加服务器、网关等设备。
3 系统的结构与功能
3.1 系统的硬件结构
结合实际情况,本文设计了一套多UPS网络监控系统,该系统包括UPS、网关、服务器端、监控终端、各战斗席位、绘图、投影等设备,如图1所示,采用基于代理/管理器(A/M)模式的基本结构。UPS与监控终端的连接主要有以下几种方式:
(1)UPS的RS 232数据线直接连接到监控终端串口设备上;
(2)UPS插人SNMP适配器,以TCP/IP方式接入网络,实现与监控终端的连接;
(3)UPS的监控线连接到网关设备的串口上,网关作为协议转换设备,将UPS接入网络,实现与监控终端的连接;网关可以灵活插入串口扩展卡,提供较多的串口资源,本系统网关设备有9个串口,可实现最多9台UPS的接入;
(4)将UPS监控线连接到普通计算机(工控机)的串口上,普通计算机作为服务器端,代理UPS完成与监控终端的连接;服务器端主机可以选择任意一台距离UPS较近的计算机,本系统使用的工控机每台只有1个串口,能实现1台UPS的接入。
本设计方案,将普通计算机(工控机)作为服务器端,充分利用其闲置的串口资源完成串网口协议转换,实现UPS接入网络的功能,从而减轻了网关工作负担,有效降低了系统成本;同时因为UPS分布于各服务器端管理,提高了系统整体稳定性。其中的战斗、管理席位、绘图、投影设备等也通过装入电源响应软件,实现接收监控终端管控命令,完成电源应急操作的功能,与UPS等设备一起构成一套完整的电源网络监控系统。
3.2系统的软件构成
代理(Agent)服务软件:安装在服务器端主机上或嵌入网关服务程序内,主要提供串网口协议转换功能,一方面将串口获取的UPS实时数据转换成IP数据发送给指定网络端口,另一方面解析监控终端发来的数据信息,生成相应的控制指令传给串口。
管理器(Manager)软件:安装在监控终端,监控终端也可以是网络上任一指定计算机,实现以下几种功能:监视UPS数据、设置和控制UPS参数;记录UPS实时状态和异常状态数据;检测并诊断异常、状态告警、广播异常数据;智能决策方案,实现在电源异常时对各计算机设备的应急管控。
电源响应软件:可以安装在所有计算机(包括部分智能设备)上,用于响应监控终端软件发来的命令,执行相应的操作,完成诸如显示告警窗口、进行语音告警、关闭所有数据库、正常退出应用程序、关闭计算机系统等功能。
4 各软件模块的结构与功能
4.1 服务器端程序设计
服务器端程序王要完成以下几个功能:通过TCP监听并建立与监控终端的连接;通过RS 232打开并从串口获取UPS返回数据,向串口发送UPS设置、控制指令;将串口获得的数据整理、打包,转换成网络数据发送给监控终端;接收监控终端发来的控制、设置命令,解析成相应UPS指令。
为便于监控终端快速找到UPS资源,服务器端对应于串口的网络端口应设置为固定值9001(本系统中每台工控机台只有一个COM口)。当服务器端服务启动后,程序自动打开并连接串口,同时开启网络服务并绑定本地9001端口,使其处于监听模式,以便使监控终端方便地扫描、定位本机数据源地址。
考虑到串口通讯速度比较慢,为保证状态数据的完整性,在服务程序必须对串口数据进行缓存,并实时进行数据检测,当检测出有回车/换行标志(或超时)时,则将此前数据从缓存中截取出来,作为一个完整的数据行发送给监控终端。
4.2网关软件设计
网关的主要功能是进行物理接口的引入和数据协议的转换。网关在指挥所内完成各种接口的接入和各种协议到IP协议的转换工作,可以透明或转换格式地将数据在各种通讯设备上交互。本系统用到网关的串网口转换功能,该网关为嵌入式操作系统,其协议通过软件转换来实现,软件的基本设计思想同与4.1中服务器端服务过程类似。需要注意的是,网关设备不是服务器,只完成协议转换功能,对应的网络端口一般处于客户端模式,不停地向监控终端发送TCP连接请求,一旦连接成功,便可以实现UPS与监控终端的对话。
本系统使用的网关自带9个串口,每个串口配对一个固定的网络端口(端口范围为9001~9009),并且将网络端口与监控终端的701~709端口对应连接,以实现UPS接入网络的功能。
4.3 监控终端软件设计
监控终端软件是人机交互的接口,应具有界面友好、使用方便的特点,完成对UPS监控功能,按功能可分为数据源模块、监视模块、控制/设置模块、智能决策模块四部分。下面就前3个模块逐一设计,智能决策模块将在4.4部分具体阐述。
4.3.1数据源模块
监控终端数据来源主要由以下几部分构成:
(1)通过串口与本机直接连接的UPS数据源;
(2)通过SNMP适配器接入网络,再和本机连接的数据源;
(3)通过网关协议转换和本机连接的UPS数据源;
(4)通过其他计算机(服务器端)代理和本机连接的UPS数据源。
通过对以上四部分数据源相应端口进行扫描、判断,可以得到所有数据源的地址,如图2所示。其中第(1)类数据源地址通过扫描本机活动串口而得到;第(2)、(3)类数据源地址通过判断本机服务端口(701~709)的连接状态而得到;第(4)类数据源地址通过扫描网络上所有IP地址的9001端口活动状态而得到。
4.3.2 监视模块
监视模块主要以表格、图形、状态条等方式显示UPS的实时状态,如图3所示为监视模块的主界面。通过界面用户可直观地了解到UPS的运行状况:左侧为用户最关心的UPS状态数据表,包括UPS的名称/编号、实时的输入电压、输出电压、输入频率、输出频率、电池温度、电池容量、电池剩余时间等信息;右侧为用户感兴趣的数据实时柱状图,可以通过选择组合框内的具体内容,定制最感兴趣的监控变量;下方状态条则显示了从数据源获得的实时数据,更具体地反映了UPS的状态信息。
4.3.3 控制/设置模块
控制、设置模块主要完成对智能UPS的控制和设置功能。比如控制UPS进行自检、电池校准、电源旁路转换等功能(如图4所示),设置电源标识、输出电压、输出频率、断电警告、低电量警告、定时自检等参数(如图5所示)。
考虑到串口传输数据速度慢,对电源的控制/设置又是基于应答式的特点,软件的控制/设置模块设计为与“超级终端”工作过程相类似的模型。如图4所示,通过点击“获取当前模式”,可以得到UPS的当前工作模式(上侧黑底红字显示)和当前模式下可进行的操作(右侧文本框内显示);用户根据UPS返回的命令及提示说明,在命令文本框(“发送控制命令”按钮下方的文本框)内输入相应命令,点击“发送控制命令”完成对UPS的相应控制和设置;UPS会在右侧文本框内返回操作结果,通过此结果决定下一步需要进行的操作;点击“返回上级模式”可以使UPS控制/设置模式返回上一级目录。
4.4 智能决策模块
4.4.1告警
监控终端不停地对各UPS数据进行解析、参数范围判断,一旦发现超压、超频、超温、旁路等非正常情况,就会启动告警程序,有选择地进行以下几种动作:网络组播消息/数据告警;音箱语音告警;警示灯告警;大屏幕投影状态条告警。使相关人员能及时了解电源异常,尽早发现隐患,采取应急措施,确保问题尽快解决。
4.4.2日志
监控终端可以记录较长时间段的UPS事件日志和数据日志,这些数据为故障诊断、反应历史状态提供数据支持。用户可按时间段,按信号等方式及组合查询历史数据,以图表、表格、曲线等可观化形式显示查询结果,通过对这些数据的全面分析,查找UPS的隐患,追溯UPS发生事故的根源,真正做到设备的“预检预修”。
4.4.3处理电源异常
对UPS的处理主要包括以下几种:
(1)对UPS进行有计划的测试,适时地运行时间校准,定时开、关机,异常状态启动自检等;
(2)实时监视UPS状态,对非正常状态能及时查询UPS预警信息,作电池矫正试验、自检等操作;
(3)对UPS的其他一些常见故障,能够按预设步骤处理或者按历史记录处理等功能。从而达到在无人值守环境下对UPS的最大限度管理,减少不必要的损失。
故障诊断与报告:当UPS发生故障时,监控终端能给出具体参数,及时分析、追踪引发电源故障的重要原因,必要时给出处理方法。
对相关设备的处理:事先在各计算机上安装电源响应软件,当UPS状态异常时,智能决策模块根据当前情况,生成一个比较优化的设备处理方案,向网络上其他计算机发送控制命令,通过电源响应软件的代理,实现对整个监控系统的统一管控。比如,当智能决策模块发现市电停止供应时,便生成并启动电源应急方案,向网络上其他计算机发送控制命令,关闭耗电量大的非核心设备(如打印机、大屏幕投影仪、绘图仪等);如果电池电量低于60%,则关闭网络上大部分非主要战斗席位;如果电池电量低于30%,则控制电源响应软件,使其对重要战斗席位上的数据库进行保存、正常关闭应用程序、安全退出计算机系统。从而最大限度地保障服务器、路由器等核心设备的运行时间,降低灾难事件发生的概率。
4.5电源响应软件
电源响应软件可安装在网络上任意一台计算机,它与监视终端相连接并受其控制,可以进行如下一些动作:显示告警提示窗口、进行语音报警;自动执行设定的命令文件,适合用户特殊处理要求;安全关闭数据库、正常退出应用程序,保证用户数据安全;正常关闭其他电子设备、安全关闭计算机操作系统,保证设备安全。
5 结语
本文提出了一种结构优化、管理智能、资源节约、容灾性强的UPS群组管理方案,实践验证了本方案的合理性、便捷性,提高了部队指挥所电源监控的网络化、智能化水平,增强了部队指挥所电源抗事故能力。此方案也具有良好可靠性和通用性,可在其他相关的单位进行推广,具有很强的推广应用价值。