0 引言
在设计某高可靠性计算机系统时,要求其配套电源采取冗余设计。一般来说,可以采取的方案有容量冗余、冗余冷备份方式、并联均流的N+1备份方式、冗余热备份方式。
容量冗余是指电源的最大负载能力大于实际负载,也就是“大马拉小车”,其缺点是不利于提高电源的效率,而且对提高电源的可靠性意义不大。
冗余冷备份方式是指电源由两个或多个功能相同的单元模块组成,电源启动后由其中一个单元模块向设备供电,当工作单元发生故障时,备份单元立刻启动向设备供电。这种方式的缺点是备份单元的启动到输出电压的建立需要一定的时间,容易造成输出电压出现较大的豁口,这样会对被供电的设备产生影响。
并联均流的N+1备份方式是指电源由多个功能相同的单元组成,所有单元的输出功率之和大于系统要求的功率,各单元的输出通过或门二极管并联在一起,有时输出采取均流控制电路,目前采用较多的就是这种方式。N+1备份方式由于是多个单元同时向设备供电,单个单元故障(失效)一般不会对输出电压产生影响,但是,如果输出线发生故障容易波及到所有单元。
冗余热备份方式是指电源由多个功能相同的单元组成,电源启动时所有单元同时工作,由其中预先设定的单元向设备供电,备份单元处于空载状态,当向设备供电的单元出现故障时,备份单元立刻向设备供电,维持了输出电压的稳定。这种方式的优点是工作单元故障后,备份单元输出响应速度快,可以保证输出电压只在一个很小的范围内波动。
本文详细论述了采取冗余热备份方式的电源设计方案。
1 工作原理
冗余热备份结构的主电路由两个功能相同且同时处于工作状态的单元组成,由切换电路控制其中一路向设备供电,另一路空载。当向设备供电的单元发生故障时,切换电路立即动作,使另一个单元向设备供电,同时切断故障单元的输出。
主电路拓扑采用正激变换器,由输入滤波电路、功率变换电路、控制电路、输出滤波电路、监测切换电路组成。电源框图如图1所示。DC 28V输入经过滤波后提供给功率变换电路,控制电路通过实时检测来控制功率变换电路,以实现输出隔离稳定的5V电压,同时对输出电压进行过压、过流保护。
图1 电源框图
冗余热备份功能由输出监测和切换开关来实现。正常状态下两个单元之一向设备供电,发生故障时,另一个处于热备份的单元立刻向设备供电,同时切断故障单元的输出。若两个单元的输出监测电路同时发生故障,则两个单元同时向设备供电,由于每个单元的输出端均连接了或门二极管,这时为电源输出并联方式下的备份。
2 监测与切换功能的电路实现
作为一种冗余热备份电源,主要问题是工作单元的故障判断。如果采取对电源的各个可能故障点设置传感器,通过智能芯片或分立芯片组进行故障判断,再采取相应的切换控制,那么整个电源的复杂程度会增加,而且故障检测判断部分的可靠性不一定高于电源本身。由于电源的主要故障均会反映在输出电压上,因此,以监测工作单元的输出电压是否在设定范围之内作为故障判断的标准。监测、切换功能的电路如图2所示。
图2 输出监测、切换电路原理图
图2中R18、R19、V10、D1组成单元1的5V输出切换开关,D1导通,单元1的5V输出被切断;R018、R019、V010、D01组成单元2的5V输出切换开关,其功能与单元1相同。R34、R35、R33、AJ4(TL431)、R20*、R22、C20、R21*、AJ2(TL431)、D2、R24、R23、C21、V13、R30实现单元1的输出电压监测和控制单元2输出切换开关的功能:当单元1的输出电压高于或低于设定的电压范围时(调节R34、R35、R20*、R21*的电阻值可以改变设定的电压范围),光耦D2的脚1、2不流过电流,使D2的脚4、5截止,V13基极电压变低,D01的脚1、2不流过电流,使单元2的切换开关打开,单元2向设备输出电压。同时,当单元2的输出电压在设定的电压范围时(调节R034、R035、R020*、R021*的电阻值可以改变设定的电压范围),光耦D02的脚1、2流过电流,使D02的脚4、5导通,V013基极电压变高,D01的脚1、2流过电流,使单元1的切换开关关断,单元1不向设备输出电压。同样,单元2中对称位置的元器件实现与单元1中相同的输出电压监测和控制单元1输出切换开关的功能。通过设定C21和C021的电容值来设定电源启动时哪个单元先向设备供电,电源启动过程中D2、D02的脚4、5均会有极其短暂的导通,C21、C021的电容值小的单元先切断另一个单元向设备供电的通路。通过图2可以看出本电源的2个单元中,若单元1先输出正确的电压,则单元2的输出被关断;单元1输出电压不正确,单元2的输出切换开关打开向设备供电,同时切断单元1的输出电压。反之亦然。
3 实验结果
用示波器观测两个单元的输出端,可以观测到单元1向设备输出电压,单元2不向设备输出电压;断开单元1的输入电压,可以观测到输出电压无变化,由单元2向设备供电。如果先给单元2提供输入电压,再给单元1提供输入电压,然后断开单元2的输入电压,情况相同。
图3给出了当工作单元由于故障或电压下降时,备份单元立刻向设备供电的波形,可以看出输出电压在10ms之内恢复到标准值,不会引起计算机重新启动。
图3 切换波形