摘 要:數字高壓斷路器具有無磨損、精度高、壽命長等優點,但某些部件的失效也會給電力系統及用戶帶來重大損失。為了提高斷路器的性能和可靠性,減少事故,采用兩片DSP芯片進行冗余來實現斷路器控制器,不僅可以實現負載分擔,還具有容錯功能,在兩芯片都正常工作的情況下,各自處理自己的輸入信號,當其中某一芯片出現故障而不能處理信號時,另一芯片獨立承擔全部處理任務,提高了系統的處理能力和可靠性。
關鍵字:斷路器 容錯 冗余 故障診斷 可靠性
1 高壓斷路器測控系統
[align=center]

圖1 高壓斷路器測控系統的系統構成[/align]
高壓斷路器測控系統廣泛應用于電力系統中,當發生過載、短路及其他故障時,高壓斷路器切斷以保護電力線和電力設備,同時為電力部門提供電壓、電流、有功功率、無功功率、頻率等基本參數,聯網后可對區域內的電能質量進行檢測,判斷電網的整體可靠性、安全性和穩定性是否在指定的指標內,為電力部門監測電網的運行提供有力支持。
圖1是高壓斷路器測控系統,由供電子系統、電參數變換子系統、核心控制子系統、操動機構及驅動子系統和人機交互子系統組成。其中供電子系統為整個系統提供電源,電參數變換子系統將10KV的高電壓和幾百安的大電流變換成可供CPU采集的0~3V的DC信號,人機交互子系統利用無線和載波方式與核心控制子系統通信。
核心控制子系統是整個控制系統的核心,它采集電參數變換子系統變換后的信號,計算頻率和功率、進行過流檢測、輸出分合閘控制命令,并同外界通訊。
驅動子系統接收核心控制子系統輸出的分合閘控制信號,再進行放大,作為固態繼電器的控制信號,固態繼電器的觸點作為斷路器操動機構中分、合閘繼電器的電源開關。
2 基于冗余技術的斷路器控制系統的設計
2.1可靠性原理
可靠性是在規定的條件下、規定的時間內,完成規定功能的能力。冗余是實現容錯和提高可靠性的一種有效方法,為了保證斷路器在任何有載情況下有效工作、保證數據的時效性和準確性,利用硬件冗余來提高系統可靠性。硬件冗余就是對系統中的關鍵部件配備多個相同的物理部件,一旦出現故障能迅速自動切除故障部分,立即啟用備份系統。在圖1中,核心控制子系統是整個控制系統的核心,它的失效將使整個系統失效,因此使用兩個。TI公司的TMS320LF2406 DSP芯片進行硬件冗余。
如圖2所示,讓四路(或多路)輸入信號同時輸入到兩個DSP芯片,可通過軟件編程的方法使其中一個芯片只采樣處理兩路信號,而另一個芯片采樣處理剩余的兩路信號,若其中一個芯片發生故障,故障診斷模塊將檢出故障并指示另一個芯片迅速作出響應,并承擔起所有四路信號的處理,即此時只由一個芯片處理信號,相當于單個芯片進行控制的情況。DSP芯片是否有軟、硬故障發生主要是通過對DSP輸出的關鍵信號的檢測來確定的,若有故障信號出現,就進行切換,讓無故障的芯片繼續工作。整個系統主要由四個模塊組成:故障診斷模塊(包括硬、軟故障診斷)、判決模塊、程序切換模塊、共享存儲器模塊。其中共享存儲器用來實現兩個芯片間的通信,切換模塊由軟件實現。
[align=center]

圖2 斷路器核心控制子系統冗余設計方案[/align]
2.2 故障診斷模塊
故障診斷模塊分為硬故障診斷模塊和軟故障診斷模塊。硬故障診斷模塊的硬件線路較簡單,該模塊讀取兩片DSP的表示硬件故障的輸出信息,根據該信息來檢測某個芯片是否發生故障,硬件電路可以通過計數器和觸發器來實現。
硬故障診斷只有在DSP發生硬件故障時才能診斷進行切換,而硬件故障發生率較小。系統中更常見的故障是軟件故障,如受到外界干擾后的程序跑飛、不進入中斷、死循環等。采取同硬件故障相同的處理方式來處理軟件故障。首先設置一個定時器,程序正常運行時,不會產生出錯信號;當程序發生故障時,產生一個出錯信號,如果由于某種偶然原因(如噪聲、靜電放電、器件偶然失靈),使程序不能正常運行、死鎖或不進入中斷等,可通過定時器超時使系統復位,來使程序克服死區恢復正常;若故障在規定的復位次數內仍不能克服,此時就將出錯信號送出,表示需要切入冗余備份來解決。
在控制器運行的主程序入口處有一判斷程序,該程序對定時器的復位次數進行計數,如果連續復位規定次數,則認為該故障不能由超時復位方式來解決,就送出一個軟件出錯信號reset=0(soft error)。當軟故障診斷模塊接受到信號reset=0(芯片正常工作時reset=1),就向自動判決模塊發送一個故障信號,從而指示程序發生切換以隔離故障、投入冗余備份。
2.3 判決模塊
判決模塊的主要功能是接受硬、軟故障診斷模塊發來的故障信號,根據其切換請求及時發出控制信號bio = 0到切換模塊,通知程序發生切換,及時隔離故障芯片并投入冗余備份,使系統能夠在極短的時間內恢復正常。該模塊可以通過D觸發器來設計,當有出錯信號到來(信號發生跳變),D觸發器就輸出一個信號到DSP。
2.4 程序切換模塊
程序切換模塊由軟件實現,芯片1運行的切換程序的主要流程是:在芯片1正常處理兩路信號程序的基礎上,增加處理四路信號的程序段,在每次等待中斷來臨的程序段中插入檢測bio的指令,若檢測到bio=0,要求程序發生切換(正常時bio=1,當bio=0,表示芯片2有故障發生),由開始運行處理兩路輸入信號的程序段切換到處理全部四路輸入信號的程序段運行。
外部時鐘信號采用周期為10us的定時器,因此切換模塊每隔10us檢測一次bio信號,即一旦出現故障最多10us后程序將發生切換。芯片1處理的流程圖如圖3所示。
(a) DSP1的主程序流程 (b) DSP1正常運行兩路信號處理的流程
[align=center]

(a) DSP1的主程序流程

(b) DSP1正常運行兩路信號處理的流程
圖3 DSP1運行的程序流程圖及其切換[/align]
從上述流程圖可以看出,在兩個芯片上電后,芯片1首先處理它自己的第1、2路信號,芯片2則處于待機狀態,芯片1在每次待機狀態時檢測bio信號來判斷芯片2是否發生了故障,一旦芯片2有故障發生,bio=0,芯片1執行的程序就發生切換,運行處理四路信號的程序段;在芯片2沒有故障發生時,芯片1依次處理它自己的第1路、第2路信號,然后通知芯片2處理另外兩路信號,最后關中斷,不再響應中斷請求,處于等待狀態,只有等芯片2處理完畢打開中斷才能再響應。同樣,芯片2在執行程序時同樣也定時檢測bio的值來判斷芯片1是否發生了故障,并在處理完第4路信號后再通知芯片1進行處理,如此循環往復。
由于程序處理采取的是分散控制,即四路信號的A/D轉換、PID處理、D/A輸出是輪流執行的,程序每隔10us產生一次中斷,所以各路信號的采樣周期為40us。
3 可靠性分析
設兩個芯片的平均失效率為λ,表示在(0,t)時間間隔內的平均故障次數;平均無故障工作時間為T,表示在(0,t)時間間隔內的平均無故障工作時間;設單個芯片的可靠性為R(t),表示單個芯片在(0,t)時間內正常工作的概率。
則有: R(t) = e[sup]-λt[/sup] t ≥ 0 其中 T =1/λ
由于系統采用的是熱備份旁待冗余方式,這種冗余結構的可靠性可按下式計算:

則整個系統的平均無故障時間為:

顯然,系統的平均無故障時間是單機運行的1.5倍。由此可見,用兩個芯片冗余組成的控制系統的可靠性要比單個芯片組成的控制系統的可靠性大大提高。
5 結束語
采用兩個DSP芯片基于冗余技術的斷路器容錯設計方案主要完成了兩芯片間的通信接口設計、軟硬件故障診斷模塊、判決模塊的設計,在此硬件基礎之上設計了兩芯片分擔處理四路信號的切換程序和實現系統容錯功能的程序。使每個芯片的處理數據量降低了,可進一步提高A/D采樣頻率。當其中某一芯片出現故障時,另一芯片將獨立完成全部輸入信號的處理任務,從而有效地實現了電力系統的測控,較大地提高了系統的可靠性。
參考文獻:
[1]王劍. 趙海燕. 基于CPLD的控制器冗余設計.微計算機信息.2005年13期
[2] )衡軍山甄成剛. 基于軟件的雙CPU冗余控制研究. 微計算機信息.2005年21期
[3]余同正,徐龍祥.基于雙DSP 的磁軸承數字控制器容錯設計.電子設計應用.2005年1月
[4]廖慧敏.PLC 控制器的雙CPU 冗余控制實現.湖北電力.2005年12 月
[5] 劉劍,魏冠楠.電梯控制系統可靠性的冗余設計. 遼寧化工. 2003年12月
[6] 張宇聲,孫豐瑞.熱力系統控制可容錯性分析與應用研究.熱科學與技術.2003年第6 期