1 引言
20世紀90年代以來,以DCS(集散控制系統)為代表的現代化自動控制系統在火電機組中得到了普遍應用,數以千計的傳感器數據提供了大量反映電站設備運行狀態的信息。但是由于傳感器的故障、漂移和各種干擾的存在使得測量數據中可能會產生一些不良值,從而使基于這些數據開發的系統性能下降,甚至造成系統無法工作。對測量數據中不良值的檢驗已經引起了國內外學者的重視[1]。
測量數據優化估計值的求取是不良數據檢驗問題的關鍵,當前有如下幾種求取方法:基于硬件冗余的互判法,該方法簡單實用,但是要增加相應的硬件投入,只能適用于對一些關鍵參數的測量,而且當冗余傳感器的數目較少時不能準確定位故障傳感器;基于采樣數據的時間序列關系的AR、ARMA以及Kalman等時間序列預測模型,但它們對過程數據的突變會產生誤判,同時其模型參數要求大采樣,實際過程常常不能滿足;帶時間窗的新陳代謝方法,采用有限樣本進行預測,避免了大采樣的要求,但該方法只能對不良數據進行質疑,不能完全檢驗,同時不能實現糾錯的目的;基于機理模型,采用解析冗余技術進行參數預測,但是這要求有足夠精確的機理模型,同時對于非線性復雜系統模型計算量大,有時不能滿足實時的要求[2~4]。

[align=left] 本文給出了基于自聯想神經網絡AANN(Auto-associate Neural Networks)的不良數據自校正檢驗方法,利用AANN進行過程參數間的主要特征識別與相關估計,采用參數預測模型并通過殘差決策邏輯實現網絡輸入數據的選擇,有效地避免“野點”引起的“殘差污染”問題,以便正確估計測量參數。
[b]2 自聯想神經網絡AANN
2.1 AANN網絡結構
[/b] 自聯想神經網絡是在1987年由Ballard針對編碼/解碼問題首先提出的[5],其網絡原型是一種具有對稱拓撲結構的五層前饋傳遞網絡,如圖1所示。AANN應用到數據檢驗問題時具有比較明顯的物理意義,首先通過輸入層、映射層以及瓶頸層實現了輸入數據信息的壓縮。從網絡輸入的高維參數空間中提取了反映系統結構的最具代表性的低維子空間,同時有效地濾去了測量數據中的噪聲和測量誤差,再通過瓶頸層、解映射層和輸出層實現數據的解壓縮,將前面壓縮的信息還原到各個參數值,從而實現各測量數據的重構。
為了達到信息壓縮的目的,AANN網絡瓶頸層節點數目明顯小于輸入層,又為了防止形成輸入輸出之間的簡單單一映射,除了輸出層激勵函數采用線形函數外,其它各層均采用非線形的激勵函數。
[b]2.2 AANN樣本選擇與學習算法
2.2.1 樣本選擇
[/b] AANN學習的是輸入參數間的相關性,一般可以認為測量數據中的噪聲是不相關的,因此可直接將帶有噪聲的測量數據同時作為網絡的輸入和訓練目標值,并以式(1)作為網絡訓練的目標函數[/align]
[img=272,47]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-1.jpg[/img]
[align=left] 式中 n為訓練樣本數;xi、yi分別為網絡的輸入輸出數據。
由于噪聲的存在,網絡訓練結束的條件不是E的最小化,而是當E收斂到一個小的定值而趨向不變時就停止訓練,否則網絡將試圖對噪聲進行學習,即所謂的“過學習”,從而降低網絡的“泛化”能力。
2.2.2 改進的BP算法
本文在AANN訓練時應用改進的BP算法,訓練時增加了附加動量因子并采用自適應學習速率[6]。
節點權值的調整公式為[/align]
[img=348,203]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-2.jpg[/img]
[img=352,43]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-3.jpg[/img]
[align=left][b]3 基于AANN的測量數據自校正檢驗方法
3.1 常規檢驗方法[/b]
[/align]
[img=346,101]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-4.jpg[/img]
AANN網絡能夠提取測量數據中主要信息,濾去噪聲等次要信息,通過數據重構可以對測量數據進行估計,因此可以直接用來進行測量數據的檢驗,如圖2所示。將過程測量矢量x (k)作為網絡輸入,網絡輸出矢量y(k)即為測量數據的估計值,再根據估計余差矢量e(k)進行數據檢驗。但是,當網絡輸入參數中存在大的異常值時,如儀表發生大的漂移或者故障時,其測量數據明顯不可信,這樣會使網絡輸入數據的完整性受到大的破壞,如果還以此測量參數作為輸入值,會將其錯誤傳遞到其它參數中去,引起所謂的“殘差污染”,不能得到正確的結果。
3.2 基于AANN的測量數據自校正檢驗方法
為了克服常規檢驗方法的不足,本文提出如圖3所示的基于AANN的測量數據自校正檢驗方法。
[img=338,190]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-5.jpg[/img]
圖中 A為殘差生成模塊,通過過程測量參數x (k)、AANN輸出參數有y(k)以及單參數預測模型輸出參數[img=26,15]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-6.jpg[/img]生成殘差;T為網絡輸入參數選擇模塊。
數據檢驗時,首先以當前時刻測量數據x (k)作為AANN的輸入,得到網絡對應的輸出數據 y(k),再根據網絡的歷史輸出數據通過單參數預測模型,求得各參數的預測值[img=26,15]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/153-6.jpg[/img],然后通過殘差決策邏輯確定是否存在大的不良數據,如果第i個測量參數存在大的異常數據,通過T模塊將相應的測量數據xi(k)替換為[img=36,25]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-3.jpg[/img],重新形成網絡的輸入參數[img=34,22]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-1.jpg[/img],產生網絡新的輸出。
[b] 3.2.1 單參數預測模型
[/b] 在連續采樣的系統中,測量參數序列本身也是一個離散的隨機時間序列。同樣,經過AANN處理后的輸出量也具有一定的時序特性,因此可以利用時間序列預測方法對單參數進行初步預測。根據預測值可以對單參數的大異常值進行質疑,如果測量參數與預測參數相差不大,則此測量參數可以作為網絡的輸入參數。反之,可以用比測量參數更可信的預測值作為網絡輸入,以減少大的異常值對網絡輸出數據的影響。
3.2.2 殘差決策邏輯
對于同一個參數,除了測量數據外,還有AANN的估計值與單參數預測模型的估計值,這些數據之間存在一定的殘差。
(1)當所有測量數據與AANN對應的輸出數據之間的殘差小于一定的閾值時,即式(6)成立時,表明不存在不良數據。
[img=328,27]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-2.jpg[/img]
式中 n為測量參數個數;δi為相應的閾值。
(2)當式(6)不成立時,取
[sub][img=104,30]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-ss.jpg[/img][/sub], j=1,2,...,n ,其中σj為第j個測量參數的方差。如果式(7)不成立,則第i個測量參數中存在大的偏差,以[img=36,25]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-3.jpg[/img]替代xi(k)組成新的網絡輸入數據[img=34,22]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-1.jpg[/img],重新進行網絡計算。如果式(7)成立,則表明發生測量參數偏差不大,AANN輸出可以看作是測量數據的估計值。
[img=380,56]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-5.jpg[/img]
式中 αi為檢測閾值,且αi>δi。
4算例
[img=380,130]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-6.jpg[/img]
以圖4所示的某電廠200 MW機組回熱系統為例,根據現場DCS系統測點的具體布置情況,以表1所列測點的測量數據作為研究對象。在機組的正常運行范圍內通過DCS采集了各測點對應的運行參數,采樣間隔為30s,共400個樣本,并對它們進行了標準化處理。其中前200個作為網絡訓練樣本,后200個作為測試樣本。數據檢驗時,AANN網絡結構為5-8-3-8-5,采用改進的BP算法以此處理模式進行訓練,誤差曲線如圖5所示。
[img=357,134]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-7.jpg[/img]
[img=342,211]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-8.jpg[/img]
[align=left]
為了驗證本文算法的有效性,以流量測點F2為例,在測試數據上迭加如式(8)所示定斜率漂移的不良數據。圖6顯示了應用常規方法進行數據檢驗的結果,圖7顯示了本文方法的檢驗結果,兩圖中(a)為F2的測量值、估計值與真實值,(b)為各參數估計殘差的平方值,即各參數測量值與估計值之間的差的平方。[/align]
[img=297,383]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/154-9.jpg[/img]
[img=329,330]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/155-1.jpg[/img]
[align=center][img=288,44]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/155-2.jpg[/img]
可見,應用AANN網絡能夠正確地反映測量數據中存在的不良數據,但是,圖6中明顯地看出“殘差污染”的存在,從而使其它測量數據的估計值也具有比較大的重構殘差。而采用本文方法(如圖7)可以對該現象進行有效地抑制。圖8(b)則顯示了應用自校正方法前后各參數估計殘差平方和的變化情況,而如圖8(a)為不采用自校正方法時的檢驗結果。盡管F2對應的殘差平方和明顯增大,但是其它測量數據的殘差也發生不合理的增加,顯然不能保證這些測量參數的估計精度。而采用本節的自校正方法后如圖8(b),只有故障儀表對應的數據殘差發生大的變化,其它測量數據的殘差變化不大[/align][align=left]
5 結論
測量數據的正確性對電站監測與優化系統都是至關重要的,離開了數據的準確性,任何研究與監測算法是不切實際的。本文提出的基于AANN網絡的自校正數據檢驗方法,通過對神經網絡輸入數據的處理與選擇,提高了神經網絡方法在線應用的準確率,避免了數據檢驗時出現的“殘差污染”, 從而對測量數據中不良值進行正確檢測與定位,同時能夠對不良數據進行正確的重構與估計。通過現場實際采集數據驗證了該方法的有效性,表明本文方法具有十分重要的現實意義。[/align]
[img=301,329]http://zszl.cepee.com/cepee_kjlw_pic/files/wx/zgdjgcxb/2002-6/155-3.jpg[/img]