數據挖掘在電力企業中的應用
時間:2006-09-04 09:49:00來源:wangsl
導語:?自20世紀80年代投資人工智能(AI)的研究轉入實際應用時就提出了一個新興的。
自20世紀80年代投資人工智能(AI)的研究轉入實際應用時就提出了一個新興的、面向商業應用的研究課題——數據挖掘。目前,越來越多的管理人員正在利用數據挖掘工具,解決所遇到的至關重要的商業問題和決策問題,如企業經營方向的定位、管理模式的確立、營銷的決策、內部生產力的促進、成本的控制和企業核心競爭力的獲取等。
數據挖掘首先需要在商業環境中收集大量的數據,然后運用挖掘的知識對企業已有的數據進行分析。它具有不同的應用形式,如企業經營分析研究工具(research)、市場營銷分析工具(marketing)、客戶關系管理工具(customer relationship management,CRM)等。
本文從應用角度出發,介紹了數據挖掘技術的基本概念及其在電力企業中的應用,并結合廣東省廣電集團有限公司信息化的具體情況構造了一個簡單的數據挖掘模型,同時展望了數據挖掘在電力行業的發展前景。
1數據挖掘技術的概念和實用價值
1.1數據挖掘的概念
所謂數據挖掘,是從海量的數據中,抽取出潛在的、有價值的知識(模型或規則)的過程。也就是根據預定義的商業目標,對大量的企業數據進行探索和分析,揭示其中隱含的商業規律,并進一步將其模型化的先進有效的技術過程。數據挖掘是一門交叉學科,它集成了許多學科中成熟的工具和技術,包括數據庫技術、統計學、機器學習、模型識別、人工智能、神經網絡等。
數據挖掘能做以下6種不同事情:分類 (classification)、估值(estimation)、預測(prediction)、相關性分組或關聯規則(affinity grouping or association rules)、聚類(clustering)、描述和可視化(description and visualization)。
1.1.1分類
分類即區分數據類別。首先從數據中選出已經分好類的訓練集,在該訓練集上運用數據挖掘分類的技術,建立分類模型,對于沒有分類的數據進行分類。
1.1.2估值
估值與分類相似,不同之處在于,分類描述的是離散型變量的輸出,而估值處理連續值的輸出,同時分類的類別是確定數目的,估值的量是不確定的。
1.1.3預測
通常,預測是通過分類或估值起作用的,也就是說,通過分類或估值得出模型,該模型用于對未知變量的預言。預測其目的是對未來未知變量的預測,這種預測是需要時間來驗證的,即必須經過一定時間后,才知道預言準確性是多少。
1.1.4相關性分組或關聯規則
通過分析數據或記錄間的關系,決定哪些事情將一起發生。
1.1.5聚類
聚類是對記錄分組,把相似的記錄分在一個聚集里。聚類和分類的區別是聚類不依賴于預先定義好的類,不需要訓練集。
1.1.6描述和可視化
即對數據進行歸約、概化或圖形描述等。
1.2數據挖掘在電力企業的使用價值
數據挖掘技術源于商業的直接需求,因此它在各種商業領域都存在廣泛的使用價值。下面結合電力企業的行業特點來具體談一談數據挖掘在電力企業中的可能作用。
1.2.1指導設備更新
在電力設備的更新中,現在有兩種方式:一種是電力設備意外損壞,需要即時更新,這種更新通過電力設備監控系統即可發現,然后予以維修更換;另一種是對老化設備的更新,現在是通過經驗來判斷,比如說通過使用年限等,可是這樣存在很多問題,像有的設備已經到期了,但是保養得好,仍然可用,卻要更換,造成浪費,有的設備雖然沒到期,但是各種使用參數已經不符合要求了,卻沒有更換,導致電力的較大損耗。通過數據挖掘技術即可解決后一種方式存在的問題。我們可通過挖掘由故障報修、電力損耗、各種電力參數等數據組成的主題倉庫來分析電力設備的故障和老化情況,來最終決定設備的更新.
1.2.2業績評估
在電力企業中,集團公司如何評價一個分公司的業績,一直是一件令領導頭疼的事,只用利潤來分析吧,地區有先進落后之分,況且對電力這個關系國計民生的行業來說,安全或其它方面有時比利潤顯得更加重要。數據挖掘技術能夠最大程度地綜合考慮到各方面因素,通過分析由利潤、利潤增長率、同行對比、投訴舉報、生產成本等數據組成的主題倉庫來分析對某一地區或分公司的經營情況,同時用最直觀的方式,如用圖表顯示出來,方便領導做出最終的評價。
1.2.3指導電力企業的建設規劃
近幾年,廣東省連續發生電力供應緊張的情況,這其中的問題就是未能把握住電力需求市場發展的趨勢,無論是電廠建設,還是電網建設都沒有跟上時代的發展。而這方面更是數據挖掘的用武之地,我們可以通過分析由新增用戶(報裝)、現有用戶、用戶位置、用戶用電量、國家的建設計劃等數據組成的主題倉庫來指導未來電力企業的建設計劃,如在何時、何處建設多大功率的電廠和設置多大容量的電力設備等。
1.2.4指導電力的生產和購買
自從國家提出了電力企業改革方案,到2001年底廣東省電力集團公司就完成了廠網分離的改革。而隨著改革的完成,許多新的問題將出現在領導面前。比如說電力的購買,以前電廠、電網同屬一個集團公司,電網要多少電,電廠發多少電,或是電廠發多少電,電網要多少電。可是現在就不一樣了,電網需要電,必須預先購買,而由于電力的特殊性(必須買多少電用多少電),對于什么時候買,買多少,將會是一個讓人尤其頭疼的事。對此,數據挖掘技術也能給我們提供最大的幫助。我們可以通過挖掘相應的主題倉庫來決定如何購買以及電力的調度(以有余補不足),同時亦可以指導發電企業的生產計劃。
1.2.5進一步提高服務質量,抓住客戶
電力企業改革的最終方向是將輸電網與配電網相互分開,各發電企業成為獨立的發電企業,通過公平競爭的規則競價上網,而且允許大的電力用戶直接從發電企業購買低價的電力,統一電網或互聯電網只負責轉運輸送。那么以前那種電力企業壟斷一切的現象將消失,用戶尤其是大用戶將能夠決定最終使用誰的電。電力企業失去了用戶也就等于失去了一切。這兩年各電力企業在CRM(即客戶關系系統)上投入如此巨大,也是這個原因。而從某種意義上來說,數據挖掘最強的就是這個方面。通過挖掘相關的主題倉庫(可以由用戶信息,用電信息等數據組成),我們可以對客戶有更加深入的了解,并根據不同用戶特點采取不同的經營策略,比如說通過價格或其它優惠政策吸引客戶甚至引導客戶使用電力,從而在未來的競爭中居于更加有利的位置。
1.2.6發現竊電者
對于電網企業來說,最大的損失來自于兩個方面,一方面是線損,另外一方面就是用戶偷電、竊電。我們可以在最短的時間內通過分析用戶數據的奇點,來發現異常數據,最后準確地找出偷電、竊電者,從而將企業的損失減少到最小。
1.2.7減少電力損耗,改善電力質量,減少設備損耗
電力是一種特殊的商品,這種商品的特殊性在于它無法保存,有多少要用多少。然而,發電和用電基本上是兩個脫節的環,為了保證電力的質量,同時保證電力設備的安全,必須要對其進行調節。現在采用的方法是修建蓄能電廠,當有剩余電力時將電力儲存起來,電力不足時將儲存電力釋放出來,這是一種比較被動的方法,有一定的局限性。若通過數據挖掘發現用戶用電行為規律,通過綜合運用安排發電計劃、電力調度,電力存儲技術將能夠積極主動地對電力進行調節,達到減少電力損耗、改善電力質量,減少設備損耗的目的。
1.2.8在其它方面的應用
數據挖掘在電力企業的其它方面也有巨大的用處,比如說指導項目管理、安全管理、資源管理、投資組合管理、活動分析、銷售預測、收入預測、需求預測、理賠分析等。而且當使用數據挖掘系統時,用戶會對模型進行調優和定制。這將會逐步積累符合企業自身需要的模型庫,成為企業知識庫的重要組成部分。
2使用數據挖掘的必要性和可行性
2.1我國電力企業信息化現狀使采用數據挖掘技術成為可能
以廣東省廣電集團為例,廣東電網現在已經走過了信息化的初始階段(即僅用計算機完成統計報表,管理信息系統處于單機單項應用的初級階段),正處于企業信息化的中級階段(即企業建立了局域網,廣電集團已經建立起連接全省的光纖通信網,通過企業信息化建設實現企業業務部門的應用和管理計算機化,如MIS、OA、物資管理、財務管理以及客戶服務中心等)。已經對企業的基本信息資源進行了整合,建立了統一的應用平臺,同時積累了大量的企業歷史數據,而這一切都是使用數據挖掘技術所必需的。
2.2 我國電力企業改革的趨勢使采用數據挖掘技術成為必然
我國政府為了逐漸打破電力系統的壟斷地位,引入競爭機制,首先進行“廠網分家”,為發電競爭模式提供了先決條件,而這一步廣電集團業已完成。下一步的發展方向應該是電網轉運模式。以上這些改革將極大地打破電力企業現有壟斷的格局。為了在未來的競爭中勝出,將要求電力企業必須更快地降低自己的生產經營成本,為客戶提供更個性化的服務,對本企業以及對手企業有更深入的了解。而所有這一切,又必須借助現代信息技術去解決,數據挖掘技術將在其中發揮關鍵的作用。
3電力企業數據挖掘模型的構想
以下將結合我國電力體制改革的大背景構造一個簡單的數據挖掘模型,如圖1所示。
圖1所示模型是一個金字塔式的數據模型。從塔底到塔尖依次為基層單位、縣(區)、地市、省級多層分布式的數據倉庫體系。基層供電單位的系統是建立在MIS基礎之上的,在MIS中已經為各種數據主體建立了統計分析主體數據庫。在基層以上的縣、市級管理單位則通過采集和匯總基層單位的主題數據庫形成自己的統計分析數據基礎,進行統計和分析。
4展望
目前電力企業信息化風起云涌,為了在未來的競爭中勝出,各電力企業都加快了自己的信息化進程。 縱觀2003年電力行業的軟件應用項目,從中也可以找尋到一條規律,那就是:電力行業軟件系統應用的重點已經從操作層面向管理層面逐漸轉移,主要集中在OA系統、電力營銷系統、客戶關系管理、MIS、ERP系統等。數據挖掘技術必將在其中大放異彩。
參考文獻
[1]HAN J, KAMBER M. Data Mining: Concepts and Techniques [M]. 范明,孟小峰譯. 北京:機械工業出版社,2001.
[2]林宇. 數據倉庫原理與實踐[M]. 北京:人民郵電出版社,2003.
[3]曹偉. 電力行業的ERP系統綜述[EB/OL].http://www.chinabbc.com.cn/e/schemedetail.asp?schemeid=3599,2003.02.10.
[4]劉會霞. 信息化:數據挖掘在CRM中的核心作用[EB/OL].
標簽:
中國傳動網版權與免責聲明:凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.hysjfh.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。
本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。