長、短期電力負荷大數(shù)據(jù)下的智能預測實例分析
引言
隨著電力信息化平臺概念逐漸成為現(xiàn)實,多維電能信息的采集已經具備充足的應用條件。但由于對電力信息的處理能力有待進一步提高,目前已經存在海量電力數(shù)據(jù)急待分析、處理。用電量,即負荷情況包含了用電量增長、行業(yè)周期輪換等因素,同時與氣候等條件息息相關,在電能儲存技術實用性有限的背景下,實時負荷情況屬于多重條件下的電力使用情況綜合表現(xiàn)。同時,在電力行業(yè)改革的背景下,實時交易平衡對負荷預測精度提出了越來越高的要求,負荷預測已經成為電力行業(yè)內典型的電力信息大數(shù)據(jù)處理的案例。
不同時間的負荷數(shù)據(jù)信息中包含了包括電網系統(tǒng)升級、社會行業(yè)發(fā)展以及氣候變化的多維信息,綜合利用歷史數(shù)據(jù),挖掘隱藏信息并充分利用這種知識有利于提高預測的準確度。基于負荷數(shù)據(jù)的非線性與時序性等特性,時間序列分析與機器學習分析兩類方法被廣泛應用于負荷預測。前者主要關注歷史數(shù)據(jù)的連續(xù)性,對非線性數(shù)據(jù)難以處理:后者可以有效處理非線性數(shù)據(jù),但往往不能兼顧數(shù)據(jù)間的非線性。
長短期記憶網絡(Longshort-TermMemory,LsTM)通過使用內部結構門實現(xiàn)同時接收不同時間點的信息,利用遺忘門控制數(shù)據(jù)對預測結果的有效性,從而保證了輸入信息的有效性與全面性。該算法可以記憶變化時間長度信息的特性,保證了其可以兼顧歷史數(shù)據(jù)中存在的非線性與時序性情況,從而提高預測精度?;诿绹鳳JM電力市場的實際數(shù)據(jù),應用LsTM算法進行負荷預測,預測準確率可以達到5%以內,效果較為明顯,具備一定的實用性。
lLSTM的原理與應用
為解決傳統(tǒng)神經網絡算法,包括反向神經網絡(BackPropagationNeuralNetwork,BPNN)與卷積神經網絡(Convo-lutionalNeuralNetwork,CNN)等難以同時處理不同時間點數(shù)據(jù)間的相關性的問題,循環(huán)神經網絡(RecurrentNeuralNetwork,RNN)被用于開展基于當前時刻輸入、前一時刻輸出結果等信息同樣被用于預測當前時刻的輸出。LsTM算法基于RNN結構的思想提出,通過篩選對當前輸出有意義的信息開展學習與訓練,兼顧了數(shù)據(jù)間關聯(lián),其網絡結構相比RNN更為復雜,訓練效果在數(shù)據(jù)質量達標的情況下更好[1]。
LsTM算法主要由遺忘門、輸入門以及輸出門構成。對任意預測時刻,輸入信息包括有本時刻的輸入信息、上一時刻LsTM輸出信息以及上一時刻的單元狀態(tài):輸出信息包括當前的LsTM輸出信息與當前時刻的單元狀態(tài)?;趩卧獱顟B(tài),
遺忘門實現(xiàn)了保留對1時刻輸出有意義的前一時刻數(shù)據(jù),并刪除、弱化對預測沒有作用或作用有限的當前時刻輸入信息。其作用函數(shù)/t為:
/t=r(wf[h1-1,x1]+bf)
式中,r為sigmoid函數(shù):wf為遺忘門權重矩陣:h1-1為上一時刻LsTM輸出信息:x1為當前時刻的輸入數(shù)據(jù):bf為偏置項。
輸入門基于激活函數(shù)與遺忘門的輸出得到更新的單元狀態(tài),新單元狀態(tài)與遺忘門輸出共同作用得到完整的篩選后的有效預測數(shù)據(jù)。在信息分配權重矩陣作用下,根據(jù)前述單元狀態(tài)與篩選后數(shù)據(jù)得到最終輸出,保證了整個數(shù)據(jù)庫的信息最大化利用。
2數(shù)據(jù)驗證與分析
本文以美國PJM電力市場的3個月時長的小時負荷情況作為分析對象,采用LsTM算法挖掘前后每一小時內存在負荷變化的規(guī)律,通過遺忘門合理地使用當前輸入信息與已有經驗開展負荷預測。作為對比,本文同時使用負荷預測中較為常用的時間序列分析方法ARIMA算法,該算法通過對歷史經驗數(shù)據(jù)的截尾與拖尾情況進行分析,以盡可能地考慮數(shù)據(jù)關聯(lián)的情況,并基于自相關函數(shù)參數(shù)得到預測值。兩種分析方法的預測結果與實際情況的對比如圖1所示,具體誤差數(shù)值對比如表1所示。
對圖1與表1的數(shù)據(jù)進行分析可以發(fā)現(xiàn),LsTM算法所預測結果與真實情況的對比相對ARIMA算法而言波動性更強,后者的預測誤差維持在較高且穩(wěn)定的誤差范圍內。ARIMA算法因為無法有效跟蹤實際負荷在00:00后穩(wěn)定進而在02:00后逐漸增長的趨勢,在這一時間段內出現(xiàn)較大的誤差。LsTM算法在23:00附近接近實際用電負荷情況后,其曲線變化緊跟實際情況進入最小值,并及時開始提高電力負荷的預測值。這既說明了LsTM算法對實時輸入的敏感性,同時也證明了其對非線性數(shù)據(jù)的處理能力。
根據(jù)圖1可以發(fā)現(xiàn),在時間段20:00一23:00、03:00一06:00期間,LsTM算法的預測結果誤差較高。該時間段分別為夜間用電高峰期和凌晨用電低谷期,居民生活與社會生產狀態(tài)的調整可能是導致這一情況的重要影響因素。ARIMA算法的預測數(shù)據(jù)實際上同樣呈現(xiàn)出了類似的傾向。
基于上述分析情況,本文認為,在趨勢出現(xiàn)變化的時刻,如圖1中約01:00的位置設置預警信號,于訓練過程中著重挖掘對應信號時刻的變化信息,并應用于當前訓練網絡,將能一定程度上提高對數(shù)據(jù)變化的敏感性,從而進一步提高最終預測準確度。
3結語
為兼顧電力信息化數(shù)據(jù)中的時序信息與非線性情況,開展電力大數(shù)據(jù)處理,本文使用LsTM算法開展以美國PJM電力市場為基礎的電力負荷預測。憑借LsTM算法的遺忘門對以往信息和當時信息的篩選,該算法的平均預測誤差約達4.98%,準確程度較高,表現(xiàn)出了對電力多維、海量數(shù)據(jù)較強的處理能力,尤其是可以處理存在時序特性的歷史數(shù)據(jù),具有一定的實用意義。





