引言
基于目前電力設備數量級迅猛增長的電網的規(guī)模和運維工作需求,國家電網在"十三五"規(guī)劃中設立了智能運檢的建設目標:2021年初步建成智能運檢體系。通過應用"大云物移"等新技術,以智能運檢九大典型技術領域為重點,以設備、通道、運維、檢修和生產管理智能化為途徑,全面構建智能運檢體系,全面提升設備狀態(tài)管控力和運檢管理穿透力。
由于電纜輸電安全性高,且敷設于地下,有利于節(jié)省用地,保證環(huán)境美觀,目前配電網輸電線路中電纜線路的占比普遍較高。而電纜中的局部放電信號特征是評價電纜絕緣水平的重要依據,因此對電纜局放信號的檢測有利于更加方便、快捷、準確地掌握電纜絕緣的運行狀態(tài),有助于電纜的可靠運行。
目前,電纜中局部放電信號的檢測和定位已成為國內外研究的熱點,并且獲得了很多有價值的研究成果。針對電力領域智能運檢的需求,對電纜中的局部放電信號進行圖像識別和智能診斷對于提高電力系統(tǒng)的智能運維水平具有重要的意義。因此,基于深度學習、卷積神經網絡等前沿技術進行電纜局部放電數據診斷系統(tǒng)的研究具有非常廣闊的前景。
高質量的樣本數據是提高局部放電診斷模型訓練準確率的前提,本文分別采用樣本篩選技術和數據增強技術來解決殘缺、冗余樣本問題和樣本不均衡問題,為基于深度學習的局部放電診斷模型的準確率提升提供技術支撐。
1樣本篩選技術現狀
在局部放電樣本累積過程中,經常出現大量幅值分布、相位分布均非常類似的樣本,在對故障源同一時段的集中檢測中該現象尤為常見。而在深度學習的訓練中,模型質量和樣本數量并不完全成正比,損壞的樣本、大量重復的樣本不僅無法達到增強網絡性能的目的,反而會造成迭代緩慢、訓練速度下降,甚至有可能引起過擬合。
在很多機器學習、深度學習的研究中,都假設使用的訓練樣本各類別是同等數量的,或稱訓練樣本是均衡的。但是真實場景中遇到的實際問題往往不符合這個假設。一般而言,非均衡的訓練樣本會導致模型側重于樣本數目較多的類別,而忽略樣本數目較少的類別。如果在二分類中有99個正樣本和1個負樣本,那么很多學習算法包括神經網絡算法會放棄負例預測。這樣,即使訓練出的模型也在樣本集上可以達到99%的高準確率,這樣的模型也不具備泛化性和實用價值。因此,對樣本的均衡處理是訓練深度學習模型之前的必要措施。
2局放信號的樣本篩選和處理
2.1樣本篩選
本文采用的樣本篩選技術包括樣本清洗和樣本查重。
清洗的主要目的是去除格式不正確的、殘缺的圖譜。對原始數據進行有效性檢查,檢查其相位、周期是否在有效性范圍內,以及每個點的數據是否在量程范圍內。對繪制出的圖譜像素檢查包括對R(Red)、G(Green)、B(Blue)三個色彩值分別進行的合法性檢查。
查重的目的是去除重復的、冗余的樣本。本文采用的查重分為人工查重和自動查重。人工查重依賴人工經驗,主要關注的是圖譜的幅值、相位、是否對稱、簇數和噪聲來源是否相同等特征。自動查重通過對數據進行相關性計算來完成。對同測點的一批數據隨機抽取一部分作為基礎數據,統(tǒng)計剩余數據對基礎數據的相關性,刪除相關性高于閾值的數據,閾值設置為0.95。相關性的計算采用的是Pearson相關系數,其計算公式如下所示:
式中:px,y為x和y之間的Pearson相關系數。
與人工查重相比,自動查重效率較高,且減少了人工參與比例,提高了自動化程度。
2.2樣本數據增強
樣本庫中的訓練和測試數據來自于多個變電站現場的實測局部放電數據。現場實測數據的特點在于特征鮮明、數據真實。然而,因數據來源各異、缺陷持續(xù)時間各不相同,對不同缺陷采集到的樣本數量有較大的差異,容易造成樣本不均衡。如果基于不均衡的樣本直接進行神經網絡訓練,會導致訓練出的模型泛化能力差,容易發(fā)生過擬合。數據增強是解決樣本不均衡問題的重要手段之一。
本文針對數量較少的樣本,通過對已有樣本進行處理,生成新的樣本,平衡各類標簽的樣本數量,避免樣本不平衡對訓練結果的影響。
使用噪聲疊加法進行數據增強,如圖1所示。在缺陷圖譜上疊加現場常見的噪聲信號,生成新的樣本。疊加方式為:將采集前端采集到的局部放電原始數據轉成以相位為x軸,周期為y軸,幅值為:軸的三維數據:然后按照現場干擾的數據特征,分別生成各干擾對應的三維數據:再對局部放電原始數據和干擾數據進行幅值累加,得到干擾疊加后的數據。
同時,本文還采用了稀疏處理法來進行數據增強,如圖2所示。在真實缺陷數據的基礎上,隨機去除部分脈沖,生成新的樣本。依此種辦法生成的圖譜和原圖譜相似但不相同,又同樣具備缺陷特征。稀疏處理方法是補充原有樣本集的優(yōu)秀手段。
高質量的樣本數據是提高模型訓練準確率的前提,樣本收集工作是一個持續(xù)的過程,需要持續(xù)收集更多的樣本數據。
3結語
基于局部放電智能診斷模型對高質量的樣本數據的需求,本文提出采用樣本篩選技術和數據增強技術來解決殘缺、冗余樣本問題和樣本不均衡問題。在樣本篩選中使用了樣本清洗和樣本查重等方法,同時使用了噪聲疊加法和稀疏處理法對樣本進行數據增強,可以為提高局放診斷系統(tǒng)的準確率提供技術支撐。





