機(jī)器學(xué)習(xí)算法在泵密封腔壓力預(yù)測(cè)中的應(yīng)用
掃描二維碼
隨時(shí)隨地手機(jī)看文章
0引言
在石油化工行業(yè),泵是關(guān)鍵的流體輸送設(shè)備。密封腔壓力作為泵的重要參數(shù),極大影響著密封系統(tǒng)的設(shè)計(jì)、沖洗方案的確定和沖洗壓力的計(jì)算,精準(zhǔn)預(yù)測(cè)密封腔壓力不僅對(duì)泵的密封效果、效率和壽命有著重要意義,還能防止泄漏和設(shè)備故障,從而提高整個(gè)系統(tǒng)的安全性和經(jīng)濟(jì)效益。密封腔壓力的影響因素多,且種類復(fù)雜,如何計(jì)算和預(yù)測(cè)泵密封腔壓力一直是相關(guān)領(lǐng)域?qū)<已芯康闹攸c(diǎn)課題。
API 682標(biāo)準(zhǔn)最早提出了針對(duì)離心泵和回轉(zhuǎn)泵密封系統(tǒng)的密封腔壓力經(jīng)驗(yàn)公式[1];隨著泵設(shè)計(jì)和運(yùn)行條件的復(fù)雜化,單靠經(jīng)驗(yàn)公式已不再足夠,P. Geiger 和H. Fiedler等人通過CFD技術(shù),模擬密封腔內(nèi)的流體流動(dòng),提供壓力分布預(yù)測(cè)[2];A. khonsar,和E. Booser 基于現(xiàn)代密封設(shè)計(jì)理論提出先進(jìn)的設(shè)計(jì)和材料可以顯著減小密封腔內(nèi)的壓力波動(dòng),增強(qiáng)密封的可靠性[3]。近年來,人工智能(AI)技術(shù),特別是機(jī)器學(xué)習(xí)和深度學(xué)習(xí),在處理復(fù)雜數(shù)據(jù)和預(yù)測(cè)模型方面展現(xiàn)出了強(qiáng)大的能力。通過學(xué)習(xí)大量的歷史運(yùn)行數(shù)據(jù),機(jī)器學(xué)習(xí)能夠捕捉到傳統(tǒng)物理模型難以表達(dá)的復(fù)雜模式和關(guān)系。在工業(yè)領(lǐng)域,機(jī)器學(xué)習(xí)已經(jīng)在許多應(yīng)用場(chǎng)景中取得了成功,例如設(shè)備故障預(yù)測(cè)、生產(chǎn)優(yōu)化和流程控制。然而,石油化工行業(yè)由于其工藝流程的復(fù)雜性和風(fēng)險(xiǎn)性,對(duì)AI技術(shù)的應(yīng)用還處于探索階段。
高速離心泵作為北京航天石化技術(shù)裝備工程有限公司的明星產(chǎn)品之一,因具有流量小、揚(yáng)程高、結(jié)構(gòu)緊湊、轉(zhuǎn)速高、可靠性好等特點(diǎn),被廣泛應(yīng)用于石油化工領(lǐng)域。以高速泵為研究對(duì)象具備現(xiàn)實(shí)意義,其每年近300臺(tái)的出廠量也為研究提供了充分的數(shù)據(jù)支撐。本文旨在開發(fā)一種基于機(jī)器學(xué)習(xí)的泵密封腔壓力預(yù)測(cè)方法,以高速泵的密封腔壓力數(shù)據(jù)為載體,結(jié)合數(shù)據(jù)預(yù)處理、特征工程和模型優(yōu)化,形成一套完整的預(yù)測(cè)解決方案。本研究不僅在理論上驗(yàn)證了機(jī)器學(xué)習(xí)在工業(yè)參數(shù)預(yù)測(cè)中的可行性,還在實(shí)際應(yīng)用中展示了其顯著的優(yōu)勢(shì)。
1數(shù)據(jù)收集與預(yù)處理
1.1 系統(tǒng)流程圖
機(jī)器學(xué)習(xí)的主要要素包含數(shù)據(jù)、算法和訓(xùn)練優(yōu)化過程,通過對(duì)已知數(shù)據(jù)的智能學(xué)習(xí),獲得對(duì)未知數(shù)據(jù)決策的泛化能力是智能學(xué)習(xí)的關(guān)鍵。機(jī)器學(xué)習(xí)模型在學(xué)習(xí)數(shù)據(jù)的過程中,逐步由高誤差模型向低誤差模型迭代,這不僅依賴于算法本身,更是由梯度下降優(yōu)化器決定的,這種函數(shù)作用于真實(shí)值與預(yù)測(cè)值之間誤差的導(dǎo)數(shù),實(shí)現(xiàn)對(duì)算法參數(shù)的更新,進(jìn)而提高模型準(zhǔn)確度。本文針對(duì)密封腔壓力的研究,對(duì)關(guān)鍵步驟進(jìn)行流程設(shè)計(jì),如圖1所示。
1.2 數(shù)據(jù)收集
在任何基于人工智能的項(xiàng) 目中,數(shù)據(jù)都是至關(guān)重要的,高質(zhì)量的數(shù)據(jù)是訓(xùn)練高性能模型的基礎(chǔ)。為確保預(yù)測(cè)模型的有效性和穩(wěn)定性,數(shù)據(jù)庫包含了115組泵的實(shí)驗(yàn)數(shù)據(jù),每組數(shù)據(jù)的特征都具備獨(dú)特性,覆蓋了泵的設(shè)計(jì)參數(shù)、性能參數(shù)、操作環(huán)境和密封效果等多個(gè)維度,具體包括泵型號(hào)、轉(zhuǎn)速、入口壓力、誘導(dǎo)輪參數(shù)、平衡孔參數(shù)及密封方案等13個(gè)特征項(xiàng)。
為了確保數(shù)據(jù)的質(zhì)量,對(duì)收集到的數(shù)據(jù)進(jìn)行了清洗和處理。數(shù)據(jù)清洗包括缺失值處理、異常值檢測(cè)等步驟,確保數(shù)據(jù)的完整性,并對(duì)不同格式的數(shù)據(jù)進(jìn)行處理,使其具備python程序可識(shí)別的數(shù)字、文本格式,統(tǒng)一數(shù)據(jù)的度量單位和表示方式,最終得到如表1所示形式的數(shù)據(jù)。
1.3 數(shù)據(jù)標(biāo)準(zhǔn)化
通過對(duì)收集數(shù)據(jù)的觀察,明確了數(shù)據(jù)形式多樣、數(shù)值量級(jí)不同的特點(diǎn)。機(jī)器學(xué)習(xí)對(duì)不同特征采取無差別學(xué)習(xí),為了進(jìn)一步消除特征間的量級(jí)差異,適配數(shù)學(xué)模型,對(duì)數(shù)據(jù)進(jìn)行了歸一化和標(biāo)準(zhǔn)化處理,將數(shù)值數(shù)據(jù)縮放到[0,1]區(qū)間內(nèi),均值為0,標(biāo)準(zhǔn)差為1。這些處理使得所有的特征數(shù)值范圍相近,從而提高了模型的訓(xùn)練效率,改善了梯度下降的優(yōu)化過程和預(yù)測(cè)性能。
2數(shù)據(jù)的特征工程
2.1特征提取
為了讓python編程語言識(shí)別數(shù)據(jù)內(nèi)容,使得模型能夠更好地理解和利用這些數(shù)據(jù),所有特征需以數(shù)值的形式體現(xiàn),因此對(duì)高速泵的性能、結(jié)構(gòu)、運(yùn)行數(shù)據(jù)進(jìn)行了詳細(xì)的特征提取。
1)泵模型分解:例如,“GSB-L1-8/1303”字段中的信息分解為型號(hào)L1、流量8和揚(yáng)程1303。
2)誘導(dǎo)輪參數(shù)處理:汽蝕余量為高速泵設(shè)計(jì)中重要的性能指標(biāo),為了防止汽蝕發(fā)生,部分高速泵需配備誘導(dǎo)輪增強(qiáng)汽蝕性能,通過數(shù)據(jù)輸入,可以自動(dòng)識(shí)別是否需要配備誘導(dǎo)輪并獲取誘導(dǎo)輪信息,誘導(dǎo)輪特征提取函數(shù)如圖2所示。例如,“φ30/φ19”字段中的信息分解為誘導(dǎo)輪外徑30和輪轂尺寸19。
3)葉輪平衡孔參數(shù)提取:例如,“φ55×12×φ8”字段中的多個(gè)數(shù)值分別表示平衡孔的位置、數(shù)量和尺寸。
2.2特征編碼
除了特征提取外,一些字符類數(shù)據(jù)無法直接用數(shù)字表示,例如密封類型有串聯(lián)、單端面、雙端面多種文字描述。鑒于數(shù)據(jù)要參與數(shù)學(xué)模型的運(yùn)算,機(jī)器學(xué)習(xí)模型可能會(huì)錯(cuò)誤地認(rèn)為這些值之間存在某種大小或順序關(guān)系,進(jìn)而在模型中會(huì)引入錯(cuò)誤的假設(shè),因而此類無實(shí)際意義的數(shù)值無法直接用數(shù)字0,1,2,…表達(dá)。
為了讓模型理解和處理分類特征,對(duì)這些特征進(jìn)行了one—Hot編碼處理,將其轉(zhuǎn)換為二進(jìn)制向量,以數(shù)組的形式擴(kuò)展這類特征的空間域。其數(shù)學(xué)表達(dá)如下:假設(shè)有一個(gè)分類變量x,其可能取值有n種:{x1,x2,… ,xn},如果x=xi,那么one—Hot編碼后向量為[0,0,…,1,0],其中第i位是1,其余為0。
例如,密封形式中的串聯(lián)可表示為[1,0,0],單端面為[0,1,0],雙端面為[0,0,1]。采用one—Hot編碼避免了序列性假設(shè),消除了對(duì)類別間的任何順序或大小關(guān)系的錯(cuò)誤假設(shè),也對(duì)不同機(jī)器學(xué)習(xí)模型具備極強(qiáng)的兼容性,拓展的特征空間也提升了模型準(zhǔn)確度上限。
3模型選擇與優(yōu)化
3.1模型選擇
在選擇模型時(shí),首先對(duì)機(jī)器學(xué)習(xí)算法大類進(jìn)行劃分,預(yù)測(cè)密封腔壓力輸出為連續(xù)數(shù)值,而非離散數(shù)值,明確研究課題為回歸問題。另外,考慮了數(shù)據(jù)的特性、任務(wù)的復(fù)雜度和計(jì)算資源的限制,對(duì)于密封腔壓力的預(yù)測(cè),對(duì)不同理論下產(chǎn)生的算法模型利弊分析如下:
1)多層感知器(MLP):能夠處理非線性關(guān)系,并且適合高維特征的回歸問題,模型復(fù)雜度設(shè)置靈活,可解釋性好。
2)線性回歸:適用于簡(jiǎn)單的線性關(guān)系預(yù)測(cè),但在處理復(fù)雜的非線性關(guān)系時(shí),性能受到限制。
3)決策樹和隨機(jī)森林:這些模型能夠處理復(fù)雜的特征交互,在高維數(shù)據(jù)中表現(xiàn)良好。但對(duì)數(shù)據(jù)量規(guī)模小、特征空間大的數(shù)據(jù)庫,可能會(huì)面臨過擬合的問題。
4)支持向量機(jī)(SVM):SVM在處理高維空間的分類和回歸任務(wù)時(shí)表現(xiàn)出色,但對(duì)于數(shù)據(jù)集的計(jì)算開銷較大,且對(duì)于存在壞點(diǎn)、異常點(diǎn)的數(shù)據(jù)存在較大方差。
基于初步分析,最終選定MLP作為本次研究的主要模型。
3.2模型訓(xùn)練與優(yōu)化
模型的訓(xùn)練過程包括數(shù)據(jù)分割、前向傳播、損失計(jì)算和反向傳播等步驟,每一步驟的程序設(shè)計(jì)都影響著模型預(yù)測(cè)密封腔壓力學(xué)習(xí)的準(zhǔn)確度。
3.2.1數(shù)據(jù)分割
鑒于數(shù)據(jù)庫體量適中,將數(shù)據(jù)集分為含數(shù)據(jù)量為90%的訓(xùn)練集和含數(shù)據(jù)量為10%的測(cè)試集,并進(jìn)一步在訓(xùn)練集中進(jìn)行交叉驗(yàn)證,排除極端訓(xùn)練的情況,評(píng)估模型的平均泛化能力。
3.2.2前向傳播
MLP由無數(shù)個(gè)神經(jīng)元組成,在前向傳播過程中,輸入數(shù)據(jù)通過神經(jīng)元的層層傳遞,經(jīng)過一系列的加權(quán)和激活函數(shù)的處理,生成最終的輸出預(yù)測(cè)值。本次采用relu激活函數(shù),實(shí)現(xiàn)非線性計(jì)算。
3.2.3損失計(jì)算
實(shí)驗(yàn)中使用均方誤差(MSE)作為損失函數(shù),計(jì)算模型預(yù)測(cè)值與真實(shí)值之間的差異,通過差值可以計(jì)算模型預(yù)測(cè)的準(zhǔn)確度,為后續(xù)模型優(yōu)化提供評(píng)判依據(jù)。損失函數(shù)的公式為:
式中:n是樣本的數(shù)量;yi是第i個(gè)樣本的真實(shí)值;y^i是模型對(duì)第i個(gè)樣本的預(yù)測(cè)值。
3.2.4反向傳播
根據(jù)損失函數(shù)的值,計(jì)算模型參數(shù)的梯度,并使用梯度下降的優(yōu)化算法更新模型參數(shù),以最小化損失量。模型的反向傳播通過優(yōu)化器實(shí)現(xiàn),例如實(shí)驗(yàn)中采用的Adam優(yōu)化器,具備自適應(yīng)學(xué)習(xí)率、對(duì)導(dǎo)數(shù)的偏差糾正、訓(xùn)練過程穩(wěn)定、收斂速度快等特點(diǎn),可實(shí)現(xiàn)在迭代過程中逐漸優(yōu)化參數(shù)的作用,宏觀上體現(xiàn)為模型準(zhǔn)確度提高。
3.2.5超參數(shù)優(yōu)化
通過網(wǎng)格搜索和交叉驗(yàn)證的方法實(shí)現(xiàn)了優(yōu)化模 型的超參數(shù)調(diào)節(jié),包括學(xué)習(xí)率、批量大小、訓(xùn)練輪數(shù)等。通過遍歷不同的超參數(shù)組合,選擇出最佳配置,以提高模型的性能。
4模型評(píng)估與驗(yàn)證
4.1 交叉驗(yàn)證
為了更全面地評(píng)估模型的泛化能力,采用了交叉驗(yàn)證的方法。交叉驗(yàn)證將數(shù)據(jù)分為多個(gè)子集,進(jìn)行多次訓(xùn)練和評(píng)估I最終計(jì)算出模型的平均性能。這種方法有效減少了模型性能受數(shù)據(jù)分割方式影響的風(fēng)險(xiǎn),提高了評(píng)估的穩(wěn)定性。
4.2 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)對(duì)優(yōu)化器學(xué)習(xí)率(lr)、數(shù)據(jù)批次(batch—size)、訓(xùn)練輪數(shù)(epoch)這三個(gè)超參數(shù)采用控制變量法進(jìn)行了設(shè)置,得到18組不同配置的模型,實(shí)驗(yàn)參數(shù)如表2所示。
通過對(duì)比18組數(shù)據(jù)的MSE值可以得出誤差最小的參數(shù)組合I即最優(yōu)解。最優(yōu)解下的實(shí)驗(yàn)結(jié)果如圖3所示。
4.3結(jié)果分析
通過實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)I經(jīng)過100輪的模型迭代訓(xùn)練I損失量Loss總體呈下降趨勢(shì),由最初的0.011 0下降到0.001 2;MSE僅為0.000 3,遠(yuǎn)低于類似應(yīng)用的經(jīng) 驗(yàn)誤差值0.01,證明實(shí)驗(yàn)?zāi)P鸵丫邆淞己玫姆夯芰?用于解決高速泵密封腔壓力預(yù)測(cè)問題時(shí)精度高。最優(yōu)解結(jié)果如表3所示。
進(jìn)一步分析各超參數(shù)對(duì)預(yù)測(cè)密封腔壓力問題的影響:
1)優(yōu)化器學(xué)習(xí)率lr為0.001雖然比較常見I但在本次實(shí)驗(yàn)中效果不如0.0005I表明較低的學(xué)習(xí)率在高速泵密封腔壓力的數(shù)據(jù)集上能更好地優(yōu)化模型I避免過大的梯度更新導(dǎo)致的訓(xùn)練不穩(wěn)定。
2)當(dāng)訓(xùn)練輪數(shù)epoch過低時(shí)I模型訓(xùn)練不充分I無法捕捉到數(shù)據(jù)中的復(fù)雜模式I導(dǎo)致預(yù)測(cè)性能不佳;隨著epoch的增加I為100時(shí)訓(xùn)練效果有顯著提高;當(dāng)epoch為200時(shí)I模型過度擬合訓(xùn)練數(shù)據(jù)I反而降低了對(duì)測(cè)試集的泛化能力。
3)較大的批量大小batchsize可以加快模型訓(xùn)練的收斂速度I但由于本次研究數(shù)據(jù)體量有限I當(dāng)批量大小為12時(shí)I誤差反而增加I因此8是更加合適的批量大小I兼顧了訓(xùn)練的穩(wěn)定性和收斂速度。
研究中以MSE為模型誤差的標(biāo)準(zhǔn)I為了更直觀地識(shí)別密封腔壓力預(yù)測(cè)的準(zhǔn)確度I特列舉12項(xiàng)測(cè)試數(shù)據(jù)的預(yù)測(cè)值與真實(shí)值如表4所示。
通過計(jì)算誤差I(lǐng)發(fā)現(xiàn)大多數(shù)誤差范圍都在4%以內(nèi)I表明用機(jī)器學(xué)習(xí)的方法不僅可以預(yù)測(cè)泵密封腔壓力I預(yù)測(cè)精度也很高I完全具備了工程應(yīng)用的條件。
5結(jié)論與展望
5.1 結(jié)論
1)本文提出了一種應(yīng)用機(jī)器學(xué)習(xí)的高速泵密封腔壓力預(yù)測(cè)方法I通過全流程的研究I系統(tǒng)地開展特征工程和超參數(shù)調(diào)優(yōu)I形成了基于人工智能的新解決方案。
2)探索了針對(duì)密封腔壓力預(yù)測(cè)問題的數(shù)據(jù)特征空間及參數(shù)優(yōu)化方向,優(yōu)化后的MLP模型在測(cè)試集上的均方誤差MSE僅為0.0003,表明了該方法在實(shí)際工程應(yīng)用中的高精度和可靠性。
3)傳統(tǒng)的泵密封腔壓力預(yù)測(cè)主要依賴于實(shí)際運(yùn)轉(zhuǎn)實(shí)驗(yàn),過程煩瑣且成本高昂。該模型的成功證明了機(jī)器學(xué)習(xí)在處理復(fù)雜非線性關(guān)系方面的強(qiáng)大能力,為實(shí)驗(yàn)方法的更新提供了新思路,研究結(jié)果也對(duì)石油化工領(lǐng)域的設(shè)備維護(hù)和操作優(yōu)化具有重要意義。
5.2 展望
盡管本研究的模型已展現(xiàn)出較高的精度和可靠性,但其未來仍有提升空間,包括對(duì)數(shù)據(jù)集規(guī)模和多樣性的補(bǔ)充,對(duì)特征選擇的研究;對(duì)模型架構(gòu)的探索和改進(jìn)提升;還有基于物理引導(dǎo)的機(jī)器學(xué)習(xí)技術(shù)。因此,將工程設(shè)計(jì)與人工智能結(jié)合,是值得挖掘的一個(gè)提高設(shè)計(jì)水平的方向。
[參考文獻(xiàn)]
[1]NGKB,DIAKOW s J.pumps—shaft sealing systemsforcentrifugalandRotarypumps:ApIsTD682[s]. AmericanpetroleumInstitute, 2014.
[2] GEIGER p ,FIEDLER H .Numerical simulation andExperimental ValidationofMechanicalseals [J].TribologyInternational,2017(115): 1—10.
[3] KHONsARI A,BOOsER E.Advances in MechanicalsealsDesignandOperation[J].springer,2019.
《機(jī)電信息》2025年第12期第9篇





