基于InfoLSGAN和AC算法的滾動(dòng)軸承剩余壽命預(yù)測(cè)
發(fā)布時(shí)間:2020-11-19 08:13
為解決小樣本和噪聲干擾下滾動(dòng)軸承剩余壽命(RUL)預(yù)測(cè)準(zhǔn)確率低的問題,提出一種基于信息最小二乘生成對(duì)抗網(wǎng)絡(luò)(information least squares generative adversarial network,InfoLSGAN)和行動(dòng)者-評(píng)論家(actor-critic,AC)算法的滾動(dòng)軸承剩余壽命預(yù)測(cè)方法。將堆疊降噪自動(dòng)編碼器、信息生成對(duì)抗網(wǎng)絡(luò)和最小二乘生成對(duì)抗網(wǎng)絡(luò)相結(jié)合,構(gòu)建InfoLSGAN,自動(dòng)地從噪聲數(shù)據(jù)中提取可解釋的魯棒特征,解決梯度消失問題;采用基于AC的訓(xùn)練算法訓(xùn)練InfoLSGAN,減少訓(xùn)練時(shí)間,加快收斂速度;根據(jù)訓(xùn)練后的InfoLSGAN,利用softmax分類器預(yù)測(cè)測(cè)試樣本中滾動(dòng)軸承的剩余壽命。通過滾動(dòng)軸承加速疲勞壽命試驗(yàn)驗(yàn)證該方法的有效性。試驗(yàn)結(jié)果證明,當(dāng)信噪比等于0時(shí),該方法對(duì)滾動(dòng)軸承測(cè)試樣本的壽命預(yù)測(cè)準(zhǔn)確率至少提高了10%。在小樣本情況下,滾動(dòng)軸承剩余壽命預(yù)測(cè)的平均準(zhǔn)確率達(dá)95.84%。
【部分圖文】:
式中θn+1為輸出層的參數(shù)集,g(·)為softmax分類器的激活函數(shù)。SDAE通過最小化交叉熵?fù)p失函數(shù)LSDAE實(shí)現(xiàn)微調(diào),采用Adam優(yōu)化算法[18]微調(diào)SDAE的參數(shù)集。L SDAE = argmin Θ - 1 Μ ∑ m=1 Μ [ y m ln?c m -(1-y m )ln(1-c m )] ??? (2)
L(G)=E x~Ρ data (x) [log?D * (x)]+ E z~Ρ z (z) {log[1-D * (G(z))]}=-log(4)+ 2D J-S (Ρ data |Ρ g ) ??? (6)式中L(G)為生成器G的成本函數(shù)。DJ-S(·)為Jensen-Shannon散度。當(dāng)Pdata=Pg時(shí),Jensen-Shannon散度等于0,且L(G)達(dá)到最小值。
式中rt+i為智能體在狀態(tài)st+i根據(jù)策略π執(zhí)行動(dòng)作at+i所獲得的立即獎(jiǎng)勵(lì)。Q(st)為在狀態(tài)st的期望回報(bào)。若TD誤差大于零,則智能體在后續(xù)狀態(tài)中應(yīng)積極執(zhí)行動(dòng)作at;若TD誤差小于零,則智能體在后續(xù)狀態(tài)中應(yīng)降低執(zhí)行動(dòng)作at的概率。AC算法將行動(dòng)者和評(píng)論家獨(dú)立出來,對(duì)值函數(shù)和策略函數(shù)進(jìn)行同步訓(xùn)練,從而減少訓(xùn)練時(shí)間,加快收斂速度。因此,AC算法可用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),其值函數(shù)梯度和策略函數(shù)梯度的計(jì)算公式分別為
【相似文獻(xiàn)】
本文編號(hào):2889945
【部分圖文】:
式中θn+1為輸出層的參數(shù)集,g(·)為softmax分類器的激活函數(shù)。SDAE通過最小化交叉熵?fù)p失函數(shù)LSDAE實(shí)現(xiàn)微調(diào),采用Adam優(yōu)化算法[18]微調(diào)SDAE的參數(shù)集。L SDAE = argmin Θ - 1 Μ ∑ m=1 Μ [ y m ln?c m -(1-y m )ln(1-c m )] ??? (2)
L(G)=E x~Ρ data (x) [log?D * (x)]+ E z~Ρ z (z) {log[1-D * (G(z))]}=-log(4)+ 2D J-S (Ρ data |Ρ g ) ??? (6)式中L(G)為生成器G的成本函數(shù)。DJ-S(·)為Jensen-Shannon散度。當(dāng)Pdata=Pg時(shí),Jensen-Shannon散度等于0,且L(G)達(dá)到最小值。
式中rt+i為智能體在狀態(tài)st+i根據(jù)策略π執(zhí)行動(dòng)作at+i所獲得的立即獎(jiǎng)勵(lì)。Q(st)為在狀態(tài)st的期望回報(bào)。若TD誤差大于零,則智能體在后續(xù)狀態(tài)中應(yīng)積極執(zhí)行動(dòng)作at;若TD誤差小于零,則智能體在后續(xù)狀態(tài)中應(yīng)降低執(zhí)行動(dòng)作at的概率。AC算法將行動(dòng)者和評(píng)論家獨(dú)立出來,對(duì)值函數(shù)和策略函數(shù)進(jìn)行同步訓(xùn)練,從而減少訓(xùn)練時(shí)間,加快收斂速度。因此,AC算法可用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),其值函數(shù)梯度和策略函數(shù)梯度的計(jì)算公式分別為
【相似文獻(xiàn)】
相關(guān)期刊論文 前1條
1 ;AC型耐腐蝕泵[J];機(jī)電新產(chǎn)品導(dǎo)報(bào);1994年01期
本文編號(hào):2889945
本文鏈接:http://lk138.cn/kejilunwen/jixiegongcheng/2889945.html
最近更新
教材專著