中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 儀器儀表論文 >

基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的電子鼻系統(tǒng)

發(fā)布時(shí)間:2024-05-20 01:47
  電子鼻技術(shù)發(fā)展至今已有幾十年的歷史,在環(huán)境監(jiān)測(cè)、食品安全、醫(yī)療診斷等方面得到了廣泛的應(yīng)用。嗅覺和其他人類知覺類似,是一種主動(dòng)感知(Active Perception)過程,可以用馬爾可夫決策過程(MDP)來描述,強(qiáng)化學(xué)習(xí)是解決MDP問題的重要的方法。近年來,結(jié)合了深度學(xué)習(xí)的強(qiáng)化學(xué)習(xí)算法(如DQN、A3C等)取得了很大的突破,受到了越來越多的重視。傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法依賴外部獎(jiǎng)勵(lì)信號(hào),但在外部獎(jiǎng)勵(lì)稀疏或者缺乏時(shí)強(qiáng)化學(xué)習(xí)算法便無法適用。而生物體可以在只有稀疏外部獎(jiǎng)勵(lì)信號(hào)或者沒有外部獎(jiǎng)勵(lì)信號(hào)的情況下進(jìn)行學(xué)習(xí)。本文在生物學(xué)習(xí)的仿生基礎(chǔ)上提出了一種基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的強(qiáng)化學(xué)習(xí)框架,模擬生物在學(xué)習(xí)過程中產(chǎn)生內(nèi)部獎(jiǎng)勵(lì)信號(hào)(如好奇心和賦能),通過內(nèi)部獎(jiǎng)勵(lì)信號(hào)和外部獎(jiǎng)勵(lì)信號(hào)共同作用,以彌補(bǔ)強(qiáng)化學(xué)習(xí)的缺陷。針對(duì)目前電子鼻存在的不足,本文應(yīng)用基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的強(qiáng)化學(xué)習(xí)框架來提高電子鼻性能。主要進(jìn)行了以下研究:(1)硬件傳感器由于其電子特性、數(shù)量等原因決定了電子鼻無法與生物嗅覺相媲美,本文嘗試在改善進(jìn)氣氣道設(shè)計(jì)、傳感器布置以及動(dòng)態(tài)調(diào)制采樣速度基礎(chǔ)上,將傳統(tǒng)的靜態(tài)分類算法,轉(zhuǎn)換為動(dòng)態(tài)馬爾可夫決策過程,以充分...

【文章頁數(shù)】:67 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖1-1機(jī)器學(xué)習(xí)分類結(jié)構(gòu)圖??監(jiān)督學(xué)習(xí)在分類時(shí)存在很多問題,例如泛化問題、正確學(xué)習(xí)數(shù)據(jù)的選擇和處??

圖1-1機(jī)器學(xué)習(xí)分類結(jié)構(gòu)圖??監(jiān)督學(xué)習(xí)在分類時(shí)存在很多問題,例如泛化問題、正確學(xué)習(xí)數(shù)據(jù)的選擇和處??

獎(jiǎng)勵(lì)信號(hào)才能得以持續(xù)工作。在許多場(chǎng)景下,比物嗅覺機(jī)制一樣,生物進(jìn)行嗅探行為并不是或者了獎(jiǎng)勵(lì)信號(hào)刺激,而是生物內(nèi)在自發(fā)的根據(jù)自身在少數(shù),而是廣泛存在于各種現(xiàn)實(shí)場(chǎng)景,在外部,傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法將不再適用。因此,如何術(shù)領(lǐng)域的重要研究方向。??可獲取和計(jì)算機(jī)算力的快速提升,圖形圖像識(shí)別得....


圖1-2論文章節(jié)結(jié)構(gòu)圖??以下是圖丨-2中論文的具體結(jié)構(gòu):??

圖1-2論文章節(jié)結(jié)構(gòu)圖??以下是圖丨-2中論文的具體結(jié)構(gòu):??

著更高的準(zhǔn)確性。??1.5.2?本文的主要貢獻(xiàn)??(1)提出了一種基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的強(qiáng)化學(xué)習(xí)框架;??(2)在框架中使用兩種方式組成內(nèi)在激勵(lì)信號(hào);??(3)實(shí)驗(yàn)研究了不同氣體(黃酒、VOC氣體)的進(jìn)氣流速與傳感器響應(yīng)的??關(guān)系,并將本文的框架與現(xiàn)有分類算法進(jìn)行對(duì)比。??1.5....


圖2-s外部激勵(lì)行為和內(nèi)部激勵(lì)行為流程對(duì)比圖

圖2-s外部激勵(lì)行為和內(nèi)部激勵(lì)行為流程對(duì)比圖

?基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的電子鼻系統(tǒng)???動(dòng)?他們從事各種各樣的活動(dòng),出于好奇或樂趣,沒有得到回報(bào)。這種行為在成??人和動(dòng)物身上也能觀察到,這種行為現(xiàn)象被稱為內(nèi)在動(dòng)機(jī)。心理學(xué)家依據(jù)動(dòng)機(jī)的??來源區(qū)分內(nèi)在動(dòng)機(jī)和外在動(dòng)機(jī)。當(dāng)獎(jiǎng)勵(lì)來自環(huán)境時(shí),它被稱為外部動(dòng)機(jī)。??大腦會(huì)同時(shí)受外部環(huán)境和內(nèi)....


圖3-1現(xiàn)有強(qiáng)化學(xué)習(xí)框架??

圖3-1現(xiàn)有強(qiáng)化學(xué)習(xí)框架??

現(xiàn)有強(qiáng)化學(xué)習(xí)框架是Agent在已有動(dòng)作序列中選擇一個(gè)動(dòng)作對(duì)環(huán)境產(chǎn)生影??響,環(huán)境把觀測(cè)值和外部獎(jiǎng)勵(lì)反饋給Agent,然后Agent據(jù)此使用算法對(duì)下一個(gè)??動(dòng)作序列進(jìn)行動(dòng)作選取。如圖3-1:??atu動(dòng)作???觀測(cè)值〇,?t??環(huán)境?Agent?一???^?DQN,A3C算法??外....



本文編號(hào):3978773

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/yiqiyibiao/3978773.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9e49d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com