基于自適應(yīng)動(dòng)態(tài)規(guī)劃的無(wú)人機(jī)編隊(duì)最優(yōu)協(xié)同控制研究
發(fā)布時(shí)間:2020-06-22 05:25
【摘要】:本論文基于自適應(yīng)動(dòng)態(tài)規(guī)劃(Adaptive Dynamic Programming,ADP)方法,結(jié)合一致性理論,對(duì)無(wú)人機(jī)編隊(duì)的最優(yōu)協(xié)同控制進(jìn)行研究。首先建立一致性誤差動(dòng)態(tài)模型,基于此模型,主要從三個(gè)方面深入分析和研究相應(yīng)的協(xié)同控制技術(shù):討論無(wú)人機(jī)系統(tǒng)輸入受限情形下的一致性問(wèn)題,討論無(wú)人機(jī)系統(tǒng)模型部分未知和模型完全未知情形下的一致性問(wèn)題。主要內(nèi)容有:(1)針對(duì)編隊(duì)中的無(wú)人機(jī)系統(tǒng)存在輸入飽和受限情形,提出了分布式自適應(yīng)最優(yōu)控制方案求解其非零和微分博弈問(wèn)題。為解決輸入受限造成的不連續(xù)問(wèn)題,選用一個(gè)合適的非二次型泛函將問(wèn)題轉(zhuǎn)化為可求解的優(yōu)化問(wèn)題。為每架無(wú)人機(jī)設(shè)計(jì)單網(wǎng)絡(luò)結(jié)構(gòu)來(lái)近似耦合哈密頓-雅克比(Hamilton-Jacobi,HJ)方程的解,進(jìn)而求得分布式最優(yōu)協(xié)同控制律。對(duì)于無(wú)人機(jī)的編隊(duì)系統(tǒng),使用單網(wǎng)絡(luò)而不是自適應(yīng)動(dòng)態(tài)規(guī)劃典型的雙網(wǎng)結(jié)構(gòu)優(yōu)勢(shì)更加突出,因?yàn)檫@樣不但可以減少對(duì)無(wú)人機(jī)的內(nèi)存需求還可以減少計(jì)算負(fù)擔(dān)。此外所有無(wú)人機(jī)的神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)權(quán)值更新都是同時(shí)且連續(xù)的,這也使得所得控制律是平滑的。(2)針對(duì)模型部分未知的無(wú)人機(jī)編隊(duì)系統(tǒng)的最優(yōu)協(xié)同控制問(wèn)題,提出了基于辨識(shí)-評(píng)價(jià)結(jié)構(gòu)的在線自適應(yīng)最優(yōu)控制方案。一般地,非線性非零和微分博弈最優(yōu)協(xié)同控制的關(guān)鍵是耦合HJ方程的求解。由于存在不確定性,針對(duì)每一架無(wú)人機(jī),分別使用一個(gè)辨識(shí)NN用于估計(jì)無(wú)人機(jī)系統(tǒng)的未知?jiǎng)討B(tài)和一個(gè)評(píng)價(jià)NN用于近似耦合HJ方程的解(最優(yōu)值函數(shù)),繼而導(dǎo)出最優(yōu)協(xié)同控制律;诒孀R(shí)-評(píng)價(jià)結(jié)構(gòu),辨識(shí)NN和評(píng)價(jià)NN可以同步調(diào)整權(quán)值。(3)針對(duì)模型完全未知且存在干擾的情形,提出了一種新的數(shù)據(jù)驅(qū)動(dòng)ADP算法。首先提出了基于模型的策略迭代算法,然后證明了值函數(shù)和控制策略的迭代序列收斂于最優(yōu)函數(shù)。為了放松算法對(duì)系統(tǒng)模型準(zhǔn)確信息的依賴(lài),結(jié)合前面基于模型的算法和積分強(qiáng)化學(xué)習(xí)(Integral Reinforcement Learning,IRL)技術(shù),推導(dǎo)出了無(wú)模型(model free)迭代方程。進(jìn)一步提出一種數(shù)據(jù)驅(qū)動(dòng)的迭代ADP方法,利用生成的系統(tǒng)數(shù)據(jù)來(lái)求解無(wú)模型迭代方程。并且從理論上證明了這種無(wú)模型迭代方程等價(jià)于基于模型的迭代方程。這意味著數(shù)據(jù)驅(qū)動(dòng)算法可以近似最優(yōu)值函數(shù)和控制策略。
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:V279;V249.1
【圖文】:
雖然單架無(wú)人機(jī)單獨(dú)執(zhí)行任務(wù)時(shí)會(huì)有某些優(yōu)勢(shì),但是多架無(wú)人機(jī)的協(xié)同會(huì)帶來(lái)更大的好處以一定的方式協(xié)調(diào)多架無(wú)人機(jī)的移動(dòng),以達(dá)到某一目標(biāo),如許多小型且便宜的無(wú)人機(jī)一起行動(dòng)可以取得單個(gè)龐大無(wú)人機(jī)達(dá)不到的效果。比如對(duì)目標(biāo)的精確定位、進(jìn)入狹小洞穴對(duì)其測(cè)繪或者進(jìn)入濃密的雨林進(jìn)行實(shí)時(shí)環(huán)境評(píng)估。多個(gè)無(wú)人飛行器的編隊(duì)飛行已被確定為許多協(xié)同任務(wù)的關(guān)鍵技術(shù)[1],本質(zhì)是將成本和復(fù)雜度從硬件平臺(tái)轉(zhuǎn)移到軟件和算法上。無(wú)人機(jī)系統(tǒng)的協(xié)同控制對(duì)許多民用、國(guó)土安全和軍事應(yīng)用也都有潛在的影響。潛在的民用項(xiàng)目包括協(xié)同監(jiān)控森林火災(zāi)、油田或管道泄漏和跟蹤野生動(dòng)物等。潛在的國(guó)土安全應(yīng)用包括邊境巡邏和監(jiān)測(cè)核電站周邊地區(qū)軍事上的應(yīng)用包括監(jiān)視、偵察和戰(zhàn)斗損傷評(píng)估等。然而,對(duì)于所有這些應(yīng)用,都因通信帶寬距離和電源續(xù)航能力的約束對(duì)集中式的指揮和控制提出了巨大難題。為了使一組無(wú)人機(jī)保持一定的隊(duì)形結(jié)構(gòu),它們之間應(yīng)該存在信息交互作用。研究編隊(duì)中無(wú)人機(jī)的信息流動(dòng)對(duì)理解它們的協(xié)同運(yùn)動(dòng)起著重要的作用。在目前涉及無(wú)人駕駛飛行器的軍事場(chǎng)景中,像“捕食者”(見(jiàn)圖 1. 1)這樣的高配無(wú)人機(jī)可能具有雙向通信能力,而一些微型飛行器可能只有接收信息的能力。無(wú)人機(jī)編隊(duì)協(xié)同控制在結(jié)構(gòu)上具有個(gè)體+通信規(guī)則+連通拓?fù)涞奶攸c(diǎn),且系統(tǒng)整體動(dòng)力學(xué)是由簡(jiǎn)單的個(gè)體行為規(guī)則與局部信息產(chǎn)生[2],控制目的就是通過(guò)無(wú)人機(jī)間相互配合以實(shí)現(xiàn)協(xié)同行為,具有成本低、效率高、自適應(yīng)性強(qiáng)、維護(hù)便捷等優(yōu)點(diǎn)。
雖然單架無(wú)人機(jī)單獨(dú)執(zhí)行任務(wù)時(shí)會(huì)有某些優(yōu)勢(shì),但是多架無(wú)人機(jī)的協(xié)同會(huì)帶來(lái)更大的好處以一定的方式協(xié)調(diào)多架無(wú)人機(jī)的移動(dòng),以達(dá)到某一目標(biāo),如許多小型且便宜的無(wú)人機(jī)一起行動(dòng)可以取得單個(gè)龐大無(wú)人機(jī)達(dá)不到的效果。比如對(duì)目標(biāo)的精確定位、進(jìn)入狹小洞穴對(duì)其測(cè)繪或者進(jìn)入濃密的雨林進(jìn)行實(shí)時(shí)環(huán)境評(píng)估。多個(gè)無(wú)人飛行器的編隊(duì)飛行已被確定為許多協(xié)同任務(wù)的關(guān)鍵技術(shù)[1],本質(zhì)是將成本和復(fù)雜度從硬件平臺(tái)轉(zhuǎn)移到軟件和算法上。無(wú)人機(jī)系統(tǒng)的協(xié)同控制對(duì)許多民用、國(guó)土安全和軍事應(yīng)用也都有潛在的影響。潛在的民用項(xiàng)目包括協(xié)同監(jiān)控森林火災(zāi)、油田或管道泄漏和跟蹤野生動(dòng)物等。潛在的國(guó)土安全應(yīng)用包括邊境巡邏和監(jiān)測(cè)核電站周邊地區(qū)軍事上的應(yīng)用包括監(jiān)視、偵察和戰(zhàn)斗損傷評(píng)估等。然而,對(duì)于所有這些應(yīng)用,都因通信帶寬距離和電源續(xù)航能力的約束對(duì)集中式的指揮和控制提出了巨大難題。為了使一組無(wú)人機(jī)保持一定的隊(duì)形結(jié)構(gòu),它們之間應(yīng)該存在信息交互作用。研究編隊(duì)中無(wú)人機(jī)的信息流動(dòng)對(duì)理解它們的協(xié)同運(yùn)動(dòng)起著重要的作用。在目前涉及無(wú)人駕駛飛行器的軍事場(chǎng)景中,像“捕食者”(見(jiàn)圖 1. 1)這樣的高配無(wú)人機(jī)可能具有雙向通信能力,而一些微型飛行器可能只有接收信息的能力。無(wú)人機(jī)編隊(duì)協(xié)同控制在結(jié)構(gòu)上具有個(gè)體+通信規(guī)則+連通拓?fù)涞奶攸c(diǎn),且系統(tǒng)整體動(dòng)力學(xué)是由簡(jiǎn)單的個(gè)體行為規(guī)則與局部信息產(chǎn)生[2],控制目的就是通過(guò)無(wú)人機(jī)間相互配合以實(shí)現(xiàn)協(xié)同行為,具有成本低、效率高、自適應(yīng)性強(qiáng)、維護(hù)便捷等優(yōu)點(diǎn)。
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:V279;V249.1
【圖文】:
雖然單架無(wú)人機(jī)單獨(dú)執(zhí)行任務(wù)時(shí)會(huì)有某些優(yōu)勢(shì),但是多架無(wú)人機(jī)的協(xié)同會(huì)帶來(lái)更大的好處以一定的方式協(xié)調(diào)多架無(wú)人機(jī)的移動(dòng),以達(dá)到某一目標(biāo),如許多小型且便宜的無(wú)人機(jī)一起行動(dòng)可以取得單個(gè)龐大無(wú)人機(jī)達(dá)不到的效果。比如對(duì)目標(biāo)的精確定位、進(jìn)入狹小洞穴對(duì)其測(cè)繪或者進(jìn)入濃密的雨林進(jìn)行實(shí)時(shí)環(huán)境評(píng)估。多個(gè)無(wú)人飛行器的編隊(duì)飛行已被確定為許多協(xié)同任務(wù)的關(guān)鍵技術(shù)[1],本質(zhì)是將成本和復(fù)雜度從硬件平臺(tái)轉(zhuǎn)移到軟件和算法上。無(wú)人機(jī)系統(tǒng)的協(xié)同控制對(duì)許多民用、國(guó)土安全和軍事應(yīng)用也都有潛在的影響。潛在的民用項(xiàng)目包括協(xié)同監(jiān)控森林火災(zāi)、油田或管道泄漏和跟蹤野生動(dòng)物等。潛在的國(guó)土安全應(yīng)用包括邊境巡邏和監(jiān)測(cè)核電站周邊地區(qū)軍事上的應(yīng)用包括監(jiān)視、偵察和戰(zhàn)斗損傷評(píng)估等。然而,對(duì)于所有這些應(yīng)用,都因通信帶寬距離和電源續(xù)航能力的約束對(duì)集中式的指揮和控制提出了巨大難題。為了使一組無(wú)人機(jī)保持一定的隊(duì)形結(jié)構(gòu),它們之間應(yīng)該存在信息交互作用。研究編隊(duì)中無(wú)人機(jī)的信息流動(dòng)對(duì)理解它們的協(xié)同運(yùn)動(dòng)起著重要的作用。在目前涉及無(wú)人駕駛飛行器的軍事場(chǎng)景中,像“捕食者”(見(jiàn)圖 1. 1)這樣的高配無(wú)人機(jī)可能具有雙向通信能力,而一些微型飛行器可能只有接收信息的能力。無(wú)人機(jī)編隊(duì)協(xié)同控制在結(jié)構(gòu)上具有個(gè)體+通信規(guī)則+連通拓?fù)涞奶攸c(diǎn),且系統(tǒng)整體動(dòng)力學(xué)是由簡(jiǎn)單的個(gè)體行為規(guī)則與局部信息產(chǎn)生[2],控制目的就是通過(guò)無(wú)人機(jī)間相互配合以實(shí)現(xiàn)協(xié)同行為,具有成本低、效率高、自適應(yīng)性強(qiáng)、維護(hù)便捷等優(yōu)點(diǎn)。
雖然單架無(wú)人機(jī)單獨(dú)執(zhí)行任務(wù)時(shí)會(huì)有某些優(yōu)勢(shì),但是多架無(wú)人機(jī)的協(xié)同會(huì)帶來(lái)更大的好處以一定的方式協(xié)調(diào)多架無(wú)人機(jī)的移動(dòng),以達(dá)到某一目標(biāo),如許多小型且便宜的無(wú)人機(jī)一起行動(dòng)可以取得單個(gè)龐大無(wú)人機(jī)達(dá)不到的效果。比如對(duì)目標(biāo)的精確定位、進(jìn)入狹小洞穴對(duì)其測(cè)繪或者進(jìn)入濃密的雨林進(jìn)行實(shí)時(shí)環(huán)境評(píng)估。多個(gè)無(wú)人飛行器的編隊(duì)飛行已被確定為許多協(xié)同任務(wù)的關(guān)鍵技術(shù)[1],本質(zhì)是將成本和復(fù)雜度從硬件平臺(tái)轉(zhuǎn)移到軟件和算法上。無(wú)人機(jī)系統(tǒng)的協(xié)同控制對(duì)許多民用、國(guó)土安全和軍事應(yīng)用也都有潛在的影響。潛在的民用項(xiàng)目包括協(xié)同監(jiān)控森林火災(zāi)、油田或管道泄漏和跟蹤野生動(dòng)物等。潛在的國(guó)土安全應(yīng)用包括邊境巡邏和監(jiān)測(cè)核電站周邊地區(qū)軍事上的應(yīng)用包括監(jiān)視、偵察和戰(zhàn)斗損傷評(píng)估等。然而,對(duì)于所有這些應(yīng)用,都因通信帶寬距離和電源續(xù)航能力的約束對(duì)集中式的指揮和控制提出了巨大難題。為了使一組無(wú)人機(jī)保持一定的隊(duì)形結(jié)構(gòu),它們之間應(yīng)該存在信息交互作用。研究編隊(duì)中無(wú)人機(jī)的信息流動(dòng)對(duì)理解它們的協(xié)同運(yùn)動(dòng)起著重要的作用。在目前涉及無(wú)人駕駛飛行器的軍事場(chǎng)景中,像“捕食者”(見(jiàn)圖 1. 1)這樣的高配無(wú)人機(jī)可能具有雙向通信能力,而一些微型飛行器可能只有接收信息的能力。無(wú)人機(jī)編隊(duì)協(xié)同控制在結(jié)構(gòu)上具有個(gè)體+通信規(guī)則+連通拓?fù)涞奶攸c(diǎn),且系統(tǒng)整體動(dòng)力學(xué)是由簡(jiǎn)單的個(gè)體行為規(guī)則與局部信息產(chǎn)生[2],控制目的就是通過(guò)無(wú)人機(jī)間相互配合以實(shí)現(xiàn)協(xié)同行為,具有成本低、效率高、自適應(yīng)性強(qiáng)、維護(hù)便捷等優(yōu)點(diǎn)。
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 張化光;張欣;羅艷紅;楊s
本文編號(hào):2725260
本文鏈接:http://www.lk138.cn/kejilunwen/hangkongsky/2725260.html
最近更新
教材專(zhuān)著