基于經(jīng)驗共享強化學習的人群疏散仿真方法研究
發(fā)布時間:2024-11-02 16:59
我國目前發(fā)展迅速,人群聚集現(xiàn)象變得非常普遍,突發(fā)事件日益增多。尤其是在學校和火車站等人員眾多的公共場所,事故更是頻發(fā)。目前人群能否迅速成功疏散是許多公共場所的主要安全問題,之前的一些人群疏散演練不僅效果不佳,而且成本普遍較高,對于偶然事件中的隨機情況并不能進行有效模擬,F(xiàn)在通過使用計算機技術可以進行模擬人群疏散,而且可操作性更強,消耗的成本也更少,人群模擬技術在近幾年來也引起了廣泛的關注。通過深入的研究分析人群疏散運動,利用某些疏散場景建模和疏散仿真來設計最佳的疏散計劃,可以更好的幫助人們安全逃生,對于人類來說意義是非常大的?梢詫崿F(xiàn)群體運動的疏散仿真方法已經(jīng)有很多,雖然目前已有方法通過強化學習來規(guī)劃路徑,但是這些方法仍有不足,計算量普遍比較巨大,而且聚集疏散過程較為緩慢。針對上面提出的問題,本文對多智能體強化學習算法做了進一步的改進,更注重于智能體之間的交流共享,提出了經(jīng)驗共享的理論概念,并且將該算法應用到了人群疏散中。該方法使用兩層控制機制,上層引領者使用基于經(jīng)驗共享強化學習算法的決策過程來選擇路徑,下層人群進行疏散時主要通過改進的社會力模型來指導。本文將改進的兩種方法結合在了一起,...
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4009838
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
山東師范大學碩士學位論文1第一章緒論1.1研究背景及意義人類是一種習慣于群居的生命體,所以大量人群聚集的現(xiàn)象總是時有發(fā)生。尤其是在比較擁擠的地方,萬一有事故發(fā)生,很容易導致人群踩踏等突發(fā)事件。如果人群沒有得到有效疏散,可能會發(fā)生大規(guī)模死亡等嚴重事故。就在2009年12月的某一天晚....
山東師范大學碩士學位論文10型將人群運動看作是一個自組織過程的結果[35,36]。人群行為分析已經(jīng)成為仿真領域的一個活躍的研究課題,其主要目標是創(chuàng)建真實的人群運動。如果可以有效利用行為模型,并且將其應用到人群模擬,可以設計出適當?shù)墓箔h(huán)境,將大大降低生活中危險事件的發(fā)生,為社會做....
山東師范大學碩士學位論文
山東師范大學碩士學位論文214.3改進的經(jīng)驗共享強化學習算法多智能體強化學習算法需要解決的問題有兩個比較關鍵的:1)在某些復雜的環(huán)境中,如果智能體的數(shù)量不像之前比較少,而是不斷地增加,可能會導致狀態(tài)空間變得異常巨大,而無法進行運算;2)如何有效地進行智能體之間的交互與合作,增加個....
本文編號:4009838
本文鏈接:http://lk138.cn/jingjilunwen/jianzhujingjilunwen/4009838.html
教材專著