基于強(qiáng)化學(xué)習(xí)的多路徑傳輸控制協(xié)議優(yōu)化
【學(xué)位單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類(lèi)】:TP393.06
【部分圖文】:
、??圖1-1:?MPTCP的協(xié)議棧??TCP/IP協(xié)議族是一組不同層次上的多個(gè)協(xié)議的組合,如圖1-1左側(cè)所示,??TCP/IP通常被表示為一個(gè)四層協(xié)議系統(tǒng),每層負(fù)責(zé)不同的功能,層與層之間分??工合作[I]。鏈路層通常包括操作系統(tǒng)中的設(shè)備驅(qū)動(dòng)程序和計(jì)算機(jī)中對(duì)應(yīng)的網(wǎng)??絡(luò)接口卡,處理物理接口的細(xì)節(jié);網(wǎng)絡(luò)層負(fù)責(zé)處理分組選路等分組在網(wǎng)絡(luò)中的??活動(dòng);傳輸層負(fù)責(zé)為兩臺(tái)主機(jī)上的應(yīng)用程序提供端到端的通信。傳輸控制協(xié)議??TCP屬于傳輸層的協(xié)議,可以提供高可靠性的數(shù)據(jù)通信;應(yīng)用層負(fù)責(zé)處理特定??的應(yīng)用程序細(xì)節(jié)[1]。??如圖1-1右側(cè)所示,MPTCP也屬于傳輸層的協(xié)議,可以看作是單路徑TCP??擴(kuò)展到多路徑的多路傳輸協(xié)議。MPTCP使得多網(wǎng)卡、多鏈路的資源得以充分利??用,同時(shí)提高傳輸?shù)男屎汪敯粜。MPTCP使用與單路徑TCP?—樣的socket??接口,使得能夠兼容現(xiàn)有的TCP應(yīng)用。同時(shí)MPTCP的每個(gè)子流和單路徑TCP??流類(lèi)似,使用相同的TCP首部數(shù)據(jù)格式和數(shù)據(jù)封裝過(guò)程,這使得MPTCP能夠??兼容其下的網(wǎng)絡(luò)層協(xié)議。??圖1-2展示了使用MPTCP進(jìn)行數(shù)據(jù)傳輸時(shí)
?、、、、?TCP!?TCP2?…TCPn??、??圖1-1:?MPTCP的協(xié)議棧??TCP/IP協(xié)議族是一組不同層次上的多個(gè)協(xié)議的組合,如圖1-1左側(cè)所示,??TCP/IP通常被表示為一個(gè)四層協(xié)議系統(tǒng),每層負(fù)責(zé)不同的功能,層與層之間分??工合作[I]。鏈路層通常包括操作系統(tǒng)中的設(shè)備驅(qū)動(dòng)程序和計(jì)算機(jī)中對(duì)應(yīng)的網(wǎng)??絡(luò)接口卡,處理物理接口的細(xì)節(jié);網(wǎng)絡(luò)層負(fù)責(zé)處理分組選路等分組在網(wǎng)絡(luò)中的??活動(dòng);傳輸層負(fù)責(zé)為兩臺(tái)主機(jī)上的應(yīng)用程序提供端到端的通信。傳輸控制協(xié)議??TCP屬于傳輸層的協(xié)議,可以提供高可靠性的數(shù)據(jù)通信;應(yīng)用層負(fù)責(zé)處理特定??的應(yīng)用程序細(xì)節(jié)[1]。??如圖1-1右側(cè)所示,MPTCP也屬于傳輸層的協(xié)議,可以看作是單路徑TCP??擴(kuò)展到多路徑的多路傳輸協(xié)議。MPTCP使得多網(wǎng)卡、多鏈路的資源得以充分利??用,同時(shí)提高傳輸?shù)男屎汪敯粜。MPTCP使用與單路徑TCP?—樣的socket??接口,使得能夠兼容現(xiàn)有的TCP應(yīng)用。同時(shí)MPTCP的每個(gè)子流和單路徑TCP??流類(lèi)似
圖3-3:基于強(qiáng)化學(xué)習(xí)的MPTCP擁塞控制SmartCC的框架??態(tài)映射到離散的狀態(tài)區(qū)域塊。所以每個(gè)狀態(tài)s可以由一個(gè)狀態(tài)區(qū)域塊t?=?iA〇)??表示,該等式表示狀態(tài)區(qū)域塊T包含狀態(tài)s或者狀態(tài)區(qū)域塊T被狀態(tài)s激活。??因此,2函數(shù)(動(dòng)作值函數(shù))可以表示為:2(r,a)?=?2(少⑷,a)=E[2:yV,],??其含義為從狀態(tài)s出發(fā),執(zhí)行動(dòng)作《后,機(jī)器能得到的累積折扣獎(jiǎng)賞的期望。??本文采用基于表格形式的Q-leaming算法[37],來(lái)學(xué)出一個(gè)貪婪的確定性??策略?7r(a,)?=?argmaxa?2(少(\),^〇。舉例,當(dāng)?A?=?argmaxa?2(0(4),^,那么如果??機(jī)器從狀態(tài)^出發(fā),執(zhí)行動(dòng)作并一直根據(jù)該策略選擇執(zhí)行動(dòng)作,機(jī)器將??會(huì)得到最大化的累積折扣獎(jiǎng)賞。訓(xùn)練器的規(guī)則表也會(huì)根據(jù)策略7T添加或更新規(guī)??則—個(gè)基于貪婪確定性策略的規(guī)則表如表3-3所示,它指定了不同狀??態(tài)下最大化累積折扣獎(jiǎng)賞的動(dòng)作。例如表3-3的第一行規(guī)則<Tl5?A?>,第一項(xiàng)??被狀態(tài)h激活的狀態(tài)區(qū)域塊n?=?(Ahi),第二項(xiàng)是基于2函數(shù)最大化的動(dòng)作??ax?=?argmaxa?Q(i//(si),a)〇??
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 哈渭濤;;一種新的反饋式流媒體擁塞控制算法[J];科學(xué)技術(shù)與工程;2010年05期
2 韓燮;安愛(ài)芬;;一種網(wǎng)絡(luò)擁塞控制算法的研究[J];太原大學(xué)學(xué)報(bào);2008年03期
3 王滿(mǎn)喜;胡向暉;馬刈非;;混合式的網(wǎng)絡(luò)擁塞控制算法[J];電子科技大學(xué)學(xué)報(bào);2007年03期
4 ?膳;李紹滋;;一種基于反饋的流媒體擁塞控制算法的改進(jìn)[J];計(jì)算機(jī)應(yīng)用;2007年10期
5 楊新宇,曾明,江曉,趙瑞,吳航;一種新的自適應(yīng)網(wǎng)絡(luò)擁塞控制算法[J];計(jì)算機(jī)工程;2004年08期
6 蔣學(xué)勤,楊麗芳;網(wǎng)絡(luò)中兩類(lèi)擁塞控制算法比較[J];貴州大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期
7 熊曉將;;基于探測(cè)機(jī)制的衛(wèi)星鏈路擁塞控制算法研究[J];航天器工程;2012年05期
8 黨美瑩;歐陽(yáng);孫元姝;甄長(zhǎng)飛;;一種新的流媒體擁塞控制算法[J];小型微型計(jì)算機(jī)系統(tǒng);2011年08期
9 彭立宏;張鶴穎;姜新文;竇文華;;一種快速公平收斂的擁塞控制算法[J];電子學(xué)報(bào);2010年08期
10 劉宇蘋(píng);;基于擁塞控制算法的研究[J];武漢船舶職業(yè)技術(shù)學(xué)院學(xué)報(bào);2009年03期
相關(guān)博士學(xué)位論文 前10條
1 龍承念;高動(dòng)態(tài)異構(gòu)INTERNET擁塞控制算法研究[D];燕山大學(xué);2004年
2 錢(qián)艷平;互聯(lián)網(wǎng)擁塞控制算法若干問(wèn)題研究[D];東南大學(xué);2006年
3 楊洪勇;Internet擁塞控制算法的動(dòng)力學(xué)研究[D];東南大學(xué);2005年
4 邵立松;互聯(lián)網(wǎng)端到端擁塞控制算法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年
5 陳虎;互聯(lián)網(wǎng)擁塞控制算法研究[D];華中科技大學(xué);2008年
6 胡曦;無(wú)線(xiàn)SDN穩(wěn)定性擁塞控制算法研究[D];電子科技大學(xué);2017年
7 侯萍;基于控制理論的網(wǎng)絡(luò)擁塞控制算法研究[D];南京理工大學(xué);2011年
8 楊歆豪;基于控制理論的網(wǎng)絡(luò)擁塞控制中的若干算法研究[D];南京理工大學(xué);2010年
9 任娟;無(wú)線(xiàn)Mesh網(wǎng)絡(luò)的資源分配及擁塞控制算法研究[D];北京交通大學(xué);2010年
10 何凌;TCP/IP網(wǎng)絡(luò)擁塞控制若干問(wèn)題的研究[D];東北大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 張晗;基于強(qiáng)化學(xué)習(xí)的多路徑傳輸控制協(xié)議優(yōu)化[D];南京大學(xué);2019年
2 李超君;面向?qū)崟r(shí)音視頻流的擁塞控制算法[D];北京郵電大學(xué);2019年
3 吳蕾蕾;數(shù)據(jù)驅(qū)動(dòng)的移動(dòng)視頻直播擁塞控制技術(shù)研究[D];北京郵電大學(xué);2019年
4 李洪林;異構(gòu)網(wǎng)絡(luò)中TCP擁塞控制算法的研究與改進(jìn)[D];北京郵電大學(xué);2019年
5 李少博;端到端的TCP擁塞控制算法研究[D];哈爾濱理工大學(xué);2018年
6 劉盼;基于BBR擁塞控制算法的空間環(huán)境數(shù)據(jù)傳輸系統(tǒng)[D];中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院國(guó)家空間科學(xué)中心);2018年
7 潘俊臣;基于TCP協(xié)議的擁塞控制算法的研究[D];成都理工大學(xué);2018年
8 徐磊;基于模糊神經(jīng)網(wǎng)絡(luò)的無(wú)線(xiàn)網(wǎng)絡(luò)擁塞控制算法[D];江蘇科技大學(xué);2018年
9 湯永鋒;基于嵌入式的TCP無(wú)線(xiàn)通信設(shè)計(jì)與性能研究[D];華中科技大學(xué);2017年
10 段家琛;移動(dòng)環(huán)境下MPTCP擁塞控制算法的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
本文編號(hào):2891344
本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2891344.html