基于深度學(xué)習(xí)的時(shí)序動(dòng)作檢測(cè)研究
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1卷積操作示例
華中科技大學(xué)碩士學(xué)位論文轉(zhuǎn)換為另一個(gè)。常用的神經(jīng)元層由三種類型:卷積層,池化層,以通過(guò)一系列隱藏層將輸入圖像轉(zhuǎn)換為輸出向量。每個(gè)隱藏層由一對(duì)其輸入應(yīng)用線性變換,即用于卷積層的卷積和用于全連接層的通常會(huì)緊隨一個(gè)激活函數(shù),例如ReLU,Sigmoid等非線性函數(shù)。和輸出是稱為特征....
圖2.2ReLU函數(shù)示意圖
設(shè)卷積步長(zhǎng)值為S,將每個(gè)卷積核滑過(guò)輸入特征圖。當(dāng)S1時(shí)跳過(guò)S像素,將產(chǎn)生一個(gè)空間下采樣的特征圖。最后,設(shè)對(duì)應(yīng)填像素的數(shù)為P。通常我們使用它來(lái)保證輸入特征圖的空間大小,因度和高度是相同的。入特征圖的空間大小為WWD。則輸出特征圖的大小為MMW....
圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)圖
圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)圖[75]RPN被放置在最后的共享卷積層conv5之后,并在特征圖上滑動(dòng)以確定該區(qū)否為目標(biāo)。值得注意的是,RPN網(wǎng)絡(luò)與目標(biāo)檢測(cè)層是共享的。具體來(lái)說(shuō),圖像入網(wǎng)絡(luò),在經(jīng)過(guò)conv5層的卷積操作之后,特征圖被傳到RPN網(wǎng)絡(luò)....
圖3.1特征提取采樣示意圖
和內(nèi)存容量的問(wèn)題,整個(gè)視頻無(wú)法直接輸入網(wǎng)絡(luò)。因此,需要對(duì)視頻進(jìn)行一定的處理,在獲得準(zhǔn)確有效的特征圖的前提下,盡量減小內(nèi)存的占用。首先,需要確定的是采樣的方式。設(shè)現(xiàn)有視頻V,以25fps/s的幀率將視頻拆分為圖像,拆分后的總幀數(shù)為T(mén),則有1={f}TttV,ft代表視....
本文編號(hào):4003332
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/4003332.html
下一篇:沒(méi)有了