中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的時(shí)序動(dòng)作檢測(cè)研究

發(fā)布時(shí)間:2024-07-07 07:04
  近年來(lái),隨著全球移動(dòng)互聯(lián)網(wǎng)技術(shù)以及數(shù)字化設(shè)備的快速發(fā)展和普及,互聯(lián)網(wǎng)上的視頻數(shù)據(jù)每天都在以驚人的速度增長(zhǎng),依靠人工的方式處理如此海量的視頻數(shù)據(jù)并不現(xiàn)實(shí),基于深度學(xué)習(xí)的時(shí)序動(dòng)作檢測(cè)研究引起了廣大研究者們的興趣,已經(jīng)成為了目前智能視頻分析領(lǐng)域中的研究熱點(diǎn)。該研究涉及計(jì)算機(jī)視覺(jué)、圖像處理、視頻分析、目標(biāo)檢測(cè)等諸多研究領(lǐng)域,具有重要的科學(xué)意義,可以廣泛應(yīng)用于智能安防、機(jī)器人視覺(jué)、虛擬現(xiàn)實(shí)、視頻監(jiān)控、人機(jī)交互等多個(gè)領(lǐng)域,具有良好的應(yīng)用前景。時(shí)序動(dòng)作檢測(cè)是給定一段未裁剪的視頻,實(shí)現(xiàn)視頻中動(dòng)作片段的檢測(cè),包括開(kāi)始時(shí)間、結(jié)束時(shí)間和動(dòng)作類(lèi)別,是智能視頻分析領(lǐng)域中的研究熱點(diǎn)之一;谑止ぬ卣魈崛〉膫鹘y(tǒng)方法對(duì)于復(fù)雜多變的動(dòng)作類(lèi)型魯棒性較差,基于深度學(xué)習(xí)的方法可以有效地學(xué)習(xí)到不同動(dòng)作之間的差異,在視頻動(dòng)作分析領(lǐng)域已取得了大量的研究成果。然而時(shí)序動(dòng)作檢測(cè)的性能?chē)?yán)重依賴(lài)于目標(biāo)動(dòng)作的時(shí)序提議效果,有效的時(shí)序提議對(duì)動(dòng)作檢測(cè)效果起到了決定性的作用,而視頻數(shù)據(jù)結(jié)構(gòu)復(fù)雜、目標(biāo)動(dòng)作變化多樣且動(dòng)作持續(xù)時(shí)間長(zhǎng)短不一等問(wèn)題,使得時(shí)序動(dòng)作檢測(cè)中時(shí)序提議方法存在著視頻特征利用不充分、目標(biāo)動(dòng)作邊界檢測(cè)困難等問(wèn)題。針對(duì)以上所存在的問(wèn)題,本...

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2.1卷積操作示例

圖2.1卷積操作示例

華中科技大學(xué)碩士學(xué)位論文轉(zhuǎn)換為另一個(gè)。常用的神經(jīng)元層由三種類(lèi)型:卷積層,池化層,以通過(guò)一系列隱藏層將輸入圖像轉(zhuǎn)換為輸出向量。每個(gè)隱藏層由一對(duì)其輸入應(yīng)用線性變換,即用于卷積層的卷積和用于全連接層的通常會(huì)緊隨一個(gè)激活函數(shù),例如ReLU,Sigmoid等非線性函數(shù)。和輸出是稱(chēng)為特征....


圖2.2ReLU函數(shù)示意圖

圖2.2ReLU函數(shù)示意圖

設(shè)卷積步長(zhǎng)值為S,將每個(gè)卷積核滑過(guò)輸入特征圖。當(dāng)S1時(shí)跳過(guò)S像素,將產(chǎn)生一個(gè)空間下采樣的特征圖。最后,設(shè)對(duì)應(yīng)填像素的數(shù)為P。通常我們使用它來(lái)保證輸入特征圖的空間大小,因度和高度是相同的。入特征圖的空間大小為WWD。則輸出特征圖的大小為MMW....


圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)圖

圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)圖

圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)圖[75]RPN被放置在最后的共享卷積層conv5之后,并在特征圖上滑動(dòng)以確定該區(qū)否為目標(biāo)。值得注意的是,RPN網(wǎng)絡(luò)與目標(biāo)檢測(cè)層是共享的。具體來(lái)說(shuō),圖像入網(wǎng)絡(luò),在經(jīng)過(guò)conv5層的卷積操作之后,特征圖被傳到RPN網(wǎng)絡(luò)....


圖3.1特征提取采樣示意圖

圖3.1特征提取采樣示意圖

和內(nèi)存容量的問(wèn)題,整個(gè)視頻無(wú)法直接輸入網(wǎng)絡(luò)。因此,需要對(duì)視頻進(jìn)行一定的處理,在獲得準(zhǔn)確有效的特征圖的前提下,盡量減小內(nèi)存的占用。首先,需要確定的是采樣的方式。設(shè)現(xiàn)有視頻V,以25fps/s的幀率將視頻拆分為圖像,拆分后的總幀數(shù)為T(mén),則有1={f}TttV,ft代表視....



本文編號(hào):4003332

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/4003332.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)d8413***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com