當(dāng)前位置：主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的時(shí)序動(dòng)作檢測(cè)研究

發(fā)布時(shí)間：2024-07-07 07:04

　　近年來(lái),隨著全球移動(dòng)互聯(lián)網(wǎng)技術(shù)以及數(shù)字化設(shè)備的快速發(fā)展和普及,互聯(lián)網(wǎng)上的視頻數(shù)據(jù)每天都在以驚人的速度增長(zhǎng),依靠人工的方式處理如此海量的視頻數(shù)據(jù)并不現(xiàn)實(shí),基于深度學(xué)習(xí)的時(shí)序動(dòng)作檢測(cè)研究引起了廣大研究者們的興趣,已經(jīng)成為了目前智能視頻分析領(lǐng)域中的研究熱點(diǎn)。該研究涉及計(jì)算機(jī)視覺(jué)、圖像處理、視頻分析、目標(biāo)檢測(cè)等諸多研究領(lǐng)域,具有重要的科學(xué)意義,可以廣泛應(yīng)用于智能安防、機(jī)器人視覺(jué)、虛擬現(xiàn)實(shí)、視頻監(jiān)控、人機(jī)交互等多個(gè)領(lǐng)域,具有良好的應(yīng)用前景。時(shí)序動(dòng)作檢測(cè)是給定一段未裁剪的視頻,實(shí)現(xiàn)視頻中動(dòng)作片段的檢測(cè),包括開(kāi)始時(shí)間、結(jié)束時(shí)間和動(dòng)作類別,是智能視頻分析領(lǐng)域中的研究熱點(diǎn)之一。基于手工特征提取的傳統(tǒng)方法對(duì)于復(fù)雜多變的動(dòng)作類型魯棒性較差,基于深度學(xué)習(xí)的方法可以有效地學(xué)習(xí)到不同動(dòng)作之間的差異,在視頻動(dòng)作分析領(lǐng)域已取得了大量的研究成果。然而時(shí)序動(dòng)作檢測(cè)的性能嚴(yán)重依賴于目標(biāo)動(dòng)作的時(shí)序提議效果,有效的時(shí)序提議對(duì)動(dòng)作檢測(cè)效果起到了決定性的作用,而視頻數(shù)據(jù)結(jié)構(gòu)復(fù)雜、目標(biāo)動(dòng)作變化多樣且動(dòng)作持續(xù)時(shí)間長(zhǎng)短不一等問(wèn)題,使得時(shí)序動(dòng)作檢測(cè)中時(shí)序提議方法存在著視頻特征利用不充分、目標(biāo)動(dòng)作邊界檢測(cè)困難等問(wèn)題。針對(duì)以上所存在的問(wèn)題,本...

【文章頁(yè)數(shù)】：58 頁(yè)

【學(xué)位級(jí)別】：碩士

【部分圖文】：

圖2.1卷積操作示例

華中科技大學(xué)碩士學(xué)位論文轉(zhuǎn)換為另一個(gè)。常用的神經(jīng)元層由三種類型：卷積層，池化層，以通過(guò)一系列隱藏層將輸入圖像轉(zhuǎn)換為輸出向量。每個(gè)隱藏層由一對(duì)其輸入應(yīng)用線性變換，即用于卷積層的卷積和用于全連接層的通常會(huì)緊隨一個(gè)激活函數(shù)，例如ReLU，Sigmoid等非線性函數(shù)。和輸出是稱為特征....

圖2.2ReLU函數(shù)示意圖

設(shè)卷積步長(zhǎng)值為S，將每個(gè)卷積核滑過(guò)輸入特征圖。當(dāng)S1時(shí)跳過(guò)S像素，將產(chǎn)生一個(gè)空間下采樣的特征圖。最后，設(shè)對(duì)應(yīng)填像素的數(shù)為P。通常我們使用它來(lái)保證輸入特征圖的空間大小，因度和高度是相同的。入特征圖的空間大小為WWD。則輸出特征圖的大小為MMW....

圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)圖

圖2.4FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)圖[75]RPN被放置在最后的共享卷積層conv5之后，并在特征圖上滑動(dòng)以確定該區(qū)否為目標(biāo)。值得注意的是，RPN網(wǎng)絡(luò)與目標(biāo)檢測(cè)層是共享的。具體來(lái)說(shuō)，圖像入網(wǎng)絡(luò)，在經(jīng)過(guò)conv5層的卷積操作之后，特征圖被傳到RPN網(wǎng)絡(luò)....

圖3.1特征提取采樣示意圖

和內(nèi)存容量的問(wèn)題，整個(gè)視頻無(wú)法直接輸入網(wǎng)絡(luò)。因此，需要對(duì)視頻進(jìn)行一定的處理，在獲得準(zhǔn)確有效的特征圖的前提下，盡量減小內(nèi)存的占用。首先，需要確定的是采樣的方式。設(shè)現(xiàn)有視頻V，以25fps/s的幀率將視頻拆分為圖像，拆分后的總幀數(shù)為T，則有1={f}TttV，ft代表視....

本文編號(hào)：4003332

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://lk138.cn/kejilunwen/zidonghuakongzhilunwen/4003332.html

上一篇：基于深度學(xué)習(xí)的植物葉片識(shí)別研究與實(shí)現(xiàn)
下一篇：沒(méi)有了

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

基于深度學(xué)習(xí)的時(shí)序動(dòng)作檢測(cè)研究