中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學習的時序動作檢測研究

發(fā)布時間:2024-07-07 07:04
  近年來,隨著全球移動互聯(lián)網(wǎng)技術以及數(shù)字化設備的快速發(fā)展和普及,互聯(lián)網(wǎng)上的視頻數(shù)據(jù)每天都在以驚人的速度增長,依靠人工的方式處理如此海量的視頻數(shù)據(jù)并不現(xiàn)實,基于深度學習的時序動作檢測研究引起了廣大研究者們的興趣,已經(jīng)成為了目前智能視頻分析領域中的研究熱點。該研究涉及計算機視覺、圖像處理、視頻分析、目標檢測等諸多研究領域,具有重要的科學意義,可以廣泛應用于智能安防、機器人視覺、虛擬現(xiàn)實、視頻監(jiān)控、人機交互等多個領域,具有良好的應用前景。時序動作檢測是給定一段未裁剪的視頻,實現(xiàn)視頻中動作片段的檢測,包括開始時間、結束時間和動作類別,是智能視頻分析領域中的研究熱點之一。基于手工特征提取的傳統(tǒng)方法對于復雜多變的動作類型魯棒性較差,基于深度學習的方法可以有效地學習到不同動作之間的差異,在視頻動作分析領域已取得了大量的研究成果。然而時序動作檢測的性能嚴重依賴于目標動作的時序提議效果,有效的時序提議對動作檢測效果起到了決定性的作用,而視頻數(shù)據(jù)結構復雜、目標動作變化多樣且動作持續(xù)時間長短不一等問題,使得時序動作檢測中時序提議方法存在著視頻特征利用不充分、目標動作邊界檢測困難等問題。針對以上所存在的問題,本...

【文章頁數(shù)】:58 頁

【學位級別】:碩士

【部分圖文】:

圖2.1卷積操作示例

圖2.1卷積操作示例

華中科技大學碩士學位論文轉(zhuǎn)換為另一個。常用的神經(jīng)元層由三種類型:卷積層,池化層,以通過一系列隱藏層將輸入圖像轉(zhuǎn)換為輸出向量。每個隱藏層由一對其輸入應用線性變換,即用于卷積層的卷積和用于全連接層的通常會緊隨一個激活函數(shù),例如ReLU,Sigmoid等非線性函數(shù)。和輸出是稱為特征....


圖2.2ReLU函數(shù)示意圖

圖2.2ReLU函數(shù)示意圖

設卷積步長值為S,將每個卷積核滑過輸入特征圖。當S1時跳過S像素,將產(chǎn)生一個空間下采樣的特征圖。最后,設對應填像素的數(shù)為P。通常我們使用它來保證輸入特征圖的空間大小,因度和高度是相同的。入特征圖的空間大小為WWD。則輸出特征圖的大小為MMW....


圖2.4FasterR-CNN網(wǎng)絡結構簡圖

圖2.4FasterR-CNN網(wǎng)絡結構簡圖

圖2.4FasterR-CNN網(wǎng)絡結構簡圖[75]RPN被放置在最后的共享卷積層conv5之后,并在特征圖上滑動以確定該區(qū)否為目標。值得注意的是,RPN網(wǎng)絡與目標檢測層是共享的。具體來說,圖像入網(wǎng)絡,在經(jīng)過conv5層的卷積操作之后,特征圖被傳到RPN網(wǎng)絡....


圖3.1特征提取采樣示意圖

圖3.1特征提取采樣示意圖

和內(nèi)存容量的問題,整個視頻無法直接輸入網(wǎng)絡。因此,需要對視頻進行一定的處理,在獲得準確有效的特征圖的前提下,盡量減小內(nèi)存的占用。首先,需要確定的是采樣的方式。設現(xiàn)有視頻V,以25fps/s的幀率將視頻拆分為圖像,拆分后的總幀數(shù)為T,則有1={f}TttV,ft代表視....



本文編號:4003332

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/4003332.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶d8413***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com