基于深度學(xué)習(xí)的視頻分類方法研究

發(fā)布時間：2024-06-11 01:01

　　為了有效管理視頻數(shù)據(jù)和提取視頻中的重要信息,視頻自動分類技術(shù)成為解決這一問題的主要途徑。視頻數(shù)據(jù)由圖像幀組成,其內(nèi)部信息的關(guān)系結(jié)構(gòu)比較復(fù)雜,基于傳統(tǒng)手工設(shè)計的特征不能有效的表示視頻數(shù)據(jù)中的復(fù)雜信息。利用深度學(xué)習(xí)技術(shù)能夠提取較為完整的特征信息,提高視頻分類的準確率。因此,本文研究了基于深度學(xué)習(xí)的視頻分類方法,主要工作如下:(1)針對定長的視頻序列不能完全覆蓋視頻全部動作信息的問題,提出了基于三維卷積神經(jīng)網(wǎng)絡(luò)的特征融合的視頻分類方法。該方法在三維卷積網(wǎng)絡(luò)模型的基礎(chǔ)上,提取不同時間尺度的視頻幀序列特征,并對全連接層的特征進行加權(quán)融合。在數(shù)據(jù)集UCF101上對不同的融合方法進行比較,實驗結(jié)果表明,后端加權(quán)融合方法的視頻分類準確率較高;然后經(jīng)過實驗確定加權(quán)融合的參數(shù),從而構(gòu)建了不同尺度特征融合的視頻分類網(wǎng)絡(luò)模型。實驗結(jié)果表明,本方法比主流方法更有效的進行視頻分類。(2)針對視頻語義變化對視頻分類結(jié)果的影響以及如何提高視頻分類過程中類內(nèi)相似度和類間離散度等問題,提出了一種基于深度度量學(xué)習(xí)的多路卷積網(wǎng)絡(luò)視頻分類方法。該方法基于不同尺度特征融合的網(wǎng)絡(luò)模型,設(shè)計了一種多路卷積視頻分類網(wǎng)絡(luò)。為了使網(wǎng)絡(luò)能夠...

【文章頁數(shù)】：60 頁

【學(xué)位級別】：碩士

【文章目錄】：
摘要
ABSTRACT
1 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 基于傳統(tǒng)手工特征的分類方法
        1.2.2 基于深度學(xué)習(xí)的分類方法
    1.3 主要研究內(nèi)容及研究路線
        1.3.1 主要研究內(nèi)容
        1.3.2 研究路線
    1.4 論文組織結(jié)構(gòu)
    1.5 本章小結(jié)
2 視頻分類相關(guān)理論及技術(shù)
    2.1 視頻分類方法
    2.2 深度神經(jīng)網(wǎng)絡(luò)
        2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
        2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
    2.3 度量學(xué)習(xí)
        2.3.1 度量學(xué)習(xí)及應(yīng)用
        2.3.2 度量學(xué)習(xí)與Softmax
    2.4 本章小結(jié)
3 基于三維卷積神經(jīng)網(wǎng)絡(luò)的特征融合視頻分類方法
    3.1 問題分析
    3.2 不同尺度特征融合的視頻分類網(wǎng)絡(luò)模型設(shè)計
        3.2.1 網(wǎng)絡(luò)模型設(shè)計思想
        3.2.2 網(wǎng)絡(luò)模型的建立
    3.3 實驗與結(jié)果分析
        3.3.1 實驗數(shù)據(jù)及評價標準
        3.3.2 融合方法的選取
        3.3.3 加權(quán)融合的權(quán)值選取
        3.3.4 實驗結(jié)果對比與分析
    3.4 本章小結(jié)
4 基于深度度量學(xué)習(xí)的多路卷積網(wǎng)絡(luò)視頻分類方法
    4.1 問題分析
    4.2 基于多路卷積網(wǎng)絡(luò)的視頻分類方法設(shè)計
        4.2.1 網(wǎng)絡(luò)模型設(shè)計思想
        4.2.2 網(wǎng)絡(luò)模型的建立
    4.3 基于負向樣本對語義距離間隔分配的度量學(xué)習(xí)方法
        4.3.1 網(wǎng)絡(luò)損失函數(shù)的計算
        4.3.2 度量損失的計算
        4.3.3 基于負向樣本對語義距離間隔函數(shù)的設(shè)計
    4.4 實驗及結(jié)果分析
        4.4.1 多路卷積網(wǎng)絡(luò)模型的有效性驗證
        4.4.2 網(wǎng)絡(luò)模型各項參數(shù)對分類結(jié)果影響驗證
        4.4.3 實驗結(jié)果對比與分析
    4.5 本章小結(jié)
5 基于多路卷積網(wǎng)絡(luò)與LSTM的視頻分類方法
    5.1 問題分析
    5.2 基于多路卷積網(wǎng)絡(luò)與LSTM的網(wǎng)絡(luò)模型設(shè)計
        5.2.1 網(wǎng)絡(luò)模型設(shè)計思想
        5.2.2 網(wǎng)絡(luò)模型的建立
    5.3 實驗結(jié)果及分析
        5.3.1 網(wǎng)絡(luò)的有效性驗證
        5.3.2 實驗結(jié)果對比與分析
    5.4 本章小結(jié)
6 總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
致謝
參考文獻
附錄

本文編號：3992168

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://lk138.cn/shoufeilunwen/xixikjs/3992168.html

上一篇：基于Hadoop平臺的數(shù)據(jù)遷移系統(tǒng)的設(shè)計與實現(xiàn)
下一篇：基于視頻車流量的智能路網(wǎng)指揮系統(tǒng)研究與設(shè)計

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

基于深度學(xué)習(xí)的視頻分類方法研究