基于深度學習的視頻分類方法研究
發(fā)布時間:2024-06-11 01:01
為了有效管理視頻數(shù)據和提取視頻中的重要信息,視頻自動分類技術成為解決這一問題的主要途徑。視頻數(shù)據由圖像幀組成,其內部信息的關系結構比較復雜,基于傳統(tǒng)手工設計的特征不能有效的表示視頻數(shù)據中的復雜信息。利用深度學習技術能夠提取較為完整的特征信息,提高視頻分類的準確率。因此,本文研究了基于深度學習的視頻分類方法,主要工作如下:(1)針對定長的視頻序列不能完全覆蓋視頻全部動作信息的問題,提出了基于三維卷積神經網絡的特征融合的視頻分類方法。該方法在三維卷積網絡模型的基礎上,提取不同時間尺度的視頻幀序列特征,并對全連接層的特征進行加權融合。在數(shù)據集UCF101上對不同的融合方法進行比較,實驗結果表明,后端加權融合方法的視頻分類準確率較高;然后經過實驗確定加權融合的參數(shù),從而構建了不同尺度特征融合的視頻分類網絡模型。實驗結果表明,本方法比主流方法更有效的進行視頻分類。(2)針對視頻語義變化對視頻分類結果的影響以及如何提高視頻分類過程中類內相似度和類間離散度等問題,提出了一種基于深度度量學習的多路卷積網絡視頻分類方法。該方法基于不同尺度特征融合的網絡模型,設計了一種多路卷積視頻分類網絡。為了使網絡能夠...
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.2.1 基于傳統(tǒng)手工特征的分類方法
1.2.2 基于深度學習的分類方法
1.3 主要研究內容及研究路線
1.3.1 主要研究內容
1.3.2 研究路線
1.4 論文組織結構
1.5 本章小結
2 視頻分類相關理論及技術
2.1 視頻分類方法
2.2 深度神經網絡
2.2.1 卷積神經網絡
2.2.2 循環(huán)神經網絡
2.3 度量學習
2.3.1 度量學習及應用
2.3.2 度量學習與Softmax
2.4 本章小結
3 基于三維卷積神經網絡的特征融合視頻分類方法
3.1 問題分析
3.2 不同尺度特征融合的視頻分類網絡模型設計
3.2.1 網絡模型設計思想
3.2.2 網絡模型的建立
3.3 實驗與結果分析
3.3.1 實驗數(shù)據及評價標準
3.3.2 融合方法的選取
3.3.3 加權融合的權值選取
3.3.4 實驗結果對比與分析
3.4 本章小結
4 基于深度度量學習的多路卷積網絡視頻分類方法
4.1 問題分析
4.2 基于多路卷積網絡的視頻分類方法設計
4.2.1 網絡模型設計思想
4.2.2 網絡模型的建立
4.3 基于負向樣本對語義距離間隔分配的度量學習方法
4.3.1 網絡損失函數(shù)的計算
4.3.2 度量損失的計算
4.3.3 基于負向樣本對語義距離間隔函數(shù)的設計
4.4 實驗及結果分析
4.4.1 多路卷積網絡模型的有效性驗證
4.4.2 網絡模型各項參數(shù)對分類結果影響驗證
4.4.3 實驗結果對比與分析
4.5 本章小結
5 基于多路卷積網絡與LSTM的視頻分類方法
5.1 問題分析
5.2 基于多路卷積網絡與LSTM的網絡模型設計
5.2.1 網絡模型設計思想
5.2.2 網絡模型的建立
5.3 實驗結果及分析
5.3.1 網絡的有效性驗證
5.3.2 實驗結果對比與分析
5.4 本章小結
6 總結與展望
6.1 總結
6.2 展望
致謝
參考文獻
附錄
本文編號:3992168
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.2.1 基于傳統(tǒng)手工特征的分類方法
1.2.2 基于深度學習的分類方法
1.3 主要研究內容及研究路線
1.3.1 主要研究內容
1.3.2 研究路線
1.4 論文組織結構
1.5 本章小結
2 視頻分類相關理論及技術
2.1 視頻分類方法
2.2 深度神經網絡
2.2.1 卷積神經網絡
2.2.2 循環(huán)神經網絡
2.3 度量學習
2.3.1 度量學習及應用
2.3.2 度量學習與Softmax
2.4 本章小結
3 基于三維卷積神經網絡的特征融合視頻分類方法
3.1 問題分析
3.2 不同尺度特征融合的視頻分類網絡模型設計
3.2.1 網絡模型設計思想
3.2.2 網絡模型的建立
3.3 實驗與結果分析
3.3.1 實驗數(shù)據及評價標準
3.3.2 融合方法的選取
3.3.3 加權融合的權值選取
3.3.4 實驗結果對比與分析
3.4 本章小結
4 基于深度度量學習的多路卷積網絡視頻分類方法
4.1 問題分析
4.2 基于多路卷積網絡的視頻分類方法設計
4.2.1 網絡模型設計思想
4.2.2 網絡模型的建立
4.3 基于負向樣本對語義距離間隔分配的度量學習方法
4.3.1 網絡損失函數(shù)的計算
4.3.2 度量損失的計算
4.3.3 基于負向樣本對語義距離間隔函數(shù)的設計
4.4 實驗及結果分析
4.4.1 多路卷積網絡模型的有效性驗證
4.4.2 網絡模型各項參數(shù)對分類結果影響驗證
4.4.3 實驗結果對比與分析
4.5 本章小結
5 基于多路卷積網絡與LSTM的視頻分類方法
5.1 問題分析
5.2 基于多路卷積網絡與LSTM的網絡模型設計
5.2.1 網絡模型設計思想
5.2.2 網絡模型的建立
5.3 實驗結果及分析
5.3.1 網絡的有效性驗證
5.3.2 實驗結果對比與分析
5.4 本章小結
6 總結與展望
6.1 總結
6.2 展望
致謝
參考文獻
附錄
本文編號:3992168
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/3992168.html
最近更新
教材專著