中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于圖像內(nèi)容理解的圖片自動(dòng)管理方法研究

發(fā)布時(shí)間:2024-09-22 20:59
  隨著數(shù)字媒體技術(shù)的不斷發(fā)展,人們的多媒體信息也變得日益豐富。與此同時(shí),一個(gè)顯著的問(wèn)題是,如何有效的管理這些多媒體資源。近年來(lái),國(guó)內(nèi)外對(duì)此已有一些初步的研究,但大都不太系統(tǒng),在實(shí)際應(yīng)用過(guò)程中也有很多問(wèn)題。針對(duì)于此,本文探討了通過(guò)圖像內(nèi)容理解的方式對(duì)圖片進(jìn)行分類管理的方法。具體將從以下幾部分展開:圖像的場(chǎng)景分析、特定目標(biāo)識(shí)別中特征學(xué)習(xí)的有效方法探究(以人臉識(shí)別到人臉驗(yàn)證的遷移為例)、特征搜索算法設(shè)計(jì)優(yōu)化與實(shí)現(xiàn)等。對(duì)于面向圖像自動(dòng)管理的場(chǎng)景分析部分,本文首先分析了原始圖像分類中單類別分類的目標(biāo)局限性,在此基礎(chǔ)上提出了一種適應(yīng)于日常生活照片的多標(biāo)簽場(chǎng)景分類網(wǎng)絡(luò)。其次,分類網(wǎng)絡(luò)的基模型采用一個(gè)計(jì)算精簡(jiǎn),移動(dòng)端友好的Shufflenet網(wǎng)絡(luò)作為基礎(chǔ)結(jié)構(gòu),避免了常見網(wǎng)絡(luò)分類需要在服務(wù)器部署,并由網(wǎng)絡(luò)傳輸?shù)葞?lái)的一系列包括但不限于數(shù)據(jù)隱私,網(wǎng)絡(luò)延遲、模型過(guò)大的存儲(chǔ)等問(wèn)題。再次,作為對(duì)基礎(chǔ)網(wǎng)絡(luò)的一個(gè)優(yōu)化,引入了注意力模型,通過(guò)深度卷積網(wǎng)絡(luò)通道上的加權(quán)使分類模型對(duì)數(shù)據(jù)有更好的適應(yīng)性。此外,對(duì)于損失函數(shù),考慮到多標(biāo)簽分類網(wǎng)絡(luò)中正負(fù)標(biāo)簽比例不均衡的情況,設(shè)計(jì)了一個(gè)均衡的二元交叉熵?fù)p失函數(shù),以對(duì)數(shù)據(jù)更好的建模。最...

【文章頁(yè)數(shù)】:65 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
致謝
摘要
ABSTRACT
序言
1 引言
    1.1 選題背景與意義
    1.2 研究現(xiàn)狀
        1.2.1 場(chǎng)景分類
        1.2.2 特定目標(biāo)(人臉)識(shí)別
        1.2.3 圖像搜索
    1.3 研究?jī)?nèi)容及章節(jié)安排
2 面向圖片自動(dòng)管理的場(chǎng)景分類
    2.1 基于傳統(tǒng)特征的場(chǎng)景分類
        2.1.1 圖像預(yù)處理
        2.1.2 圖像增強(qiáng)
        2.1.3 特征提取
        2.1.4 模式分類
    2.2 基于深度學(xué)習(xí)的場(chǎng)景分類
        2.2.1 場(chǎng)景分類基礎(chǔ)網(wǎng)絡(luò)
        2.2.2 基礎(chǔ)網(wǎng)絡(luò)的通道關(guān)注改進(jìn)
        2.2.3 多標(biāo)簽分類及損失函數(shù)實(shí)現(xiàn)
        2.2.4 網(wǎng)絡(luò)整體結(jié)構(gòu)
        2.2.5 多標(biāo)簽場(chǎng)景分類實(shí)現(xiàn)
    2.3 本章小結(jié)
3 面向圖片自動(dòng)管理的特定目標(biāo)(人臉)識(shí)別
    3.1 人臉識(shí)別處理概覽
        3.1.1 人臉檢測(cè)
        3.1.2 人臉對(duì)齊
        3.1.3 人臉特征提取與人臉識(shí)別
    3.2 人臉識(shí)別損失函數(shù)設(shè)計(jì)
        3.2.1 類內(nèi)損失
        3.2.2 類間損失
        3.2.3 去冗余項(xiàng)
    3.3 網(wǎng)絡(luò)選擇
        3.3.1 網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)選擇
        3.3.2 激活函數(shù)選擇
    3.4 人臉識(shí)別網(wǎng)絡(luò)實(shí)現(xiàn)及其特征遷移
        3.4.1 網(wǎng)絡(luò)概覽
        3.4.2 實(shí)驗(yàn)結(jié)果
    3.5 本章小結(jié)
4 圖片自動(dòng)管理中的高效搜索
    4.1 基于倒排表的近似搜索算法
    4.2 基于分段矢量量化的近似搜索算法
    4.3 近似搜索算法實(shí)現(xiàn)
        4.3.1 近似搜索算法速度/內(nèi)存使用對(duì)比
        4.3.2 Facebook Faiss近似搜索庫(kù)PQ算法優(yōu)化
        4.3.3 分段矢量量化召回率與近鄰個(gè)數(shù)關(guān)系
    4.4 本章小結(jié)
5 實(shí)驗(yàn)環(huán)境搭建及實(shí)驗(yàn)結(jié)果
    5.1 數(shù)據(jù)集準(zhǔn)備
    5.2 神經(jīng)網(wǎng)絡(luò)搭建
    5.3 網(wǎng)絡(luò)訓(xùn)練
    5.4 實(shí)測(cè)結(jié)果
        5.4.1 場(chǎng)景分類結(jié)果
        5.4.2 人臉近似搜索結(jié)果
    5.5 本章小結(jié)
6 總結(jié)與未來(lái)展望
    6.1 論文總結(jié)
    6.2 未來(lái)展望
參考文獻(xiàn)
作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集



本文編號(hào):4006099

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/sousuoyinqinglunwen/4006099.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9c51c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com