基于注意力機(jī)制的視頻哈希檢索方法研究
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1哈希學(xué)習(xí)思想示例W??哈希學(xué)習(xí)可以將文本、圖像、視頻等類(lèi)型的數(shù)據(jù)映射成一段較短的哈希碼,??
?山東大學(xué)碩士學(xué)位論文???第2章相關(guān)技術(shù)介紹??在本章中,首先對(duì)哈希學(xué)習(xí)進(jìn)行簡(jiǎn)單的介紹。然后詳細(xì)介紹本文方法中所使??用的各種相關(guān)技術(shù),包括卷積神經(jīng)網(wǎng)絡(luò),長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制。??2.1哈希學(xué)習(xí)??隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,海量的數(shù)據(jù)被互聯(lián)網(wǎng)用戶(hù)上傳到互聯(lián)網(wǎng)上,其中尤??....
圖2-2VGG-16?(?
?山東大學(xué)碩士學(xué)位論文???在本方法中,我們使用VGG網(wǎng)絡(luò)來(lái)提取視頻中每一幀的特征。VGG網(wǎng)絡(luò)結(jié)??構(gòu)相對(duì)比較簡(jiǎn)單,通過(guò)卷積層的疊加來(lái)學(xué)習(xí)圖像的高級(jí)特征,VGG-16和VGG-??19的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2-2?(a)和圖2-2?(b)所示。??(?(?"1??224*224?圖像?....
圖2-3長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)包括一個(gè)輸入門(mén),一個(gè)輸出門(mén),一個(gè)遺忘門(mén)和兩個(gè)狀態(tài)??
列中的長(zhǎng)期依賴(lài)信息。梯度消失問(wèn)題與梯度爆炸問(wèn)題是??由于權(quán)重矩陣循環(huán)相乘導(dǎo)致的。解決梯度爆炸問(wèn)題可以采用截?cái)嗟姆绞。通過(guò)設(shè)??置一個(gè)臨界值,將大于臨界值的梯度的值截?cái)酁樵撆R界值。然而,該方法會(huì)在一??定程度上改變梯度的方向。梯度消失問(wèn)題無(wú)法使用截?cái)嗟姆绞絹?lái)進(jìn)行處理。如果??采用截....
圖2*4圖像中的注意力機(jī)制[541??2.4.2自然語(yǔ)言處理中的注意力機(jī)制??
?山東大學(xué)碩士學(xué)位論文???的位置。如圖2-4所示,圖像中紅色的區(qū)域表示注意力集中地地方,而藍(lán)色的區(qū)??域代表人類(lèi)的注意力不在這個(gè)位置。當(dāng)人類(lèi)看到圖2-4左上角圖像時(shí),會(huì)自動(dòng)將??注意力集中在圖像中的狗身上,因此紅色區(qū)域主要集中在狗身上;同樣地,當(dāng)人??類(lèi)看到圖2*4右上角的圖像....
本文編號(hào):4051924
本文鏈接:http://lk138.cn/shoufeilunwen/xixikjs/4051924.html
下一篇:沒(méi)有了