中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

一種基于GPU的高性能稀疏卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化

發(fā)布時間:2024-05-27 05:57
  卷積神經(jīng)網(wǎng)絡(luò)CNN目前作為神經(jīng)網(wǎng)絡(luò)的一個重要分支,相比于其他神經(jīng)網(wǎng)絡(luò)方法更適合應(yīng)用于圖像特征的學(xué)習(xí)和表達(dá)。隨著CNN的不斷發(fā)展,CNN將面臨更多的挑戰(zhàn)。CNN參數(shù)規(guī)模變得越來越大,這使得CNN對計算的需求量變得非常大。因此,目前產(chǎn)生了許多種方式對CNN的規(guī)模進(jìn)行壓縮。然而壓縮后的CNN模型往往產(chǎn)生了許多稀疏的數(shù)據(jù)結(jié)構(gòu),這種稀疏結(jié)構(gòu)會影響CNN在GPU上的性能。為了解決該問題,采用直接稀疏卷積算法,來加速GPU處理稀疏數(shù)據(jù)。根據(jù)其算法特點(diǎn)將卷積運(yùn)算轉(zhuǎn)換為稀疏向量與稠密向量內(nèi)積運(yùn)算,并將其在GPU平臺上實現(xiàn)。本文的優(yōu)化方案充分利用數(shù)據(jù)稀疏性和網(wǎng)絡(luò)結(jié)構(gòu)來分配線程進(jìn)行任務(wù)調(diào)度,利用數(shù)據(jù)局部性來管理內(nèi)存替換,使得在稀疏卷積神經(jīng)網(wǎng)絡(luò)SCNN中的GPU仍能夠高效地處理卷積層運(yùn)算。相比cuBLAS的實現(xiàn),在AlexNet、GoogleNet、ResNet上的性能提升分別達(dá)到1.07×~1.23×、1.17×~3.51×、1.32×~5.00×的加速比。相比cuSPARSE的實現(xiàn),在AlexNet、GoogleNet、ResNet上的性能提升分別達(dá)到1.31×~1.42×、1.09×~2.00×、1.0...

【文章頁數(shù)】:9 頁

【部分圖文】:

圖1降維展開方式實現(xiàn)卷積運(yùn)算Figure1Loweringmethodperformsconvolutionoperation

圖1降維展開方式實現(xiàn)卷積運(yùn)算Figure1Loweringmethodperformsconvolutionoperation

Figure1Loweringmethodperformsconvolutionoperation圖1降維展開方式實現(xiàn)卷積運(yùn)算Table1Descriptionofconvolutionparameters表1卷積參數(shù)描述參數(shù)描述N三維輸入特征矩陣批處理任務(wù)的batchsizeM....


圖2直接稀疏卷積Figure2Directsparseconvolution

圖2直接稀疏卷積Figure2Directsparseconvolution

接稀疏卷積去除了輸入特征矩陣中的數(shù)據(jù)重復(fù)復(fù)制。該算法將卷積核矩陣的規(guī)模擴(kuò)展到輸入矩陣的相同大小。對于延展后的卷積核行展開生成向量Wm,其長度為C×H×W。由于有M個卷積核,對每一個卷積核進(jìn)行延展后得到了M×(C×H×W)的權(quán)重矩陣。對于該批次任務(wù)下的輸入矩陣以行展開的方式形成列向....


圖3行壓縮存儲格式Figure3CSRformat

圖3行壓縮存儲格式Figure3CSRformat

Figure3CSRformat圖3行壓縮存儲格式的行列指針。相比降維方式,直接稀疏卷積更適合在GPU上實現(xiàn)SCNN。3設(shè)計與實現(xiàn)本節(jié)介紹本文所提方法的具體實現(xiàn)和優(yōu)化。由于權(quán)重刪減后SCNN產(chǎn)生了大量稀疏數(shù)據(jù)結(jié)構(gòu),而傳統(tǒng)的降維方式并不能保證稀疏矩陣卷積的計算性能,本文采用全新的直....


圖4權(quán)重延展Figure4Weightstretched

圖4權(quán)重延展Figure4Weightstretched

的降維方式并不能保證稀疏矩陣卷積的計算性能,本文采用全新的直接稀疏卷積來替代降維方式,彌補(bǔ)性能損失。除此以外,GPU的體系結(jié)構(gòu)特征需要在實現(xiàn)過程中對線程映射、任務(wù)分配以及內(nèi)存管理進(jìn)行更多的考慮和優(yōu)化。3.1概述直接稀疏卷積的實現(xiàn)主要由兩部分組成:(1)數(shù)據(jù)預(yù)處理,主要完成對卷積核....



本文編號:3982862

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/3982862.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bbfd4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com