中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

一種基于GPU的高性能稀疏卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化

發(fā)布時(shí)間:2024-05-27 05:57
  卷積神經(jīng)網(wǎng)絡(luò)CNN目前作為神經(jīng)網(wǎng)絡(luò)的一個(gè)重要分支,相比于其他神經(jīng)網(wǎng)絡(luò)方法更適合應(yīng)用于圖像特征的學(xué)習(xí)和表達(dá)。隨著CNN的不斷發(fā)展,CNN將面臨更多的挑戰(zhàn)。CNN參數(shù)規(guī)模變得越來(lái)越大,這使得CNN對(duì)計(jì)算的需求量變得非常大。因此,目前產(chǎn)生了許多種方式對(duì)CNN的規(guī)模進(jìn)行壓縮。然而壓縮后的CNN模型往往產(chǎn)生了許多稀疏的數(shù)據(jù)結(jié)構(gòu),這種稀疏結(jié)構(gòu)會(huì)影響CNN在GPU上的性能。為了解決該問(wèn)題,采用直接稀疏卷積算法,來(lái)加速GPU處理稀疏數(shù)據(jù)。根據(jù)其算法特點(diǎn)將卷積運(yùn)算轉(zhuǎn)換為稀疏向量與稠密向量?jī)?nèi)積運(yùn)算,并將其在GPU平臺(tái)上實(shí)現(xiàn)。本文的優(yōu)化方案充分利用數(shù)據(jù)稀疏性和網(wǎng)絡(luò)結(jié)構(gòu)來(lái)分配線程進(jìn)行任務(wù)調(diào)度,利用數(shù)據(jù)局部性來(lái)管理內(nèi)存替換,使得在稀疏卷積神經(jīng)網(wǎng)絡(luò)SCNN中的GPU仍能夠高效地處理卷積層運(yùn)算。相比cuBLAS的實(shí)現(xiàn),在AlexNet、GoogleNet、ResNet上的性能提升分別達(dá)到1.07×~1.23×、1.17×~3.51×、1.32×~5.00×的加速比。相比cuSPARSE的實(shí)現(xiàn),在AlexNet、GoogleNet、ResNet上的性能提升分別達(dá)到1.31×~1.42×、1.09×~2.00×、1.0...

【文章頁(yè)數(shù)】:9 頁(yè)

【部分圖文】:

圖1降維展開(kāi)方式實(shí)現(xiàn)卷積運(yùn)算Figure1Loweringmethodperformsconvolutionoperation

圖1降維展開(kāi)方式實(shí)現(xiàn)卷積運(yùn)算Figure1Loweringmethodperformsconvolutionoperation

Figure1Loweringmethodperformsconvolutionoperation圖1降維展開(kāi)方式實(shí)現(xiàn)卷積運(yùn)算Table1Descriptionofconvolutionparameters表1卷積參數(shù)描述參數(shù)描述N三維輸入特征矩陣批處理任務(wù)的batchsizeM....


圖2直接稀疏卷積Figure2Directsparseconvolution

圖2直接稀疏卷積Figure2Directsparseconvolution

接稀疏卷積去除了輸入特征矩陣中的數(shù)據(jù)重復(fù)復(fù)制。該算法將卷積核矩陣的規(guī)模擴(kuò)展到輸入矩陣的相同大小。對(duì)于延展后的卷積核行展開(kāi)生成向量Wm,其長(zhǎng)度為C×H×W。由于有M個(gè)卷積核,對(duì)每一個(gè)卷積核進(jìn)行延展后得到了M×(C×H×W)的權(quán)重矩陣。對(duì)于該批次任務(wù)下的輸入矩陣以行展開(kāi)的方式形成列向....


圖3行壓縮存儲(chǔ)格式Figure3CSRformat

圖3行壓縮存儲(chǔ)格式Figure3CSRformat

Figure3CSRformat圖3行壓縮存儲(chǔ)格式的行列指針。相比降維方式,直接稀疏卷積更適合在GPU上實(shí)現(xiàn)SCNN。3設(shè)計(jì)與實(shí)現(xiàn)本節(jié)介紹本文所提方法的具體實(shí)現(xiàn)和優(yōu)化。由于權(quán)重刪減后SCNN產(chǎn)生了大量稀疏數(shù)據(jù)結(jié)構(gòu),而傳統(tǒng)的降維方式并不能保證稀疏矩陣卷積的計(jì)算性能,本文采用全新的直....


圖4權(quán)重延展Figure4Weightstretched

圖4權(quán)重延展Figure4Weightstretched

的降維方式并不能保證稀疏矩陣卷積的計(jì)算性能,本文采用全新的直接稀疏卷積來(lái)替代降維方式,彌補(bǔ)性能損失。除此以外,GPU的體系結(jié)構(gòu)特征需要在實(shí)現(xiàn)過(guò)程中對(duì)線程映射、任務(wù)分配以及內(nèi)存管理進(jìn)行更多的考慮和優(yōu)化。3.1概述直接稀疏卷積的實(shí)現(xiàn)主要由兩部分組成:(1)數(shù)據(jù)預(yù)處理,主要完成對(duì)卷積核....



本文編號(hào):3982862

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/3982862.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bbfd4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com