基于FPGA的RNN加速SoC設(shè)計(jì)與實(shí)現(xiàn)
【文章頁數(shù)】:6 頁
【部分圖文】:
如圖1所示,循環(huán)神經(jīng)網(wǎng)絡(luò)加速SoC包含MicroBlaze主處理器,RNN加速器核,DMA,DDR控制器,UART核PCIEDMA等部分.PC端通過PCIE接口將神經(jīng)網(wǎng)絡(luò)參數(shù)核輸入傳輸至DDR中;MicroBlaze控制RNN加速器核的工作狀態(tài),完成激活函數(shù)與向量逐點(diǎn)相乘等計(jì)算....
為了使每一個(gè)周期均有非零值進(jìn)入MAC陣列計(jì)算,實(shí)現(xiàn)計(jì)算資源的最大利用,向量讀取和索引產(chǎn)生模塊每一個(gè)周期讀取16個(gè)元素并輸入0值刪除模塊,并盡可能每一個(gè)周期產(chǎn)生一個(gè)非零值.如圖2所示,當(dāng)?shù)谝患?jí)FIFO未滿時(shí),向量讀取模塊產(chǎn)生使能信號(hào),讀取16個(gè)數(shù),并產(chǎn)生索引進(jìn)入第一級(jí)FIFO.第一....
3.5MAC陣列一個(gè)MAC單元用于計(jì)算矩陣中的一行與向量點(diǎn)積的結(jié)果.如圖3所示,一個(gè)MAC單元是一個(gè)三級(jí)流水線結(jié)構(gòu):第一級(jí)中向量的非零值打一拍,同時(shí)根據(jù)非零值的索引值取出對(duì)應(yīng)位置的權(quán)重值,還會(huì)同時(shí)從偏置SRAM和輸出SRAM分別取出偏置值和臨時(shí)的累加結(jié)果;第二級(jí)向量非零值和權(quán)重....
本文編號(hào):4011357
本文鏈接:http://www.lk138.cn/kejilunwen/dianzigongchenglunwen/4011357.html