廣告推薦系統(tǒng)的硬件優(yōu)化設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-12-09 06:38
新型互聯(lián)網(wǎng)廣告通過建立網(wǎng)絡(luò)用戶與廣告之間的信息關(guān)系,利用智能化廣告推薦技術(shù)匹配用戶潛在感興趣的廣告定向投放。目前智能化廣告推薦系統(tǒng)以傳統(tǒng)的軟件CPU實(shí)現(xiàn)方式為主,但是隨著數(shù)據(jù)量的增加,由于CPU的計(jì)算性能不足,軟件CPU的實(shí)現(xiàn)方式存在用戶響應(yīng)時(shí)間長和吞吐量低的問題。針對(duì)本文研究的廣告推薦系統(tǒng),綜合分析并且選擇基于FPGA的硬件加速方案提升廣告推薦系統(tǒng)的計(jì)算性能。本文概述了廣告推薦系統(tǒng)模型并且分析了FM和FFM算法優(yōu)缺點(diǎn),設(shè)計(jì)了基于FFM和DNN的混合推薦算法。為了解決廣告推薦系統(tǒng)的服務(wù)器CPU計(jì)算性能不足,本文做了四方面工作:第一,充分利用本文研究的推薦算法的重復(fù)計(jì)算和FPGA的并行計(jì)算能力設(shè)計(jì)了基于FPGA的廣告推薦系統(tǒng)的硬件加速架構(gòu)。第二,本文通過設(shè)計(jì)了基于URAM的數(shù)據(jù)分片的方案優(yōu)化了FPGA計(jì)算時(shí)的數(shù)據(jù)傳輸時(shí)耗。第三,本文通過可重構(gòu)計(jì)算、分布式并行計(jì)算和DSP資源復(fù)用的優(yōu)化設(shè)計(jì)方案提高了FPGA的并行計(jì)算能力。第四,本文提出了基于LSM的分段多項(xiàng)式算法和分段線性查找表和EC-CORDIC算法擬合激活函數(shù),提高了傳統(tǒng)擬合方法的精度,減少了FPGA邏輯資源使用。最后本文搭建了廣告推...
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:94 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
廣告推薦系統(tǒng)模型
圖 3-2服務(wù)器CPUCPUCPUCPUDDRFPGA計(jì)算DDRPCIE=4, =10, =18 損失函數(shù)變化可以發(fā)現(xiàn),F(xiàn)FM 算法隱向量的維度 對(duì)算法的性能后性能評(píng)估參數(shù) AUC 如表 3-1 所示。表 3-1 =4, =10, =18 AUC 值對(duì)比 4 維 10 維 值 0.7479 0.7606 值 0.7237 0.7326 節(jié)采用 AdaGrad 優(yōu)化器的迭代算法以及 FFM 算法的 值,本仿真測(cè)試的參數(shù) =80, =18,在迭代過程法的損失函數(shù)對(duì)比曲線如圖 3-3。
24圖 3-3 FM 和 FFM 算法的損失值從圖 3-3 中可以發(fā)現(xiàn),剛開始迭代損失函數(shù)下降很快,越到后面下降的越慢,說明經(jīng)過了 100 次迭代已經(jīng)收斂理論極限值。而且可以看出 FFM 算法的迭代的損失函數(shù)極限值是小于 FM 算法的,所以 FFM 算法的性能是優(yōu)于 FM 算法的。AdaGrad 優(yōu)化器對(duì)應(yīng)的 AUC 指標(biāo)如表 3-2。表 3-2 AUC 值數(shù)據(jù)集 FM 算法 FFM 算法 DNN+FMM 算法訓(xùn)練 AUC 值 0.7457 0.7780 0.7902測(cè)試 AUC 值 0.7248 0.7380 0.7633從上表中的測(cè)試結(jié)果可以看出,不管是訓(xùn)練數(shù)據(jù)集還是線上測(cè)試數(shù)據(jù)集基于FFM 和 DNN 混合推薦算法 AUC 值都優(yōu)于 FM 算法和 FFM 算法,而且 FFM 算法的性能是優(yōu)于 FM 算法的,所以說明本文研究推薦系統(tǒng)使用基于 FFM 和 DNN 混合推薦算法時(shí)可行的。3.2 廣告推薦系統(tǒng)的硬件架構(gòu)設(shè)計(jì)第二章分析了 CPU/GPU/FPGA/ASIC 的性能,選擇 FPGA 作為本文研究的廣告推薦系統(tǒng)的硬件加速方案,所以需要在廣告推薦系統(tǒng)利用 FPGA 的并行計(jì)算能力和低延時(shí)的特性設(shè)計(jì)加速系統(tǒng)架構(gòu)
本文編號(hào):2906456
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:94 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
廣告推薦系統(tǒng)模型
圖 3-2服務(wù)器CPUCPUCPUCPUDDRFPGA計(jì)算DDRPCIE=4, =10, =18 損失函數(shù)變化可以發(fā)現(xiàn),F(xiàn)FM 算法隱向量的維度 對(duì)算法的性能后性能評(píng)估參數(shù) AUC 如表 3-1 所示。表 3-1 =4, =10, =18 AUC 值對(duì)比 4 維 10 維 值 0.7479 0.7606 值 0.7237 0.7326 節(jié)采用 AdaGrad 優(yōu)化器的迭代算法以及 FFM 算法的 值,本仿真測(cè)試的參數(shù) =80, =18,在迭代過程法的損失函數(shù)對(duì)比曲線如圖 3-3。
24圖 3-3 FM 和 FFM 算法的損失值從圖 3-3 中可以發(fā)現(xiàn),剛開始迭代損失函數(shù)下降很快,越到后面下降的越慢,說明經(jīng)過了 100 次迭代已經(jīng)收斂理論極限值。而且可以看出 FFM 算法的迭代的損失函數(shù)極限值是小于 FM 算法的,所以 FFM 算法的性能是優(yōu)于 FM 算法的。AdaGrad 優(yōu)化器對(duì)應(yīng)的 AUC 指標(biāo)如表 3-2。表 3-2 AUC 值數(shù)據(jù)集 FM 算法 FFM 算法 DNN+FMM 算法訓(xùn)練 AUC 值 0.7457 0.7780 0.7902測(cè)試 AUC 值 0.7248 0.7380 0.7633從上表中的測(cè)試結(jié)果可以看出,不管是訓(xùn)練數(shù)據(jù)集還是線上測(cè)試數(shù)據(jù)集基于FFM 和 DNN 混合推薦算法 AUC 值都優(yōu)于 FM 算法和 FFM 算法,而且 FFM 算法的性能是優(yōu)于 FM 算法的,所以說明本文研究推薦系統(tǒng)使用基于 FFM 和 DNN 混合推薦算法時(shí)可行的。3.2 廣告推薦系統(tǒng)的硬件架構(gòu)設(shè)計(jì)第二章分析了 CPU/GPU/FPGA/ASIC 的性能,選擇 FPGA 作為本文研究的廣告推薦系統(tǒng)的硬件加速方案,所以需要在廣告推薦系統(tǒng)利用 FPGA 的并行計(jì)算能力和低延時(shí)的特性設(shè)計(jì)加速系統(tǒng)架構(gòu)
本文編號(hào):2906456
本文鏈接:http://www.lk138.cn/wenyilunwen/guanggaoshejilunwen/2906456.html
最近更新
教材專著