基于FMM-PM方法的宇宙N體模擬在GPU上的實現和優(yōu)化
發(fā)布時間:2024-10-04 18:48
【目的】本文在多GPU平臺上,對基于快速多極子方法(FMM)和粒子網格方法(PM)的天文N體模擬軟件PHoToNs的核心函數進行CUDA加速實現和性能優(yōu)化!痉椒ā恐饕獌(yōu)化方法包括算法的參數優(yōu)化、頁鎖定內存和CUDA流優(yōu)化、混合精度和快速數學庫優(yōu)化等。【結果】優(yōu)化后的短程力相互作用核心函數在Titan V的GPU平臺上采用4張GPU卡的計算速度相對采用4個Intel Xeon CPU核提高了約410倍。【結論】本文的優(yōu)化技術可為其它高性能GPU異構平臺上的進一步算法研究和超大規(guī)模天文N體模擬提供支撐。
【文章頁數】:10 頁
【文章目錄】:
引言
1 FMM-PM算法原理
1.1 快速多極子方法
1.2 粒子網格方法
1.3 FMM-PM耦合方法
2 FMM在GPU上的實現
3 FMM在GPU上的性能優(yōu)化
3.1 核心函數的參數優(yōu)化
3.2 頁鎖定內存優(yōu)化和CUDA流優(yōu)化
3.3 混合精度和快速數學庫優(yōu)化
4 數值結果
5 結論與展望
利益沖突聲明
本文編號:4007027
【文章頁數】:10 頁
【文章目錄】:
引言
1 FMM-PM算法原理
1.1 快速多極子方法
1.2 粒子網格方法
1.3 FMM-PM耦合方法
2 FMM在GPU上的實現
3 FMM在GPU上的性能優(yōu)化
3.1 核心函數的參數優(yōu)化
3.2 頁鎖定內存優(yōu)化和CUDA流優(yōu)化
3.3 混合精度和快速數學庫優(yōu)化
4 數值結果
5 結論與展望
利益沖突聲明
本文編號:4007027
本文鏈接:http://www.lk138.cn/kejilunwen/tianwen/4007027.html
上一篇:探析文藝復興晚期宇宙觀的轉變
下一篇:沒有了
下一篇:沒有了