中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 天文學(xué)論文 >

基于FMM-PM方法的宇宙N體模擬在GPU上的實現(xiàn)和優(yōu)化

發(fā)布時間:2024-10-04 18:48
   【目的】本文在多GPU平臺上,對基于快速多極子方法(FMM)和粒子網(wǎng)格方法(PM)的天文N體模擬軟件PHoToNs的核心函數(shù)進(jìn)行CUDA加速實現(xiàn)和性能優(yōu)化!痉椒ā恐饕獌(yōu)化方法包括算法的參數(shù)優(yōu)化、頁鎖定內(nèi)存和CUDA流優(yōu)化、混合精度和快速數(shù)學(xué)庫優(yōu)化等。【結(jié)果】優(yōu)化后的短程力相互作用核心函數(shù)在Titan V的GPU平臺上采用4張GPU卡的計算速度相對采用4個Intel Xeon CPU核提高了約410倍!窘Y(jié)論】本文的優(yōu)化技術(shù)可為其它高性能GPU異構(gòu)平臺上的進(jìn)一步算法研究和超大規(guī)模天文N體模擬提供支撐。

【文章頁數(shù)】:10 頁

【文章目錄】:
引言
1 FMM-PM算法原理
    1.1 快速多極子方法
    1.2 粒子網(wǎng)格方法
    1.3 FMM-PM耦合方法
2 FMM在GPU上的實現(xiàn)
3 FMM在GPU上的性能優(yōu)化
    3.1 核心函數(shù)的參數(shù)優(yōu)化
    3.2 頁鎖定內(nèi)存優(yōu)化和CUDA流優(yōu)化
    3.3 混合精度和快速數(shù)學(xué)庫優(yōu)化
4 數(shù)值結(jié)果
5 結(jié)論與展望
利益沖突聲明



本文編號:4007027

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/tianwen/4007027.html

上一篇:探析文藝復(fù)興晚期宇宙觀的轉(zhuǎn)變  
下一篇:沒有了

Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶53091***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com