中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 力學(xué)論文 >

基于CPU/GPU異構(gòu)系統(tǒng)架構(gòu)的高超聲速湍流直接數(shù)值模擬研究

發(fā)布時(shí)間:2024-06-29 06:31
  【目的】高超聲速湍流直接數(shù)值模擬(DNS)對(duì)空間及時(shí)間分辨率要求高,計(jì)算量非常大。過大的計(jì)算量及過長的計(jì)算時(shí)間是導(dǎo)致DNS難以在工程中被大范圍應(yīng)用的重要原因。為加快計(jì)算速度,作者設(shè)計(jì)并開發(fā)了一套CPU/GPU異構(gòu)系統(tǒng)架構(gòu)(HSA)下的高性能計(jì)算流體力學(xué)程序OpenCFD-SCU!痉椒ā吭摮绦蛞宰髡咔捌陂_發(fā)的高精度有限差分求解器OpenCFD-SC為基礎(chǔ),經(jīng)GPU系統(tǒng)的移植及優(yōu)化而得。GPU程序的計(jì)算部分使用CUDA編程,確保所有算術(shù)運(yùn)算都在GPU上完成!窘Y(jié)果】利用GPU程序OpenCFD-SCU,進(jìn)行了來流Mach數(shù)6,6°攻角鈍錐邊界層轉(zhuǎn)捩的直接數(shù)值模擬,得到了轉(zhuǎn)捩過程中的時(shí)空演化流場。針對(duì)這一算例,GPU程序OpenCFD-SCU與CPU程序OpenCFD-SC相比,實(shí)現(xiàn)了60倍的加速效果(單GPU卡對(duì)單CPU核心),大大加速了DNS計(jì)算過程。【結(jié)論】未來,相信會(huì)有更多高超聲速湍流模擬選擇在GPU上開展。

【文章頁數(shù)】:12 頁

【部分圖文】:

圖6鈍錐表面流向網(wǎng)格

圖6鈍錐表面流向網(wǎng)格

網(wǎng)格規(guī)模為1600*1200*120,其中流線網(wǎng)格數(shù)1600,周向網(wǎng)格數(shù)1200,法向網(wǎng)格數(shù)120,總網(wǎng)格2.3億,流向網(wǎng)格在頭部進(jìn)行加密,周向采用非均勻網(wǎng)格在迎風(fēng)面對(duì)網(wǎng)格進(jìn)行加密。壁面第一層網(wǎng)格為0.01mm。流向與周向網(wǎng)格見圖6、圖7。圖7鈍錐表面周向網(wǎng)格


圖1CPU與GPU浮點(diǎn)運(yùn)算能力[16]

圖1CPU與GPU浮點(diǎn)運(yùn)算能力[16]

在過往對(duì)高超聲速湍流的DNS中,往往通過在大規(guī)模CPU集群上做并行計(jì)算來實(shí)現(xiàn),節(jié)點(diǎn)間采用MPI(MessagePassingInterface)、ZeroMQ(0MQ)、Hadoop等方式進(jìn)行數(shù)據(jù)通訊。然而,多核架構(gòu)的CPU的計(jì)算能力現(xiàn)今已被眾核架構(gòu)的GPU甩在身后,圖1、....


圖2CPU與GPU的帶寬[16]

圖2CPU與GPU的帶寬[16]

利用GPU求解流體力學(xué)問題前人已經(jīng)開展過一些工作,2003年TakashiAmada在GPU上實(shí)現(xiàn)了基于平滑分子動(dòng)力學(xué)(SmoothedParticleHydrody-namics)的粒子流動(dòng)模擬[3],同年,J.Kruger利用GPU求解了二維不可壓N-S方程[4]。20....


圖3OpenCFD-SC計(jì)算流程

圖3OpenCFD-SC計(jì)算流程

CPU/GPU異構(gòu)系統(tǒng)架構(gòu)(HSA)下的計(jì)算流體力學(xué)程序OpenCFD-SCU(OpenCFDScientificComputing-CUDA)以作者前期開發(fā)的高精度有限差分求解器OpenCFD-SC[20]為基礎(chǔ),兩者使用相同的程序框架,程序框架如圖3。程序先讀入控制....



本文編號(hào):3997308

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/lxlw/3997308.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1f588***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com