基于國(guó)產(chǎn)十億億次超算系統(tǒng)的近連續(xù)過(guò)渡流區(qū)N-S/DSMC耦合算法并行優(yōu)化研究
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
圖1“申威26010”眾核處理器架構(gòu)2.2MPC耦合方法Figure1Architectureof"Sunway26010"
第4節(jié)研究進(jìn)程級(jí)優(yōu)化;第5節(jié)探討眾核級(jí)優(yōu)化;最后給出優(yōu)化測(cè)試結(jié)果、實(shí)際算例結(jié)果及結(jié)論。本文的主要成果有:(1)首次在異構(gòu)眾核超級(jí)計(jì)算機(jī)上實(shí)現(xiàn)耦合算法的眾核版本,并完成了性能測(cè)試與分析;(2)改進(jìn)初始化算法,使初始化時(shí)間性能提高達(dá)到102數(shù)量級(jí)。2眾核平臺(tái)及耦合算法介紹2.1國(guó)產(chǎn)異....
圖2流場(chǎng)及區(qū)域分解Figure2Flowdomaindecomposition
耦合計(jì)算。該方法的優(yōu)點(diǎn):CFD和DSMC計(jì)算程序不需改動(dòng),只需在2個(gè)獨(dú)立程序模塊外部加入網(wǎng)格和信息交換的計(jì)算模塊,就可以實(shí)現(xiàn)N-S/DSMC的耦合計(jì)算[1-6]。3并行策略與熱點(diǎn)分析3.1區(qū)域分解并行計(jì)算首先涉及到并行區(qū)域分解,為了使CFD方法和DSMC方法耦合過(guò)程中區(qū)域的拓?fù)溆?...
圖7返回艙流場(chǎng)結(jié)構(gòu)Figure7Flowstructureofthere-entrycapsule
故計(jì)算過(guò)程中需頻繁讀入新的數(shù)據(jù)。由于“申威26010”眾核處理器的LDM(局部存儲(chǔ)空間)只有64KB,每次加載到從核的數(shù)據(jù)量有限,導(dǎo)致了大量的從核訪問(wèn)主存操作;又由于眾核訪LDM一般為5拍,離散訪問(wèn)主存可能達(dá)到800~170拍,性能差別達(dá)幾十到幾百倍,故眾核加速效果不理想,甚至有....
圖8氣動(dòng)特性比較7結(jié)束語(yǔ)Figure8Comparisonofaerocharacteristics
中需頻繁讀入新的數(shù)據(jù)。由于“申威26010”眾核處理器的LDM(局部存儲(chǔ)空間)只有64KB,每次加載到從核的數(shù)據(jù)量有限,導(dǎo)致了大量的從核訪問(wèn)主存操作;又由于眾核訪LDM一般為5拍,離散訪問(wèn)主存可能達(dá)到800~170拍,性能差別達(dá)幾十到幾百倍,故眾核加速效果不理想,甚至有些循環(huán)段沒(méi)....
本文編號(hào):3987134
本文鏈接:http://lk138.cn/kejilunwen/lxlw/3987134.html