基于國產(chǎn)十億億次超算系統(tǒng)的近連續(xù)過渡流區(qū)N-S/DSMC耦合算法并行優(yōu)化研究
【文章頁數(shù)】:7 頁
【部分圖文】:
圖1“申威26010”眾核處理器架構(gòu)2.2MPC耦合方法Figure1Architectureof"Sunway26010"
第4節(jié)研究進(jìn)程級優(yōu)化;第5節(jié)探討眾核級優(yōu)化;最后給出優(yōu)化測試結(jié)果、實際算例結(jié)果及結(jié)論。本文的主要成果有:(1)首次在異構(gòu)眾核超級計算機(jī)上實現(xiàn)耦合算法的眾核版本,并完成了性能測試與分析;(2)改進(jìn)初始化算法,使初始化時間性能提高達(dá)到102數(shù)量級。2眾核平臺及耦合算法介紹2.1國產(chǎn)異....
圖2流場及區(qū)域分解Figure2Flowdomaindecomposition
耦合計算。該方法的優(yōu)點:CFD和DSMC計算程序不需改動,只需在2個獨(dú)立程序模塊外部加入網(wǎng)格和信息交換的計算模塊,就可以實現(xiàn)N-S/DSMC的耦合計算[1-6]。3并行策略與熱點分析3.1區(qū)域分解并行計算首先涉及到并行區(qū)域分解,為了使CFD方法和DSMC方法耦合過程中區(qū)域的拓?fù)溆?...
圖7返回艙流場結(jié)構(gòu)Figure7Flowstructureofthere-entrycapsule
故計算過程中需頻繁讀入新的數(shù)據(jù)。由于“申威26010”眾核處理器的LDM(局部存儲空間)只有64KB,每次加載到從核的數(shù)據(jù)量有限,導(dǎo)致了大量的從核訪問主存操作;又由于眾核訪LDM一般為5拍,離散訪問主存可能達(dá)到800~170拍,性能差別達(dá)幾十到幾百倍,故眾核加速效果不理想,甚至有....
圖8氣動特性比較7結(jié)束語Figure8Comparisonofaerocharacteristics
中需頻繁讀入新的數(shù)據(jù)。由于“申威26010”眾核處理器的LDM(局部存儲空間)只有64KB,每次加載到從核的數(shù)據(jù)量有限,導(dǎo)致了大量的從核訪問主存操作;又由于眾核訪LDM一般為5拍,離散訪問主存可能達(dá)到800~170拍,性能差別達(dá)幾十到幾百倍,故眾核加速效果不理想,甚至有些循環(huán)段沒....
本文編號:3987134
本文鏈接:http://www.lk138.cn/kejilunwen/lxlw/3987134.html