Top > 2012-06-02 > 4 (発表4回) Kepler(GK104) いけてない ぽんこつさん。ねこみみ
GK110 宇宙物理学。ITベンチャー新入社員
LINPACK 世界で性能の高いスパコン - TOP10 のうち3つ1 NVIDIA GPU - 5位に東工大の TSUBAME2 宇宙物理のN体計算
流体計算 => 領域を区切る。基礎方程式に従い流れを計算、Δt後の物質分布を出す。 それの繰り返し。 SM(Streaming Multiprocessor Register は 1 thread 当たり 64本まで。 溢れると Global memoryに飛ばされるので、1clock が数100clock まで消費してしまう。 GPU: CUDA CPU: OpenMP + Eigen (線形代数ライブラリ) Roe 法 Lax-Wendroff 法 <= 計算方法少ない。少し複雑(一時変数多い、レジスタ溢れる) データアクセス多い Occupancy (GPU の実行効率) とりあえず早くなった ばらつきが多い メモリ何とかしろ
|