Top > 2012-06-02 > 4
(発表4回) Kepler(GK104) いけてない ぽんこつさん。ねこみみ - 256bit 帯域メモリ - 倍精度計算できない。 こんな小さなチップがフラグチップじゃない。 -- GK110 --------- 宇宙物理学。ITベンチャー新入社員 -- 流体研究。 株式会社データセクション - データマイニング。 3種の神器:Xubuntu, 1Emacs, Python 現実: Java Eclipse SQL LINPACK 世界で性能の高いスパコン - TOP10 のうち3つ1 NVIDIA GPU - 5位に東工大の TSUBAME2 ---- 宇宙物理のN体計算 - 実行効率80%とか意味不明 - 3年で GRAPE を完全に駆逐した感。 流体計算 => 領域を区切る。基礎方程式に従い流れを計算、Δt後の物質分布を出す。 それの繰り返し。 SM(Streaming Multiprocessor Register は 1 thread 当たり 64本まで。 溢れると Global memoryに飛ばされるので、1clock が数100clock まで消費してしまう。 GPU: CUDA CPU: OpenMP + Eigen (線形代数ライブラリ) Roe 法 Lax-Wendroff 法 <= 計算方法少ない。少し複雑(一時変数多い、レジスタ溢れる) データアクセス多い Occupancy (GPU の実行効率) ------ とりあえず早くなった ばらつきが多い メモリ何とかしろ -- GK110(Kepler)から white paper 出てる 64 制限は 内部ISA の都合だけど、255本になる。 |