(発表4回) Kepler(GK104) いけてない ぽんこつさん。ねこみみ

- 256bit 帯域メモリ
- 倍精度計算できない。
こんな小さなチップがフラグチップじゃない。

--

GK110
---------
宇宙物理学。ITベンチャー新入社員
--
流体研究。
株式会社データセクション
- データマイニング。
3種の神器:Xubuntu, 1Emacs, Python
現実: Java Eclipse SQL

LINPACK 世界で性能の高いスパコン
  - TOP10 のうち3つ1 NVIDIA GPU
  - 5位に東工大の TSUBAME2

----
宇宙物理のN体計算
- 実行効率80%とか意味不明
- 3年で GRAPE を完全に駆逐した感。

流体計算
 => 領域を区切る。基礎方程式に従い流れを計算、Δt後の物質分布を出す。
   それの繰り返し。


SM(Streaming Multiprocessor

Register は 1 thread 当たり 64本まで。
溢れると Global memoryに飛ばされるので、1clock が数100clock まで消費してしまう。

GPU: CUDA
CPU: OpenMP + Eigen (線形代数ライブラリ)

Roe 法
Lax-Wendroff 法  <= 計算方法少ない。少し複雑(一時変数多い、レジスタ溢れる)
 データアクセス多い

Occupancy (GPU の実行効率)

------
とりあえず早くなった
ばらつきが多い
メモリ何とかしろ
--
GK110(Kepler)から white paper 出てる
64 制限は 内部ISA の都合だけど、255本になる。

Reload   Diff   Front page List of pages Search Recent changes Backup Referer   Help   RSS of recent changes