(発表4回) Kepler(GK104) いけてない ぽんこつさん。ねこみみ

  • 256bit 帯域メモリ
  • 倍精度計算できない。 こんな小さなチップがフラグチップじゃない。

GK110


宇宙物理学。ITベンチャー新入社員

  • 流体研究。 株式会社データセクション
  • データマイニング。 3種の神器:Xubuntu, 1Emacs, Python 現実: Java Eclipse SQL

LINPACK 世界で性能の高いスパコン

 - TOP10 のうち3つ1 NVIDIA GPU
 - 5位に東工大の TSUBAME2

宇宙物理のN体計算

  • 実行効率80%とか意味不明
  • 3年で GRAPE を完全に駆逐した感。

流体計算

=> 領域を区切る。基礎方程式に従い流れを計算、Δt後の物質分布を出す。
  それの繰り返し。

SM(Streaming Multiprocessor

Register は 1 thread 当たり 64本まで。 溢れると Global memoryに飛ばされるので、1clock が数100clock まで消費してしまう。

GPU: CUDA CPU: OpenMP + Eigen (線形代数ライブラリ)

Roe 法 Lax-Wendroff 法 <= 計算方法少ない。少し複雑(一時変数多い、レジスタ溢れる)

データアクセス多い

Occupancy (GPU の実行効率)


とりあえず早くなった ばらつきが多い メモリ何とかしろ

  • GK110(Kepler)から white paper 出てる 64 制限は 内部ISA の都合だけど、255本になる。

Reload   Diff   Front page List of pages Search Recent changes Backup Referer   Help   RSS of recent changes
Last-modified: Tue, 10 Jun 2014 01:13:08 JST (3607d)