2012-06-02/4 - YoyaWiki Plus!

その他の巡回

ニコニコ動画

Google乗り換え

Googleニュース

pukiwiki-official

Wikiの書き方(整形ルール)

プラグインヘルプ

各種ドキュメント

GitHub |Qiita |awm-Tech
SpeakerDeck |Docswell
BlueSky |Twitter (likes)
Facebook |はてブロ (admin)

Yahoo!天気 |地震
 天気JP 地震
 Yahoo!路線 |Excite辞書
 黄砂

よやアプリ | よやツール

recent(20)

2024-04-25

Map

2024-04-24

2024-04-23

2024-04-22

Wasmer

2024-04-21

2024-04-20

Menu編集
 Wiki管理メモ

Top > 2012-06-02 > 4

(発表４回) Kepler(GK104) いけてないぽんこつさん。ねこみみ

256bit 帯域メモリ
倍精度計算できない。こんな小さなチップがフラグチップじゃない。

GK110

宇宙物理学。ITベンチャー新入社員

流体研究。株式会社データセクション

データマイニング。３種の神器：Xubuntu, 1Emacs, Python 現実: Java Eclipse SQL

LINPACK 世界で性能の高いスパコン

 - TOP10 のうち３つ1 NVIDIA GPU
 - 5位に東工大の TSUBAME2

宇宙物理のN体計算

実行効率80%とか意味不明
3年で GRAPE を完全に駆逐した感。

流体計算

=> 領域を区切る。基礎方程式に従い流れを計算、Δt後の物質分布を出す。
  それの繰り返し。

SM（Streaming Multiprocessor

Register は 1 thread 当たり 64本まで。溢れると Global memoryに飛ばされるので、1clock が数100clock まで消費してしまう。

GPU: CUDA CPU: OpenMP + Eigen (線形代数ライブラリ)

Roe 法 Lax-Wendroff 法 <= 計算方法少ない。少し複雑(一時変数多い、レジスタ溢れる)

データアクセス多い

Occupancy (GPU の実行効率)

とりあえず早くなったばらつきが多いメモリ何とかしろ

GK110(Kepler)から white paper 出てる 64 制限は内部ISA の都合だけど、255本になる。

Last-modified: Tue, 10 Jun 2014 01:13:08 JST (3607d)