(発表2)
GPU DE ちょっとした問題解いてみた - Terumi YAMADA
SIMD 好き。
巡回セールスマン問題といてみた。
Aobench 走らせてみた。
OpenCL とは?
Geforce GTX 580
- 512 CUDA core 3GNB RAM PCIe3.0
AMD
Radeon HD7970 - GCN,
* 巡回セールスマン問題 [#j7391e9a]
NP困難問題。(現時点では多項式時間で解く方法が見つかってない)
- 遺伝的アルゴリズム。
- 蟻コロニー最適か
- μ-opt法
- LK法
------------
2opt 法 (μ=2 の時の)
TST アート。(巡回セールスマン問題を解く事で絵にする)
力づくだと72時間で10万都市。
ブロック分けして、独立した問題として解く。
=>それでも良い事は証明されてるらしい。
------------
Aobench
浮動小数点演算のベンチマーク。
Ambient Occlution
ホットスポットの話。
レイトレース。
これをどう、オフロードするか。
ピクセル毎に独立してる。
AMD 遅い。
ベンチとっても問題なさそう。
帯域は出てる。
カーネルを細かくしたら AMD 遅かった。
AMD はデータ転送とカーネルキックが遅い?
適切に分割したら速い。
結論
- スロースターター
- カーネルが大きくなれば...
GPGPU やるなら Geforce GTX580
------
電圧の関係で遅くなる事がある。電源ユニット替えて速くなる事もある。