(発表7回) TopCoder/NVIDIA 主催 @foota / nox
並列処理。IT企業。機械学習。論文のsurbey. 元分子動力学(MD)計算の研究員。創薬の研究。
(さっき GRAPE が滅びてるような話がありますが、MD GRAPE4 開発してるはず)
CUDA Superhero Challenge
- 問題を、読む>考える>解く。
----
TopCoder 競技プログラミング。世界最大。
代表的なのは、
短期間で問題をとく。1SRM(Single Round Match)
長期間でとく MM (マラソンマッチ)
GPGPU を使って長期間(2週間)で解く。
賞金総額 5,000ドル。一位はこの半分。
海外のニュースサイトに乗ったりする。
連結成分ラベリングをGPUを使って出来るだけ高速に解くだけ。
「連結成分ラベリング」って?
領域分けを出来るだけ速く。
条件。
入力画像<3億1pixelまで。いっぺんの長さ2万pixexl
1画像につき1分以内。
メモリは2,500MB まで。
サンプル。19枚。
コードの書き方。
Class、 メソッド、パラメータ。。戻り値。
メソッドシグネチャ。
ーーー
ベンチマークをとった時の。
CPU, Intel Xeon X5650 @2.57GHz
GPU: ...
ラベルの初期値>左上から順に
各ピクセルで一番小さなラベルを新しいラベルとする。
というのを全ピクセルで繰り返し。ラベルが更新されなくなったら>終了。
------
隣接伝播だとグラデーション対応出来なさそうだけど大丈夫なの?
https://github.com/foota/ccl
小さい画像は CPU の方が速いのでスイッチ
GPU 最適化
ほぼ、このアルゴリズムか、それを拡張したもの。
最近の論文では更に高速にするものもある。> リファレンス
-----
高速化するのにプロファイルで色んな指標を見て
チューニングしたと思いますが、どの辺りを特に気にして進めたでしょう。
コツがあれば是非。
MM は巡回セールスマン問題のような決まった答えがない事が多くて、マネジメント的な能力が求められる。