Top > 2012-06-02 > 7 (発表7回) TopCoder/NVIDIA 主催 @foota / nox 並列処理。IT企業。機械学習。論文のsurbey. 元分子動力学(MD)計算の研究員。創薬の研究。 (さっき GRAPE が滅びてるような話がありますが、MD GRAPE4 開発してるはず) CUDA Superhero Challenge - 問題を、読む>考える>解く。 ---- TopCoder 競技プログラミング。世界最大。 代表的なのは、 短期間で問題をとく。1SRM(Single Round Match) 長期間でとく MM (マラソンマッチ) GPGPU を使って長期間(2週間)で解く。 賞金総額 5,000ドル。一位はこの半分。 海外のニュースサイトに乗ったりする。 連結成分ラベリングをGPUを使って出来るだけ高速に解くだけ。 「連結成分ラベリング」って? 領域分けを出来るだけ速く。 条件。 入力画像<3億1pixelまで。いっぺんの長さ2万pixexl 1画像につき1分以内。 メモリは2,500MB まで。 サンプル。19枚。 コードの書き方。 Class、 メソッド、パラメータ。。戻り値。 メソッドシグネチャ。 ーーー ベンチマークをとった時の。 CPU, Intel Xeon X5650 @2.57GHz GPU: ... ラベルの初期値>左上から順に 各ピクセルで一番小さなラベルを新しいラベルとする。 というのを全ピクセルで繰り返し。ラベルが更新されなくなったら>終了。 ------ 隣接伝播だとグラデーション対応出来なさそうだけど大丈夫なの? https://github.com/foota/ccl 小さい画像は CPU の方が速いのでスイッチ GPU 最適化 ほぼ、このアルゴリズムか、それを拡張したもの。 最近の論文では更に高速にするものもある。> リファレンス ----- 高速化するのにプロファイルで色んな指標を見て チューニングしたと思いますが、どの辺りを特に気にして進めたでしょう。 コツがあれば是非。 MM は巡回セールスマン問題のような決まった答えがない事が多くて、マネジメント的な能力が求められる。 |