(発表7回) TopCoder/NVIDIA 主催 @foota / nox

並列処理。IT企業。機械学習。論文のsurbey. 元分子動力学(MD)計算の研究員。創薬の研究。 (さっき GRAPE が滅びてるような話がありますが、MD GRAPE4 開発してるはず)

CUDA Superhero Challenge

  • 問題を、読む>考える>解く。

TopCoder 競技プログラミング。世界最大。 代表的なのは、 短期間で問題をとく。1SRM(Single Round Match) 長期間でとく MM (マラソンマッチ)

GPGPU を使って長期間(2週間)で解く。 賞金総額 5,000ドル。一位はこの半分。 海外のニュースサイトに乗ったりする。

連結成分ラベリングをGPUを使って出来るだけ高速に解くだけ。 「連結成分ラベリング」って? 領域分けを出来るだけ速く。

条件。 入力画像<3億1pixelまで。いっぺんの長さ2万pixexl 1画像につき1分以内。 メモリは2,500MB まで。 サンプル。19枚。

コードの書き方。 Class、 メソッド、パラメータ。。戻り値。 メソッドシグネチャ。 ーーー ベンチマークをとった時の。 CPU, Intel Xeon X5650 @2.57GHz GPU: ...

ラベルの初期値>左上から順に 各ピクセルで一番小さなラベルを新しいラベルとする。 というのを全ピクセルで繰り返し。ラベルが更新されなくなったら>終了。


隣接伝播だとグラデーション対応出来なさそうだけど大丈夫なの?

https://github.com/foota/ccl

小さい画像は CPU の方が速いのでスイッチ GPU 最適化 ほぼ、このアルゴリズムか、それを拡張したもの。 最近の論文では更に高速にするものもある。> リファレンス


高速化するのにプロファイルで色んな指標を見て チューニングしたと思いますが、どの辺りを特に気にして進めたでしょう。 コツがあれば是非。

MM は巡回セールスマン問題のような決まった答えがない事が多くて、マネジメント的な能力が求められる。


Reload   Diff   Front page List of pages Search Recent changes Backup Referer   Help   RSS of recent changes
Last-modified: Tue, 10 Jun 2014 01:14:08 JST (3602d)