どんなもの?
SportsMOTチャレンジ一位の解法。
先行研究と比べてどこがすごい?
モーションブラーやオクルージョンを解決するために三段階のマッチングプロセスを採用。
技術や手法のキモはどこ?
3段階のプロセスを加えて、MOTの直面する技術的課題に対して処理している。
- 第1段階は、すべての検出ボックスを調べ、閾値を設定。
- 第2段階では、信頼度の高い検出ボックスのみを調べ、トラックに統合。
- 第3ステージでは信頼性の低いボックスを調べ、既存のトラックにマージ。
Croud Trackの導入
一旦アスリートが近づきすぎると(IOU距離の計算により識別)、1つの検出bboxが多くのCroudトラックに対応できるようにする。
どうやって有効だと検証した?
SportsMOTデータセットを使用
- 3カテゴリ, 240本の動画であり、25FPS, 720P.平均フレームは495
- 学習用データは合計で28574フレームで、検証用フレームは合計26970フレーム
評価指標にはHOTAを使用
DetectionにはYoloX, ReIDモデルはFast-ReIDを使用
validation setで80.863 HOTA スコアが記録
test setで76.264 HOTAスコアを記録
DeeperActionコンペにおいて最高精度を達成した。
議論はある?
次に読むべき論文は?
DeepSORT, FastReIDの論文