どんなもの?
skeketon-base Action Recognitionにおける一般的な階層的整合性対比学習手法の提案.
先行研究と比べてどこがすごい?
教師なしskeketon-base Action Recognitionはアノテーションコストを考慮して,教師なしの表現学習が注目
しかし,骨格データに対する強いデータ拡張は性能劣化に繋がる(RGBよりも感度が高い?)
HiCLRは性能劣化させない手法の提案している点が新しい
技術や手法のキモはどこ?
HiCLRは複数の相関のある正のペアを構築する,成長する階層的データ拡張ポリシーを採用.これにより強いデータ拡張からも性能劣化させることをすることなく学習が可能になる.
どうやって有効だと検証した?
3つの大規模データセットで検証
- 1) NTU RGB+D Dataset 60 (NTU60)
- 2) NTU RGB+D Dataset 120 (NTU120)
- 3) PKU Multi-Modality Dataset (PKUMMD)
評価指標
- KNN Evaluation
- Linear Evaluation
- Semi-supervised Evaluation
議論はある?
次に読むべき論文は?
Memo
https://jhang2020.github.io/Projects/HiCLR/HiCLR.html
- skelton-based ARはGARよりは進んでいる印象