どんなもの?
弱教師ありGroup Activity Recognitionにおける,研究を用いた手法の提案.
先行研究と比べてどこがすごい?
従来手法は集団行動の認識のためには検出器を1st-stageで利用することが主流であったがそれは誤検出の際にGARの性能低下につながる.
提案手法ではTransformerにより選手の動きの特徴を直接抽出している
技術や手法のキモはどこ?
Attentionのメカニズムを用いて部分的な行動(つまり選手個人)の行動を埋め込み,それらの時間的な変化を集約する.
どうやって有効だと検証した?
Volleyball データセットとNBAデータセット
また提案したMHSAモジュールなどのモジュールのアブレーション実験も行う
議論はある?
直接的な教師データがないため多様なトークン埋め込みが困難である.
そのため,不要なコンテキストを補足しないような手法の提案で更なる改善が達成できそう