どんなもの?
マルチエージェントのトラッキングデータを用いた新しい軌道生成モデルの提案.
先行研究と比べてどこがすごい?
GNNと変分リカレントNN(VRNN)を活用しスポーツに適した順列等変量モデルを実現している点.
今までのロールベースの手法の課題を克服.
技術や手法のキモはどこ?
GNNと変分リカレントNN(VRNN)を活用しスポーツシーンに適用させている.
どうやって有効だと検証した?
生成されたサンプルの品質を分布レベルで定量化する、いくつかの新しい評価指標を提案
- 否定的対数尤度(NLL)。テスト集合における負の対数尤度
- Mean and best L2-error
- Max L2-error (Best)
- Miss rate:
- Conditional L2-error (Best):
- Distributional metrics:
- Player の平均速度
議論はある?
- サッカーにおける軌道のモデリングはバスケほどうまく行っていない.これは確率的な要素が少ないという仮説がある.
- 急加速はガウス尤度ではうまく捉えられない疎なバースト的現象であるため、いずれのモデルも選手の加速度を適切にモデル化できていない.
- ボールもモデル化できているけど,バスケほどの顕著な性能は出なかった
次に読むべき論文は?
- Where Will They Go? Predicting Fine-Grained Adversarial Multi-Agent Motion using Conditional Variational Autoencoders(ECCV2018)
- Generative multiagent behavioral cloning(Arxiv 2018)
- Representing and discovering adversarial team behaviors using player roles(CVPR 2013)
歩行者を用いたGNN:1, 15, 24, 30,40]
- A recurrent latent variable model for sequential data(NeurIPS 2015)
Memo
論文読み:44 min
詳細(式等の確認):5 min
メモ:44min
- 2019年CVPR論文
- 軌道予測のタスクをGNNを利用して解いている.
- 検索タスクにおいても使えそうだから理解しておきたい.
- VRNNは,完全連結グラフ(Full)または自己ループのみを含むグラフ、すなわち対角隣接行列(Diag)を持つグラフ変分リカレントニューラルネット。
- 問題の定式化:
- 下記を時間$t$におけるエージェントkの二次元位置として,
をゲームの一つのセグメントとする.は全てのセグメントを含む.
- 提案手法はVRNNに基づいて構築される.
- 以下の分布とRNN更新式で特徴付けられる.
- where
- N (-μ, σ2) は平均μ、共分散行列 diag(σ2)を持つ多変量正規分布を表す。ここで、fpri, fenc, fdec は学習可能なパラメータφとθを持つ事前ネットワーク、エンコーダ、デコーダに対応するディープネットである。
- VRNNはエビデンス下限(ELBO)を最大化することによって学習される。
- Consistent representation:
- 上記のVRNNは軌道kの順序を暗黙的にカプセル化している.しかしマルチエージェントにおいては順序が一貫していることが重要である.
- D1とD2は異なる表現であり,同じモデル確率を出力しない.この順序の不一致をどうにかする必要がある.
- Graph networks
- 各ノ ードviの特徴ベクトルから始める。
- そして、各辺eijに対して、接続されているノードに基づいて特徴ベクトルを導出する。
- その後、接続された各ノードにエッジ特徴ベクトル を「メッセージ」として送信し、その新しい出力状態oiを計算する。
- GNNは特徴ベクトルを取って,隣接行列を生成し,ノードベクトルを出力する.
- Graph VRNNs
- 我々のモデルは、各エージェントに対して独立したRNNと観測値を持つ。
- 各ノードがエージェントであり、グラフが完全連結であるGNNを用いて、各ステップにおけるそれらの相互作用をモデル化する。
where