A new look into Off-ball Scoring Opportunity: taking into account the continuous nature of the game

どういう論文？

元々のOff-Ball Scoring Opportunity（OBSO）モデルは、プレーヤーがアクションを実行したときだけ、ゲームのスナップショットを考慮するようにモデル化されている。

しかし、サッカーは常に意思決定が行われる連続的なスポーツであり、野球のように行動が離散化されることはない。

この論文では，攻撃側のプレーヤーが足元にボールを持っている時間ステップごとにオフボール得点機会を計算するという，オリジナルのモデルの再解釈を提案．

これは，プレーヤーがボールをコントロールしている限り，ピッチ上の他の場所にボールを移動させることが可能

この新しい方法でOBSOモデルを適用することにより、任意の瞬間の次のオンボールイベントの得点確率を表す時系列を構築することが可能
このモデルの使用方法によって、個人およびチームレベルでの攻撃の創造について、より詳細なビューが得られることを示す。

モデルの入力に使用するデータは？

トラッキングデータのみで動作可能？

しかし論文を見た限りだと、ボールを保持しているシーンのみに対してOBSOスコアが追加されており、パスなどのボールの移動中に対してはスコア付けされていないよう。
なので、ボールタッチをしているという情報は必要になるのかもしれない。

実験結果は？

次に読みたい論文は？

ゴール期待値

1. Introduction

トラッキングデータによって、サッカーに対する理解や分析が格段に深まり、ボールの周りで起こることだけでなく、ゲーム全体を評価することが可能になりました。

我々の挑戦は、ゲームに内在する意思決定のプロセスに論理的に対応した、定量的な分析方法を生み出すこと

ある意味、集団レベル、個人レベルで理想的な行動をとるための思考過程をモデルに取り込むことが必要。

ゴールにつながりうる選手のオフボールポジショニングを評価するために、Off-Ball Scoring Opportunity (OBSO) [Spearman 2018]というモデルが開発

研究の主目的は、パスを受け、ボールをコントロールし、得点できるエリアでの良いポジショニングをした選手に報酬を与えることで、過去のゴールやシュートよりも将来のゴールを予測する指標を作ることであった。
そのステップが「ボールはどこに移動するのか」「フィールド上のどのエリアが各チームによって支配されているのか」といったサッカー特有の質問に対する答えであるため、非常に直感的に理解することができる。

ただし、このモデルでは、イベントデータに一致する試合のタイムスタンプのトラッキングデータのみを使用しています。

それだと、アクションが実行されたときのアタッカーのオフボールポジショニングしか分析出来ない。

例えば、ある選手が長い時間ボールをドリブルし、ある時点でパスをすることを決めたとする。その場合、その選手がパスをした時点のパスの可能性についての情報しか得られない。
もしそのプレーヤーが早い段階でより良いパスの機会があったとしても，モデルはそれを捕らえることはできない

OBSO モデルを連続的な時系列として見ることは理にかなっている。

なぜなら、プレーヤーは、チームメイトがいつあなたにボールを渡すか分からないので、そのパスを受け取ることができるようにする時間の長さが関係してくるから。

この論文では、選手が自分自身にボールを移行することができ（パスだけでなく）、オンボールイベントだけでなく、すべてのオンボールタッチが関連する、オフボール得点機会モデルの新しい使用方法を提案する。

2. DATA

本研究では、公開データセット[Tavares 2020]に存在する、2019年中にLiverpoolが決めた19ゴールのうち18ゴールの放送追跡データを分析。

今回利用したゴールはすべてオープンプレーからの得点であり、セットプレー（コーナー、フリーキック、PK）に続くものではない。
データセットの中で利用されなかったゴールはコーナーからのものであり、そのため、この研究の目的には適わない。

画面上の全ての選手とボールについてフィールド上の座標を抽出。

重要なのは、ボールに近い選手は全員含まれていても、すべての選手が各プレーに含まれているわけではないことである。

オフボール得点機会モデルを適用するためには、プレーヤーの位置の他に、各時点での速度も重要である。まず、すべてのプレーヤーの変位を計算し、フレーム間のタイムステップ（0.05 秒）で割ります。次に，移動平均フィルタを適用して，速度を平滑化する．また、選手の位置の潜在的な誤差が非現実的な巨大な速度をもたらさないように、選手が現実的に到達できる最大速度を設定した。

3. METHODS

最初にOff-ball Scoring Opportunity (OBSO)モデルについて説明し、オリジナル作品との相違点に触れる
その後、イベントが発生した時点だけでなく、OBSOを計算する瞬間のシーケンスを選択する別の方法を提案する。

3.1 Off-ball Scoring Opportunity

従来型のOBSOモデルは、次のイベントの後、特定の瞬間に攻撃側のチームが得点する確率を計算
以下の3つの確率の同時確率がOBSO

(1)Transition : ボールが元の位置からピッチ上の任意の点rに遷移する確率。Tr
(2)Control : この任意の点rにおいて、ボールが攻撃側によってコントロールされる確率。Cr
(3)Score: この任意の点rから得点する確率。Sr

Dは特定の瞬間におけるゲーム状態、Rはフィールド上の全ての点の集合
瞬時のゲーム状態には、すべてのプレーヤーの位置と速度が含まれる。

(1)の確率は一連の条件付き確率に分解でき、以下の式が形成される。

3.1.1 Control Model

Potential Pitch Control Field (PPCF) [Spearman 2018]は、ボールがその場所に移動したと仮定して、各選手がフィールド上のすべての場所でボールをコントロールする確率を定量化

相手からの干渉を受けず，小さな距離の中にいる時間が長いほど，そのプレーヤーがボールを正しくコントロールできる確率は高くなる
また，ボールが目的地に瞬時に到着することは想定していない．
したがって，ボールがこの場所に到着するまでにある程度の時間がかかると考えた．

ボールの空気抵抗を用いてパスが特定の場所に到達するまでの時間を計算することは，原著論文とは異なり，行わない
その代わり，ボールの移動時間は，現在のボールの位置からターゲットの位置までの距離を設定したボール速度で割った値とした

平均ボール速度 15m/s を使用 [Shaw 2020]．
以下の微分方程式を用いて，各プレイヤーが時間 t において，ある位置 r でボールをコントロールする確率を計算

式 3 において，fj (t, -→r , T|s) は時間 t においてプレイヤー j が時間 T よりも短い時間で r に到達できる確率.以下のように定式化

ここで，τexp(t -→r ) は期待インターセプト時間で，注目するプレイヤーが，初速 →vj (t)，一定加速度 a，最大速度 v で，rj (t) から r に到達するまでの時間を計算して求めたものである． Spearman と同様、a と v にはそれぞれ 7m/s2 と 5m/s を使用した。
式 3 の変数 λj は制御率であり，プレイヤーがボールを制御して触れるまでにかかる平均時間の逆数を表している．制御率が高ければ高いほど，プレイヤーがボールを制御するのに要する時間は短くなる．元のモデルと同様に，λj は 3.99 に設定された．プレイヤーがオフサイドのとき，そのコントロール率は 0 になる．式 3 を 0 から ∞ までの T にわたって積分すると，プレーヤーごとのコントロールの確率が構築される．

3.1.2 Transition Model.

Transitionモデルは次のボールタッチが特定の位置 r で起こる確率を測定
後続のボールイベント間の変位の分布は正規分布であるため[Spearman 2018]、プレーヤーはより高い頻度でショートパスを試みる傾向
また、パス時の角度分散のため、プレーヤーがロングパスを試みると、そのターゲット位置はより高い分散を持つことになる。

原理的には、プレーヤーは味方の誰かがコントロールすると思われる場所にパスを出します。
PPCFモデルは、ボールがフィールド上の特定の場所に行った場合に攻撃側にコントロールされる確率を与えるので、これを正規分布と重ね合わせて決定確率密度場を構成することができる。このようにして意思決定が遷移モデルに組み込まれる。

式5において、σはオンボールイベント間の平均距離に関係し、Aは全ての攻撃側プレーヤーの集合、αはPPCFモデルの重みパラメータ、Nは2次元の正規分布。
Spearman の研究よりσを 23.9、αを 1.04 とした。式3はユニティに正規化されている

3.1.3 Score Model

式 2 の第 1 項 P(Sr|Cr, Tr, D)は，ボールがそこに移動し，攻撃側によってコントロールされた場合に，ある位置 r から得点する確率を記述する

簡略化のため、ゲームの状態である D は考慮しない。

Spearmanと同様に、我々はフィールド上の特定の地点から得点する確率を決定するためにデータ駆動型モデルを構築

しかし、距離の関数として得点の確率だけを考えるのではなく、プレーヤーとゴールポストの間に形成される角度も考慮した。

我々は、得点モデルを、距離とゴール角の関数としてのシュートによる得点の確率と定義[Sumpter 2020]

直感的には、距離が大きくなると得点の確率は下がり、角度が大きくなると上がる。

それをモデル化するために、プレミアリーグの全シーズンのノンヘッダーショットデータを使用[Pappalardo et al.2019]。

すべてのショットから座標を取得することで、ゴールの角度と距離を計算し、それをショットの結果と対にして、データを説明する最適な曲線にフィット可能

θはボールから各ゴールポストに向かう線の間にできる角度（ラジアン単位）、dはショットが行われた場所からゴールの中心までの距離（メートル単位）です。c0、c1、c2は対数尤度関数を最大化する値です。それぞれの値は、0.7895、-1.2594、0.1155である。このモデルの限界の1つは，モデルが非ヘッダーショットで構築されており，ヘッダーは通常のショットよりも低いコンバージョンレートを持っているので，ヘッダーからの得点の確率を過大評価してしまうことである．
図2は、ロジスティック回帰の詳細

3.1.4 Final Probability.

前のセクションに従うことで、我々は、時間tにおいて、特定の位置rから、式2の3つの条件付き確率のそれぞれの確率を計算することができます。
最後に、以下の式は、時間tにおいて、フィールド上のターゲットセグメントrから、次のオンボールアクションの後に得点する確率を記述しています。

T(t,r)は遷移確率、C(t,r)はコントロール確率、Sは得点確率
各中間確率を可視化できるように、フィールド上のすべての場所について計算する。

この分析のために、フィールドを正方形のセルに分解し、32×50の行列を形成

したがって、すべてのセルについて、フィールド上のすべての点について、条件付き確率を計算し、それらを掛け合わせて、最終的な確率を算出

3.2 OBSO Space-Integration

ある時間tの瞬間に、フィールド上のすべての点rを積分することで、ボールに対する次のアクションの後に得点する総確率を得ることができる

これは式1、式2の別の書き方となる

3.3 OBSO Time-Integration

オリジナルのアプローチでは、Spearmanはイベントが起こったタイムスタンプでのみゲームのスナップショットを考慮する。

つまり、ある選手がボックス内のストライカーへのスクエアパスをミスしたとしても、ストライカーのポジショニングが報われることになる

しかし、サッカーは意思決定が連続するゲームであり、選手はボールをコントロールしている限り、ピッチ上の別の場所にボールを移動させることを選択することができる

攻撃側の選手がボールを支配しているタイムスタンプごとにOBSOを計算することで、集団的な空間創出と選手の意思決定の両面から、攻撃機会についてより深く理解することができる。
この研究では、プレーヤーがオンボールタッチをしたタイムスタンプと、ボールが誰にもコントロールされていない（つまり、ボールがプレーヤーから別のプレーヤーに渡されている）タイムスタンプを手動でタグ付けしています。

すべてのオンボール・タッチについて OBSO を計算した後、それらの値の時間的な積分を行うことが出来る。

以下の式は、時間経過に伴う積分を説明するもので、原著と同じ方法で行われますが、より多くのデータポイントに渡って行われます。以下の式は、時間積分の方法を説明するものである。

Nは0.05sのタイムステップの数、tはt番目のタイムステップを示す変数
得られた OBSO の合計値は、各タイムステップの OBSO 値の累積和となる。
より多くの値で積分を行うことで、OBSO メトリクスは予測性を失い、いくつかの攻撃機会で 1 より大きな値が得られるため、プレーがゴールに至る確率を表すものではなくなります。
しかし、積分値が高いプレーは、良いトランジションオプションがより多くの時間提供されたことを示すので、攻撃の質の強い指標であることに変わりはない。

4. RESULTS

このセクションでは、データセットから使用された各ゴールの OBSO Time-seriesを提示する。
また、OBSOの時系列とその統合から得られる簡単なメトリクスを用いて、これらの攻撃機会を評価
3つの異なるメトリックに焦点を当てる。

1) max ([OBSO(1), OBSO(2), ..., OBSO(N)]),

Nは0.05sのタイムステップ

2) OBSO（攻撃時間を通して時間積分したもの）
3) OBSO/n

OBSO は式 9 を用いて計算され，n は攻撃チームがボールをコントロールしていたタイムステップの数で，ボールがパスやシュートの軌道に入っていない全時間である．

最初の指標は、関数OBSO(t)の最大値を与える。したがって、それぞれのゴールにおける最大値を比較することで、得点のチャンスが最も高かったときに、あるプレーが他のプレーに比べてどれだけ優れていたかを分析することができる。

2つ目の指標は、3.3で説明したように、時間積分したOBSO(t)関数を与えるものである。これはまた，プレーの最大 OBSO 値が高くなくても，プレーヤーがボールを持っている時間が長ければ，攻撃チャンスが少し悪くなるため，良い比較指標となる．

最後に、3つ目の指標は、各ゴールについて、攻撃側のプレーヤーがボールを支配していた時間のOBSO値の平均値を示す。これは、攻撃プレーの場合、ボールが選手の足元に留まっている時間が短い（つまり、ワンタッチパスが行われている）ため、大きな積分値を持たないかもしれませんが、その瞬間は得点の確率が高いので、評価に貢献することができます。
表 2 は、すべての結果を第 2 の提案指標で並べたものである。図4、図5、図6に各ゴールのOBSOの時系列を表示した。

5. PRACTICAL APPLICATIONS

攻撃機会をOBSOの時系列で見ることで、トラッキングデータを通してどのようにチャンスが生まれるかについて、より深い洞察が可能となる。
コントロールモデルとトランジションモデルが、近い将来のゲームの状態を予測しようとする将来の研究のベースとなるべきであると考えています。