前回は、作成したスコアとランキングが実際にどれくらい機能するのかを、バックテストで確認しました。
その結果、ある程度の再現性はあるものの、レースによって結果にばらつきがあることが分かりました。
もう少し精度を上げたい
そう考えたときに、「何が結果に影響しているのか」を分解して見ていく必要があると感じました。
その中で最初に気になったのが、
スタート(ST)です
スタート(ST)とは
競艇におけるスタート(ST)は、スタートラインを通過するタイミングを数値で表したものです。
単純に考えると、
スタートが速いほど有利になりそう
というイメージがあります。
ただ、実際にどの程度影響しているのかは、この時点ではよく分かっていませんでした。
実際にデータで見てみる
まずはシンプルに、
勝った選手のスタート順位
を確認してみました。
すると、ある傾向が見えてきました。
・スタートが速い選手が勝っているケースが多い
・特に外側のコースでその傾向が強い
ここまでは、なんとなく想像通りの結果です。
ただ、もう少し細かく見ていくと、少し違う景色が見えてきました。
コースごとに分けてみる
スタートの影響をコースごとに分けて見てみると、明確な違いがありました。
外側のコース(2・3・4コース)
スタートの影響が大きい
・スタートが速いほど勝ちやすい
・スタート順位がそのまま結果に繋がるケースが多い
特に、捲りに近い展開では、この傾向が強く出ていました。
イン(1コース)
スタートだけでは崩れない
・多少スタートが遅くても残るケースがある
・単純に「スタートが速い=勝ち」とはならない
ここは、直感とは少し違う結果でした。
見えてきた違い
この結果から分かったのは、
コースごとに勝ち方の構造が違う
ということでした。
・外側はスタートの影響を受けやすい
・内側は別の要因も関係している
つまり、
同じロジックでは説明できない可能性がある
ということです。
気づいたこと
今回の分析で一番大きかったのは、
「速い」だけでは足りない
という点でした。
単純にスタート順位を見るだけではなく、
「誰より速いのか」
という視点が必要になってきます。
ここで初めて、「比較」という考え方が必要だと感じました。
まだ単純ではない
スタートは確かに重要な要素でしたが、それだけで結果が決まるわけではありません。
・コースによって影響の仕方が違う
・他の選手との関係も影響している
思っていたよりも単純ではない
という印象です。
次にやること
スタートの影響を見ていく中で、
「単体」ではなく「関係」で考える必要がある
と感じるようになりました。
特に気になったのが、
・2コースと1コースの関係
・3コースと他コースの関係
といった、コース同士の影響です。
次回は、コースごとの条件を整理しながら、もう少し具体的にロジックを組み立てていきます。
