これまで、ボートレースのデータを使いながら、コース別の成績やスタートタイミングなどをもとに分析を進めてきました。
条件を変えながら結果を比較する中で、少しずつ分析の形が整ってきています。
前回は、分析を続けていく中でコードが少しずつツールの形になってきたところまでを書きました。
(→ 分析していたらツール化してきた話)
ただ、こうした分析を進める中で、最初からなんとなく感じていたことがありました。
最初から感じていた違和感
コースやスタートの条件を見ていく中で、「これだけでは足りない気がする」という感覚がありました。
例えば、同じような条件でも、選手によって結果が大きく変わることがあります。
条件としては同じなのに、成績が安定している選手とそうでない選手がいる。
この違いは、単純なコース補正では説明しきれません。
もともとボートレースの予想をするときも、コースや展開だけでなく、「その選手がどういうタイプか」を自然と見ていました。
スタートが安定しているのか
コース取りが得意なのか
展開を突けるタイプなのか
そういった要素を、感覚的に判断していた状態です。
そのため、分析を始めた段階から、「選手ごとのデータを持った方がいいのではないか」という考えは、なんとなく頭の中にありました。
選手別データを持つことにした
最初はコースや条件ごとの分析を進めていましたが、その裏でずっと「選手単位で見たい」という感覚がありました。
コースの条件を整えても、最終的に結果を左右しているのは選手の能力や特徴です。
そのため、条件を細かく調整していくよりも、選手ごとの傾向をしっかり持った方が、結果として安定した判断につながるのではないかと考えました。
そこで、コース別の結果を見るだけでなく、選手ごとの成績をまとめて扱えるようにすることにしました。
ここで初めて、「データベースのような形で管理する」という方向に進むことになります。
CSVからデータベースを作り始めた
実際のデータはCSVで管理していたため、まずはこのデータをもとに、選手ごとの成績をまとめる処理を作りました。
・選手ごとの出走回数
・コース別の1着率
・連対率
・3連対率
といった形で、必要なデータを選手単位で整理していきます。
これまでは1レースごとにデータを見ていましたが、こうしてまとめることで、「この選手はこういう傾向がある」という形で見えるようになってきました。
詳しい処理の作り方については、次の記事で整理しようと思いますが、この段階で分析の見え方が大きく変わった感覚がありました。
分析から一段階進んだ感覚
これまでは、条件を変えながらその都度結果を確認する、いわば「その場の分析」が中心でした。
しかし、選手別のデータを持つことで、いつでも同じ基準で比較できるようになります。
例えば、別のレースを見たときでも、
この選手はこのコースで強い
この選手はスタートにばらつきがある
といった情報をすぐに使えるようになりました。
その場で考える分析から、蓄積したデータを使う分析へと変わってきた感覚です。
まだ試し始めた段階ではありますが、分析の中心が少しずつ変わってきたことを実感しています。
このあと、選手別データを使ってスコアを作る仕組みを作っていきます。
分析からデータベースへと進んだ流れが、さらにロジックとして形になっていきました。
