分析していたら選手別データベースを作ることになった話｜スマホ×AIで進めるPython独学

これまで、ボートレースのデータを使いながら、コース別の成績やスタートタイミングなどをもとに分析を進めてきました。

条件を変えながら結果を比較する中で、少しずつ分析の形が整ってきています。

前回は、分析を続けていく中でコードが少しずつツールの形になってきたところまでを書きました。

ただ、こうした分析を進める中で、最初からなんとなく感じていたことがありました。

最初から感じていた違和感

コースやスタートの条件を見ていく中で、「これだけでは足りない気がする」という感覚がありました。

例えば、同じような条件でも、選手によって結果が大きく変わることがあります。

条件としては同じなのに、成績が安定している選手とそうでない選手がいる。

この違いは、単純なコース補正では説明しきれません。

もともとボートレースの予想をするときも、コースや展開だけでなく、「その選手がどういうタイプか」を自然と見ていました。

スタートが安定しているのか

コース取りが得意なのか

展開を突けるタイプなのか

そういった要素を、感覚的に判断していた状態です。

そのため、分析を始めた段階から、「選手ごとのデータを持った方がいいのではないか」という考えは、なんとなく頭の中にありました。

最初はコースや条件ごとの分析を進めていましたが、その裏でずっと「選手単位で見たい」という感覚がありました。

コースの条件を整えても、最終的に結果を左右しているのは選手の能力や特徴です。

そのため、条件を細かく調整していくよりも、選手ごとの傾向をしっかり持った方が、結果として安定した判断につながるのではないかと考えました。

そこで、コース別の結果を見るだけでなく、選手ごとの成績をまとめて扱えるようにすることにしました。

ここで初めて、「データベースのような形で管理する」という方向に進むことになります。

実際のデータはCSVで管理していたため、まずはこのデータをもとに、選手ごとの成績をまとめる処理を作りました。

・選手ごとの出走回数

・コース別の1着率

・連対率

・3連対率

といった形で、必要なデータを選手単位で整理していきます。

これまでは1レースごとにデータを見ていましたが、こうしてまとめることで、「この選手はこういう傾向がある」という形で見えるようになってきました。

詳しい処理の作り方については、次の記事で整理しようと思いますが、この段階で分析の見え方が大きく変わった感覚がありました。

これまでは、条件を変えながらその都度結果を確認する、いわば「その場の分析」が中心でした。

しかし、選手別のデータを持つことで、いつでも同じ基準で比較できるようになります。

例えば、別のレースを見たときでも、

この選手はこのコースで強い

この選手はスタートにばらつきがある

といった情報をすぐに使えるようになりました。

その場で考える分析から、蓄積したデータを使う分析へと変わってきた感覚です。

まだ試し始めた段階ではありますが、分析の中心が少しずつ変わってきたことを実感しています。

このあと、選手別データを使ってスコアを作る仕組みを作っていきます。

分析からデータベースへと進んだ流れが、さらにロジックとして形になっていきました。