これまで、選手別のデータをまとめて扱うために、データベースのような形で情報を整理してきました。
コース別の成績や出走回数などを選手単位で持つことで、分析の見え方が大きく変わってきています。
前回は、分析を進める中で選手別のデータベースを作るようになったところまでを書きました。
(→ 分析していたら選手別データベースを作ることになった話)
ただ、データを持つようになって次に感じたのは、「このままでは使いづらい」ということでした。
データがあってもそのままでは判断しづらい
選手ごとの成績をまとめることで、それぞれの特徴は見えるようになってきました。
例えば、
・この選手は1着率が高い
・この選手は連対率は高いが勝ち切れない
・この選手は安定して3着以内に入る
といった違いは分かります。
ただ、実際にレースを予想するときには、これらの情報を一つひとつ見ながら判断する必要があります。
複数の選手を同時に比較しようとすると、どの要素をどれくらい重視するのかが分かりづらく、判断がぶれてしまう感覚がありました。
数値としてまとめる必要が出てきた
こうした状態を改善するために、「一つの基準で比較できる形にしたい」と考えるようになりました。
それぞれのデータを個別に見るのではなく、まとめて評価できる形にする必要があります。
そこで考えたのが、「スコア」という形にすることでした。
複数の要素を組み合わせて一つの数値にすることで、選手同士を並べて比較できるようになります。
スコアを作ってみた
実際には、選手別データベースにある数値を使って、シンプルな計算式を作りました。
score =
1着率 × 2 + 連対率 + 3連対率 × 0.5
という形です。
それぞれの要素に重みをつけることで、自分の中で重要だと思っているポイントが反映されるようにしています。
もちろん完璧なものではありませんが、まずは感覚的に判断していた内容を、そのまま数値として表現することを優先しました。
データとロジックがつながった
このスコアを使うことで、選手別に持っていたデータが、そのまま評価として使えるようになりました。
これまではデータを見て判断していた状態でしたが、スコアを作ったことで、「自動で評価される」形に変わってきました。
過去のデータ
↓
スコア計算
↓
比較
という流れが自然にできるようになり、分析から一歩進んだ感覚があります。
分析からロジックへ
これまでは、データを見ながらその場で判断する「分析」が中心でした。
しかし、スコアを作ったことで、判断基準がコードとして固定されるようになりました。
どの要素をどれくらい重視するのかを、あらかじめ決めておくことで、同じ基準で比較ができるようになります。
感覚で行っていた判断が、少しずつロジックとして整理されてきた感覚です。
まだ調整途中ではありますが、分析の結果をそのまま使うのではなく、ロジックとして再現できるようになってきました。
このあと、作ったスコアを使って実際に順位を並べる処理を作っていきます。
データとロジックがつながったことで、予想の形が少しずつ見えてきました。
