作った競馬予想AIの解説

2024/10/26

2025/01/30

使用するデータ

使用しているのは

の3つです。

これは文字通り開催されるレースの詳細データで、項目としては

のレースそのものの情報と

の馬ごとの情報の2種類からなっています。

データ長をそろえるために最新10回分の成績を使用しています。

項目はレースデータと同じです。

こちらでは出走したすべてのレースを

ごとに分類したうえで、1着、2着、３着、4着以下の回数を集計しています。

それぞれのデータはそのままだと項目数が多すぎるので適宜圧縮を行ってます。

モデルについてはニューラルネットワークを採用しています。

隠れ層は128ニューロン×2で3着以内に入る確率を1～18の各馬番に対して出力するようにしています。

活性化関数は出力層にシグモイド関数、その他の層はミッシュ関数を使用しています。

作成したモデル

レースのない日は必要な情報の収集と、収集したデータを予想に使用できる形式に整形する処理を行っています。情報の収集は12,20時に行い、整形の処理は深夜の時間帯に行っています。

レースのある日は直近3レースに対して馬体重などの当日に公開される情報の収集を行い、取得出来しだい予想をしています。それぞれの馬に対して3着以内に入る確率を予測し、上位5頭に対して確率が高い馬から順に印を打っています。

実装はしているものの精度は正直良くないので、改良はしていきたいと思っています。

今思いついているのは

ぐらいですが、何か思いつけば試したりしようと思います。

また、スクレイピングが重いのかエラーで当日の情報が取れず予測がされていないレースを割と見かけるので、そこも修正しようするつもりです。

ローカルでは再現できていないのでサーバースペック起因の可能性もありますが、ひとまず処理を軽くできそうな箇所があれば軽くしていこうと思います。