競馬AI予測

大穴依存のリスク|524頭のデータが示す厳しい現実

プロローグ:第8週の衝撃

2026年4月20日。

第8週の結果を集計し終えた時、画面を見つめたまま動けませんでした。

週次回収率: 41.7%

そして、累計を確認すると…

累計回収率: 95.3%

第7週まで103.0%だった累計が、一気に目標未達に転落しました。

何が起きたのか?

なぜこんなことになったのか?

この記事では、8週間524頭のデータを詳細に分析し、
競馬AIが抱える「大穴依存のリスク」について考察します。


📊 8週間の全データ

週次成績の推移

ベット数投資額払戻額収支回収率
#185頭8,500円5,710円-2,790円67.2%
#236頭3,600円3,160円-440円87.8%
#378頭7,800円8,590円+790円110.1%
#469頭6,900円5,180円-1,720円75.1%
#572頭7,000円5,840円-1,260円83.4%
#638頭3,800円11,860円+8,060円312.1% 🎉
#780頭8,000円6,840円-1,160円85.5%
#866頭6,600円2,750円-3,850円41.7%
累計524頭52,400円49,930円-2,470円95.3%

累計回収率の推移

ベット数 | 累計回収率
---------|------------
    85頭 | 67.2%  ▂▂▂
   121頭 | 73.3%  ▃▃▃
   199頭 | 87.7%  ▅▅▅▅▅
   268頭 | 84.5%  ▅▅▅▅
   340頭 | 83.8%  ▅▅▅▅
   378頭 | 106.7% ▇▇▇▇▇▇▇ ← 第6週後
   458頭 | 103.0% ▇▇▇▇▇▇ ← 第7週後
   524頭 | 95.3%  ▅▅▅▅▅▅ ← 第8週後 ⚠️

第6週で一気に上昇し、
第8週で急落しました。


🎯 第6週を除くと...

衝撃的な事実

第6週(98.4倍的中の週)を除いて計算してみました。

項目
対象期間7週間(第6週除く)
ベット数486頭
投資額48,600円
払戻額37,390円
収支-11,210円
回収率76.9%

第6週がなければ、回収率76.9%

これが意味すること

第6週あり: 95.3% 第6週なし: 76.9%

差: 18.4ポイント

つまり、

  • 第6週の98.4倍的中に助けられていた
  • 通常は70-80%台
  • 目標103%には程遠い

これが、「大穴依存」の問題です。


💡 大穴依存のリスク

問題の本質

回収率のブレが激しすぎる:

最高配当回収率
#117.6倍67.2%
#224.5倍87.8%
#327.8倍110.1%
#420.3倍75.1%
#524.5倍83.4%
#698.4倍312.1%
#718.9倍85.5%
#811.2倍41.7%

傾向:

30倍以上: 312.1%
20-30倍: 83-110%
20倍未満: 41-87%

→ 大穴の有無で200%以上の差

大穴の出現頻度

8週間の配当分布:

配当範囲件数割合
1-5倍26頭53.1%
5-10倍11頭22.4%
10-20倍11頭22.4%
20-30倍0頭0%
30倍以上1頭2.0%

30倍以上が、524頭で1回だけ

テストデータとの比較

項目テスト(2024年)実戦(8週間)
データ数約12,000頭524頭
30倍以上の出現約30頭1頭
出現頻度400頭に1回524頭に1回

確率的には、ほぼ想定通り

でも、これでは目標達成できません。

安定性の問題

週次回収率の統計:

指標
平均118.9%
中央値85.5%
標準偏差約85%
最高312.1%
最低41.7%
レンジ270.4ポイント

標準偏差85%は異常値

通常の投資では、標準偏差は10-20%程度。

85%は、極めて不安定です。


📈 配当の詳細分析

週次の配当推移

的中数平均配当最高配当
#112頭476円1,760円
#22頭1,580円2,450円
#36頭1,432円2,780円
#46頭863円2,030円
#56頭973円2,450円
#63頭3,953円9,840円
#79頭760円1,890円
#85頭550円1,120円
累計49頭1,019円9,840円

気づき

1. 低配当が増えている:

第1-5週: 平均1,065円
第7-8週: 平均655円

→ 最近は低配当化

2. 第6週だけ異常:

第6週: 平均3,953円
他7週: 平均850円

→ 4.6倍の差

3. 的中率は安定:

累計的中率: 9.4%
想定: 8%

→ 的中率に問題なし
→ 配当が問題

🔍 テストと実戦の差

詳細比較

項目テスト実戦
回収率103.5%95.3%-8.2%
的中率約8%9.4%+1.4%
平均配当約13倍10.2倍-2.8倍
データ数12,000頭524頭-

原因の仮説

仮説1: サンプル数の差

テスト: 12,000頭(十分)
実戦: 524頭(不十分)

→ まだブレの範囲内?
→ 1,000頭まで続ければ103%に近づく?

仮説2: 過学習の可能性

テスト: 2024年のデータで学習
実戦: 2026年のデータで運用

→ 2年間でデータ分布が変化?
→ モデルが古い?

仮説3: 実力が95%程度

テスト: たまたま103.5%だった
実戦: 真の実力は95%程度

→ これが現実?

仮説4: 大穴の出現率が低い

テスト: 400頭に1回
実戦: 524頭に1回(まだ1回のみ)

→ 確率のブレ?
→ もう少し続ければ出現率が上がる?

💭 安定性をどう確保するか

問題点の整理

現状の問題:

  1. 大穴(30倍以上)がないと目標未達
  2. 大穴は稀(524頭で1回)
  3. 標準偏差85%(不安定)
  4. 週次で±200%ブレる

解決策の方向性

方向性1: 大穴の的中率を上げる

課題: 大穴の予測精度向上
方法: 特徴量追加(騎手、調教師、過去走)
効果: 不明(要検証)
リスク: 過学習の可能性

方向性2: 中穴(10-20倍)を増やす

課題: 中穴の的中数を増やす
方法: 期待値閾値の調整
効果: 的中数増加、配当やや低下
リスク: 回収率が下がる可能性

方向性3: 低配当を減らす

課題: 1-5倍の的中を減らす
方法: 期待値閾値を上げる(5% → 7%)
効果: 推奨馬を厳選、精度向上
リスク: ベット数減少

方向性4: このまま様子見

課題: サンプル数不足かも
方法: 1,000頭まで続ける
効果: 真の実力が分かる
リスク: さらに損失が拡大

📊 統計的考察

大数の法則から考える

理論:

サンプル数が増えると、
実測値は真の値に近づく

現状:

データ数回収率
85頭67.2%
199頭87.7%
378頭106.7%
524頭95.3%

まだ収束していない

信頼区間の計算

95%信頼区間:

現在の回収率: 95.3%
標準誤差: 約3.7%
95%信頼区間: 88.1% - 102.5%

→ 真の回収率は88-102%の範囲
→ 103%は信頼区間の外

統計的には、目標未達の可能性が高い

必要なサンプル数

計算:

目標精度: ±3%
信頼度: 95%
想定的中率: 9.4%

必要サンプル数: 約400的中
→ 約4,250頭

現在: 524頭(49的中)

→ まだ12%程度
→ 8倍のデータが必要

4,000頭以上必要という厳しい現実


🎯 改善の方向性

次週の結果次第で判断

パターンA: 次週100%以上

判断: 第8週は一時的なブレ
方針: このまま継続
目標: 1,000頭まで様子見
改善: 不要

パターンB: 次週80-100%

判断: 実力95%前後の可能性
方針: 改善を検討
改善: 期待値閾値の調整から開始
効果測定: A/Bテスト

パターンC: 次週80%未満

判断: システムに問題あり
方針: 本格的な見直し
改善: 特徴量追加、モデル再構築
再テスト: 必須

改善の優先順位

もし改善するなら、この順番で:

1. 期待値閾値の調整

現在: 5%以上
変更: 7%や10%に引き上げ
効果: 推奨馬を厳選
リスク: ベット数減少
実装難易度: 低

2. 騎手データ追加

追加データ: 騎手の勝率、得意コース
期待効果: 的中率向上
リスク: 過学習
実装難易度: 中

3. 調教師データ追加

追加データ: 調教師の実績
期待効果: 期待値計算の精度向上
リスク: データ取得が面倒
実装難易度: 中

4. 過去走データ追加

追加データ: 前走、前々走の成績
期待効果: 予測精度向上
リスク: 大幅な改変、効果不明
実装難易度: 高

📝 まとめ

8週間で分かったこと

事実:

  • ✅ 累計回収率95.3%(目標未達)
  • ✅ 第6週を除くと76.9%
  • ✅ 大穴依存(524頭で1回)
  • ✅ 標準偏差85%(不安定)
  • ✅ 的中率9.4%(想定通り)
  • ✅ 配当10.2倍(想定13倍より低い)

問題点:

  1. 大穴がないと目標未達
  2. 大穴は稀(400頭に1回程度)
  3. 週次で±200%ブレる
  4. 安定性がない

原因の仮説:

  • サンプル数不足(524頭では不十分)
  • 過学習の可能性(2024→2026の変化)
  • 実力が95%程度(テストは偶然)
  • 大穴の出現率が低い(確率のブレ)

次のステップ

短期(次週):

✅ 第9週のデータ収集
✅ 結果で判断(100%以上? 80-100%? 80%未満?)
✅ 方針決定(継続 or 改善 or 見直し)

中期(〜1,000頭):

✅ データ蓄積を継続
✅ 統計的な分析
✅ 改善の検討・実施
✅ A/Bテストで効果測定

長期(1,000頭〜):

✅ 真の実力の把握
✅ 本格運用の可否判断
✅ システムの最適化

結論

大穴依存のリスクは深刻です

524頭のデータが示す厳しい現実:

  • 第6週の98.4倍的中に助けられていた
  • 通常は70-80%台
  • 大穴がないと目標未達
  • 安定性がない

でも、諦めません。

✅ 次週の結果で判断
✅ データを信じる
✅ 感情を排除
✅ 科学的に分析
✅ 冷静に改善

これが、データサイエンティストの仕事です。


🔜 次回予告

次回は、第9週の結果を報告します。

正念場です。


📊 関連記事


最後まで読んでいただき、ありがとうございました!

「大穴依存のリスク、よく分かった」
「統計的な分析、勉強になる」
「次週に期待」

コメントお待ちしています 💬

-競馬AI予測