プロローグ:第8週の衝撃
2026年4月20日。
第8週の結果を集計し終えた時、画面を見つめたまま動けませんでした。
週次回収率: 41.7%
そして、累計を確認すると…
累計回収率: 95.3%
第7週まで103.0%だった累計が、一気に目標未達に転落しました。
何が起きたのか?
なぜこんなことになったのか?
この記事では、8週間524頭のデータを詳細に分析し、
競馬AIが抱える「大穴依存のリスク」について考察します。
📊 8週間の全データ
週次成績の推移
| 週 | ベット数 | 投資額 | 払戻額 | 収支 | 回収率 |
|---|---|---|---|---|---|
| #1 | 85頭 | 8,500円 | 5,710円 | -2,790円 | 67.2% |
| #2 | 36頭 | 3,600円 | 3,160円 | -440円 | 87.8% |
| #3 | 78頭 | 7,800円 | 8,590円 | +790円 | 110.1% |
| #4 | 69頭 | 6,900円 | 5,180円 | -1,720円 | 75.1% |
| #5 | 72頭 | 7,000円 | 5,840円 | -1,260円 | 83.4% |
| #6 | 38頭 | 3,800円 | 11,860円 | +8,060円 | 312.1% 🎉 |
| #7 | 80頭 | 8,000円 | 6,840円 | -1,160円 | 85.5% |
| #8 | 66頭 | 6,600円 | 2,750円 | -3,850円 | 41.7% ❌ |
| 累計 | 524頭 | 52,400円 | 49,930円 | -2,470円 | 95.3% |
累計回収率の推移
ベット数 | 累計回収率
---------|------------
85頭 | 67.2% ▂▂▂
121頭 | 73.3% ▃▃▃
199頭 | 87.7% ▅▅▅▅▅
268頭 | 84.5% ▅▅▅▅
340頭 | 83.8% ▅▅▅▅
378頭 | 106.7% ▇▇▇▇▇▇▇ ← 第6週後
458頭 | 103.0% ▇▇▇▇▇▇ ← 第7週後
524頭 | 95.3% ▅▅▅▅▅▅ ← 第8週後 ⚠️
第6週で一気に上昇し、
第8週で急落しました。
🎯 第6週を除くと...
衝撃的な事実
第6週(98.4倍的中の週)を除いて計算してみました。
| 項目 | 値 |
|---|---|
| 対象期間 | 7週間(第6週除く) |
| ベット数 | 486頭 |
| 投資額 | 48,600円 |
| 払戻額 | 37,390円 |
| 収支 | -11,210円 |
| 回収率 | 76.9% |
第6週がなければ、回収率76.9%
これが意味すること
第6週あり: 95.3% 第6週なし: 76.9%
差: 18.4ポイント
つまり、
- 第6週の98.4倍的中に助けられていた
- 通常は70-80%台
- 目標103%には程遠い
これが、「大穴依存」の問題です。
💡 大穴依存のリスク
問題の本質
回収率のブレが激しすぎる:
| 週 | 最高配当 | 回収率 |
|---|---|---|
| #1 | 17.6倍 | 67.2% |
| #2 | 24.5倍 | 87.8% |
| #3 | 27.8倍 | 110.1% |
| #4 | 20.3倍 | 75.1% |
| #5 | 24.5倍 | 83.4% |
| #6 | 98.4倍 | 312.1% |
| #7 | 18.9倍 | 85.5% |
| #8 | 11.2倍 | 41.7% |
傾向:
30倍以上: 312.1% 20-30倍: 83-110% 20倍未満: 41-87% → 大穴の有無で200%以上の差
大穴の出現頻度
8週間の配当分布:
| 配当範囲 | 件数 | 割合 |
|---|---|---|
| 1-5倍 | 26頭 | 53.1% |
| 5-10倍 | 11頭 | 22.4% |
| 10-20倍 | 11頭 | 22.4% |
| 20-30倍 | 0頭 | 0% |
| 30倍以上 | 1頭 | 2.0% |
30倍以上が、524頭で1回だけ
テストデータとの比較
| 項目 | テスト(2024年) | 実戦(8週間) |
|---|---|---|
| データ数 | 約12,000頭 | 524頭 |
| 30倍以上の出現 | 約30頭 | 1頭 |
| 出現頻度 | 400頭に1回 | 524頭に1回 |
確率的には、ほぼ想定通り
でも、これでは目標達成できません。
安定性の問題
週次回収率の統計:
| 指標 | 値 |
|---|---|
| 平均 | 118.9% |
| 中央値 | 85.5% |
| 標準偏差 | 約85% |
| 最高 | 312.1% |
| 最低 | 41.7% |
| レンジ | 270.4ポイント |
標準偏差85%は異常値
通常の投資では、標準偏差は10-20%程度。
85%は、極めて不安定です。
📈 配当の詳細分析
週次の配当推移
| 週 | 的中数 | 平均配当 | 最高配当 |
|---|---|---|---|
| #1 | 12頭 | 476円 | 1,760円 |
| #2 | 2頭 | 1,580円 | 2,450円 |
| #3 | 6頭 | 1,432円 | 2,780円 |
| #4 | 6頭 | 863円 | 2,030円 |
| #5 | 6頭 | 973円 | 2,450円 |
| #6 | 3頭 | 3,953円 | 9,840円 |
| #7 | 9頭 | 760円 | 1,890円 |
| #8 | 5頭 | 550円 | 1,120円 |
| 累計 | 49頭 | 1,019円 | 9,840円 |
気づき
1. 低配当が増えている:
第1-5週: 平均1,065円 第7-8週: 平均655円 → 最近は低配当化
2. 第6週だけ異常:
第6週: 平均3,953円 他7週: 平均850円 → 4.6倍の差
3. 的中率は安定:
累計的中率: 9.4% 想定: 8% → 的中率に問題なし → 配当が問題
🔍 テストと実戦の差
詳細比較
| 項目 | テスト | 実戦 | 差 |
|---|---|---|---|
| 回収率 | 103.5% | 95.3% | -8.2% |
| 的中率 | 約8% | 9.4% | +1.4% |
| 平均配当 | 約13倍 | 10.2倍 | -2.8倍 |
| データ数 | 12,000頭 | 524頭 | - |
原因の仮説
仮説1: サンプル数の差
テスト: 12,000頭(十分) 実戦: 524頭(不十分) → まだブレの範囲内? → 1,000頭まで続ければ103%に近づく?
仮説2: 過学習の可能性
テスト: 2024年のデータで学習 実戦: 2026年のデータで運用 → 2年間でデータ分布が変化? → モデルが古い?
仮説3: 実力が95%程度
テスト: たまたま103.5%だった 実戦: 真の実力は95%程度 → これが現実?
仮説4: 大穴の出現率が低い
テスト: 400頭に1回 実戦: 524頭に1回(まだ1回のみ) → 確率のブレ? → もう少し続ければ出現率が上がる?
💭 安定性をどう確保するか
問題点の整理
現状の問題:
- 大穴(30倍以上)がないと目標未達
- 大穴は稀(524頭で1回)
- 標準偏差85%(不安定)
- 週次で±200%ブレる
解決策の方向性
方向性1: 大穴の的中率を上げる
課題: 大穴の予測精度向上 方法: 特徴量追加(騎手、調教師、過去走) 効果: 不明(要検証) リスク: 過学習の可能性
方向性2: 中穴(10-20倍)を増やす
課題: 中穴の的中数を増やす 方法: 期待値閾値の調整 効果: 的中数増加、配当やや低下 リスク: 回収率が下がる可能性
方向性3: 低配当を減らす
課題: 1-5倍の的中を減らす 方法: 期待値閾値を上げる(5% → 7%) 効果: 推奨馬を厳選、精度向上 リスク: ベット数減少
方向性4: このまま様子見
課題: サンプル数不足かも 方法: 1,000頭まで続ける 効果: 真の実力が分かる リスク: さらに損失が拡大
📊 統計的考察
大数の法則から考える
理論:
サンプル数が増えると、 実測値は真の値に近づく
現状:
| データ数 | 回収率 |
|---|---|
| 85頭 | 67.2% |
| 199頭 | 87.7% |
| 378頭 | 106.7% |
| 524頭 | 95.3% |
まだ収束していない
信頼区間の計算
95%信頼区間:
現在の回収率: 95.3% 標準誤差: 約3.7% 95%信頼区間: 88.1% - 102.5% → 真の回収率は88-102%の範囲 → 103%は信頼区間の外
統計的には、目標未達の可能性が高い
必要なサンプル数
計算:
目標精度: ±3% 信頼度: 95% 想定的中率: 9.4% 必要サンプル数: 約400的中 → 約4,250頭 現在: 524頭(49的中) → まだ12%程度 → 8倍のデータが必要
4,000頭以上必要という厳しい現実
🎯 改善の方向性
次週の結果次第で判断
パターンA: 次週100%以上
判断: 第8週は一時的なブレ 方針: このまま継続 目標: 1,000頭まで様子見 改善: 不要
パターンB: 次週80-100%
判断: 実力95%前後の可能性 方針: 改善を検討 改善: 期待値閾値の調整から開始 効果測定: A/Bテスト
パターンC: 次週80%未満
判断: システムに問題あり 方針: 本格的な見直し 改善: 特徴量追加、モデル再構築 再テスト: 必須
改善の優先順位
もし改善するなら、この順番で:
1. 期待値閾値の調整
現在: 5%以上 変更: 7%や10%に引き上げ 効果: 推奨馬を厳選 リスク: ベット数減少 実装難易度: 低
2. 騎手データ追加
追加データ: 騎手の勝率、得意コース 期待効果: 的中率向上 リスク: 過学習 実装難易度: 中
3. 調教師データ追加
追加データ: 調教師の実績 期待効果: 期待値計算の精度向上 リスク: データ取得が面倒 実装難易度: 中
4. 過去走データ追加
追加データ: 前走、前々走の成績 期待効果: 予測精度向上 リスク: 大幅な改変、効果不明 実装難易度: 高
📝 まとめ
8週間で分かったこと
事実:
- ✅ 累計回収率95.3%(目標未達)
- ✅ 第6週を除くと76.9%
- ✅ 大穴依存(524頭で1回)
- ✅ 標準偏差85%(不安定)
- ✅ 的中率9.4%(想定通り)
- ✅ 配当10.2倍(想定13倍より低い)
問題点:
- 大穴がないと目標未達
- 大穴は稀(400頭に1回程度)
- 週次で±200%ブレる
- 安定性がない
原因の仮説:
- サンプル数不足(524頭では不十分)
- 過学習の可能性(2024→2026の変化)
- 実力が95%程度(テストは偶然)
- 大穴の出現率が低い(確率のブレ)
次のステップ
短期(次週):
✅ 第9週のデータ収集 ✅ 結果で判断(100%以上? 80-100%? 80%未満?) ✅ 方針決定(継続 or 改善 or 見直し)
中期(〜1,000頭):
✅ データ蓄積を継続 ✅ 統計的な分析 ✅ 改善の検討・実施 ✅ A/Bテストで効果測定
長期(1,000頭〜):
✅ 真の実力の把握 ✅ 本格運用の可否判断 ✅ システムの最適化
結論
大穴依存のリスクは深刻です
524頭のデータが示す厳しい現実:
- 第6週の98.4倍的中に助けられていた
- 通常は70-80%台
- 大穴がないと目標未達
- 安定性がない
でも、諦めません。
✅ 次週の結果で判断
✅ データを信じる
✅ 感情を排除
✅ 科学的に分析
✅ 冷静に改善
これが、データサイエンティストの仕事です。
🔜 次回予告
次回は、第9週の結果を報告します。
正念場です。
📊 関連記事
最後まで読んでいただき、ありがとうございました!
「大穴依存のリスク、よく分かった」
「統計的な分析、勉強になる」
「次週に期待」
コメントお待ちしています 💬