大穴依存のリスク｜524頭のデータが示す厳しい現実

プロローグ：第8週の衝撃

2026年4月20日。

第8週の結果を集計し終えた時、画面を見つめたまま動けませんでした。

週次回収率: 41.7%

そして、累計を確認すると…

累計回収率: 95.3%

第7週まで103.0%だった累計が、一気に目標未達に転落しました。

何が起きたのか？

なぜこんなことになったのか？

この記事では、8週間524頭のデータを詳細に分析し、
競馬AIが抱える「大穴依存のリスク」について考察します。

📊 8週間の全データ

週次成績の推移

週	ベット数	投資額	払戻額	収支	回収率
#1	85頭	8,500円	5,710円	-2,790円	67.2%
#2	36頭	3,600円	3,160円	-440円	87.8%
#3	78頭	7,800円	8,590円	+790円	110.1%
#4	69頭	6,900円	5,180円	-1,720円	75.1%
#5	72頭	7,000円	5,840円	-1,260円	83.4%
#6	38頭	3,800円	11,860円	+8,060円	312.1% 🎉
#7	80頭	8,000円	6,840円	-1,160円	85.5%
#8	66頭	6,600円	2,750円	-3,850円	41.7% ❌
累計	524頭	52,400円	49,930円	-2,470円	95.3%

累計回収率の推移

ベット数 | 累計回収率
---------|------------
    85頭 | 67.2%  ▂▂▂
   121頭 | 73.3%  ▃▃▃
   199頭 | 87.7%  ▅▅▅▅▅
   268頭 | 84.5%  ▅▅▅▅
   340頭 | 83.8%  ▅▅▅▅
   378頭 | 106.7% ▇▇▇▇▇▇▇ ← 第6週後
   458頭 | 103.0% ▇▇▇▇▇▇ ← 第7週後
   524頭 | 95.3%  ▅▅▅▅▅▅ ← 第8週後 ⚠️

第6週で一気に上昇し、
第8週で急落しました。

🎯 第6週を除くと...

衝撃的な事実

第6週（98.4倍的中の週）を除いて計算してみました。

項目	値
対象期間	7週間（第6週除く）
ベット数	486頭
投資額	48,600円
払戻額	37,390円
収支	-11,210円
回収率	76.9%

第6週がなければ、回収率76.9%

これが意味すること

第6週あり: 95.3% 第6週なし: 76.9%

差: 18.4ポイント

つまり、

第6週の98.4倍的中に助けられていた
通常は70-80%台
目標103%には程遠い

これが、「大穴依存」の問題です。

💡 大穴依存のリスク

問題の本質

回収率のブレが激しすぎる:

週	最高配当	回収率
#1	17.6倍	67.2%
#2	24.5倍	87.8%
#3	27.8倍	110.1%
#4	20.3倍	75.1%
#5	24.5倍	83.4%
#6	98.4倍	312.1%
#7	18.9倍	85.5%
#8	11.2倍	41.7%

傾向:

30倍以上: 312.1%
20-30倍: 83-110%
20倍未満: 41-87%

→ 大穴の有無で200%以上の差

大穴の出現頻度

8週間の配当分布:

配当範囲	件数	割合
1-5倍	26頭	53.1%
5-10倍	11頭	22.4%
10-20倍	11頭	22.4%
20-30倍	0頭	0%
30倍以上	1頭	2.0%

30倍以上が、524頭で1回だけ

テストデータとの比較

項目	テスト（2024年）	実戦（8週間）
データ数	約12,000頭	524頭
30倍以上の出現	約30頭	1頭
出現頻度	400頭に1回	524頭に1回

確率的には、ほぼ想定通り

でも、これでは目標達成できません。

安定性の問題

週次回収率の統計:

指標	値
平均	118.9%
中央値	85.5%
標準偏差	約85%
最高	312.1%
最低	41.7%
レンジ	270.4ポイント

標準偏差85%は異常値

通常の投資では、標準偏差は10-20%程度。

85%は、極めて不安定です。

📈 配当の詳細分析

週次の配当推移

週	的中数	平均配当	最高配当
#1	12頭	476円	1,760円
#2	2頭	1,580円	2,450円
#3	6頭	1,432円	2,780円
#4	6頭	863円	2,030円
#5	6頭	973円	2,450円
#6	3頭	3,953円	9,840円
#7	9頭	760円	1,890円
#8	5頭	550円	1,120円
累計	49頭	1,019円	9,840円

気づき

1. 低配当が増えている:

第1-5週: 平均1,065円
第7-8週: 平均655円

→ 最近は低配当化

2. 第6週だけ異常:

第6週: 平均3,953円
他7週: 平均850円

→ 4.6倍の差

3. 的中率は安定:

累計的中率: 9.4%
想定: 8%

→ 的中率に問題なし
→ 配当が問題

🔍 テストと実戦の差

詳細比較

項目	テスト	実戦	差
回収率	103.5%	95.3%	-8.2%
的中率	約8%	9.4%	+1.4%
平均配当	約13倍	10.2倍	-2.8倍
データ数	12,000頭	524頭	-

原因の仮説

仮説1: サンプル数の差

テスト: 12,000頭（十分）
実戦: 524頭（不十分）

→ まだブレの範囲内？
→ 1,000頭まで続ければ103%に近づく？

仮説2: 過学習の可能性

テスト: 2024年のデータで学習
実戦: 2026年のデータで運用

→ 2年間でデータ分布が変化？
→ モデルが古い？

仮説3: 実力が95%程度

テスト: たまたま103.5%だった
実戦: 真の実力は95%程度

→ これが現実？

仮説4: 大穴の出現率が低い

テスト: 400頭に1回
実戦: 524頭に1回（まだ1回のみ）

→ 確率のブレ？
→ もう少し続ければ出現率が上がる？

💭 安定性をどう確保するか

問題点の整理

現状の問題:

大穴（30倍以上）がないと目標未達
大穴は稀（524頭で1回）
標準偏差85%（不安定）
週次で±200%ブレる

解決策の方向性

方向性1: 大穴の的中率を上げる

課題: 大穴の予測精度向上
方法: 特徴量追加（騎手、調教師、過去走）
効果: 不明（要検証）
リスク: 過学習の可能性

方向性2: 中穴（10-20倍）を増やす

課題: 中穴の的中数を増やす
方法: 期待値閾値の調整
効果: 的中数増加、配当やや低下
リスク: 回収率が下がる可能性

方向性3: 低配当を減らす

課題: 1-5倍の的中を減らす
方法: 期待値閾値を上げる（5% → 7%）
効果: 推奨馬を厳選、精度向上
リスク: ベット数減少

方向性4: このまま様子見

課題: サンプル数不足かも
方法: 1,000頭まで続ける
効果: 真の実力が分かる
リスク: さらに損失が拡大

📊 統計的考察

大数の法則から考える

理論:

サンプル数が増えると、
実測値は真の値に近づく

現状:

データ数	回収率
85頭	67.2%
199頭	87.7%
378頭	106.7%
524頭	95.3%

まだ収束していない

信頼区間の計算

95%信頼区間:

現在の回収率: 95.3%
標準誤差: 約3.7%
95%信頼区間: 88.1% - 102.5%

→ 真の回収率は88-102%の範囲
→ 103%は信頼区間の外

統計的には、目標未達の可能性が高い

必要なサンプル数

計算:

目標精度: ±3%
信頼度: 95%
想定的中率: 9.4%

必要サンプル数: 約400的中
→ 約4,250頭

現在: 524頭（49的中）

→ まだ12%程度
→ 8倍のデータが必要

4,000頭以上必要という厳しい現実

🎯 改善の方向性

次週の結果次第で判断

パターンA: 次週100%以上

判断: 第8週は一時的なブレ
方針: このまま継続
目標: 1,000頭まで様子見
改善: 不要

パターンB: 次週80-100%

判断: 実力95%前後の可能性
方針: 改善を検討
改善: 期待値閾値の調整から開始
効果測定: A/Bテスト

パターンC: 次週80%未満

判断: システムに問題あり
方針: 本格的な見直し
改善: 特徴量追加、モデル再構築
再テスト: 必須

改善の優先順位

もし改善するなら、この順番で:

1. 期待値閾値の調整

現在: 5%以上
変更: 7%や10%に引き上げ
効果: 推奨馬を厳選
リスク: ベット数減少
実装難易度: 低

2. 騎手データ追加

追加データ: 騎手の勝率、得意コース
期待効果: 的中率向上
リスク: 過学習
実装難易度: 中

3. 調教師データ追加

追加データ: 調教師の実績
期待効果: 期待値計算の精度向上
リスク: データ取得が面倒
実装難易度: 中

4. 過去走データ追加

追加データ: 前走、前々走の成績
期待効果: 予測精度向上
リスク: 大幅な改変、効果不明
実装難易度: 高

📝 まとめ

8週間で分かったこと

事実:

✅ 累計回収率95.3%（目標未達）
✅ 第6週を除くと76.9%
✅ 大穴依存（524頭で1回）
✅ 標準偏差85%（不安定）
✅ 的中率9.4%（想定通り）
✅ 配当10.2倍（想定13倍より低い）

問題点:

大穴がないと目標未達
大穴は稀（400頭に1回程度）
週次で±200%ブレる
安定性がない

原因の仮説:

サンプル数不足（524頭では不十分）
過学習の可能性（2024→2026の変化）
実力が95%程度（テストは偶然）
大穴の出現率が低い（確率のブレ）

次のステップ

短期（次週）:

✅ 第9週のデータ収集
✅ 結果で判断（100%以上? 80-100%? 80%未満?）
✅ 方針決定（継続 or 改善 or 見直し）

中期（〜1,000頭）:

✅ データ蓄積を継続
✅ 統計的な分析
✅ 改善の検討・実施
✅ A/Bテストで効果測定

長期（1,000頭〜）:

✅ 真の実力の把握
✅ 本格運用の可否判断
✅ システムの最適化

結論

大穴依存のリスクは深刻です

524頭のデータが示す厳しい現実:

第6週の98.4倍的中に助けられていた
通常は70-80%台
大穴がないと目標未達
安定性がない

でも、諦めません。

✅ 次週の結果で判断
✅ データを信じる
✅ 感情を排除
✅ 科学的に分析
✅ 冷静に改善

これが、データサイエンティストの仕事です。

🔜 次回予告

次回は、第9週の結果を報告します。

正念場です。

📊 関連記事

最後まで読んでいただき、ありがとうございました！

「大穴依存のリスク、よく分かった」
「統計的な分析、勉強になる」
「次週に期待」

コメントお待ちしています 💬