Metodología Estadística

Cómo hacer un backtest en apuestas deportivas correctamente

El backtesting es el proceso de aplicar una estrategia de apuestas a datos históricos para evaluar su rentabilidad pasada. Bien hecho, es la herramienta más potente para validar un sistema. Mal hecho, genera una ilusión de rentabilidad que colapsa en cuanto se opera en real.

Qué es el backtesting y para qué sirve

Un backtest consiste en definir las reglas de una estrategia de apuestas — en qué partidos apostar, en qué mercado y bajo qué condiciones — y aplicarlas sistemáticamente a un conjunto de datos históricos para calcular qué resultado habría dado esa estrategia en el pasado.

El objetivo no es demostrar que la estrategia habría funcionado — con suficiente flexibilidad en los parámetros, cualquier estrategia puede parecer rentable en el pasado. El objetivo es estimar con rigor estadístico si la estrategia tiene una ventaja real sobre el mercado y qué probabilidad hay de que esa ventaja persista en el futuro.

Los datos: el punto de partida

La calidad del backtest depende directamente de la calidad y cantidad de los datos. Para un backtest fiable en fútbol necesitas:

→Resultados históricos: fecha, equipos, resultado final (y a ser posible parcial). Al menos 5 temporadas para resultados significativos, idealmente 10 o más.
→Cuotas históricas: las cuotas que estaban disponibles en el mercado antes del partido, no las cuotas actuales. Este punto es crítico — usar cuotas actuales introduce look-ahead bias.
→Muestra suficiente: como mínimo 200-300 operaciones para que los resultados tengan significancia estadística. Con menos datos, el ruido puede confundirse con señal.

Los 3 errores que invalidan un backtest

01 — Look-ahead bias (sesgo de anticipación)

Ocurre cuando el sistema utiliza información que no estaba disponible en el momento en que se habría tomado la decisión de apostar. Ejemplo: usar la clasificación final de temporada para evaluar partidos de enero, cuando en enero esa clasificación no existía. Es el error más común y el más grave — puede hacer que cualquier sistema parezca rentable aunque no lo sea.

02 — Overfitting (sobreajuste)

El overfitting ocurre cuando los parámetros del sistema se ajustan demasiado a los datos históricos específicos, capturando el ruido estadístico en lugar de patrones reales. Un sistema con 15 condiciones distintas puede tener ROI del 40% en backtest y ser completamente inútil en real porque ha "memorizado" el pasado en lugar de identificar una ineficiencia genuina. La señal de alarma: cuantos más parámetros tiene un sistema, más probable es el overfitting.

03 — Data snooping (minería exhaustiva de datos)

Si testeas 200 estrategias distintas sobre los mismos datos, estadísticamente encontrarás varias con p-value menor de 0.05 simplemente por azar. El problema es que presentar solo la estrategia ganadora como si fuera el resultado de una hipótesis previa distorsiona completamente la interpretación estadística. Un backtest riguroso parte de una hipótesis concreta basada en lógica económica o conductual, no de buscar patrones hasta encontrar uno que funcione.

Las métricas que debes analizar

El ROI es la métrica más citada pero no la más importante. Un backtest riguroso analiza al menos estas métricas:

Métrica	Qué mide	Umbral mínimo
ROI	Rentabilidad por unidad apostada	> 5% en muestra completa
Win rate	Porcentaje de apuestas ganadoras	Depende del tipo de apuesta
p-value	Probabilidad de que sea ruido estadístico	< 0.05
Consistencia temporal	% de temporadas positivas	> 70% de períodos
Max drawdown	Peor racha de pérdidas consecutivas	Debe ser asumible
Sharpe ratio	Rentabilidad ajustada al riesgo	> 1.0

Cómo validar que el backtest no es una ilusión

Una vez que tienes un sistema con backtest positivo, el trabajo no ha terminado — acaba de empezar. Los pasos para validar que el resultado no es un artefacto estadístico:

1.Reserva datos out-of-sample: antes de optimizar el sistema, separa el 20% más reciente de los datos y no los toques hasta el final. Si el sistema funciona en ese bloque sin modificaciones, la validación es genuina.
2.Walk-forward analysis: simula que descubres los datos año a año. Aplica el sistema a cada temporada nueva sin reoptimizar. Si el rendimiento es consistente temporada a temporada, el sistema es robusto.
3.Test de Monte Carlo: baraja aleatoriamente el orden de las apuestas miles de veces y recalcula el ROI en cada simulación. Si el ROI positivo persiste en la mayoría de simulaciones, no es producto del orden específico de los resultados.
4.Análisis de sensibilidad: modifica ligeramente los parámetros del sistema y observa si el rendimiento colapsa. Un sistema robusto mantiene rentabilidad positiva con pequeñas variaciones en sus condiciones.

La brecha entre backtest y realidad

Incluso los mejores backtests sobreestiman el rendimiento real por razones inevitables: las cuotas históricas no reflejan exactamente las cuotas que habrías obtenido en el mercado en ese momento, los mercados cambian con el tiempo, y la ejecución real introduce fricciones que el backtest no captura.

Una regla práctica: espera que el rendimiento real sea un 20-30% inferior al backtest en los primeros meses de operación. Si el sistema es genuino, convergerá hacia las métricas históricas con el tiempo. Si colapsa completamente, el backtest probablemente tenía alguno de los errores descritos arriba.

Continúa leyendo

Metodología

Los 5 filtros de robustez que aplicamos antes de operar un sistema

Estrategias de Apuestas

Qué es el value betting y cómo calcular si una cuota tiene valor

Ver resultados verificados en real