Conceptos de estadística para traders👽

Actualizado
Comprender la estadística es una de las habilidades fundamentales que se requieren para el análisis cuantitativo, se tratan dos conceptos básicos distribución y probabilidad, ambos conceptos están estrechamente relacionados, el concepto de probabilidad nos brinda un soporte para los cálculos matemáticos y las distribuciones nos ayudan a visualizar lo que está sucediendo con los datos.

Distribución de frecuencia e histograma🦖
Comencemos por la parte más sencilla, una distribución es simplemente una manera de describir el patrón de los datos, ejemplo simple pensamos en los rendimientos diarios de una acción en bolsa o en los resultados de un backtest, estos retornos son nuestros datos de muestra, para tener una visión más clara a estos rendimientos o rentabilidades podemos clasificarlos en intervalos de igual tamaño y contar el número de observaciones de cada intervalo, si representamos estos resultados en un gráfico obtendremos lo que en estadística se llama un histograma de frecuencias, los histogramas nos permiten tener un panorama general de cómo se han distribuido los retornos.

Además, a partir de esta distribución de frecuencias podremos conocer sus medidas de tendencia central de nuestra muestra.
– El valor que está en el centro de nuestro histograma nos indica la media aritmética de los datos (el rendimiento medio).
– La mediana parte la distribución en dos dejando la misma cantidad de valores a un lado que a otro.
También podremos ver qué tan variables han sido los resultados medidas de dispersión, la volatilidad de los retornos se mide con la desviación estándar o desviación típica, por último también podremos ver la forma que tiene la distribución, si es una distribución simétrica, si tiene colas más gordas léase resultados más extremos de lo que debería, etc.

Vamos a ver estas características con mayor detalle, características de una distribución🔥

Asimetría estadística
Un aspecto muy importante es la simetría de la distribución, si una distribución es simétrica, existe el mismo número de valores a la derecha que a la izquierda de la media, por tanto, el mismo número de desviaciones con signo positivo que con signo negativo, decimos que hay asimetría positiva o a la derecha si la cola a la derecha de la media es más larga que la de la izquierda, es decir, si hay valores más separados de la media a la derecha, diremos que hay asimetría negativa o a la izquierda si la cola a la izquierda de la media es más larga que la de la derecha, es decir, si hay valores más separados de la media a la izquierda.
Cuando hablamos de sistemas de trading, un sistema puede tener una asimetría negativa o positiva según cómo sean sus características, para mí, el ejemplo más evidente es cuando analizamos la distribución entre los resultados de un sistema tendencial comparado a los resultados de un sistema de reversión a la media, en el primer caso, nuestra muestra tendría una simetría positiva cuando acierta gana mucho y los retornos se alejan del valor medio media, cuando no acierta pierde poco y los valores a la izquierda de la media no están muy alejados de esta, en el segundo caso sería a la inversa.

Curtosis
La curtosis es una medida estadística que determina el grado de concentración de los valores de una distribución alrededor de su media, el coeficiente de curtosis indica si la distribución tiene colas «pesadas», es decir, si los valores extremos concentran o no una alta frecuencia. El coeficiente mide el «grado de apuntamiento o achatamiento de las colas» respecto a la distribución normal, entonces, si tomamos la distribución normal como referencia, una distribución puede ser leptocúrtica, platicúrtica o mesocúrtica.

Distribución de probabilidad
Hasta aquí simplemente hemos estados analizando los datos de nuestra muestra en el ejemplo, los resultados de las operaciones utilizando estadística descriptiva, sin embargo, tal y como comentábamos en nuestro sobre las series temporales y la inversión cuantitativa, cuando trabajamos con los datos buscamos algo más que simplemente describirlos, buscamos poder predecir cómo se comportará esa serie de datos en el futuro, para esto echamos mano de la teoría de la probabilidad y la estadística inferencial, a partir los resultados de una muestra, buscamos extraer conclusiones para el total de la población, existen numerosos tipos de distribución de variables, solo nos vamos a ocupar de la distribución normal, que es el tipo de distribución más conocido y sobre el que se asientan la mayoría de modelos de probabilidad, para describirla solo se necesitan dos parámetros la media aritmética que define el valor central y la desviación estándar que describe el ancho de la campana.

Antes comentaba que para modelizar el riesgo lo único necesario es conocer la media y la desviación estándar, esto es así porque la distribución de probabilidad asigna una probabilidad a cada posible resultado de un experimento, la función de probabilidad que se mencionaba antes en el extracto es un concepto matemático que nos permite utilizar el área debajo de la curva para representar el espacio de probabilidad, podemos entender intuitivamente que aquellos valores que están más distantes de la media se repiten con menos frecuencia, mientras que aquellos valores más cercanos a la media son mucho más frecuentes, de esta forma se pueden definir intervalos de probabilidad dentro de los cuales podremos encontrar la rentabilidad del total de la muestra., este tipo de análisis es el que utiliza el modelo de VaR (Value at risk) para evaluar la probabilidad del riesgo de una inversión.

La volatilidad, que en este caso está medida por el valor de la desviación estándar, es una medida de incertidumbre riesgo, esta incertidumbre está relacionada con la probabilidad de obtener un rendimiento que sea igual al rendimiento esperado la media, como podemos ver en ejemplo de debajo, para el mismo rendimiento esperado, la curva se aplana cuando la volatilidad es más grande mientras que se vuelve más delgada y más alta cuando la volatilidad disminuye, un activo cuya rentabilidad tiene una desviación estándar más alta se considera más volátil, y por lo tanto, más arriesgado que un activo con una volatilidad más baja.

Otras notas🦖
Cuando hablamos de una distribución de toda la población, las propiedades media, desviación típica, etc, son parámetros, cuando hablamos de la distribución de la muestra, las propiedades son estadísticas.
¿Por qué utilizar distribuciones estadísticas para medir el riesgo, si al final los resultados no se ajustan a un modelo de distribución?, porque estás trabajando con modelos, tener un marco teórico en el que asentar una estrategia de inversión cuantitativa añade solidez al conjunto.
Operación cerrada: objetivo alcanzado
DJIFundamental AnalysisTechnical IndicatorsNasdaq Composite Index CFDNDAQNYASPX (S&P 500 Index)S&P 500 (SPX500)spx500analysisUS SPX 500Trend AnalysisUSD

También en:

Exención de responsabilidad