Supuesto de normalidad en modelos de predicción

Ya en un artículo anterior hablamos de las características de la distribución normal y su importancia dentro de los mercados financieros. Hoy vamos a ver un ejemplo del test de Jarque Bera, que nos ayudará a detectar si existe normalidad en una serie y también analizaremos como influye la existencia de ésta, o por el contrario su ausencia en los modelos econométricos.

Si queremos especificar un modelo de regresión lineal para predecir el precio de un activo, tenemos que recordar que una de los supuestos que debe cumplir el modelo es que los errores se distribuyan normalmente. Esa condición es determinante en tanto en cuanto la significancia o no de las variables y la obtención de los parámetros que se obtengan dependerá del uso de pruebas estadísticas basadas o relacionadas con la Normal, como la distribución t, F y Chi cuadrado.

Si bien en la práctica acaba siendo muy difícil encontrar un modelo econométrico que cumpla todos los supuestos teóricos y que además los resultados sean muy buenos, la experiencia nos dice que conseguir que los errores se distribuyan normalmente es un paso importante para acabar teniendo un sistema que se comporte bien.

Ponemos énfasis en esto porque la falta de normalidad en un modelo influirá principalmente en que:

  1. Los estimadores no serán de mínima varianza.
  2. Tanto los contrastes de significación como las pruebas de hipótesis para los parámetros no serán exactos

Test de Jarque Bera

Una de las pruebas estadísticas más conocidas, aunque no la única, es el test de Jarque-Bera, que pretende determinar si una determinada distribución de probabilidad se asemeja a una normal, y lo hace mediante el estudio de la asimetría y la curtosis.

Podemos utilizar este test para ver comprobar el supuesto de normalidad en los errores del modelo. Aparte de las pruebas estadísticas también es aconsejable realizar un histograma o gráficos para comprobar visualmente el comportamiento de estos.

Vamos a ver una ejemplo en R donde hacemos tanto un estudio visual como el test de Jarque -Bera para los residuos de un modelo.

Hemos creado un modelo de regresión sobre el precio del aceite de oliva en el que tenemos en cuenta 9 variables independientes, entre ellas oferta,demanda,variables macroeconómicas ….

Aquí tenemos el sumario del modelo:

A primera vista el resultado del sumario es muy bueno, con un ajuste del modelo por encima del 91% y nueve variables significativas para poder predecir el precio.

Pero ahora debemos ver si los errores cumplen el supuesto de normalidad y así poder fiarnos de los valores que hemos obtenido.

De forma que extraemos los residuos y hacemos su histograma.

 

Ya viendo el gráfico observamos que existe una clara asimetría.

Vamos a ver ahora los resultados del test de Jarque Bera ;

Para considerar que la distribución de los errores sigue una normal el p-value del test debería ser mayor 0.05. En este caso el pvalue es menor al nivel de significancia de 0.05, por lo que los errores no cumplen el supuesto de normalidad.

Como complemento a esto, apuntar que si el estadístico de Jarque Bera está muy cercano a 0 habrá evidencia de que los errores se ajustan a una normal, si esto no es así, como en nuestro caso que los vemos en 8.5988, la distribuciones de los parámetros y la varianza de los errores no tendrán distribuciones adecuadas para la inferencia estadística. Sólo serán válidas de manera asintótica de acuerdo al Teorema Central del Límite.

Con todo esto ya sabemos que debemos modificar nuestro modelo si queremos que sea eficiente. Podría ser que no hemos tenido en cuenta algunas variables importantes. También se puede comprobar si los residuos son estacionarios o incluso analizar si la relación de algunas variables no es lineal con respecto a la variable dependiente.

Ya sea por un motivo o por otro lo que está claro es que no podemos quedarnos sólo con el resultado del R cuadrado ajustado, que aparentemente era muy bueno, sino que habrá que cambiar o buscar nuevas variables, o transformar el modelo con el objetivo de poder utilizarlo con garantías.

Bibliografía de referencia:

http://dm.udc.es/asignaturas/estadistica2/sec4_3.html

https://mregresion.files.wordpress.com/2011/10/normalidad.pdf

https://es.wikipedia.org/wiki/Test_de_Jarque-Bera

https://www.uam.es/personal_pdi/ciencias/abaillo/AmbEst/Tema4.pdf