Los modelos log-lineales y la Regresión logística, su relación y aplicación.

Autor: Guillermina Eslava Gómez
Coautor(es): Ricardo Ramírez Aldana y Johan Van Horebeek
Los modelos log-lineales son modelos estadísticos útiles para explicar la relación entre un conjunto de variables aleatorias discretas X=(X1,…,Xp). El modelo se expresa a través del logaritmo de la función de distribución conjunta, log(P(X1=x1,….,Xp=xp)). Si una de estas variables, digamos X1:01, es considerada como variable respuesta y el resto como explicativas, podemos considerar a un modelo de regresión logística para modelar el logaritmo del momio log(P(X1=1 | X2,…,Xp)/P(X1=0 | X2,…,Xp)). Ambos modelos son muy aplicados en diversas áreas, e.g. investigación médica, estudios de mercado, riesgos crediticios, y otras. Donde dado un conjunto de observaciones, puede ajustarse uno de estos modelos y estimar probabilidades de ocurrencia de un evento dados valores específicos de un conjunto de variables adicionales. Estos modelos guardan una relación estrecha en el sentido que a través de cada uno de ellos puede expresarse la probabilidad condicional de X1 dado el resto de las variables, esto es P(X1=1 | X2= x2,…,Xp=xp). Y dado un conjunto de observaciones esta probabilidad puede estimarse. La probabilidad condicional P(X1=1 | X2= x2,…,Xp=xp) derivada del modelo log-lineal y la derivada de la regresión logística en general no son iguales. En esta plática damos las condición bajo la cual estas dos probabilidades son iguales para el caso de modelos log-lineales jerárquicos y en particular para modelos gráficos log-lineales. Se presenta un ejemplo de aplicación que ilustra la utilidad de los modelos y la relación que guardan entre ellos.