jueves, 24 de abril de 2014

UN ENSAYO SOBRE ACCIÓN POLÍTICA Parte 4


En el contexto de un discurso generalizado al respecto de una crisis de la política y de lo político, el presente ensayo trata la acción política. Una práctica elaborada con datos extraídos del barómetro de abril de 2012, en concreto el estudio 2941 del CIS. Se va a trabajar con dos modelos a modo de hipótesis, con el objeto de obtener una explicación a través de un análisis pormenorizado de la información resultante. Se realizará un estudio comparando ambos modelos e intentando en todo momento, dialogar con la información resultante, como con otros estudios conexos. El contraste de estos resultados puede permitir distinguir hasta qué punto los modelos desarrollados con la regresión logística, son explicativos.

3.3.-Resultados Regresión Logística

Una vez establecidas las variables que se van a utilizar en este primer modelo, sólo queda llevar a cabo la regresión logística. Para ello es requisito que la variable objetivo (es decir, INDIT2) sea dicotómica (Bi-Valuada, valor 0 ó 1). Se pasa a recodificar por tanto INDIT2: hasta 9 “políticamente inactivo” (valor 0) y de 10 en adelante “políticamente activo” (valor 1).

Se pasa a agrupar los valores tanto de F1 como de F2 en tres categorías para simplificar y se añaden etiquetas:

·       Recode F1 (2 3 4 5 =3) (6 7 8=1) (9 10 11 12=2)
·       Recode F2 (2 2,5 3 3,5=3) (4 4,5 5=1) (5,5 6 7 8=2)
·       Value Labels:
F1 3 F1 (Bajo) 1 F1 (Medio)  2 F1 (Alto)
F2 3 F2 (Bajo) 1 F2 (Medio)  2 F2 (Alto)

Se lleva a cabo la Regresión Logística. El subcomando / Categorical F1 F2 hará que la codificación dummy se compute de forma automática para F1 y F2, de lo contrario habría que implementarla mediante código. El subcomando no sería necesario si F1 y F2 fuesen dicotómicas, pero no es el caso. Es aquí cuando se añade el subcomando/criteria para que haga un máximo de 100 iteraciones si fuera preciso (por defecto efectúa 20). Por defecto la categorización dummy que consiste en la generación de variables dicotómicas para las distintas categorías de la variables (ficticias), y que lleva a cabo PSPP para variables categóricas, asigna “0” al valor más alto definido.

La estimación se detuvo en la iteración número 5 (en cinco pasos se estableció convergencia) porque las estimaciones de parámetros cambiaron menos que 0,0001 (nivel de convergencia al tercer dígito decimal). Los casos perdidos (12,28%) no se considera una merma muy significativa.

Pasamos a continuación al resumen del modelo:


Para este modelo, se ha obtenido un coeficiente de R Cuadrada de Cox & Snell de un valor de 0,13, un valor con un efecto muy bajo de las variables independientes analizadas. El siguiente coeficiente analizado es R cuadrada de Nagelkerker, un valor de R cuadrada de Cox y Snell estandarizado sobre el valor máximo que éste podría tomar. Una forma de garantizar su interpretación entre 0 y 1, en este caso es de 0,24. En ambos casos los coeficientes de determinación tienen valores que no se pueden considerar del todo aceptables[1].

Al respecto del -2log de la verosimilitud tiene una cota inferior = 0, pero no está acotado superiormente, con lo cual es muy difícil establecer un criterio para decidir qué es un valor alto y cuál no.




[1] R^2 de Cox y Snell y la R^2 de Nagerkerke (esta última como modificación o variante de la de Cox y Snell, es considerada más fiable). En principio los valores que se han obtenido con este primer modelo no se pueden considerar del todo buenos, pero con matices. Para empezar, tanto la R^2 de Cox-Snell como la de R^2 de Nagelkerke dan cuenta del porcentaje de variabilidad explicado por las variables independientes en el modelo. Es decir, si mi modelo es “Y = aX + b” y obtengo un 0.24 como valor de R^2 quiere decir que sólo un 24% de variabilidad observada en “Y” queda explicado mediante la variable X. En un modelo ideal (es decir, perfecto), se debería obtener -2Log(verosimilitud) = 0, R^2(Cox-Snell) cercana a la unidad y R^2 de Nagerkelke = 1. En los modelos de regresión lineal ordinarios (los habituales, lo que utilizan mínimos cuadrados) este tipo de  parámetros (las R^2, hay varias definiciones) se interpretan como porcentaje de variabilidad explicado por el modelo. En algunas fuentes que he consultado se da por hecho que la R^2 Cox y Snell así como la de R^2 Nagerkelke vienen a tener la misma interpretación; sin embargo, otras fuentes consultadas son más críticas al respecto y afirman que no se pueden interpretar de manera análoga a como se hace en la regresión lineal ordinaria y que hay que ser muy cauteloso al respecto.