En el contexto de un
discurso generalizado al respecto de una crisis de la política y de lo
político, el presente ensayo trata la acción política. Una práctica elaborada con datos
extraídos del barómetro de abril de 2012, en concreto el estudio 2941 del CIS.
Se va a trabajar con dos modelos a modo de hipótesis, con el objeto de obtener
una explicación a través de un análisis pormenorizado de la información
resultante. Se realizará un estudio comparando ambos modelos e intentando en
todo momento, dialogar con la información resultante, como con otros estudios
conexos. El contraste de estos resultados puede permitir
distinguir hasta qué punto los modelos desarrollados con la regresión
logística, son explicativos.
3.3.-Resultados Regresión Logística
Una vez establecidas las variables que se van a
utilizar en este primer modelo, sólo queda llevar a cabo la regresión
logística. Para ello es requisito que la variable objetivo (es decir, INDIT2)
sea dicotómica (Bi-Valuada, valor 0 ó
1). Se pasa a recodificar por tanto INDIT2: hasta 9 “políticamente inactivo” (valor 0) y de 10 en adelante “políticamente activo” (valor 1).
Se pasa a agrupar los valores tanto de F1 como de F2 en tres categorías para simplificar y se añaden etiquetas:
· Recode F1 (2 3 4 5 =3) (6 7 8=1) (9 10 11
12=2)
· Recode F2 (2 2,5 3 3,5=3) (4 4,5 5=1) (5,5
6 7 8=2)
· Value Labels:
F1 3 F1 (Bajo) 1 F1 (Medio) 2 F1 (Alto)
F2 3 F2 (Bajo) 1 F2 (Medio) 2 F2 (Alto)
Se lleva a cabo la Regresión Logística. El subcomando
/ Categorical F1 F2 hará que la codificación dummy se compute de forma automática
para F1 y F2, de lo contrario habría que implementarla mediante código. El
subcomando no sería necesario si F1
y F2 fuesen dicotómicas, pero no es
el caso. Es aquí cuando se añade el subcomando/criteria para que haga un máximo
de 100 iteraciones si fuera preciso (por defecto efectúa 20). Por defecto la
categorización dummy que consiste en
la generación de variables dicotómicas para las distintas categorías de la
variables (ficticias), y que lleva a cabo PSPP para variables categóricas,
asigna “0” al valor más alto definido.
La estimación se detuvo en la iteración número 5 (en
cinco pasos se estableció convergencia) porque las estimaciones de parámetros
cambiaron menos que 0,0001 (nivel de convergencia al tercer dígito decimal).
Los casos perdidos (12,28%) no se considera una merma muy significativa.
Pasamos a continuación al
resumen del modelo:
Para este modelo, se ha obtenido un coeficiente de R
Cuadrada de Cox & Snell de un valor de 0,13, un valor con un efecto muy
bajo de las variables independientes analizadas. El siguiente coeficiente
analizado es R cuadrada de Nagelkerker, un valor de R cuadrada de Cox y Snell
estandarizado sobre el valor máximo que éste podría tomar. Una forma de
garantizar su interpretación entre 0 y 1, en este caso es de 0,24. En ambos
casos los coeficientes de determinación tienen valores que no se pueden
considerar del todo aceptables[1].
Al respecto del -2log de la verosimilitud tiene
una cota inferior = 0, pero no está acotado superiormente, con lo cual es muy
difícil establecer un criterio para decidir qué es un valor alto y cuál no.
[1]
R^2 de Cox y Snell y la R^2 de Nagerkerke (esta última como
modificación o variante de la de Cox y Snell, es considerada más fiable). En
principio los valores que se han obtenido con este primer modelo no se pueden
considerar del todo buenos, pero con matices. Para empezar, tanto la R^2 de
Cox-Snell como la de R^2 de Nagelkerke dan cuenta del porcentaje de
variabilidad explicado por las variables independientes en el modelo. Es decir,
si mi modelo es “Y = aX + b” y obtengo un 0.24 como valor de R^2 quiere decir
que sólo un 24% de variabilidad observada en “Y” queda explicado mediante
la variable X. En un modelo ideal (es decir, perfecto), se debería obtener
-2Log(verosimilitud) = 0, R^2(Cox-Snell) cercana a la unidad y R^2 de
Nagerkelke = 1. En los modelos de regresión lineal ordinarios (los habituales,
lo que utilizan mínimos cuadrados) este tipo de parámetros (las R^2, hay
varias definiciones) se interpretan como porcentaje de variabilidad explicado
por el modelo. En algunas fuentes que he consultado se da por hecho que la R^2
Cox y Snell así como la de R^2 Nagerkelke vienen a tener la misma
interpretación; sin embargo, otras fuentes consultadas son más críticas al
respecto y afirman que no se pueden interpretar de manera análoga a como se
hace en la regresión lineal ordinaria y que hay que ser muy cauteloso al
respecto.
No hay comentarios:
Publicar un comentario