Portada » Matemáticas » Análisis de Regresión Lineal y Correlación con SPSS
Regresión y Correlación con SPSS
①Analizar>regresión>lineal>dependiente:estrés_2>independientes:apoyo,estrategia,resilencia>Método: introducir>Estadísticos: ajuste al modelo, cambio en R, correlaciones parcial y semiparcial.
Correlación: R se ve si el número es alto
Capacidad explicativa del modelo: R2 el número se convierte a porcentaje multiplicándolo por 100
Significancia del modelo en la población: sig tabla Aanova El número tiene que ser menor a 0.05
Coeficientes: Se miran todos los números sig y se usan sólo los menores de 0.05
②Linealidad: asumir que las variables se distribuyen de forma lineal. Se evalúa en un gráfico de dispersión.
Analizar>regresión>lineal>gráficos> ejeY : residuos > ejeX: predichos> marcar: histograma, grafico de probabilidad normal, generar todos los gráficos parciales
Es lineal cuando los valores se distribuyen de forma constante, a medida que aumentan los aumentan los valores predichos, se van manteniendo constantes los residuos.
③Residuos independientes entre sí: Los residuos no tienen relación o no están inflluenciados entre sí. Se evalúa con Durbin Watson.
Analizar>regresión>lineal>Estadísticos>Marcar en Residuos:Durbin Watson
Durbin Watson: Si el número está entre 1.5 y 2.5 se acepta el supuesto
④Homocedasticidad: La varianza de los residuos se mantiene constante. Se evalúa en el gráfico de dispersión(de nuevo)
Si no hay homocedasticidad los valores podrían ir en aumento
⑤Normalidad en la distribución de los datos: existe una distribución simétrica de los datos. Se evalúa en el histograma, no debe ser muy asimétrica. También se puede evaluar en el QQPlot, donde los puntitos van dentro o muy cerca de la línea.
⑥Ausencia de Co linealidad: Las variables predictoras que estudiaremos no se relacionan entre sí (no tienen correlación alta). Se evalúa con Tolerancia y VIF
Analizar>regresión>lineal>Estadísticos> Marcar: diagnóstico de colinealidad
Tolerancia: Los datos deben ser mayor a 0.1. Si el número es menor es porque se relacionan mucho las variables
VIF (Factor de inflación de la varianza): Debe ser menor a 10
⑦Ausencia de casos influyentes: No existen casos que se alejen demasiado de la media o que sean extremos, porque van a sesgar los resultados. Se evalúa en distancia de Cook o en casos influyentes.
Analizar>regresión>lineal>Guardar>Marcar en Distancias: De Cook, Valores de influencia
Distancia de Cook, Casos influyentes: Mayor a 1 hay casos influyentes. Si el valor es menor a 0.2 “arriesgando”. Si está entre 0.2 y 0.5 el caso es “problemático”. Si el valor es mayor a 0.5 “evitar”
⑧Modelo: Ŷ= b₀+b₁ X₁+b₂ X₂+b₃X₃
a) Se reemplazan los valores de la tabla en el modelo
Ŷ= Estrés b₀=Constante= 14.209 b₁=Pendiente= 0.091 b₂=Pendiente= -0.004 b₃= 0.914
b)Crear variable nueva:
Transformar>Calcular>variable de destino: Estrés_predicho (nombre de la nueva variable)> se ponen los valores del modelo: (b₀)14.209 + (b₁)0,914 * (X₁)Se saca de la lista la variable “resilencia”
Se crea una variable nueva que son los “valores predichos del estrés”, que aparece al final de la lista en la ventana “vista de variables”
c) Correlacionar valores predichos con valores reales del estrés. Debería ser parecido a la tabla resumen del modelo
Analizar>correlaciones>bivariadas>seleccionar de la lista la variable Y “estrés_2” y la nueva variable “estrés_predicho>Marcar en Coeficiente de correlación: Pearson, Tau-b de Kendall>Spearman>marcar las correlaciones significativas
Cuando no es significativo no se pone en el modelo.
Error= Valor predicho – Valor real
*Mientras más chicos los residuos, más confiable es el modelo
Analizar>regresión>lineal>dependiente:estrés_2>independientes:apoyo,estrategia,resilencia>Método: introducir>Estadísticos: ajuste al modelo, cambio en R, correlaciones parcial y semiparcial, diagnostico de colinealidad>Marcar en Coeficientes de regresión: estimaciones>Marcar en Residuos:Durbin Watson>Continuar>Gráficos:ejeY : residuos > ejeX: predichos> marcar: histograma, grafico de probabilidad normal, generar todos los gráficos parciales>Guardar: Marcar en distancias:De Cook, Valores de influencia> Marcar Incluir matriz de covarianza>Opciones: Usar probabilidad de F: .05
Analizar>correlaciones>bivariadas>seleccionar de la lista la variable Y “estrés_2” y la nueva variable “estrés_predicho>Marcar en Coeficiente de correlación: Pearson, Tau-b de Kendall>Spearman>marcar las correlaciones significativas