Page 114 - Introducción a la Bioestadística con R
P. 114
La función summary() nos devuelve la estimación de los coeficientes con su error estándar, y un valor t que sigue una distribución t-test, que se obtiene de dividir cada coeficiente por su error. En último lugar, se obtiene el valor p-value para cada cada coeficiente que nos permite o no rechazar la hipótesis nula. La información restante corresponde con el coeficiente de correlación múltiple o coeficiente de determinación (Multiple R-squared) y su valor ajustado (Adjusted R- squared) y el estadístico F y su p-value asociado.
Si nos fijamos en nuestros resultados, todos los valores son estadísticamente significativos con la excepción de lcavol (recordemos, volumen del cáncer). Lo mismo ocurre con el p-value de del estadístico F, de manera que podemos concluir que las variables edad (age) y peso de la próstata (lweight) nos permiten predecir el valor de la variable dependiente lbph.
Vamos a realizar una serie de diagnósticos para confirmar que nuestro modelo es válido y sigue los cuatro supuestos establecidos al inicio de esta sección. En primer lugar, vamos a representar el valor obtenido de los residuos (diferencia entre el valor real de la variable dependiente y su valor estimado en nuestro modelo linear) y las distintas medidas. Para ello utilizamos la función plot().
Introducción a la Bioestadística con R
110