Page 68 - Introducción a la Bioestadística con R
P. 68
El tercer supuesto es que los datos de nuestra muestra siguen una distribución normal. Esto significa que sus datos al representarse gráficamente siguen una curva de distribución de datos en forma de campana. En este paso, se puede especificar un nivel de probabilidad (nivel de significancia, p) como criterio de aceptación previamente. En la mayoría de los casos, se puede asumir un valor del 5% (0.05) o del 1% (0.01).
El cuarto supuesto está supeditado al anterior y hace referencia al tamaño de muestra. Se supone que se ha alcanzado un tamaño de muestra suficientemente grande cuando se cumple el supuesto tercero, es decir, la distribución de los datos es normal. Si no es así, se deberá ampliar el tamaño de muestra.
El quinto y último supuesto es la homogeneidad de la varianza. Existe una varianza homogénea o igual cuando las desviaciones estándar de las muestras son aproximadamente iguales. Para ello debemos tener dos muestras, es decir, este supuesto no es aplicable en nuestro contexto actual que es la prueba t de una cola.
El primer supuesto se cumple en nuestro caso, ya que las edades de los individuos siguen una escala continua. El segundo supuesto hace referencia a la ética y diseño del experimento, y debe tenerse en cuenta al inicio del estudio. En nuestro caso, asumiremos que la muestra se ha recopilado de manera aleatoria. A continuación, vamos a ver cómo calcular con R si nuestra muestra sigue una distribución normal (el tercer supuesto).
A continuación vamos a ver 3 diferentes métodos para estimar si los datos siguen una distribución normal.
•
•
•
Introducción a la Bioestadística con R
64