Page 79 - Introducción a la Bioestadística con R
P. 79

 Sección 6: ANOVA y Kruskal-Wallis. Conceptos clave.
Introducción a la Bioestadística con R
 • •
•
• • •
La ANOVA tipo I y tipo II nos permiten comparar más de dos grupos entre sí.
Las principales condiciones que deben cumplirse son homocedasticidad y normalidad de las muestras. Si los datos no están normalmente distribuidos se puede intentar una normalización usando una función para ese propósito. Una de las más comunes sería log10().
La ANOVA es relativamente resistente a cierto grado de desviación en la normalidad y la homocedasticidad. Si la varianza no es homogénea, se puede corregir la ANOVA usando la función Welch.
Las pruebas Post-Hoc nos permiten identificar qué grupos en particular difieren entre sí cuando hemos rechazado la hipótesis nula en la ANOVA.
La prueba Kruskal Wallis equivale a la ANOVA tipo I cuando los datos son no paramétricos.
El Pairwise Wilcox Test nos permitirá identificar que grupos difieren entre sí, cuando rechazamos la hipótesis nula en la prueba Kruskal Wallis.
 ANOVA: Análisis de la varianza.
Hasta ahora hemos comparado dos grupos entre sí usando el t-test si estaban normalmente distribuidos, o el Wilcoxon Rank Sum Test si no lo estaban. El ANOVA o análisis de varianza es un enfoque matemático que se utiliza para averiguar si existen diferencias entre dos o más grupos independientes. Mientras que antes con la prueba t tenías que comparar la media de dos grupos entre ellos (o la media de tu grupo contra una media dada), con la ANOVA puedes comparar más grupos entre sí, lo que es muy útil para analizar diseños experimentales más complejos.
Hay dos tipos principales de ANOVA, que son la ANOVA tipo I y la ANOVA tipo II. Esto hace referencia a la cantidad de factores que se pueden incluir en cada modelo. En la ANOVA tipo I tendremos un solo factor; por ejemplo, imagina que está midiendo el peso corporal de los voluntarios de acuerdo con la dieta que han recibido. Tu factor será el tipo de dieta y para el análisis de dicho experimento necesitarás utilizar la ANOVA de tipo I.
Ahora imagina que además de la información dietética, también conoces si fuman o no. Algunos de tus voluntarios son fumadores, otros son no fumadores y por último hay un tercer grupo en el que son exfumadores. En este caso tienes dos factores: dieta y relación con el tabaco. Por lo tanto, deberás utilizar una ANOVA de tipo II para el análisis de este experimento. Este tipo de diseño es un 4x3, y si quisieras analizarlo usando la prueba t-test, el tipo de error crecería demasiado y los resultados no serían fiables. Por lo tanto, vamos a estudiar cómo hacerlo mediante el uso de la ANOVA.
(1) Comprensión de la ANOVA.
Cada vez que ejecutamos una prueba t asumimos un 5%, o un 1%, de posibilidades de cometer un error. Si necesitas comparar más de una muestra con uno o dos factores utilizando la
 75

















































































   77   78   79   80   81