Page 21 - Introducción a la Bioestadística con R
P. 21

 (2) Vectores con valores perdidos.
Hay ocasiones en las que cierta información, por ejemplo “ha padecido un evento cardiaco en los últimos 6 meses’, está disponible sólo para algunos individuos y no para otros. A esto se le llama valor perdido y en la notación de R se representa como NA. ¡Ojo!, no es lo mismo un valor perdido que 0. En el caso de 0, tenemos la certeza de que nuestro paciente no ha tenido ningún evento cardiaco en los últimos seis meses en el caso de nuestro ejemplo.
Usando la función is.na() podrás interrogar un vector y ver cuántos valores perdidos hay.
Es importante saber si existen eventos perdidos o no porque ciertas funciones y modelos sólo trabajan con casos completos, es decir, no pueden aceptar NAs en sus vectores. Es muy común en esas situaciones eliminar los valores perdidos (en nuestro caso a los pacientes 1003 y 1004) o imputarlos. Qué opción tomar dependerá principalmente de qué es lo más aceptado en tu campo de investigación.
Por último, hay que señalar que NA y NaN no es lo mismo. NA es un valor perdido, y NaN significa “Not a Number” (no es un número). R produce esta notación cuando una función matemática no puede funcionar correctamente, por ejemplo, 0/0 = NaN. Es importante saber que la función is.na() va a contabilizar tanto los NA como los NaN. Si quieres saber específicamente cuántos NaN hay, debes usar la función is.nan().
(3) Seleccionar un subconjunto de un vector.
A continuación vamos a ver las tres maneras principales que hay de seleccionar un subconjunto de un vector. Estas son usando un índice positivo, un índice negativo y usando un vector de tipo lógico.
Introducción a la Bioestadística con R
     17


























































































   19   20   21   22   23