Os números mostrados por você no excerto acima estão todos abaixo de um porcento. . . embora "alto" ou "baixo" seja dependente do contexto, não parecem, em princípio, "grandes".

O problema que pode se configurar (been there, done that) é que esses "missings" se forem disjuntos podem jogar fora 5649 amostras (casos). . .

Se algum atributo ou covariável for mais comum nesses casos sua análise pode ser comprometida.

Por isso somente uma avaliação sobre a análise específica a ser feita pode esclarecer o procedimento a seguir (que inclusive pode ter uma regra dada pelo receptor da análise, como órgão de governo, linha editorial, orientação acadêmica, legislação, etc.).


2016-04-22 14:26 GMT-03:00 Elias Carvalho <ecacarva@gmail.com>:
Pessoal no meu caso tenho variáveis com alto indice de missing (53 A 79%) :

[1] " variable: V1 number.na: 1456 percent.na: 0.73%"
[1] " variable: V2 number.na: 1052 percent.na: 0.53%"
[1] " variable: V3 number.na: 1577 percent.na: 0.79%"
[1] " variable: V4 number.na: 1564 percent.na: 0.78%"

Existe alguma regra ? Vale a pena aplicar um método pra tratar esses missing quando a quantidade é alta ?



_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.