[R-br] Vale a pena tratar esses missings ?

Cesar Rabak cesar.rabak em gmail.com
Terça Abril 26 14:58:03 BRT 2016


Os números mostrados por você no excerto acima estão todos abaixo de um
porcento. . . embora "alto" ou "baixo" seja dependente do contexto, não
parecem, em princípio, "grandes".

O problema que pode se configurar (been there, done that) é que esses
"missings" se forem disjuntos podem jogar fora 5649 amostras (casos). . .

Se algum atributo ou covariável for mais comum nesses casos sua análise
pode ser comprometida.

Por isso somente uma avaliação sobre a análise específica a ser feita pode
esclarecer o procedimento a seguir (que inclusive pode ter uma regra dada
pelo receptor da análise, como órgão de governo, linha editorial,
orientação acadêmica, legislação, etc.).


2016-04-22 14:26 GMT-03:00 Elias Carvalho <ecacarva em gmail.com>:

> Pessoal no meu caso tenho variáveis com alto indice de missing (53 A 79%) :
>
> [1] " variable: V1 number.na: 1456 percent.na: 0.73%"
> [1] " variable: V2 number.na: 1052 percent.na: 0.53%"
> [1] " variable: V3 number.na: 1577 percent.na: 0.79%"
> [1] " variable: V4 number.na: 1564 percent.na: 0.78%"
>
> Existe alguma regra ? Vale a pena aplicar um método pra tratar esses
> missing quando a quantidade é alta ?
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160426/ac9683bf/attachment.html>


Mais detalhes sobre a lista de discussão R-br