[R-br] lm e NA

Paulo Justiniano paulojus em leg.ufpr.br
Terça Junho 11 07:56:46 BRT 2013


Nao tem mágina Daniela, para ajustar o modelo (cm todas as covariáveis) 
sao precisos observacoes completas
Pelo visto voce nao possui nenhuma observacao completa

sugestao: antes de ajustar o modelo procure explorar e conhecer melhor as 
variáveis, veja quais possuem mais |N|A's , se sao todas relamente 
necessárias (e relevancias no contexto)
  e depois de explorar e compreender bem o padrao e ocorrecias de 
faltantes, ai sim procure ajustar um modelo mais enxuto

alternativas seria imputar dados, mas eu nao lancaria mao disto antes de 
fazer o sugerido acima


On Tue, 11 Jun 2013, Daniela Recchia wrote:

> Bom dia,
>  
> estou com dificuldades em rodar um modelo no R que acredito ser devido aos NA. Apesar do software
> aparentemente remover os NA's na hora de rodar a funcao lm, quando ajusto meu modelo
> model<-lm(cpstotalnorm~indconfident+indpride+indenergy+indgrowth+indseethingsnew+indinputstrategy
>          
> +indtrainingavailable+grppointsofview+grpconflictresol+grprightpeople+grpdifferentviews+grprethink
>           +grplessonss)
>  
> recebo um erro "error contrasts can be applied only to factors with 2 or more levels", pesquisei sobre
> o erro e vi que poderiam ser dois casos: ou as variáveis poderiam estar definidas como caracteres e nao
> como fatores - o que nao é o caso, ou há NA's no conjunto de dados - é o caso.
>  
> Tentei retirar entao os NA's dos dados para rodr o modelo, porém usando a funcao:
> datanew<-na.omit(data)
>  
> o R retira todas as observacoes, e nao só o NA, por exemplo:
>  
> > datanew$indseethingsnew
> factor(0)
> Levels: 1 2 3 4 5 6 7
>  
> enquanto se retiro somente os NA's dessa variável, no conjunto de dados original, ele mantém todas as
> outras observacoes:
> 
> > c<-na.omit(data$indseethingsnew)
> > c
>   [1] 2 2 2 3 1 3 1 2 1 1 2 3 3 3 3 2 2 1 3 4 1 1 4 3 2 3 1 2 2 1 5 2 1 3 1 1 1 6 3 1 2 1 1 1 1 2 1 2 1
>  3 1
>  [52] 3 2 5 1 5 1 1 3 2 1 2 2 1 2 2 1 1 2 2 1 2 1 2 2 1 1 2 2 3 2 2 1 2 2 2 2 3 1 3 2 2 1 3 1 2 2 1 2 3
>  2 1
> [103] 2 1 2 4 2 1 1 2 2 1 3 3 2 2 1 1 6 2 1 2 4 2 3 3 2 2 2 2 1 3 6 1 1 3 2 3 3 1 2 3 2 2 7 2 3 2 1 3 4
>  1 2
> [154] 3 2 1 3
> attr(,"na.action")
>   [1]   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24 
> 25
>  [26]  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49 
> 50
>  [51]  85  86 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 1
> 85
>  [76] 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 2
> 10
> [101] 211 212 213 214 215 216 217 218 219
> attr(,"class")
> [1] "omit"
> Levels: 1 2 3 4 5 6 7
> 
>  
> 
> Entao meu novo conjunto de dados datanew contém apenas zeros!
> 
>  
> 
> Alguém teria alguma sugestao?
> 
>  
> 
> Obrigada,
> 
> Daniela
>  
> --
> Daniela Rodrigues Recchia
> M.Sc. in Statistics
> 
> Tel. (Mobil): +49 01578 7588382
> Kißlegg - Germany
> 
> 
> “The standard of success in life is absolutely the amount of joy you feel”
> Esther & Jerry Hick
>  
> 
>


Mais detalhes sobre a lista de discussão R-br