[R-br] Fwd: como trabalhar os dados desbalanceados no R

Edson Lira edinhoestat em yahoo.com.br
Segunda Maio 2 12:13:48 BRT 2011


Desculpa, era complete.cases, abaixo um exemplo do help do R.
?complete.cases
#Examples

x <- airquality[, -1] # x is a regression design matrix
y <- airquality[,  1] # y is the corresponding response

cbind(x,y)
stopifnot(complete.cases(y) != is.na(y))
ok <- complete.cases(x,y)
sum(!ok) # how many are not "ok" ?
x <- x[ok,]
y <- y[ok]
cbind(x,y)

Nos seus dados, são poucos NA's, porque você não substitui o valor dos NA's pela média dos valores das repetições, você não acha que seria uma saída atenuante ao seu problema? 

Edson Lira

Estatístico

Manaus-Amazonas

--- Em seg, 2/5/11, Gilson Sanchez <gilsonsch em gmail.com> escreveu:

De: Gilson Sanchez <gilsonsch em gmail.com>
Assunto: [R-br] Fwd: como trabalhar os dados desbalanceados no R
Para: "Grupo R-Br" <r-br em listas.c3sl.ufpr.br>
Data: Segunda-feira, 2 de Maio de 2011, 11:19

Pessoal disculpa só agora que consegui conectar na internet Walmes, é assim tenho 4 substratos, 5 cultivares e cada rep (repetiçao) é considerado um bloco (não sei se é o caso da anaova erro tipo III) e muitas outras variaveis que também apresentam NA (exemplo de dados embaixo do texto).
 Eu estou tentando trabalhar assim,  dados<-read.table("estatistica.txt", header=TRUE)
dados
library(car)
dados$rep<-as.factor(dados$rep)
modelo <- lm(ptf ~ subst+cult+rep+subst:cult, data=dados, contrasts = list(subst=contr.sum,  cult=contr.sum, rep=contr.sum))
Anova(modelo, type="III") 
Até o momento eu consigo rodar os dados de este jeito, mas se eu quero rodar os dados como segue me baixo não consigo anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados) 
Edson, não encontrei nada sobre ?complete.case.
Obrigados
 

 
 
 
 
 
  subst
  cult
  rep
  pesofresco
 
 
  coco
  setcopa
  1
  9218,75
 
 
  coco
  setcopa
  2
  18343,75
 
 
  coco
  setcopa
  3
  26750,00
 
 
  coco
  setcopa
  4
  12450,00
 
 
  coco
  olympo
  1
  7281,25
 
 
  coco
  olympo
  2
  30281,25
 
 
  coco
  olympo
  3
  62468,75
 
 
  coco
  olympo
  4
  27906,25
 
 
  coco
  fasinio
  1
  2531,25
 
 
  coco
  fasinio
  2
  23643,75
 
 
  coco
  fasinio
  3
  29062,50
 
 
  coco
  fasinio
  4
  74968,75
 
 
  coco
  duradouro
  1
  22312,50
 
 
  coco
  duradouro
  2
  35593,75
 
 
  coco
  duradouro
  3
  87062,50
 
 
  coco
  duradouro
  4
  47156,25
 
 
  coco
  debora
  1
  22218,75
 
 
  coco
  debora
  2
  48000,00
 
 
  coco
  debora
  3
  40406,25
 
 
  coco
  debora
  4
  19312,50
 
 
  gado
  setcopa
  1
  63093,75
 
 
  gado
  setcopa
  2
  17406,25
 
 
  gado
  setcopa
  3
  50187,50
 
 
  gado
  setcopa
  4
  29281,25
 
 
  gado
  olympo
  1
  59406,25
 
 
  gado
  olympo
  2
  44281,25
 
 
  gado
  olympo
  3
  49437,50
 
 
  gado
  olympo
  4
  42156,25
 
 
  gado
  fasinio
  1
  61406,25
 
 
  gado
  fasinio
  2
  55375,00
 
 
  gado
  fasinio
  3
  6250,00
 
 
  gado
  fasinio
  4
  48812,50
 
 
  gado
  duradouro
  1
  37281,25
 
 
  gado
  duradouro
  2
  9406,25
 
 
  gado
  duradouro
  3
  75187,50
 
 
  gado
  duradouro
  4
  58687,50
 
 
  gado
  debora
  1
  24250,00
 
 
  gado
  debora
  2
  32750,00
 
 
  gado
  debora
  3
  36843,75
 
 
  gado
  debora
  4
  35218,75
 
 
  carvão
  setcopa
  1
  6125,00
 
 
  carvão
  setcopa
  2
        NA
 
 
  carvão
  setcopa
  3
  29562,50
 
 
  carvão
  setcopa
  4
  70375,00
 
 
  carvão
  olympo
  1
  37812,50
 
 
  carvão
  olympo
  2
      NA
 
 
  carvão
  olympo
  3
  11062,50
 
 
  carvão
  olympo
  4
  48906,25
 
 
  carvão
  fasinio
  1
  81718,75
 
 
  carvão
  fasinio
  2
      NA
 
 
  carvão
  fasinio
  3
      NA
 
 
  carvão
  fasinio
  4
  72375,00
 
 
  carvão
  duradouro
  1
  9531,25
 
 
  carvão
  duradouro
  2
      NA
 
 
  carvão
  duradouro
  3
  29812,50
 
 
  carvão
  duradouro
  4
  66343,75
 
 
  carvão
  debora
  1
  39156,25
 
 
  carvão
  debora
  2
      NA
 
 
  carvão
  debora
  3
  8625,00
 
 
  carvão
  debora
  4
  66781,25
 
 
  solo
  setcopa
  1
  17656,25
 
 
  solo
  setcopa
  2
  34218,75
 
 
  solo
  setcopa
  3
  11343,75
 
 
  solo
  setcopa
  4
  31718,75
 
 
  solo
  olympo
  1
  35906,25
 
 
  solo
  olympo
  2
  61468,75
 
 
  solo
  olympo
  3
  38750,00
 
 
  solo
  olympo
  4
  42218,75
 
 
  solo
  fasinio
  1
  19750,00
 
 
  solo
  fasinio
  2
  51468,75
 
 
  solo
  fasinio
  3
  60156,25
 
 
  solo
  fasinio
  4
  17687,50
 
 
  solo
  duradouro
  1
  63937,50
 
 
  solo
  duradouro
  2
  32000,00
 
 
  solo
  duradouro
  3
  21437,50
 
 
  solo
  duradouro
  4
  28500,00
 
 
  solo
  debora
  1
  26593,75
 
 
  solo
  debora
  2
  32968,75
 
 
  solo
  debora
  3
  18687,50
 
 
  solo
  debora
  4
  26312,50
 



---------- Forwarded message ----------
From: Gilson Sanchez <gilsonsch em gmail.com>

Date: 2011/4/30
Subject: como trabalhar os dados desbalanceados no R
To: Grupo R-Br <r-br em listas.c3sl.ufpr.br>



Pessoal,
 mais uma vez consultando vc'stenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo.
então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados


 dados<-read.table("dados.estatistica.txt", header=TRUE)
dados
attach(dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
> anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y)



Erro em storage.mode(y) <- "double" : 
  inválido mudar o modo de armazenamento de um fator
Além disso: Mensagens de aviso perdidas:
In model.response(mf, "numeric") :
  usando type="numeric" com um fator resposta será ignorada



outro, eu utlizaria o erro tipo III na anova?

-- 
MSc. Gilson Sánchez Chia

Laboratório de Fisiologia Vegetal
Embrapa Amazônia Ocidental
Fone: (92) 3303-7841
---
Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente.
Please consider the environment before printing this email.

Renew, Reduce and Recycle. The Planet Knows.



-- 
MSc. Gilson Sánchez Chia

Laboratório de Fisiologia Vegetal
Embrapa Amazônia Ocidental
Fone: (92) 3303-7841
---
Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente.
Please consider the environment before printing this email.

Renew, Reduce and Recycle. The Planet Knows.


-----Anexo incorporado-----

_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110502/b1082446/attachment.html>


Mais detalhes sobre a lista de discussão R-br