[R-br] Fwd: como trabalhar os dados desbalanceados no R
Edson Lira
edinhoestat em yahoo.com.br
Segunda Maio 2 12:13:48 BRT 2011
Desculpa, era complete.cases, abaixo um exemplo do help do R.
?complete.cases
#Examples
x <- airquality[, -1] # x is a regression design matrix
y <- airquality[, 1] # y is the corresponding response
cbind(x,y)
stopifnot(complete.cases(y) != is.na(y))
ok <- complete.cases(x,y)
sum(!ok) # how many are not "ok" ?
x <- x[ok,]
y <- y[ok]
cbind(x,y)
Nos seus dados, são poucos NA's, porque você não substitui o valor dos NA's pela média dos valores das repetições, você não acha que seria uma saída atenuante ao seu problema?
Edson Lira
Estatístico
Manaus-Amazonas
--- Em seg, 2/5/11, Gilson Sanchez <gilsonsch em gmail.com> escreveu:
De: Gilson Sanchez <gilsonsch em gmail.com>
Assunto: [R-br] Fwd: como trabalhar os dados desbalanceados no R
Para: "Grupo R-Br" <r-br em listas.c3sl.ufpr.br>
Data: Segunda-feira, 2 de Maio de 2011, 11:19
Pessoal disculpa só agora que consegui conectar na internet Walmes, é assim tenho 4 substratos, 5 cultivares e cada rep (repetiçao) é considerado um bloco (não sei se é o caso da anaova erro tipo III) e muitas outras variaveis que também apresentam NA (exemplo de dados embaixo do texto).
Eu estou tentando trabalhar assim, dados<-read.table("estatistica.txt", header=TRUE)
dados
library(car)
dados$rep<-as.factor(dados$rep)
modelo <- lm(ptf ~ subst+cult+rep+subst:cult, data=dados, contrasts = list(subst=contr.sum, cult=contr.sum, rep=contr.sum))
Anova(modelo, type="III")
Até o momento eu consigo rodar os dados de este jeito, mas se eu quero rodar os dados como segue me baixo não consigo anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
Edson, não encontrei nada sobre ?complete.case.
Obrigados
subst
cult
rep
pesofresco
coco
setcopa
1
9218,75
coco
setcopa
2
18343,75
coco
setcopa
3
26750,00
coco
setcopa
4
12450,00
coco
olympo
1
7281,25
coco
olympo
2
30281,25
coco
olympo
3
62468,75
coco
olympo
4
27906,25
coco
fasinio
1
2531,25
coco
fasinio
2
23643,75
coco
fasinio
3
29062,50
coco
fasinio
4
74968,75
coco
duradouro
1
22312,50
coco
duradouro
2
35593,75
coco
duradouro
3
87062,50
coco
duradouro
4
47156,25
coco
debora
1
22218,75
coco
debora
2
48000,00
coco
debora
3
40406,25
coco
debora
4
19312,50
gado
setcopa
1
63093,75
gado
setcopa
2
17406,25
gado
setcopa
3
50187,50
gado
setcopa
4
29281,25
gado
olympo
1
59406,25
gado
olympo
2
44281,25
gado
olympo
3
49437,50
gado
olympo
4
42156,25
gado
fasinio
1
61406,25
gado
fasinio
2
55375,00
gado
fasinio
3
6250,00
gado
fasinio
4
48812,50
gado
duradouro
1
37281,25
gado
duradouro
2
9406,25
gado
duradouro
3
75187,50
gado
duradouro
4
58687,50
gado
debora
1
24250,00
gado
debora
2
32750,00
gado
debora
3
36843,75
gado
debora
4
35218,75
carvão
setcopa
1
6125,00
carvão
setcopa
2
NA
carvão
setcopa
3
29562,50
carvão
setcopa
4
70375,00
carvão
olympo
1
37812,50
carvão
olympo
2
NA
carvão
olympo
3
11062,50
carvão
olympo
4
48906,25
carvão
fasinio
1
81718,75
carvão
fasinio
2
NA
carvão
fasinio
3
NA
carvão
fasinio
4
72375,00
carvão
duradouro
1
9531,25
carvão
duradouro
2
NA
carvão
duradouro
3
29812,50
carvão
duradouro
4
66343,75
carvão
debora
1
39156,25
carvão
debora
2
NA
carvão
debora
3
8625,00
carvão
debora
4
66781,25
solo
setcopa
1
17656,25
solo
setcopa
2
34218,75
solo
setcopa
3
11343,75
solo
setcopa
4
31718,75
solo
olympo
1
35906,25
solo
olympo
2
61468,75
solo
olympo
3
38750,00
solo
olympo
4
42218,75
solo
fasinio
1
19750,00
solo
fasinio
2
51468,75
solo
fasinio
3
60156,25
solo
fasinio
4
17687,50
solo
duradouro
1
63937,50
solo
duradouro
2
32000,00
solo
duradouro
3
21437,50
solo
duradouro
4
28500,00
solo
debora
1
26593,75
solo
debora
2
32968,75
solo
debora
3
18687,50
solo
debora
4
26312,50
---------- Forwarded message ----------
From: Gilson Sanchez <gilsonsch em gmail.com>
Date: 2011/4/30
Subject: como trabalhar os dados desbalanceados no R
To: Grupo R-Br <r-br em listas.c3sl.ufpr.br>
Pessoal,
mais uma vez consultando vc'stenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo.
então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados
dados<-read.table("dados.estatistica.txt", header=TRUE)
dados
attach(dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
> anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y)
Erro em storage.mode(y) <- "double" :
inválido mudar o modo de armazenamento de um fator
Além disso: Mensagens de aviso perdidas:
In model.response(mf, "numeric") :
usando type="numeric" com um fator resposta será ignorada
outro, eu utlizaria o erro tipo III na anova?
--
MSc. Gilson Sánchez Chia
Laboratório de Fisiologia Vegetal
Embrapa Amazônia Ocidental
Fone: (92) 3303-7841
---
Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente.
Please consider the environment before printing this email.
Renew, Reduce and Recycle. The Planet Knows.
--
MSc. Gilson Sánchez Chia
Laboratório de Fisiologia Vegetal
Embrapa Amazônia Ocidental
Fone: (92) 3303-7841
---
Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente.
Please consider the environment before printing this email.
Renew, Reduce and Recycle. The Planet Knows.
-----Anexo incorporado-----
_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110502/b1082446/attachment.html>
Mais detalhes sobre a lista de discussão R-br