como trabalhar os dados desbalanceados no R

Pessoal, mais uma vez consultando vc's tenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo. então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados dados<-read.table("dados.estatistica.txt", header=TRUE) dados attach(dados) anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y) Erro em storage.mode(y) <- "double" : inválido mudar o modo de armazenamento de um fator Além disso: Mensagens de aviso perdidas: In model.response(mf, "numeric") : usando type="numeric" com um fator resposta será ignorada outro, eu utlizaria o erro tipo III na anova?
-- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows.

Gilson, Nunca observei esses tipos de erros ao avaliar dados com NA. Com o que você passou na mensagem não consigo palpitar qual a causa dos erros. Tem como enviar um CMR com mais informação? À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ========================================================================== 2011/4/30 Gilson Sanchez <gilsonsch@gmail.com>
Pessoal,
mais uma vez consultando vc's tenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo. então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados
dados<-read.table("dados.estatistica.txt", header=TRUE) dados attach(dados) anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y) Erro em storage.mode(y) <- "double" : inválido mudar o modo de armazenamento de um fator Além disso: Mensagens de aviso perdidas: In model.response(mf, "numeric") : usando type="numeric" com um fator resposta será ignorada outro, eu utlizaria o erro tipo III na anova?
-- MSc. Gilson Sánchez Chia
Laboratório de Fisiologia Vegetal
Embrapa Amazônia Ocidental
Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Talvez se você elininar os NA's resolva. Use ?complete.case e veja como eliminá-los. Edson Lira Estatístico Manaus-Amazonas --- Em sáb, 30/4/11, Gilson Sanchez <gilsonsch@gmail.com> escreveu: De: Gilson Sanchez <gilsonsch@gmail.com> Assunto: [R-br] como trabalhar os dados desbalanceados no R Para: "Grupo R-Br" <r-br@listas.c3sl.ufpr.br> Data: Sábado, 30 de Abril de 2011, 18:36 Pessoal, mais uma vez consultando vc'stenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo. então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados dados<-read.table("dados.estatistica.txt", header=TRUE) dados attach(dados) anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y)
Erro em storage.mode(y) <- "double" : inválido mudar o modo de armazenamento de um fator Além disso: Mensagens de aviso perdidas: In model.response(mf, "numeric") : usando type="numeric" com um fator resposta será ignorada outro, eu utlizaria o erro tipo III na anova? -- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows. -----Anexo incorporado----- _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Pessoal disculpa só agora que consegui conectar na internet Walmes, é assim tenho 4 substratos, 5 cultivares e cada rep (repetiçao) é considerado um bloco (não sei se é o caso da anaova erro tipo III) e muitas outras variaveis que também apresentam NA (exemplo de dados embaixo do texto). Eu estou tentando trabalhar assim, dados<-read.table("estatistica.txt", header=TRUE) dados library(car) dados$rep<-as.factor(dados$rep) modelo <- lm(ptf ~ subst+cult+rep+subst:cult, data=dados, contrasts = list(subst=contr.sum, cult=contr.sum, rep=contr.sum)) Anova(modelo, type="III") Até o momento eu consigo rodar os dados de este jeito, mas se eu quero rodar os dados como segue me baixo não consigo anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados) Edson, não encontrei nada sobre ?complete.case. Obrigados subst cult rep pesofresco coco setcopa 1 9218,75 coco setcopa 2 18343,75 coco setcopa 3 26750,00 coco setcopa 4 12450,00 coco olympo 1 7281,25 coco olympo 2 30281,25 coco olympo 3 62468,75 coco olympo 4 27906,25 coco fasinio 1 2531,25 coco fasinio 2 23643,75 coco fasinio 3 29062,50 coco fasinio 4 74968,75 coco duradouro 1 22312,50 coco duradouro 2 35593,75 coco duradouro 3 87062,50 coco duradouro 4 47156,25 coco debora 1 22218,75 coco debora 2 48000,00 coco debora 3 40406,25 coco debora 4 19312,50 gado setcopa 1 63093,75 gado setcopa 2 17406,25 gado setcopa 3 50187,50 gado setcopa 4 29281,25 gado olympo 1 59406,25 gado olympo 2 44281,25 gado olympo 3 49437,50 gado olympo 4 42156,25 gado fasinio 1 61406,25 gado fasinio 2 55375,00 gado fasinio 3 6250,00 gado fasinio 4 48812,50 gado duradouro 1 37281,25 gado duradouro 2 9406,25 gado duradouro 3 75187,50 gado duradouro 4 58687,50 gado debora 1 24250,00 gado debora 2 32750,00 gado debora 3 36843,75 gado debora 4 35218,75 carvão setcopa 1 6125,00 carvão setcopa 2 NA carvão setcopa 3 29562,50 carvão setcopa 4 70375,00 carvão olympo 1 37812,50 carvão olympo 2 NA carvão olympo 3 11062,50 carvão olympo 4 48906,25 carvão fasinio 1 81718,75 carvão fasinio 2 NA carvão fasinio 3 NA carvão fasinio 4 72375,00 carvão duradouro 1 9531,25 carvão duradouro 2 NA carvão duradouro 3 29812,50 carvão duradouro 4 66343,75 carvão debora 1 39156,25 carvão debora 2 NA carvão debora 3 8625,00 carvão debora 4 66781,25 solo setcopa 1 17656,25 solo setcopa 2 34218,75 solo setcopa 3 11343,75 solo setcopa 4 31718,75 solo olympo 1 35906,25 solo olympo 2 61468,75 solo olympo 3 38750,00 solo olympo 4 42218,75 solo fasinio 1 19750,00 solo fasinio 2 51468,75 solo fasinio 3 60156,25 solo fasinio 4 17687,50 solo duradouro 1 63937,50 solo duradouro 2 32000,00 solo duradouro 3 21437,50 solo duradouro 4 28500,00 solo debora 1 26593,75 solo debora 2 32968,75 solo debora 3 18687,50 solo debora 4 26312,50 ---------- Forwarded message ---------- From: Gilson Sanchez <gilsonsch@gmail.com> Date: 2011/4/30 Subject: como trabalhar os dados desbalanceados no R To: Grupo R-Br <r-br@listas.c3sl.ufpr.br> Pessoal, mais uma vez consultando vc's tenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo. então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados dados<-read.table("dados.estatistica.txt", header=TRUE) dados attach(dados) anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y) Erro em storage.mode(y) <- "double" : inválido mudar o modo de armazenamento de um fator Além disso: Mensagens de aviso perdidas: In model.response(mf, "numeric") : usando type="numeric" com um fator resposta será ignorada outro, eu utlizaria o erro tipo III na anova?
-- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows. -- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows.

Desculpa, era complete.cases, abaixo um exemplo do help do R. ?complete.cases #Examples x <- airquality[, -1] # x is a regression design matrix y <- airquality[, 1] # y is the corresponding response cbind(x,y) stopifnot(complete.cases(y) != is.na(y)) ok <- complete.cases(x,y) sum(!ok) # how many are not "ok" ? x <- x[ok,] y <- y[ok] cbind(x,y) Nos seus dados, são poucos NA's, porque você não substitui o valor dos NA's pela média dos valores das repetições, você não acha que seria uma saída atenuante ao seu problema? Edson Lira Estatístico Manaus-Amazonas --- Em seg, 2/5/11, Gilson Sanchez <gilsonsch@gmail.com> escreveu: De: Gilson Sanchez <gilsonsch@gmail.com> Assunto: [R-br] Fwd: como trabalhar os dados desbalanceados no R Para: "Grupo R-Br" <r-br@listas.c3sl.ufpr.br> Data: Segunda-feira, 2 de Maio de 2011, 11:19 Pessoal disculpa só agora que consegui conectar na internet Walmes, é assim tenho 4 substratos, 5 cultivares e cada rep (repetiçao) é considerado um bloco (não sei se é o caso da anaova erro tipo III) e muitas outras variaveis que também apresentam NA (exemplo de dados embaixo do texto). Eu estou tentando trabalhar assim, dados<-read.table("estatistica.txt", header=TRUE) dados library(car) dados$rep<-as.factor(dados$rep) modelo <- lm(ptf ~ subst+cult+rep+subst:cult, data=dados, contrasts = list(subst=contr.sum, cult=contr.sum, rep=contr.sum)) Anova(modelo, type="III") Até o momento eu consigo rodar os dados de este jeito, mas se eu quero rodar os dados como segue me baixo não consigo anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados) Edson, não encontrei nada sobre ?complete.case. Obrigados subst cult rep pesofresco coco setcopa 1 9218,75 coco setcopa 2 18343,75 coco setcopa 3 26750,00 coco setcopa 4 12450,00 coco olympo 1 7281,25 coco olympo 2 30281,25 coco olympo 3 62468,75 coco olympo 4 27906,25 coco fasinio 1 2531,25 coco fasinio 2 23643,75 coco fasinio 3 29062,50 coco fasinio 4 74968,75 coco duradouro 1 22312,50 coco duradouro 2 35593,75 coco duradouro 3 87062,50 coco duradouro 4 47156,25 coco debora 1 22218,75 coco debora 2 48000,00 coco debora 3 40406,25 coco debora 4 19312,50 gado setcopa 1 63093,75 gado setcopa 2 17406,25 gado setcopa 3 50187,50 gado setcopa 4 29281,25 gado olympo 1 59406,25 gado olympo 2 44281,25 gado olympo 3 49437,50 gado olympo 4 42156,25 gado fasinio 1 61406,25 gado fasinio 2 55375,00 gado fasinio 3 6250,00 gado fasinio 4 48812,50 gado duradouro 1 37281,25 gado duradouro 2 9406,25 gado duradouro 3 75187,50 gado duradouro 4 58687,50 gado debora 1 24250,00 gado debora 2 32750,00 gado debora 3 36843,75 gado debora 4 35218,75 carvão setcopa 1 6125,00 carvão setcopa 2 NA carvão setcopa 3 29562,50 carvão setcopa 4 70375,00 carvão olympo 1 37812,50 carvão olympo 2 NA carvão olympo 3 11062,50 carvão olympo 4 48906,25 carvão fasinio 1 81718,75 carvão fasinio 2 NA carvão fasinio 3 NA carvão fasinio 4 72375,00 carvão duradouro 1 9531,25 carvão duradouro 2 NA carvão duradouro 3 29812,50 carvão duradouro 4 66343,75 carvão debora 1 39156,25 carvão debora 2 NA carvão debora 3 8625,00 carvão debora 4 66781,25 solo setcopa 1 17656,25 solo setcopa 2 34218,75 solo setcopa 3 11343,75 solo setcopa 4 31718,75 solo olympo 1 35906,25 solo olympo 2 61468,75 solo olympo 3 38750,00 solo olympo 4 42218,75 solo fasinio 1 19750,00 solo fasinio 2 51468,75 solo fasinio 3 60156,25 solo fasinio 4 17687,50 solo duradouro 1 63937,50 solo duradouro 2 32000,00 solo duradouro 3 21437,50 solo duradouro 4 28500,00 solo debora 1 26593,75 solo debora 2 32968,75 solo debora 3 18687,50 solo debora 4 26312,50 ---------- Forwarded message ---------- From: Gilson Sanchez <gilsonsch@gmail.com> Date: 2011/4/30 Subject: como trabalhar os dados desbalanceados no R To: Grupo R-Br <r-br@listas.c3sl.ufpr.br> Pessoal, mais uma vez consultando vc'stenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo. então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados dados<-read.table("dados.estatistica.txt", header=TRUE) dados attach(dados) anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y)
Erro em storage.mode(y) <- "double" : inválido mudar o modo de armazenamento de um fator Além disso: Mensagens de aviso perdidas: In model.response(mf, "numeric") : usando type="numeric" com um fator resposta será ignorada outro, eu utlizaria o erro tipo III na anova? -- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows. -- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows. -----Anexo incorporado----- _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Gilson, São poucos NA, e pelo que vi nos dados não compromete a estimação dos efeitos. Se interação for significativa, dedobre. Se não for, despreze e trabalhe os efeitos principais. Você pode usar a contrast::contrast() e a multcomp::glht(). Fazer imputação dos dados para evitar os NA é um procedimento que desaconselho. (1), substituir pelo valor médio das outras repetições disponíveis vai gerar um desvio de zero, o que vai aumentar os graus liberdade e não aumentar a variância, ou seja, aumentando a precisão sem que exista. Na minha opinião, visto que há recursos disponíveis para o tratamentos dos NA, deve trabalhar apenas com os dados observados, sem imputação. Para uso da contrast() e glht() olha na ridículas do LEG. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Grande Walmes obrigado pelas dicas, mas eu não domino estatistica muito bem, então os pacotes contrast::contrast() e a multcomp::glht(), eles vão me apresentar que resultados, uma anova, comparação de médias (Tukey5%). Eu já trabalhei com esse comandos mas não entendi os resultados Assim, eu consegui trabalhar como se segue (Da melhorar em alguma coisa?) ###----------------------------------------------------------### ### ANALIZANDO VARIAVEL ptf ### ###----------------------------------------------------------### anova.ptf <- lm(ptf ~ rep+subst*cult, data=dados) anova(anova.ptf) require(agricolae) # Coeficiente de variação cv.model(anova.ptf) # Compração de médias (Tukey 5% de probabilidade) compara1 <- HSD.test(anova.ptf, "subst") compara1 <- HSD.test(anova.ptf, "cult") # outros comandos require(contrast) lapply(levels(dados$subst), function(i){ contrast(anova.ptf, type="average", list(subst=i, cult=levels(dados$cult)))}) Erro em gendata.default(fit = list(coefficients = c(32460.5564692982, : not enough factors require(multcomp) summary(glht(anova.ptf, linfct=mcp(subst="Tukey"))) Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means: Tukey Contrasts Fit: lm(formula = ptf ~ rep + subst * cult, data = dados) Linear Hypotheses: Estimate Std. Error t value Pr(>|t|) coco - carvão == 0 -5438.4 15818.4 -0.344 0.986 gado - carvão == 0 -5657.2 15818.4 -0.358 0.984 solo - carvão == 0 -11782.2 15818.4 -0.745 0.878 gado - coco == 0 -218.8 14575.8 -0.015 1.000 solo - coco == 0 -6343.8 14575.8 -0.435 0.972 solo - gado == 0 -6125.0 14575.8 -0.420 0.975 (Adjusted p values reported -- single-step method) Mensagens de aviso perdidas: In mcp2matrix(model, linfct = linfct) : covariate interactions found -- default contrast might be inappropriate ---------- Forwarded message ---------- From: Gilson Sanchez <gilsonsch@gmail.com> Date: 2011/5/2 Subject: Fwd: como trabalhar os dados desbalanceados no R To: Grupo R-Br <r-br@listas.c3sl.ufpr.br> Pessoal disculpa só agora que consegui conectar na internet Walmes, é assim tenho 4 substratos, 5 cultivares e cada rep (repetiçao) é considerado um bloco (não sei se é o caso da anaova erro tipo III) e muitas outras variaveis que também apresentam NA (exemplo de dados embaixo do texto). Eu estou tentando trabalhar assim, dados<-read.table("estatistica.txt", header=TRUE) dados library(car) dados$rep<-as.factor(dados$rep) modelo <- lm(ptf ~ subst+cult+rep+subst:cult, data=dados, contrasts = list(subst=contr.sum, cult=contr.sum, rep=contr.sum)) Anova(modelo, type="III") Até o momento eu consigo rodar os dados de este jeito, mas se eu quero rodar os dados como segue me baixo não consigo anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados) Edson, não encontrei nada sobre ?complete.case. Obrigados subst cult rep pesofresco coco setcopa 1 9218,75 coco setcopa 2 18343,75 coco setcopa 3 26750,00 coco setcopa 4 12450,00 coco olympo 1 7281,25 coco olympo 2 30281,25 coco olympo 3 62468,75 coco olympo 4 27906,25 coco fasinio 1 2531,25 coco fasinio 2 23643,75 coco fasinio 3 29062,50 coco fasinio 4 74968,75 coco duradouro 1 22312,50 coco duradouro 2 35593,75 coco duradouro 3 87062,50 coco duradouro 4 47156,25 coco debora 1 22218,75 coco debora 2 48000,00 coco debora 3 40406,25 coco debora 4 19312,50 gado setcopa 1 63093,75 gado setcopa 2 17406,25 gado setcopa 3 50187,50 gado setcopa 4 29281,25 gado olympo 1 59406,25 gado olympo 2 44281,25 gado olympo 3 49437,50 gado olympo 4 42156,25 gado fasinio 1 61406,25 gado fasinio 2 55375,00 gado fasinio 3 6250,00 gado fasinio 4 48812,50 gado duradouro 1 37281,25 gado duradouro 2 9406,25 gado duradouro 3 75187,50 gado duradouro 4 58687,50 gado debora 1 24250,00 gado debora 2 32750,00 gado debora 3 36843,75 gado debora 4 35218,75 carvão setcopa 1 6125,00 carvão setcopa 2 NA carvão setcopa 3 29562,50 carvão setcopa 4 70375,00 carvão olympo 1 37812,50 carvão olympo 2 NA carvão olympo 3 11062,50 carvão olympo 4 48906,25 carvão fasinio 1 81718,75 carvão fasinio 2 NA carvão fasinio 3 NA carvão fasinio 4 72375,00 carvão duradouro 1 9531,25 carvão duradouro 2 NA carvão duradouro 3 29812,50 carvão duradouro 4 66343,75 carvão debora 1 39156,25 carvão debora 2 NA carvão debora 3 8625,00 carvão debora 4 66781,25 solo setcopa 1 17656,25 solo setcopa 2 34218,75 solo setcopa 3 11343,75 solo setcopa 4 31718,75 solo olympo 1 35906,25 solo olympo 2 61468,75 solo olympo 3 38750,00 solo olympo 4 42218,75 solo fasinio 1 19750,00 solo fasinio 2 51468,75 solo fasinio 3 60156,25 solo fasinio 4 17687,50 solo duradouro 1 63937,50 solo duradouro 2 32000,00 solo duradouro 3 21437,50 solo duradouro 4 28500,00 solo debora 1 26593,75 solo debora 2 32968,75 solo debora 3 18687,50 solo debora 4 26312,50 ---------- Forwarded message ---------- From: Gilson Sanchez <gilsonsch@gmail.com> Date: 2011/4/30 Subject: como trabalhar os dados desbalanceados no R To: Grupo R-Br <r-br@listas.c3sl.ufpr.br> Pessoal, mais uma vez consultando vc's tenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo. então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados dados<-read.table("dados.estatistica.txt", header=TRUE) dados attach(dados) anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y) Erro em storage.mode(y) <- "double" : inválido mudar o modo de armazenamento de um fator Além disso: Mensagens de aviso perdidas: In model.response(mf, "numeric") : usando type="numeric" com um fator resposta será ignorada outro, eu utlizaria o erro tipo III na anova?
-- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows. -- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows. -- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows.

Gilson, Se essa anova apresentar interação significativa, então trabalhe na comparação de médias/efeitos (ou contrastes) de um fator dentro dos demais fatores. Se ela for não significativa, então não declare a fonte de variação interação (ela será somada para o resíduo) e faça teste de hipóteses sobre os efeitos principais anova.ptf <- lm(ptf ~ rep+subst*cult, data=dados) anova(anova.ptf) Você só vai usar esses procedimentos abaixo se não houver interação. O primeiro é o teste de Tukey. O segundo são contrastes de Tukey (todos 2 a 2 possíveis) mas a correção para o p-valor não envolve os procedimentos do teste de Tukey, e sim é usado o single-step method. # Compração de médias (Tukey 5% de probabilidade) compara1 <- HSD.test(anova.ptf, "subst") require(multcomp) summary(glht(anova.ptf, linfct=mcp(subst="Tukey"))) A mensagem de erro abaixo Mensagens de aviso perdidas: In mcp2matrix(model, linfct = linfct) : covariate interactions found -- default contrast might be inappropriate Aparece porque não há sentido em comparar efeitos principais na presença de interações. É por isso que você deve remover o termo interação do modelo se ela não for significativa. No caso de interação, tente adaptar os procedimentos que eu coloquei nas Ridículas do LEG. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Valeu Walmes, consegui fazer os análises. Obrigado ---------- Forwarded message ---------- From: Gilson Sanchez <gilsonsch@gmail.com> Date: 2011/4/30 Subject: como trabalhar os dados desbalanceados no R To: Grupo R-Br <r-br@listas.c3sl.ufpr.br> Pessoal, mais uma vez consultando vc's tenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições e muitas variáves de estudo. então dentro das avaliações ele perdeu alguns dados, no SAS esses dados perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando eu tento fazer uma anova eu não consigo, sai erro, então como eu posso trabalhar com esses tipos de dados dados<-read.table("dados.estatistica.txt", header=TRUE) dados attach(dados) anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y) Erro em storage.mode(y) <- "double" : inválido mudar o modo de armazenamento de um fator Além disso: Mensagens de aviso perdidas: In model.response(mf, "numeric") : usando type="numeric" com um fator resposta será ignorada outro, eu utlizaria o erro tipo III na anova?
-- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows. -- MSc. Gilson Sánchez Chia Laboratório de Fisiologia Vegetal Embrapa Amazônia Ocidental Fone: (92) 3303-7841 --- Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente. Please consider the environment before printing this email. Renew, Reduce and Recycle. The Planet Knows.
participantes (3)
-
Edson Lira
-
Gilson Sanchez
-
Walmes Zeviani