[R-br] Fwd: como trabalhar os dados desbalanceados no R

Gilson Sanchez gilsonsch em gmail.com
Segunda Maio 2 15:41:33 BRT 2011


Grande Walmes

obrigado pelas dicas, mas eu não domino estatistica muito bem, então os
pacotes contrast::contrast() e a multcomp::glht(), eles vão me apresentar
que resultados, uma anova, comparação de médias (Tukey5%). Eu já trabalhei
com esse comandos mas não entendi os resultados

Assim, eu consegui trabalhar como se segue (Da melhorar em alguma coisa?)

###----------------------------------------------------------###
###                 ANALIZANDO VARIAVEL ptf              ###
###----------------------------------------------------------###
anova.ptf <- lm(ptf ~ rep+subst*cult, data=dados)
anova(anova.ptf)

require(agricolae)
# Coeficiente de variação
cv.model(anova.ptf)

# Compração de médias (Tukey 5% de probabilidade)
compara1 <- HSD.test(anova.ptf, "subst")
compara1 <- HSD.test(anova.ptf, "cult")
# outros comandos
require(contrast)
lapply(levels(dados$subst),
       function(i){
       contrast(anova.ptf, type="average", list(subst=i,
  cult=levels(dados$cult)))})

Erro em gendata.default(fit = list(coefficients = c(32460.5564692982,  :
  not enough factors

require(multcomp)
summary(glht(anova.ptf, linfct=mcp(subst="Tukey")))
         Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts

Fit: lm(formula = ptf ~ rep + subst * cult, data = dados)
Linear Hypotheses:
                   Estimate Std. Error t value Pr(>|t|)
coco - carvão == 0  -5438.4    15818.4  -0.344    0.986
gado - carvão == 0  -5657.2    15818.4  -0.358    0.984
solo - carvão == 0 -11782.2    15818.4  -0.745    0.878
gado - coco == 0     -218.8    14575.8  -0.015    1.000
solo - coco == 0    -6343.8    14575.8  -0.435    0.972
solo - gado == 0    -6125.0    14575.8  -0.420    0.975
(Adjusted p values reported -- single-step method)
Mensagens de aviso perdidas:
In mcp2matrix(model, linfct = linfct) :
  covariate interactions found -- default contrast might be inappropriate



---------- Forwarded message ----------
From: Gilson Sanchez <gilsonsch em gmail.com>
Date: 2011/5/2
Subject: Fwd: como trabalhar os dados desbalanceados no R
To: Grupo R-Br <r-br em listas.c3sl.ufpr.br>


Pessoal disculpa só agora que consegui conectar na internet

Walmes, é assim tenho 4 substratos, 5 cultivares e cada rep (repetiçao) é
considerado um bloco (não sei se é o caso da anaova erro tipo III) e muitas
outras variaveis que também apresentam NA (exemplo de dados embaixo do
texto).

Eu estou tentando trabalhar assim,

dados<-read.table("estatistica.txt", header=TRUE)
dados
library(car)
dados$rep<-as.factor(dados$rep)
modelo <- lm(ptf ~ subst+cult+rep+subst:cult, data=dados, contrasts =
list(subst=contr.sum,  cult=contr.sum, rep=contr.sum))
Anova(modelo, type="III")

Até o momento eu consigo rodar os dados de este jeito, mas se eu quero rodar
os dados como segue me baixo não consigo

anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)

Edson, não encontrei nada sobre ?complete.case.
Obrigados

   subst cult rep pesofresco  coco setcopa 1 9218,75  coco setcopa 2
18343,75  coco setcopa 3 26750,00  coco setcopa 4 12450,00  coco olympo 1
7281,25  coco olympo 2 30281,25  coco olympo 3 62468,75  coco olympo 4
27906,25  coco fasinio 1 2531,25  coco fasinio 2 23643,75  coco fasinio 3
29062,50  coco fasinio 4 74968,75  coco duradouro 1 22312,50  coco duradouro
2 35593,75  coco duradouro 3 87062,50  coco duradouro 4 47156,25  coco
debora 1 22218,75  coco debora 2 48000,00  coco debora 3 40406,25  coco
debora 4 19312,50  gado setcopa 1 63093,75  gado setcopa 2 17406,25  gado
setcopa 3 50187,50  gado setcopa 4 29281,25  gado olympo 1 59406,25  gado
olympo 2 44281,25  gado olympo 3 49437,50  gado olympo 4 42156,25  gado
fasinio 1 61406,25  gado fasinio 2 55375,00  gado fasinio 3 6250,00  gado
fasinio 4 48812,50  gado duradouro 1 37281,25  gado duradouro 2 9406,25
gado duradouro 3 75187,50  gado duradouro 4 58687,50  gado debora 1 24250,00
gado debora 2 32750,00  gado debora 3 36843,75  gado debora 4 35218,75
carvão setcopa 1 6125,00  carvão setcopa 2       NA  carvão setcopa 3
29562,50  carvão setcopa 4 70375,00  carvão olympo 1 37812,50  carvão olympo
2     NA  carvão olympo 3 11062,50  carvão olympo 4 48906,25  carvão fasinio
1 81718,75  carvão fasinio 2     NA  carvão fasinio 3     NA  carvão fasinio
4 72375,00  carvão duradouro 1 9531,25  carvão duradouro 2     NA  carvão
duradouro 3 29812,50  carvão duradouro 4 66343,75  carvão debora 1 39156,25
carvão debora 2     NA  carvão debora 3 8625,00  carvão debora 4 66781,25
solo setcopa 1 17656,25  solo setcopa 2 34218,75  solo setcopa 3 11343,75
solo setcopa 4 31718,75  solo olympo 1 35906,25  solo olympo 2 61468,75
solo olympo 3 38750,00  solo olympo 4 42218,75  solo fasinio 1 19750,00
solo fasinio 2 51468,75  solo fasinio 3 60156,25  solo fasinio 4 17687,50
solo duradouro 1 63937,50  solo duradouro 2 32000,00  solo duradouro 3
21437,50  solo duradouro 4 28500,00  solo debora 1 26593,75  solo debora 2
32968,75  solo debora 3 18687,50  solo debora 4 26312,50

---------- Forwarded message ----------
From: Gilson Sanchez <gilsonsch em gmail.com>
Date: 2011/4/30
Subject: como trabalhar os dados desbalanceados no R
To: Grupo R-Br <r-br em listas.c3sl.ufpr.br>



Pessoal,

mais uma vez consultando vc's
tenho um amigo que esta avaliando 4 substratos, 5 cultivares e 4 repetições
e muitas variáves de estudo.
então dentro das avaliações ele perdeu alguns dados, no SAS esses dados
perdidos são inseridos como ponto (.) no R são inseridos como NA, mas quando
eu tento fazer uma anova eu não consigo, sai erro, então como eu posso
trabalhar com esses tipos de dados

dados<-read.table("dados.estatistica.txt", header=TRUE)
dados
attach(dados)
anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados)
> anova <- lm(PTF~SUBST+CULT+REPET+SUBST:CULT, data=dados.y)
Erro em storage.mode(y) <- "double" :
  inválido mudar o modo de armazenamento de um fator
Além disso: Mensagens de aviso perdidas:
In model.response(mf, "numeric") :
  usando type="numeric" com um fator resposta será ignorada
outro, eu utlizaria o erro tipo III na anova?

-- 
MSc. Gilson Sánchez Chia

Laboratório de Fisiologia Vegetal

Embrapa Amazônia Ocidental

Fone: (92) 3303-7841
---
Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente.
Please consider the environment before printing this email.
 Renew, Reduce and Recycle. The Planet Knows.



-- 
MSc. Gilson Sánchez Chia

Laboratório de Fisiologia Vegetal

Embrapa Amazônia Ocidental

Fone: (92) 3303-7841
---
Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente.
Please consider the environment before printing this email.
 Renew, Reduce and Recycle. The Planet Knows.




-- 
MSc. Gilson Sánchez Chia

Laboratório de Fisiologia Vegetal

Embrapa Amazônia Ocidental

Fone: (92) 3303-7841
---
Antes de imprimir, pense na sua responsabilidade com o Meio Ambiente.
Please consider the environment before printing this email.
 Renew, Reduce and Recycle. The Planet Knows.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20110502/44194a6b/attachment.html>


Mais detalhes sobre a lista de discussão R-br