[R-br] split-plot

Fabiana Schneck fabiana.schneck em gmail.com
Quinta Dezembro 15 10:22:29 BRST 2011


Oi Walmes,

São 10 blocos, 5 deles em remansos e outros cinco em corredeiras.

Em cada bloco existem dois plots colocados lado a lado, sendo um com
exclusão elétrica e outro sem exclusão (ou seja, controle). Dentro de cada
um desses dois plots existem substratos de acrílico lisos e rugosos.

Preciso avaliar o efeito do habitat (remansos x corredeiras), o efeito da
exclusão (exclusão x controle) e o efeito do tipo de substrato (liso x
rugoso) levando em conta o design em spli-plot.

Ficou mais claro?

Obrigada,
Fabiana






Em 13 de dezembro de 2011 17:38, <r-br-request em listas.c3sl.ufpr.br>escreveu:

> Enviar submissões para a lista de discussão R-br para
>        r-br em listas.c3sl.ufpr.br
>
> Para se cadastrar ou descadastrar via WWW, visite o endereço
>        https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> ou, via email, envie uma mensagem com a palavra 'help' no assunto ou
> corpo da mensagem para
>        r-br-request em listas.c3sl.ufpr.br
>
> Você poderá entrar em contato com a pessoa que gerencia a lista pelo
> endereço
>        r-br-owner em listas.c3sl.ufpr.br
>
> Quando responder, por favor edite sua linha Assunto assim ela será
> mais específica que "Re: Contents of R-br digest..."
>
>
> Tópicos de Hoje:
>
>   1. split-plot (Fabiana Schneck)
>   2. Re: Transformar Variáveis discretas em Numeros Binários ->
>      Pre-processamento para Redes Neurais (Elias T. Krainski)
>   3. Rotina order (Edson Lira)
>   4. Re: Rotina order (Elias T. Krainski)
>   5. Re: MQM (Elias T. Krainski)
>   6. Re: Modificar valores de dataframe com base em outro
>      dataframe (Elias T. Krainski)
>   7. Categorização de variáveis (Edson Lira)
>   8. Re: Categorização de variáveis (Luis Iván Ortiz Valencia)
>   9. Re: Categorização de variáveis (Cesar Rabak)
>  10. Re: Categorização de variáveis (Elias T. Krainski)
>  11. Re: Categorização de variáveis (Edson Lira)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Tue, 13 Dec 2011 12:25:13 -0200
> From: Fabiana Schneck <fabiana.schneck em gmail.com>
> To: r-br <r-br em listas.c3sl.ufpr.br>
> Subject: [R-br] split-plot
> Message-ID:
>        <CALjK-AcaG3AELQAOopMDZ1X7oFYOzNg4957pn3-3BG9J+t07oA em mail.gmail.com
> >
> Content-Type: text/plain; charset="windows-1252"
>
> Prezados colegas,
>
> tenho um experimento com o seguinte design split-plot:
>
> fator 'ambiente': 5 corredeiras e 5 remansos
> em cada plot de 'ambiente' (num total de 10) há outro fator: 'peixes' com
> dois tratamentos: exclusão e controle
> ainda, dentro de cada sub-plot do fator 'peixes' existe o fator 'substrato'
> com dois tratamentos: liso e rugoso.
>
> A variável resposta é quantidade de clorofila em cada unidade experimental
> (cada substrato).
> Um exemplo dos dados:
>
>
>
> clorofila
>
> ambiente
>
> peixes
>
> substrato
>
> bloco
>
> 0.114
>
> 1
>
> 1
>
> 1
>
> 1
>
> 0.160
>
> 1
>
> 1
>
> 2
>
> 1
>
> 0.126
>
> 1
>
> 2
>
> 1
>
> 1
>
> 0.149
>
> 1
>
> 2
>
> 2
>
> 1
>
> 0.068
>
> 1
>
> 1
>
> 1
>
> 2
>
> 0.137
>
> 1
>
> 1
>
> 2
>
> 2
>
> 0.080
>
> 1
>
> 2
>
> 1
>
> 2
>
> 0.160
>
> 1
>
> 2
>
> 2
>
> 2
> ....
> ....
>
> 0.080
>
> 2
>
> 1
>
> 1
>
> 10
>
> 0.068
>
> 2
>
> 1
>
> 2
>
> 10
>
> 0.114
>
> 2
>
> 2
>
> 1
>
> 10
>
> 0.124
>
> 2
>
> 2
>
> 2
>
> 10
>
> Considerei que os fatores 'peixes' e 'substrato' estão em blocos (10),
> enquanto o fator 'ambiente' está acima dos blocos (5 blocos são no ambiente
> corredeiras e 5 no ambiente remansos).
>
> Analise os dados utilizando dois modelos distintos:
>
> *aov (log(cloro)~(amb+peixes+substrato)^2+Error(bloco/peixes))*
> *
> *
>
> Error: bloco
>
>          Df Sum Sq Mean Sq F value Pr(>F)
>
> amb        1 0.1162 0.11618   0.128 0.7297
>
> Residuals  8 7.2599 0.90749
>
>
>
> Error: bloco:peixes
>
>           Df  Sum Sq Mean Sq F value   Pr(>F)
>
> peixes      1 2.96190 2.96190 14.6147 0.005069 **
>
> amb:peixes  1 0.30121 0.30121  1.4862 0.257528
>
> Residuals   8 1.62133 0.20267
>
> ---
>
> Signif. codes:  0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
>
>
>
> Error: Within
>
>                 Df Sum Sq Mean Sq F value   Pr(>F)
>
> substrato         1 1.9924 1.99244 10.2620 0.005209 **
>
> amb:substrato     1 0.0013 0.00134  0.0069 0.934840
>
> peixes:substrato  1 0.5934 0.59335  3.0560 0.098473 .
>
> Residuals        17 3.3007 0.19416
>
>
> *
> *
> *lme(log(cloro)~(amb+peixes+**substrato)^2, random=~1|bloco/peixes))*
>
> Linear mixed-effects model fit by REML
>  Data: NULL
>       AIC      BIC    logLik
>  85.58484 100.5499 -32.79242
>
> Random effects:
>  Formula: ~1 | bloco
>        (Intercept)
> StdDev:   0.4197679
>
>  Formula: ~1 | peixes %in% bloco
>        (Intercept)  Residual
> StdDev:  0.06522495 0.4406333
>
> Fixed effects: log(cloro) ~ (amb + peixes + substrato)^2
>                        Value Std.Error DF   t-value p-value
> (Intercept)        -2.4342471 0.2647064 17 -9.196027  0.0000
> amb2               -0.2929029 0.3611524  8 -0.811023  0.4408
> peixes2             0.6142687 0.2448449  8  2.508808  0.0364
> substrato2          0.6783940 0.2413448 17  2.810891  0.0120
> amb2:peixes2        0.3471056 0.2847218  8  1.219104  0.2575
> amb2:substrato2     0.0231237 0.2786810 17  0.082976  0.9348
> peixes2:substrato2 -0.4871762 0.2786810 17 -1.748150  0.0985
>  Correlation:
>                   (Intr) amb2   peixs2 sbstr2 amb2:p2 amb2:s2
> amb2               -0.682
> peixes2            -0.462  0.229
> substrato2         -0.456  0.223  0.329
> amb2:peixes2        0.269 -0.394 -0.581  0.000
> amb2:substrato2     0.263 -0.386  0.000 -0.577  0.000
> peixes2:substrato2  0.263  0.000 -0.569 -0.577  0.000   0.000
>
> Standardized Within-Group Residuals:
>        Min          Q1         Med          Q3         Max
> -2.42000225 -0.41789060 -0.02451742  0.44159262  1.87090777
>
> Number of Observations: 40
> Number of Groups:
>            bloco peixes %in% bloco
>               10                20
>
>
>
> Tenho dúvidas se estou definindo de forma correta os modelos e também se
> devo usar aov ou lme, uma vez que os resultados dos termos isolados diferem
> entre as duas funções (porém os resultados são indênticos para as
> interações).
>
> Desde já obrigada pela atenção,
>
> Fabiana
>
> --
> -----
> Fabiana Schneck
> Programa de Pós-Graduação em Ecologia
> Universidade Federal do Rio Grande do Sul
> CP 15007 - CEP 91501-970
> Porto Alegre, RS, Brasil
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/6ca4ee6e/attachment-0001.html
> >
>
> ------------------------------
>
> Message: 2
> Date: Tue, 13 Dec 2011 06:30:03 -0800 (PST)
> From: "Elias T. Krainski" <eliaskrainski em yahoo.com.br>
> To: "r-br em listas.c3sl.ufpr.br" <r-br em listas.c3sl.ufpr.br>
> Subject: Re: [R-br] Transformar Variáveis discretas em Numeros
>        Binários -> Pre-processamento para Redes Neurais
> Message-ID:
>        <1323786603.22667.YahooMailNeo em web114716.mail.gq1.yahoo.com>
> Content-Type: text/plain; charset="iso-8859-1"
>
> Fernando, talvez eu não tenha entendido exatamente o que você quer. Veja
> dois exemplos, considerando as colunas 2 e 3 de 'warpbreaks' (disponivel no
> 'datasets', como o 'iris').
>
>
> ### Considerando que um 'factor' é um inteiro, apenas retiramos os
> 'levels', e vc pode manipular
> ### Se ha 3 ou mais classes, o resultado nao é binário, é inteiro de 1 ao
> número de classes
> sapply(warpbreaks[,2:3], unclass)
> sapply(warpbreaks[,2:3], unclass)-1
>
>
> ### converte em colunas binárias, como dummies em qualquer modelo regressão
>
> ### se há mais de duas classes, é criado mais de uma coluna
> model.matrix(~wool + tension, warpbreaks)[,-1]
>
>
> Att.
>
> Elias T. Krainski
>
>
> >________________________________
> > De: Fernando Neto <fernandoneto7 em gmail.com>
> >Para: r-br em listas.c3sl.ufpr.br
> >Enviadas: Segunda-feira, 12 de Dezembro de 2011 21:32
> >Assunto: [R-br] Transformar Variáveis discretas em Numeros Binários ->
> Pre-processamento para Redes Neurais
> >
> >
> >Boa noite, R-anos!
> >Por favor, estou precisando ajustar os arquivos de uma base de dados para
> processamento de uma RNA.
> >Estou usando a função decodeClassLabels(...) mas a operacao tá ficando
> muito custosa.
> >Por exemplo
> >__
> >Masculino Programador
> >Masculino Médico
> >Feminino Programador
> >__
> >tem que ser
> >__
> >0 1     0 1
> >1 0     1 0
> >__
> >
> >
> >Só que eu trato cada variável de cada vez. E acho que a operacao de
> concatenacao que eu uso:
> >cbind(...) tá tornando a operacao custosa (além de que a memória passa de
> 2GB).
> >
> >
> >PS.: eu faço o seguinte:
> >
> >
> >for (i in (VETOR COM AS COLUNAS A SEREM TRANSFORMADAS)){
> >    colAux = decodeClassLabels(vector[,i])
> >   vector = vector [,-i]
> >   vector = cbind(vector, colAux)
> >}
> >
> >
> >Alguém sugere algo?
> >
> >
> >Muito grato!!!
> >Fernando
> >
> >
> >--
> >----------------------------------------------------------------
> >
> >Fernando Neto
> >Twitter: @fernandompneto
> >Facebook: facebook.com/fernandompneto
> >
> >Tecnologia de Ponte
> >http://tecnologiadeponte.blogspot.com
> >----------------------------------------------------------------
> >fmpn2 @ CIn - UFPE
> >http://cin.ufpe.br/~fmpn2
> >
> >- Engenharia da Computação - Turma 2009.2 - CIn, UFPE.
> >- Monitor de Estatistica e Probabilidade Para Engenharia da Computacao
> >
> >
> >----------------------------------------------------------------
> >Confidencialidade*: *A informação contida nesta mensagem de e-mail,
> >incluindo quaisquer anexos, é confidencial e está reservada apenas à
> pessoa ou entidade para a qual foi endereçada. Se você não é o destinatário
> ou a pessoa responsável por encaminhar esta mensagem ao destinatário, você
> está, por meio desta, notificado que não deverá rever, retransmitir,
> imprimir, copiar, usar ou distribuir esta mensagem de e-mail ou quaisquer
> anexos. Caso você tenha recebido esta mensagem por engano, por favor,
> contate o remetente imediatamente e apague esta mensagem de seu computador
> ou de qualquer outro banco de dados. Muito obrigado.
> >Confidentiality Notice: The information contained in this email
> message, including any attachment, is confidential and is intended only for
> the person or entity to which it is addressed. If you are neither the
> intended recipient nor the employee or agent responsible for delivering
> this message to the intended recipient, you are hereby notified that you
> may not review, retransmit, convert to hard copy, copy, use or distribute
> this email message or any attachments to it. If you have received this
> email in error, please contact the sender immediately and delete this
> message from any computer or other data bank. Thank you.
> >
> >--------
> >
> >_______________________________________________
> >R-br mailing list
> >R-br em listas.c3sl.ufpr.br
> >https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> >Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
> >
> >
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/19fb4b33/attachment-0001.html
> >
>
> ------------------------------
>
> Message: 3
> Date: Tue, 13 Dec 2011 07:22:54 -0800 (PST)
> From: Edson Lira <edinhoestat em yahoo.com.br>
> To: R-br Lista <r-br em listas.c3sl.ufpr.br>
> Subject: [R-br] Rotina order
> Message-ID:
>        <1323789774.75434.YahooMailNeo em web160704.mail.bf1.yahoo.com>
> Content-Type: text/plain; charset="iso-8859-1"
>
> Bom dia a todos!
>
> Com a rotina abaixo eu consigo ordenar a tabela.
>
> inap<-table(tip_doa$INAPTIDAO,tip_doa$mês)
> inap2 = inap[order(rowSums(inap), decreasing=TRUE),]
> ftable(addmargins(inap2, c(1,2),
>      FUN=list(Total = sum)))
>
> Que me dá a saida abaixo(as primeiras linhas)
>
>                                                                     jan
> fev   mar   abr   mai   jun   jul   ago   set   out   nov Total
>
> ESTEVE EM ZONA DE MALARIA                                        465
> 443   387   362   343   347   343   385   550   397   409  4431
> HEMATOCRITO IRREGULAR                                            299
> 387   478   473   576   393   266   307   362   381   333  4255
> VARIAÇÃO DE PARCEIRO SEM PRESERVATIVO (MAIS DE 4 EM 12 MESES)    249
> 329   240   152   100   183   150    86   110   124   106  1829
> VARIAÇÃO DE PARCEIROS SEM PRESERVATIVO (MAIS DE 1 EM 6 MESES)    190
> 206   147    83    73   104    87    58   103    56   102  1209
> VARIAÇÃO DE PARCEIROS SEXUAIS SEM PRESERVATIVO                     0
> 0    20   106   238   135   109   138   134   142   160  1182
> GRIPE                                                            119
> 112   125    98   105   112    75    96    90    84   102  1118
>
> Gostaria de acrescentar o ano e ordenar. Quando acrescento o ano me dá o
> seguinte problema.
>
> > inap<-table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
> > inap2 = inap[order(rowSums(inap),decreasing=TRUE),]
> Erro em inap[order(rowSums(inap), decreasing = TRUE), ] :
>   número incorreto de dimensões
> > inap<-table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
> > inap2 = inap[order(rowSums(inap),decreasing=TRUE),]
> Erro em inap[order(rowSums(inap), decreasing = TRUE), ] :
>   número incorreto de dimensões
> > ftable(addmargins(inap2, c(1,2,3),
> +      FUN=list(Total = sum)))
> Erro em newdimnames[[margin]] : índice fora de limites
>
> Qual o problema? Alguém pode me ajudar?
>
>  []'s.
>
>
> Edson Lira
> Estatístico
> Manaus-Amazonas
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/d6d0f94c/attachment-0001.html
> >
>
> ------------------------------
>
> Message: 4
> Date: Tue, 13 Dec 2011 07:43:37 -0800 (PST)
> From: "Elias T. Krainski" <eliaskrainski em yahoo.com.br>
> To: "r-br em listas.c3sl.ufpr.br" <r-br em listas.c3sl.ufpr.br>,      Edson Lira
>        <edinhoestat em yahoo.com.br>
> Subject: Re: [R-br] Rotina order
> Message-ID:
>        <1323791017.65689.YahooMailNeo em web114705.mail.gq1.yahoo.com>
> Content-Type: text/plain; charset="iso-8859-1"
>
> Com
>
>   inap <- table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
> 'inap' deixa de ter duas dimensões. Portanto, rowSums() é inadequado.
>
>
> Elias T. Krainski
>
>
> >________________________________
> > De: Edson Lira <edinhoestat em yahoo.com.br>
> >Para: R-br Lista <r-br em listas.c3sl.ufpr.br>
> >Enviadas: Terça-feira, 13 de Dezembro de 2011 13:22
> >Assunto: [R-br] Rotina order
> >
> >
> >Bom dia a todos!
> >
> >Com a rotina abaixo eu consigo ordenar a tabela.
> >
> >inap<-table(tip_doa$INAPTIDAO,tip_doa$mês)
> >inap2 = inap[order(rowSums(inap), decreasing=TRUE),]
> >ftable(addmargins(inap2, c(1,2),
> >     FUN=list(Total = sum)))
> >
> >Que me dá a saida abaixo(as primeiras linhas)
> >
> >                                                                    jan
> fev   mar   abr   mai   jun   jul   ago   set   out   nov Total
> >
> >ESTEVE EM ZONA DE MALARIA                                        465
> 443   387   362   343   347   343   385   550   397   409  4431
> >HEMATOCRITO IRREGULAR                                            299
> 387   478   473   576   393   266   307   362   381   333  4255
> >VARIAÇÃO DE PARCEIRO SEM PRESERVATIVO (MAIS DE 4 EM 12 MESES)    249
> 329   240   152   100   183   150    86   110   124   106  1829
> >VARIAÇÃO DE PARCEIROS SEM PRESERVATIVO (MAIS DE 1 EM 6 MESES)    190
> 206   147    83    73   104    87    58   103    56   102  1209
> >VARIAÇÃO DE PARCEIROS SEXUAIS SEM PRESERVATIVO                     0
> 0    20   106   238   135   109   138   134   142   160  1182
> >GRIPE                                                            119
> 112   125    98   105   112    75    96    90    84   102  1118
> >
> >Gostaria de acrescentar o ano e ordenar. Quando acrescento o ano me dá o
> seguinte problema.
> >
> >>
>  inap<-table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
> >> inap2 = inap[order(rowSums(inap),decreasing=TRUE),]
> >Erro em inap[order(rowSums(inap), decreasing = TRUE), ] :
> >  número incorreto de dimensões
> >> inap<-table(tip_doa$INAPTIDAO,tip_doa$ano,tip_doa$mês)
> >> inap2 = inap[order(rowSums(inap),decreasing=TRUE),]
> >Erro em inap[order(rowSums(inap), decreasing = TRUE), ] :
> >  número incorreto de dimensões
> >> ftable(addmargins(inap2, c(1,2,3),
> >+      FUN=list(Total = sum)))
> >Erro em newdimnames[[margin]] : índice fora de limites
> >
> >Qual o problema? Alguém pode me ajudar?
> >
> > []'s.
> >
> >
> >Edson Lira
> >Estatístico
> >Manaus-Amazonas
> >_______________________________________________
> >R-br mailing list
> >R-br em listas.c3sl.ufpr.br
> >https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> >Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
> >
> >
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/53dc517b/attachment-0001.html
> >
>
> ------------------------------
>
> Message: 5
> Date: Tue, 13 Dec 2011 08:00:29 -0800 (PST)
> From: "Elias T. Krainski" <eliaskrainski em yahoo.com.br>
> To: "r-br em listas.c3sl.ufpr.br" <r-br em listas.c3sl.ufpr.br>
> Subject: Re: [R-br] MQM
> Message-ID:
>        <1323792029.83765.YahooMailNeo em web114716.mail.gq1.yahoo.com>
> Content-Type: text/plain; charset="iso-8859-1"
>
> Se em
>
>   A b = x
> A tem dimensão 3x3, então vc quer encontrar 6 valore. Para isso, vc tem 3
> valores em b e 3 valores em x. Isso é possível? No usual, quando vc quer
> saber os 3 valores de b e conhece A e x, vc tem bem mais valores conhecidos
> que desconhecidos.
>
>
> ### Exemplo
>
> ### considerando o contexto de LM
> n <- 5
> X <- cbind(1, runif(5))
> b <- c(10, 5)
> y <- rnorm(n, X%*%b, 0.5)
>
>
> ### estima b
> (XX <- crossprod(X))
> (Xy <- crossprod(X, y))
> (bhat <- solve(XX, Xy))
>
> ### com bhat e Xy podemos obter XX?
> ### considere que
> ###   XX %*% bhat = Xy
> ### para compatibilidade de operações seja
> ###   XX %*% (bhat %*% bhat') = Xy %*% bhat'
>
> require(Matrix)
> bb <- forceSymmetric(tcrossprod(bhat))
> solve(bb, tcrossprod(Xy, bhat)) ## nao é igual a XX
>
> pode ser que este 'sistema' possua mais de uma solução...
>
>
> Att.
>
> Elias T. Krainski
>
>
> >________________________________
> > De: FHRB Toledo <fernandohtoledo em gmail.com>
> >Para: R-Br <r-br em listas.c3sl.ufpr.br>
> >Enviadas: Domingo, 11 de Dezembro de 2011 12:07
> >Assunto: [R-br] MQM
> >
> >
> >Senhores,
> >
> >Tenho uma dúvida que não necessáriamente se relaciona com o programa, mas
> que em muito tem a ver com teoria estatística e algebra de matrizes, espero
> que aqui ache pelo menos uma sugestão para a resposta ou uma recomendação
> de literatura.
> >
> >O problema é dado o sistema de equações na forma matricial: Xb = y, pelo
> MQM, dada a matriz X e o vetor y, obtenho o vetor de soluções por X^-1y,
> respeitando todas as pressuposições.
> >
> >Se caso conheço ao invés de X e y, conheço os vetores b e y, existe
> alguma forma de conhecer a matriz X, podendo apenas assegurar que ela é uma
> matriz quadrada simétrica e positiva definida?
> >
> >att,
> >FH
> >
> >_______________________________________________
> >R-br mailing list
> >R-br em listas.c3sl.ufpr.br
> >https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> >Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
> >
> >
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/018859e7/attachment-0001.html
> >
>
> ------------------------------
>
> Message: 6
> Date: Tue, 13 Dec 2011 08:06:38 -0800 (PST)
> From: "Elias T. Krainski" <eliaskrainski em yahoo.com.br>
> To: "r-br em listas.c3sl.ufpr.br" <r-br em listas.c3sl.ufpr.br>
> Subject: Re: [R-br] Modificar valores de dataframe com base em outro
>        dataframe
> Message-ID:
>        <1323792398.50539.YahooMailNeo em web114717.mail.gq1.yahoo.com>
> Content-Type: text/plain; charset="iso-8859-1"
>
>  d1 <- data.frame(snp1=c("A","A","A","A","T"), snp2=c("A","G","G","A","G"),
>
>                              snp3=c("C","T","C","C","T"),
> snp4=c("T","G","G","T","T"))
>
>
>  d2 <- data.frame(snp=paste("snp",1:4,sep=""), anc=c("A","G","C","T"))
>
>  sapply(1:ncol(d1), function(i)
> 1-(as.character(d1[,i])==as.character(d2[i,2])))
>
>
> Elias T. Krainski
>
>
> >________________________________
> > De: João José de Simoni Gouveia <joao.gouveia em univasf.edu.br>
> >Para: r-br em listas.c3sl.ufpr.br
> >Enviadas: Sábado, 10 de Dezembro de 2011 22:21
> >Assunto: [R-br] Modificar valores de dataframe com base em outro dataframe
> >
> >Prezados,
> >
> >Possuo dois dataframes (nomeados aqui de 1 e 2). Preciso modificar os
> valores do dataframe1 com base no dataframe2.
> >Mais precisamente:
> >Se os valores da coluna snp1 (dataframe1) forem iguais ao valor da linha
> snp1 (dataframe2), preciso converter estes valores para 0 (zero), caso
> contrário o valor deve ser convertido para 1 (um).
> >Alguém tem alguma dica?
> >Att
> >JJ
> >Abaixo uma ilustração do que eu tenho
> >DataFrame 1 -->
> >   snp1 snp2 snp3 snp4
> >1     A    A    C    T
> >2     A    G    T    G
> >3     A    G    C    G
> >4     A    A    C    T
> >5     T    G    T    T
> >
> >DataFrame 2 -->
> >   snp       anc
> >1 snp1         A
> >2 snp2         G
> >3 snp3         C
> >4 snp4         T
> >
> >E o que eu preciso ter:
> >Dataframe final -->
> >   snp1 snp2 snp3 snp4
> >1     0    1    0    0
> >2     0    0    1    1
> >3     0    0    0    1
> >4     0    1    0    0
> >5     1    0    1    0
> >
> >--
> >============================================
> >João José de Simoni Gouveia
>
> >Médico Veterinário, Msc.
> >Doutorando em Zootecnia - PDIZ (UFC/UFPB/UFRPE)
>
> >Professor Assistente I - Colegiado Acadêmico de Zootecnia
> >Universidade Federal do Vale do São Francisco (UNIVASF)
>
> >----------------------------------------------------------------------------------------
> >Endereço: UNIVASF (Campus Ciências Agrárias)
> >Rodovia BR 407, Km 12, Lote 543
> >Projeto de Irrigação Senador Nilo Coelho, s/nº-C1
> >Petrolina, PE - CEP 56.300-000
>
> >Telefone: (87)3986-3800/3804-3801
> >Skype: joao_jose_de_simoni_gouveia
> >E-mail alternativo: jjsgouveia em gmail.com
>
> >============================================
> >_______________________________________________
> >R-br mailing list
> >R-br em listas.c3sl.ufpr.br
> >https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> >Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
> >
> >
> >
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/7ca47fe5/attachment-0001.html
> >
>
> ------------------------------
>
> Message: 7
> Date: Tue, 13 Dec 2011 09:54:57 -0800 (PST)
> From: Edson Lira <edinhoestat em yahoo.com.br>
> To: R-br Lista <r-br em listas.c3sl.ufpr.br>
> Subject: [R-br] Categorização de variáveis
> Message-ID:
>        <1323798897.47220.YahooMailNeo em web160703.mail.bf1.yahoo.com>
> Content-Type: text/plain; charset="iso-8859-1"
>
> Boa tarde, caros r-istas, estou com alguns probleminhas na categorização
> de variáveis.
>
> Tenho este banco.
>     pad pas     sexo  pg
> 155 134  83 feminino  15
> 156  72  99 feminino  30
> 157  82 151 feminino  10
> 158  23  70 feminino  20
> 159  75 128 masculino 13
> 160  73 125 feminino  05
> 161 125  80 masculino 08
> 162  65 110 feminino  10
> 163 132  92 masculino 13
> 164 114  68 masculino 11
> 165  83 153 feminino  26
> 166 166 107 masculino 22
> 167 114  76 feminino  03
>
>
>
> Preciso classificar da seguinte forma:
> se pad<85 e pas<130 é normal
> se 85<pad<89 e 130<pas<139 Normal limítrofe
> e assim por diante.
>
>
>
> a outra classificação é a seguinte:
>
> Para homens o percentual de gordura
>
> entre 15 e 20 é normal
>
> entre 20 e 25 levemente obeso
> entre 25 e 30 excessivamente obeso
> entre 10 e 14 gordura ideal
>             3 gordura essencial
>
>
>
>
>
> Para homens o percentual de gordura
>
> entre 25 e 30 é normal
>
> entre 30 e 35 levemente obeso
> entre 35 e 40 excessivamente obeso
> entre 14 e 18 gordura ideal
>            12 gordura essencial
>
>
>
>
> Como fazer estaS categorizações?
>
> []'s.
>
> Edson Lira
> Estatístico
> Manaus-Amazonas
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/ddf3f837/attachment-0001.html
> >
>
> ------------------------------
>
> Message: 8
> Date: Tue, 13 Dec 2011 15:58:43 -0200
> From: Luis Iván Ortiz Valencia <liov2067 em gmail.com>
> To: r-br em listas.c3sl.ufpr.br, Edson Lira <edinhoestat em yahoo.com.br>
> Subject: Re: [R-br] Categorização de variáveis
> Message-ID:
>        <CAJ+S-MHuH4RMQ35u092HTUwcCfMP3nqkR+WdzyouauFD9Yhhng em mail.gmail.com
> >
> Content-Type: text/plain; charset="iso-8859-1"
>
> cut()
>
> Em 13 de dezembro de 2011 15:54, Edson Lira <edinhoestat em yahoo.com.br
> >escreveu:
>
> > Boa tarde, caros r-istas, estou com alguns probleminhas na categorização
> > de variáveis.
> >
> > Tenho este banco.
> >     pad pas     sexo  pg
> > 155 134  83 feminino  15
> > 156  72  99 feminino  30
> > 157  82 151 feminino  10
> > 158  23  70 feminino  20
> > 159  75 128 masculino 13
> > 160  73 125 feminino  05
> > 161 125  80 masculino 08
> > 162  65 110 feminino  10
> > 163 132  92 masculino 13
> > 164 114  68 masculino 11
> > 165  83 153 feminino  26
> > 166 166 107 masculino 22
> > 167 114  76 feminino  03
> >
> >
> > Preciso classificar da seguinte forma:
> > se pad<85 e pas<130 é normal
> > se 85<pad<89 e 130<pas<139 Normal limítrofe
> > e assim por diante.
> >
> >
> > a outra classificação é a seguinte:
> >
> > Para homens o percentual de gordura
> >
> > entre 15 e 20 é normal
> > entre 20 e 25 levemente obeso
> > entre 25 e 30 excessivamente obeso
> > entre 10 e 14 gordura ideal
> >             3 gordura essencial
> >
> >
> >
> >  Para homens o percentual de gordura
> >
> >  entre 25 e 30 é normal
> >  entre 30 e 35 levemente obeso
> > entre 35 e 40 excessivamente obeso
> > entre 14 e 18 gordura ideal
> >            12 gordura essencial
> >
> >
> > Como fazer estaS categorizações?
> >
> >  []'s.
> >
> > Edson Lira
> > Estatístico
> > Manaus-Amazonas
> >
> > _______________________________________________
> > R-br mailing list
> > R-br em listas.c3sl.ufpr.br
> > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> > código mínimo reproduzível.
> >
>
>
>
> --
> Luis Iván Ortiz Valencia
> Doutorando Saúde Pública - Epidemiologia, IESC, UFRJ
> Estatístico Msc.
> Spatial Analyst Msc.
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111213/2702a502/attachment-0001.html
> >
>
> ------------------------------
>
> Message: 9
> Date: Tue, 13 Dec 2011 15:14:02 -0300
> From: Cesar Rabak <cesar.rabak em gmail.com>
> To: r-br em listas.c3sl.ufpr.br
> Subject: Re: [R-br] Categorização de variáveis
> Message-ID: <4EE795EA.6090407 em gmail.com>
> Content-Type: text/plain; charset=ISO-8859-1; format=flowed
>
> Edson,
>
> Use o pacote car e a função recode.
>
> Em 13/12/2011 14:54, Edson Lira escreveu:
> > Boa tarde, caros r-istas, estou com alguns probleminhas na categorização
> > de variáveis.
> >
> > Tenho este banco.
> > pad pas sexo pg
> > 155 134 83 feminino 15
> > 156 72 99 feminino 30
> > 157 82 151 feminino 10
> > 158 23 70 feminino 20
> > 159 75 128 masculino 13
> > 160 73 125 feminino 05
> > 161 125 80 masculino 08
> > 162 65 110 feminino 10
> > 163 132 92 masculino 13
> > 164 114 68 masculino 11
> > 165 83 153 feminino 26
> > 166 166 107 masculino 22
> > 167 114 76 feminino 03
> >
> >
> > Preciso classificar da seguinte forma:
> > se pad<85 e pas<130 é normal
> > se 85<pad<89 e 130<pas<139 Normal limítrofe
> > e assim por diante.
> >
> >
> > a outra classificação é a seguinte:
> >
> > Para homens o percentual de gordura
> >
> > entre 15 e 20 é normal
> > entre 20 e 25 levemente obeso
> > entre 25 e 30 excessivamente obeso
> > entre 10 e 14 gordura ideal
> > 3 gordura essencial
> >
> >
> >
> > Para homens o percentual de gordura
> >
> > entre 25 e 30 é normal
> > entre 30 e 35 levemente obeso
> > entre 35 e 40 excessivamente obeso
> > entre 14 e 18 gordura ideal
> > 12 gordura essencial
> >
> >
> > Como fazer estaS categorizações?
> >
> > []'s.
> >
> > Edson Lira
> > Estatístico
> > Manaus-Amazonas
> >
> >
> > _______________________________________________
> > R-br mailing list
> > R-br em listas.c3sl.ufpr.br
> > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
> --
> Cesar Rabak
> GNU/Linux User 52247.
> Get counted: http://counter.li.org/
>
>
> ------------------------------
>
> Message: 10
> Date: Tue, 13 Dec 2011 10:22:32 -0800 (PST)
> From: "Elias T. Krainski" <eliaskrainski em yahoo.com.br>
> To: "r-br em listas.c3sl.ufpr.br" <r-br em listas.c3sl.ufpr.br>
> Subject: Re: [R-br] Categorização de variáveis
> Message-ID:
>        <1323800552.38193.YahooMailNeo em web114707.mail.gq1.yahoo.com>
> Content-Type: text/plain; charset=iso-8859-1
>
>
>
> se vc enviasse um CMR seria mais fácil... veja este exemplo
>
> n <- 10
> x1 <- rnorm(n)
>
> ### classificação considerando apenas uma variavel
> f1 <- factor(findInterval(x1, c(-Inf, -0.5, 0.5, Inf), labels=c("Ruim",
> "Médio", "Bom"))
>
> quando vc tem:
>
>      se pad<85 e pas<130 é normal
>      >se 85<pad<89 e 130<pas<139 Normal limítrofe
> o que deve ser se pad<85 mas pas>130 por exemplo?
>
> Att.
> Elias T. Krainski
>
>
>
> >________________________________
> > De: Edson Lira <edinhoestat em yahoo.com.br>
> >Para: R-br Lista <r-br em listas.c3sl.ufpr.br>
> >Enviadas: Terça-feira, 13 de Dezembro de 2011 15:54
> >Assunto: [R-br] Categorização de variáveis
> >
> >
> >Boa tarde, caros r-istas, estou com alguns probleminhas na categorização
> de variáveis.
> >
> >
> >Tenho este banco.
> >    pad pas     sexo  pg
> >155 134  83 feminino  15
> >156  72  99 feminino  30
> >157  82 151 feminino  10
> >158  23  70 feminino  20
> >159  75 128 masculino 13
> >160  73 125 feminino  05
> >161 125  80 masculino 08
> >162  65 110 feminino  10
> >163 132  92 masculino 13
> >164 114  68 masculino 11
> >165  83 153 feminino  26
> >166 166 107 masculino 22
> >167 114  76 feminino  03
> >
> >
> >
> >
> >Preciso classificar da seguinte forma:
> >se pad<85 e pas<130 é normal
> >se 85<pad<89 e 130<pas<139 Normal limítrofe
> >e assim por diante.
> >
> >
> >
> >
> >a outra classificação é a seguinte:
> >
> >
> >Para homens o percentual de gordura
> >
> >
> >entre 15 e 20 é normal
> >
> >entre 20 e 25 levemente obeso
> >entre 25 e 30 excessivamente obeso
> >entre 10 e 14 gordura ideal
> >            3 gordura essencial
> >
> >
> >
> >
> >
> >
> >
> >Para homens o percentual de gordura
> >
> >
> >entre 25 e 30 é normal
> >
> >entre 30 e 35 levemente obeso
> >entre 35 e 40 excessivamente obeso
> >entre 14 e 18 gordura ideal
> >           12 gordura essencial
> >
> >
> >
> >
> >
> >Como fazer estaS categorizações?
> >
> >
> >[]'s.
> >
> >
> >Edson Lira
> >Estatístico
> >Manaus-Amazonas
> >_______________________________________________
> >R-br mailing list
> >R-br em listas.c3sl.ufpr.br
> >https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> >Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
> >
> >
>
>
> ------------------------------
>
> Message: 11
> Date: Tue, 13 Dec 2011 15:37:02 -0400
> From: Edson Lira <edinhoestat em yahoo.com.br>
> To: "r-br em listas.c3sl.ufpr.br" <r-br em listas.c3sl.ufpr.br>,      "Elias T.
>        Krainski" <eliaskrainski em yahoo.com.br>
> Subject: Re: [R-br] Categorização de variáveis
> Message-ID: <63652F35-F09C-4C24-8D38-0F462C8DBBF2 em yahoo.com.br>
> Content-Type: text/plain;       charset=utf-8
>
> O problema é que você tem duas variáveis, pas é pressão sistólica
>  e pad é pressão diastólica.  Se pas é menor que 130 e pad é menor que 180
> o paciente é considerado normal e assim por diante.
> [].s
> Edson Lira
> Estatístico
> Ma-Am
>
> Em 13/12/2011, às 14:22, "Elias T. Krainski" <eliaskrainski em yahoo.com.br>
> escreveu:
>
> >
> >
> > se vc enviasse um CMR seria mais fácil... veja este exemplo
> >
> > n <- 10
> > x1 <- rnorm(n)
> >
> > ### classificação considerando apenas uma variavel
> > f1 <- factor(findInterval(x1, c(-Inf, -0.5, 0.5, Inf), labels=c("Ruim",
> "Médio", "Bom"))
> >
> > quando vc tem:
> >
> >      se pad<85 e pas<130 é normal
> >      >se 85<pad<89 e 130<pas<139 Normal limítrofe
> > o que deve ser se pad<85 mas pas>130 por exemplo?
> >
> > Att.
> > Elias T. Krainski
> >
> >
> >
> >> ________________________________
> >> De: Edson Lira <edinhoestat em yahoo.com.br>
> >> Para: R-br Lista <r-br em listas.c3sl.ufpr.br>
> >> Enviadas: Terça-feira, 13 de Dezembro de 2011 15:54
> >> Assunto: [R-br] Categorização de variáveis
> >>
> >>
> >> Boa tarde, caros r-istas, estou com alguns probleminhas na
> categorização de variáveis.
> >>
> >>
> >> Tenho este banco.
> >>     pad pas     sexo  pg
> >> 155 134  83 feminino  15
> >> 156  72  99 feminino  30
> >> 157  82 151 feminino  10
> >> 158  23  70 feminino  20
> >> 159  75 128 masculino 13
> >> 160  73 125 feminino  05
> >> 161 125  80 masculino 08
> >> 162  65 110 feminino  10
> >> 163 132  92 masculino 13
> >> 164 114  68 masculino 11
> >> 165  83 153 feminino  26
> >> 166 166 107 masculino 22
> >> 167 114  76 feminino  03
> >>
> >>
> >>
> >>
> >> Preciso classificar da seguinte forma:
> >> se pad<85 e pas<130 é normal
> >> se 85<pad<89 e 130<pas<139 Normal limítrofe
> >> e assim por diante.
> >>
> >>
> >>
> >>
> >> a outra classificação é a seguinte:
> >>
> >>
> >> Para homens o percentual de gordura
> >>
> >>
> >> entre 15 e 20 é normal
> >>
> >> entre 20 e 25 levemente obeso
> >> entre 25 e 30 excessivamente obeso
> >> entre 10 e 14 gordura ideal
> >>             3 gordura essencial
> >>
> >>
> >>
> >>
> >>
> >>
> >>
> >> Para homens o percentual de gordura
> >>
> >>
> >> entre 25 e 30 é normal
> >>
> >> entre 30 e 35 levemente obeso
> >> entre 35 e 40 excessivamente obeso
> >> entre 14 e 18 gordura ideal
> >>            12 gordura essencial
> >>
> >>
> >>
> >>
> >>
> >> Como fazer estaS categorizações?
> >>
> >>
> >> []'s.
> >>
> >>
> >> Edson Lira
> >> Estatístico
> >> Manaus-Amazonas
> >> _______________________________________________
> >> R-br mailing list
> >> R-br em listas.c3sl.ufpr.br
> >> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> >> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
> >>
> >>
> > _______________________________________________
> > R-br mailing list
> > R-br em listas.c3sl.ufpr.br
> > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
>
> ------------------------------
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>
>
> Fim da Digest R-br, volume 10, assunto 19
> *****************************************
>



-- 
-----
Fabiana Schneck
Programa de Pós-Graduação em Ecologia
Universidade Federal do Rio Grande do Sul
CP 15007 - CEP 91501-970
Porto Alegre, RS, Brasil
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20111215/7feafca6/attachment-0001.html>


Mais detalhes sobre a lista de discussão R-br