[R-br] Dados com ausência de valores para determinadas variáveis e colineariade entre

Cesar Rabak cesar.rabak em gmail.com
Sex Maio 21 22:59:03 -03 2021


Marcelo,

Quantos casos você tem para conseguir estudar todos os compostos?

Por que você acha que uma regressão linear seria um bom modelo para
explicar a existência dos compostos?

Na formulação você busca a interação entre o Genótipo,  o Estado e o
Tratamento.

Você viu na resposta da regressão quantas classes de fatores foram geradas?

Você precisa olhar na documentação como coloca no modelo o fato que tem
repetições.

Por outro lado, se deseja-se estudar o 117 compostos com apenas um número
pequeno de casos (p/m/entendimento oito com três repetições para cada) você
terá que buscar outra abordagem, tipicamente usada em genômica.

HTH

On Thu, May 20, 2021 at 3:19 PM Marcelo Laia por (R-br) <
r-br em listas.c3sl.ufpr.br> wrote:

> Colegas,
>
> Tenho um conjunto de dados conforme modelo abaixo:
>
>
> Genotipo        Tratamento      Repeticao       Composto1       Composto2
>      Composto3       Composto4
> C13     Resistente      SI      R1      0,04    8,77    0
> C13     Resistente      SI      R2      0       8,67    0
> C13     Resistente      SI      R3      0       7,99    0
> C13     Resistente      CI      R1      0,04    33,83   0
> C13     Resistente      CI      R2      0,02    6,68    0
> C13     Resistente      CI      R3      0       7,32    0
> C08     Resistente      SI      R1      0,01    30,48   0,04
> C08     Resistente      SI      R2      0       22,83   0
> C08     Resistente      SI      R3      0       30,66   0
> C08     Resistente      CI      R1      0       30,19   0
> C08     Resistente      CI      R2      0       26,69   0
> C08     Resistente      CI      R3      0       33,55   0
> C17     Suscetível      SI      R1      0,08    16,94   0
> C17     Suscetível      SI      R2      0,06    22,3    0
> C17     Suscetível      SI      R3      0,07    17,19   0
> C17     Suscetível      CI      R1      0,05    17,72   0
> C17     Suscetível      CI      R2      0,05    19,46   0
> C17     Suscetível      CI      R3      0,13    30,15   0
> C11     Suscetível      SI      R1      0,04    30,03   0
> C11     Suscetível      SI      R2      0       38,64   0
> C11     Suscetível      SI      R3      0,06    42,59   0
> C11     Suscetível      CI      R1      0,04    36,96   0
> C11     Suscetível      CI      R2      0       49,7    0
> C11     Suscetível      CI      R3      0       37,67   0,06
>
>
>
> Esse exemplo está disponível no endereço:
> https://www.dropbox.com/s/izccqoifwnjkdlu/Exemplo.csv
>
> Genotipo - diferentes genótipos, incluindo plantas resistentes e
> suscetíveis
>
> Tratamento - SI = sem inoculação; CI = com inoculação
>
> Repeticao - R1 = planta 1; R2 = planta 2; R3 = planta 3
>
> Composto1 a Composton = valor aferido (medido) nas folhas de cada
> planta para o respectivo composto
>
> Interesse:
>
> 1. verificar quais compostos são produzidos em função da inoculação (CI
> vs SI)
>
> 2. verificar quais compostos são produzidos em função do Estado
> (Resistente vs Suscetível)
>
> 3. verificar se o Genotipo interfere na produção de determinado
> composto (composto específico a um dado Genotipo)
>
> 4. verificar se os demais genótipos diferem do E. camaldulensis.
>
> O valor 0 (zero) para um determinado composto não significa zero, mas,
> significa que aquele composto não foi encontrado naquela planta
> (repetição). Logo, 0 significa NA.
>
> A minha ideia é analisar composto a composto separadamente. Tenho 117
> compostos.
>
> Modelo que tentei usar:
>
> dados02 <- read.table(url("
> https://www.dropbox.com/s/izccqoifwnjkdlu/Exemplo.csv?dl=1"), sep="\t",
> header=TRUE, dec=",")
>
> dados02
>
> fit02 <- lm(Composto1 ~ Genotipo * Estado * Tratamento, data=dados02)
>
> summary(fit02)
>
> Aparece o seguinte erro:
>
> Coefficients: (9 not defined because of singularities)
>
> Pelo que li, parece que a variável é colinear ou possui correlação. Não
> sei como resolver.
>
> Outras perguntas:
>
> A minha abordagem está apropriada? Terei que rodar as 117?
>
> Existe uma maneira mais adequada de responder às quatro perguntas
> acima? Principalmente a 1 e 2? Gráficos?
>
> Obrigado!
>
> --
> Marcelo
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20210521/0eaecf66/attachment.html>


Mais detalhes sobre a lista de discussão R-br