[R-br] Dados com ausência de valores para determinadas variáveis e colineariade entre
Cesar Rabak
cesar.rabak em gmail.com
Sex Maio 21 22:59:03 -03 2021
Marcelo,
Quantos casos você tem para conseguir estudar todos os compostos?
Por que você acha que uma regressão linear seria um bom modelo para
explicar a existência dos compostos?
Na formulação você busca a interação entre o Genótipo, o Estado e o
Tratamento.
Você viu na resposta da regressão quantas classes de fatores foram geradas?
Você precisa olhar na documentação como coloca no modelo o fato que tem
repetições.
Por outro lado, se deseja-se estudar o 117 compostos com apenas um número
pequeno de casos (p/m/entendimento oito com três repetições para cada) você
terá que buscar outra abordagem, tipicamente usada em genômica.
HTH
On Thu, May 20, 2021 at 3:19 PM Marcelo Laia por (R-br) <
r-br em listas.c3sl.ufpr.br> wrote:
> Colegas,
>
> Tenho um conjunto de dados conforme modelo abaixo:
>
>
> Genotipo Tratamento Repeticao Composto1 Composto2
> Composto3 Composto4
> C13 Resistente SI R1 0,04 8,77 0
> C13 Resistente SI R2 0 8,67 0
> C13 Resistente SI R3 0 7,99 0
> C13 Resistente CI R1 0,04 33,83 0
> C13 Resistente CI R2 0,02 6,68 0
> C13 Resistente CI R3 0 7,32 0
> C08 Resistente SI R1 0,01 30,48 0,04
> C08 Resistente SI R2 0 22,83 0
> C08 Resistente SI R3 0 30,66 0
> C08 Resistente CI R1 0 30,19 0
> C08 Resistente CI R2 0 26,69 0
> C08 Resistente CI R3 0 33,55 0
> C17 Suscetível SI R1 0,08 16,94 0
> C17 Suscetível SI R2 0,06 22,3 0
> C17 Suscetível SI R3 0,07 17,19 0
> C17 Suscetível CI R1 0,05 17,72 0
> C17 Suscetível CI R2 0,05 19,46 0
> C17 Suscetível CI R3 0,13 30,15 0
> C11 Suscetível SI R1 0,04 30,03 0
> C11 Suscetível SI R2 0 38,64 0
> C11 Suscetível SI R3 0,06 42,59 0
> C11 Suscetível CI R1 0,04 36,96 0
> C11 Suscetível CI R2 0 49,7 0
> C11 Suscetível CI R3 0 37,67 0,06
>
>
>
> Esse exemplo está disponível no endereço:
> https://www.dropbox.com/s/izccqoifwnjkdlu/Exemplo.csv
>
> Genotipo - diferentes genótipos, incluindo plantas resistentes e
> suscetíveis
>
> Tratamento - SI = sem inoculação; CI = com inoculação
>
> Repeticao - R1 = planta 1; R2 = planta 2; R3 = planta 3
>
> Composto1 a Composton = valor aferido (medido) nas folhas de cada
> planta para o respectivo composto
>
> Interesse:
>
> 1. verificar quais compostos são produzidos em função da inoculação (CI
> vs SI)
>
> 2. verificar quais compostos são produzidos em função do Estado
> (Resistente vs Suscetível)
>
> 3. verificar se o Genotipo interfere na produção de determinado
> composto (composto específico a um dado Genotipo)
>
> 4. verificar se os demais genótipos diferem do E. camaldulensis.
>
> O valor 0 (zero) para um determinado composto não significa zero, mas,
> significa que aquele composto não foi encontrado naquela planta
> (repetição). Logo, 0 significa NA.
>
> A minha ideia é analisar composto a composto separadamente. Tenho 117
> compostos.
>
> Modelo que tentei usar:
>
> dados02 <- read.table(url("
> https://www.dropbox.com/s/izccqoifwnjkdlu/Exemplo.csv?dl=1"), sep="\t",
> header=TRUE, dec=",")
>
> dados02
>
> fit02 <- lm(Composto1 ~ Genotipo * Estado * Tratamento, data=dados02)
>
> summary(fit02)
>
> Aparece o seguinte erro:
>
> Coefficients: (9 not defined because of singularities)
>
> Pelo que li, parece que a variável é colinear ou possui correlação. Não
> sei como resolver.
>
> Outras perguntas:
>
> A minha abordagem está apropriada? Terei que rodar as 117?
>
> Existe uma maneira mais adequada de responder às quatro perguntas
> acima? Principalmente a 1 e 2? Gráficos?
>
> Obrigado!
>
> --
> Marcelo
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20210521/0eaecf66/attachment.html>
Mais detalhes sobre a lista de discussão R-br