<div dir="ltr">Giselle,<div><br></div><div>adoraria ajudar, mas sua explicacao nao esta' clara. O que vc quer exatamente? Apenas converter A e T para 1 e o remanescente para zero?</div><div><br></div><div>O arquivo que vc enviou (por favor, use a recomendacao do Edson) nao contem as informacoes que eu em geral uso para genotipagem... Vc informa-nos os alelos para cada locus (assumindo diploidia de milho), mas nao ha' muito o que fazer com esta informacao... Voce poderia obter frequencias alelilas para cada marcador, mas dai' para genotipos e' um passo que existe mais informacao do que vc nos passou.</div>
<div><br></div><div>Se eu tiver entendido errado, por favor, envie-nos um email que contenha, de forma resumida, a teoria necessaria e tambem exemplos dos calculos que vc precisa.</div><div><br></div><div>b</div></div><div class="gmail_extra">
<br><br><div class="gmail_quote">Em 3 de setembro de 2014 11:44, Giselle Davi <span dir="ltr"><<a href="mailto:giselle_davi@yahoo.com.br" target="_blank">giselle_davi@yahoo.com.br</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><div style="color:#000;background-color:#fff;font-family:HelveticaNeue,Helvetica Neue,Helvetica,Arial,Lucida Grande,sans-serif;font-size:12pt"><div>Prezados Colaboradores,</div><div><br></div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent">
<br></div><div style="background-color:transparent">Tenho um arquivo com uma matriz formada por letras ( SNP: bases<span style="font-size:12pt;background-color:transparent"> nitrogenadas: A, C, T, G) e preciso codificá-la para números, onde </span><span style="font-size:12pt;background-color:transparent">as letras A e T recebam 1 e as letras C e G recebam 0, formando assim uma matriz de genótipos </span><span style="font-size:12pt;background-color:transparent">Gn x m = {0;1;2} onde n é o número de indivíduos e m o número de SNPs. Anexado a este e-mail encontra-se parte dessa matriz com dimensão 6 x 30 ( Facilitando, portanto, o envio) que necessita dessa codificação.</span></div>
<div style="color:rgb(0,0,0);font-size:12pt;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent"><span style="font-size:12pt;background-color:transparent"><br>
</span></div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent"><span style="font-size:12pt;background-color:transparent">Matematicamente, a sequência de SNP é atribuída ( A qual eu não precisei
construir, pois a sequência foi originada por genotipagem ) como:</span></div><div style="color:rgb(0,0,0);font-size:12pt;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent">
<span style="font-size:12pt;background-color:transparent"><br></span></div><div style="background-color:transparent">Dado um valor para PA (probabilidade <span style="font-size:12pt;background-color:transparent">de ocorrer a base A) e para PC (probabilidade de C), de modo que PA= PT, PC = PG </span><span style="font-size:12pt;background-color:transparent">e PA+PC = 0; 5, então as bases são geradas do seguinte modo:</span></div>
<div style="background-color:transparent"> Se y existe (E virado para direita) [0;PA), a base é A;</div><div style="background-color:transparent"> Se
y existe [PA;0:5), a base é C;</div><div style="background-color:transparent"> Se y existe [0:5; (0:5+PC)), a base é G;</div><div style="background-color:transparent"><span style="background-color:transparent"></span></div>
<div style="background-color:transparent"> Se y existe [(0:5+PC);1], a base é T.</div><div style="background-color:transparent"><br></div><div style="background-color:transparent">Cada indivíduo possui um par de cromossomos homólogos, que se mantêm juntos por</div>
<div style="background-color:transparent">ligações entre as bases A e T e ligações entre as bases C e G. A codificação das sequências ( SNPs)</div><div style="background-color:transparent">deve ser feita, portanto, do seguinte modo: Contando o alelo de interesse (no caso, A) e seu correspondente</div>
<div style="background-color:transparent">no
pareamento (T) em cada fita numa posição do genótipo, e atribuir 1 quando um <span style="font-size:12pt;background-color:transparent">dos dois (A ou T) ocorre e 0 se não ocorrem. Esta codificação resulta em:</span></div>
<div style="color:rgb(0,0,0);font-size:12pt;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent"><span style="font-size:12pt;background-color:transparent"><br>
</span></div><div style="background-color:transparent"> 0 - CC, CG, GC, GG)P(0) = 4*PC elevado a 2</div><div style="background-color:transparent"> 1 - AC, AG, TC, TG, CA, GA, CT, GT)P(1) = 8*PA*PC</div><div style="background-color:transparent">
<span style="background-color:transparent"></span></div><div style="background-color:transparent"> 2 - AA, AT, TA, TT
)P(2) = 4*PA elevado a 2</div><div style="background-color:transparent"><br></div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent">
Sendo assim, preciso utilizar estas informações matemáticas no R de modo a proceder a codificação. Alguém poderia me ajudar ? Desde já agradeço.</div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent">
<br></div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent"><br></div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent">
Att,</div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent"><br></div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent">
Giselle</div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent"><br></div><div style="color:rgb(0,0,0);font-size:16px;font-family:HelveticaNeue,'Helvetica Neue',Helvetica,Arial,'Lucida Grande',sans-serif;font-style:normal;background-color:transparent">
<br></div></div></div><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br></div>