<html><body><div style="color:#000; background-color:#fff; font-family:verdana, helvetica, sans-serif;font-size:8pt"><div style="" class=""><span style="" class="">Gisele, na lista foi adotado a rotina de não anexar arquivos aos emails e sim postar os arquivos, por exemplo, no site <br class="" style=""></span></div><div class="" style="color: rgb(0, 0, 0); font-size: 10.6667px; font-family: verdana,helvetica,sans-serif; background-color: transparent; font-style: normal;"><span style="" class="">http://www.datafilehost.com/</span></div><div class="" style="color: rgb(0, 0, 0); font-size: 10.6667px; font-family: verdana,helvetica,sans-serif; background-color: transparent; font-style: normal;"><br style="" class=""><span style="" class=""></span></div><div class="" style="color: rgb(0, 0, 0); font-size: 10.6667px; font-family: verdana,helvetica,sans-serif; background-color: transparent; font-style: normal;"><span style="" class="">Busque no Google
 "Avaliar dados de genética no software R"<br style="" class=""></span></div><div class="" style="color: rgb(0, 0, 0); font-size: 10.6667px; font-family: verdana,helvetica,sans-serif; background-color: transparent; font-style: normal;"><span style="" class="">Olha o que eu achei: http://geneticapopulacional.blogspot.com.br/</span></div><div class="" style="color: rgb(0, 0, 0); font-size: 10.6667px; font-family: verdana,helvetica,sans-serif; background-color: transparent; font-style: normal;"><br style="" class=""><span style="" class=""></span></div><h3 style="" class="">
<a style="" class="" href="http://geneticapopulacional.blogspot.com.br/2014/08/faststructure.html">fastStructure</a>
</h3>
<div style="" class="">

</div>

fastStructure é um algoritmo para inferir a estrutura da população a 
partir de grandes volumes de dados genótipo SNP. Baseia-se em um quadro 
Bayesian variacional para posterior inferência e é escrito em python2.x.
 Aqui, resumimos como configurar este pacote de software, compilar os 
scripts de C e Cython e executar o algoritmo em um teste simulado 
dataset genótipo.<div class="" style="color: rgb(0, 0, 0); font-size: 10.6667px; font-family: verdana,helvetica,sans-serif; background-color: transparent; font-style: normal;"><br style="" class=""><span style="" class=""></span></div><div class="" style="color: rgb(0, 0, 0); font-size: 10.6667px; font-family: verdana,helvetica,sans-serif; background-color: transparent; font-style: normal;"><br style="" class=""><span style="" class=""></span></div><div class="" style="color: rgb(0, 0, 0); font-size: 10.6667px; font-family: verdana,helvetica,sans-serif; background-color: transparent; font-style: normal;"><span style="" class="">Boa sorte!<br style="" class=""></span></div><div style="" class=""> </div><div style="" class="">Edson Lira<br style="" class="">Estatístico<br style="" class="">Manaus-Amazonas</div> <div class="qtdSeparateBR"><br><br></div><div style="display: block;" class="yahoo_quoted"> <div class="" style="font-family: verdana,
 helvetica, sans-serif; font-size: 8pt;"> <div class="" style="font-family: HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif; font-size: 12pt;"> <div style="" class="" dir="ltr"> <font style="" class="" face="Arial" size="2"> Em Quarta-feira, 3 de Setembro de 2014 10:45, Giselle Davi <giselle_davi@yahoo.com.br> escreveu:<br style="" class=""> </font> </div>  <br style="" class=""><br style="" class=""> <div style="" class=""><div style="" class="" id="yiv4950571039"><div style="" class=""><div class="" style="color:#000;background-color:#fff;font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif;font-size:12pt;"><div class="" style="">Prezados Colaboradores,</div><div class="" style=""><br class="" style=""></div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande',
 sans-serif;font-style:normal;background-color:transparent;" class=""><br class="" style=""></div><div style="background-color:transparent;" class="">Tenho um arquivo com uma matriz formada por letras ( SNP: bases<span style="font-size:12pt;background-color:transparent;" class=""> nitrogenadas: A, C, T, G)  e preciso codificá-la para números,  onde </span><span style="font-size:12pt;background-color:transparent;" class="">as letras A e T recebam 1 e as letras C e G recebam 0, formando assim uma matriz de genótipos </span><span style="font-size:12pt;background-color:transparent;" class="">Gn x m = {0;1;2} onde n é o número de indivíduos e m  o número de SNPs. Anexado a este e-mail encontra-se parte dessa matriz com dimensão 6 x 30 ( Facilitando, portanto, o envio) que necessita dessa codificação.</span></div><div style="color:rgb(0, 0, 0);font-size:12pt;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial,
 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class=""><span style="font-size:12pt;background-color:transparent;" class=""><br class="" style=""></span></div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class=""><span style="font-size:12pt;background-color:transparent;" class="">Matematicamente, a sequência de SNP é atribuída ( A qual eu não precisei
 construir, pois  a sequência foi originada por  genotipagem ) como:</span></div><div style="color:rgb(0, 0, 0);font-size:12pt;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class=""><span style="font-size:12pt;background-color:transparent;" class=""><br style="" class=""></span></div><div style="background-color:transparent;" class="">Dado um valor para PA (probabilidade <span style="font-size:12pt;background-color:transparent;" class="">de ocorrer a base A) e para PC (probabilidade de C), de modo que PA= PT, PC = PG </span><span style="font-size:12pt;background-color:transparent;" class="">e PA+PC = 0; 5, então as bases são geradas do seguinte modo:</span></div><div style="background-color:transparent;" class=""> Se y existe (E virado para direita) [0;PA), a base é  A;</div><div style="background-color:transparent;" class=""> Se
 y existe [PA;0:5), a base é C;</div><div style="background-color:transparent;" class=""> Se y existe [0:5; (0:5+PC)), a base é G;</div><div style="background-color:transparent;" class=""><span style="background-color:transparent;" class=""></span></div><div style="background-color:transparent;" class=""> Se y existe [(0:5+PC);1], a base é T.</div><div style="background-color:transparent;" class=""><br class="" style=""></div><div style="background-color:transparent;" class="">Cada indivíduo possui um par de cromossomos homólogos, que se mantêm juntos por</div><div style="background-color:transparent;" class="">ligações entre as bases A e T e ligações entre as bases C e G. A codificação das sequências ( SNPs)</div><div style="background-color:transparent;" class="">deve ser feita, portanto, do seguinte modo: Contando o alelo de interesse (no caso, A) e seu correspondente</div><div style="background-color:transparent;" class="">no
 pareamento (T) em cada fita numa posição do genótipo, e atribuir 1 quando um <span style="font-size:12pt;background-color:transparent;" class="">dos dois (A ou T) ocorre  e 0 se não ocorrem. Esta codificação resulta em:</span></div><div style="color:rgb(0, 0, 0);font-size:12pt;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class=""><span style="font-size:12pt;background-color:transparent;" class=""><br class="" style=""></span></div><div style="background-color:transparent;" class=""> 0 - CC, CG, GC, GG)P(0) = 4*PC elevado a 2</div><div style="background-color:transparent;" class=""> 1 - AC, AG, TC, TG, CA, GA, CT, GT)P(1) = 8*PA*PC</div><div style="background-color:transparent;" class=""><span style="background-color:transparent;" class=""></span></div><div style="background-color:transparent;" class=""> 2 - AA, AT, TA, TT
 )P(2) = 4*PA elevado a 2</div><div style="background-color:transparent;" class=""><br style="" class=""></div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class="">Sendo assim, preciso utilizar estas informações matemáticas no R de modo a proceder a codificação. Alguém poderia me ajudar ? Desde já agradeço.</div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class=""><br style="" class=""></div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class=""><br style="" class=""></div><div style="color:rgb(0, 0,
 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class="">Att,</div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class=""><br style="" class=""></div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class="">Giselle</div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande', sans-serif;font-style:normal;background-color:transparent;" class=""><br class="" style=""></div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:HelveticaNeue, 'Helvetica Neue', Helvetica, Arial, 'Lucida Grande',
 sans-serif;font-style:normal;background-color:transparent;" class=""><br class="" style=""></div></div></div></div><br style="" class="">_______________________________________________<br style="" class="">R-br mailing list<br style="" class=""><a style="" class="" ymailto="mailto:R-br@listas.c3sl.ufpr.br" href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br style="" class=""><a style="" class="" href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br style="" class="">Leia o guia de postagem (<a style="" class="" href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br style="" class=""><br style="" class=""></div>  </div> </div>  </div> </div></body></html>