[R-br] Como selecionar um dataframe dentro de outro dataframe
Fernando Antonio de souza
nandodesouza em gmail.com
Quarta Janeiro 7 17:24:32 BRST 2015
Sua questão é interessante mas seu código não é reproduzível, o que
difulcuta a ajuda. faça um dput() de parte de seu banco de dados copie e
cole no e-mail para que possamos ter facil acesso e assim poder lhe ajudar.
Seja mais clara sobre o seu problema para obter ajuda mais rapidamente.
Em 7 de janeiro de 2015 15:13, Giselle Davi <giselle_davi em yahoo.com.br>
escreveu:
> Prezados,
>
> Alguém poderia me ajudar a selecionar um dataframe, para este caso o nome
> é list que corresponde à Lista de SNP's selecionados, a partir de de
> outro dataframe, que para este caso corresponde ao gen1 ( sem precisar
> indicar a posição das colunas )?
>
> Utilizei a rotina especificada abaixo, mas o comando não me disponibiliza
> a seleção de todas as 22894 colunas, ou seja, de todos os SNP's. Existem 7
> deles que não conseguem ser selecionados por serem declarados como falsos.
> Alguém poderia me ajudar ? Desde já agradeço.
>
> Att,
>
> Giselle
>
>
> ROTINA:
> #1)Lendo arquivo genotipos
> gen=read.table("matriz_genotipos.txt",h=T)#lendo arquivo genotipos
> dim(gen)#90 x 24165. Tem que colocar o nome dos cruzamentos na primerira
> coluna
> head(gen)
>
> #2)Gerando o arquivo com o nome dos SNP's selecionados
> nomes<- read.table("D_F_nomes.txt",h=F, sep=",",row.names=1,quote="")
> dim(nomes)#90 x 0
>
> #3)Arquivo de genótipos com os indivíduos nas linhas e com todos SNP's nas
> colunas
> gen1<-cbind(nomes,gen)
> head(gen1)#juntou !
> dim(gen1)#90 x 24165
>
> #4)Lendo o arquivo de frequência alélica
> freq=read.table("chr1_alefreq.txt",h=T) #lendo arquivo freq alel
> dim(freq)#22894 x 4
> head(freq)
>
> #5) Gerando o arquivo com os SNP's selecionados pela MAF
> lista_SNP_sel<- freq$nun_snp_freq
> head(lista_SNP_sel)#Está como fator
> list<-as.character(lista_SNP_sel)
> head(list)
> length(list)
> dim(gen1)
>
> #6)Verificando se os SNP's selecionados são realmente os 22894
> selecionados pela MAF
> table(list%in%colnames(gen1))
>
> #SURPRESA:Existem 7 SNP's lidos como falsos e por isso não completam os
> 22894 !
> logico<-colnames(gen1)%in%list
> head(logico)
> head(gen1)
> head(list)
> gen2<- gen1[,logico]
> head(gen2)
> dim(gen2)#90 x 22887 ( Existem 7 snps que estão sendo declarados como
> falsos, por que ?)
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20150107/0b1fa367/attachment.html>
Mais detalhes sobre a lista de discussão R-br