[R-br] Como selecionar um dataframe dentro de outro dataframe

Daniel Marcelino dmarcelino em live.com
Quarta Janeiro 7 22:27:21 BRST 2015


Sem uma amostra dos dados ou informações mais detalhadas a estrutura
do banco é difícil oferecer uma solução. Mas eu acredito que possa ser
problema envolvendo os níveis dos fatores. Veja ?droplevels .

Daniel

2015-01-07 17:24 GMT-02:00 Fernando Antonio de souza <nandodesouza em gmail.com>:
> Sua questão é interessante mas seu código não é reproduzível, o que
> difulcuta a ajuda. faça um dput() de parte de seu banco de dados copie e
> cole no e-mail para que possamos ter facil acesso e assim poder lhe ajudar.
>
> Seja mais clara sobre o seu problema para obter ajuda mais rapidamente.
>
> Em 7 de janeiro de 2015 15:13, Giselle Davi <giselle_davi em yahoo.com.br>
> escreveu:
>>
>> Prezados,
>>
>> Alguém poderia me ajudar a selecionar um dataframe, para este caso o nome
>> é  list que corresponde à Lista de SNP's selecionados,  a partir de de outro
>> dataframe, que para este caso corresponde ao  gen1 ( sem  precisar indicar a
>> posição das colunas )?
>>
>> Utilizei a rotina especificada abaixo, mas o comando não me disponibiliza
>> a seleção de todas as 22894 colunas, ou seja, de todos os SNP's. Existem 7
>> deles que não conseguem ser selecionados por serem declarados como falsos.
>> Alguém poderia me ajudar ? Desde já agradeço.
>>
>> Att,
>>
>> Giselle
>>
>>
>> ROTINA:
>> #1)Lendo arquivo genotipos
>> gen=read.table("matriz_genotipos.txt",h=T)#lendo arquivo genotipos
>> dim(gen)#90 x 24165. Tem que colocar o nome dos cruzamentos na primerira
>> coluna
>> head(gen)
>>
>> #2)Gerando o arquivo com o nome dos SNP's selecionados
>> nomes<- read.table("D_F_nomes.txt",h=F, sep=",",row.names=1,quote="")
>> dim(nomes)#90 x 0
>>
>> #3)Arquivo de genótipos com os indivíduos nas linhas e com todos SNP's nas
>> colunas
>> gen1<-cbind(nomes,gen)
>> head(gen1)#juntou !
>> dim(gen1)#90 x 24165
>>
>> #4)Lendo o arquivo de frequência alélica
>> freq=read.table("chr1_alefreq.txt",h=T) #lendo arquivo freq alel
>> dim(freq)#22894 x 4
>> head(freq)
>>
>> #5) Gerando o arquivo com os SNP's selecionados pela MAF
>> lista_SNP_sel<- freq$nun_snp_freq
>> head(lista_SNP_sel)#Está como fator
>> list<-as.character(lista_SNP_sel)
>> head(list)
>> length(list)
>> dim(gen1)
>>
>> #6)Verificando se os SNP's selecionados são realmente os 22894
>> selecionados pela MAF
>> table(list%in%colnames(gen1))
>>
>> #SURPRESA:Existem 7 SNP's lidos como falsos e por isso não completam os
>> 22894 !
>> logico<-colnames(gen1)%in%list
>> head(logico)
>> head(gen1)
>> head(list)
>> gen2<- gen1[,logico]
>> head(gen2)
>> dim(gen2)#90 x 22887 ( Existem 7 snps que estão sendo declarados como
>> falsos, por que ?)
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
> mínimo reproduzível.


Mais detalhes sobre a lista de discussão R-br