[R-br] Como selecionar um dataframe dentro de outro dataframe

Daniel Marcelino dmsilva.br em gmail.com
Quarta Janeiro 7 22:28:07 BRST 2015


Sem uma amostra dos dados ou informações mais detalhadas a estrutura
do banco é difícil oferecer uma solução. Mas eu acredito que possa ser
problema envolvendo os níveis dos fatores. Veja ?droplevels .

Daniel

2015-01-07 22:27 GMT-02:00 Daniel Marcelino <dmarcelino em live.com>:
> Sem uma amostra dos dados ou informações mais detalhadas a estrutura
> do banco é difícil oferecer uma solução. Mas eu acredito que possa ser
> problema envolvendo os níveis dos fatores. Veja ?droplevels .
>
> Daniel
>
> 2015-01-07 17:24 GMT-02:00 Fernando Antonio de souza <nandodesouza em gmail.com>:
>> Sua questão é interessante mas seu código não é reproduzível, o que
>> difulcuta a ajuda. faça um dput() de parte de seu banco de dados copie e
>> cole no e-mail para que possamos ter facil acesso e assim poder lhe ajudar.
>>
>> Seja mais clara sobre o seu problema para obter ajuda mais rapidamente.
>>
>> Em 7 de janeiro de 2015 15:13, Giselle Davi <giselle_davi em yahoo.com.br>
>> escreveu:
>>>
>>> Prezados,
>>>
>>> Alguém poderia me ajudar a selecionar um dataframe, para este caso o nome
>>> é  list que corresponde à Lista de SNP's selecionados,  a partir de de outro
>>> dataframe, que para este caso corresponde ao  gen1 ( sem  precisar indicar a
>>> posição das colunas )?
>>>
>>> Utilizei a rotina especificada abaixo, mas o comando não me disponibiliza
>>> a seleção de todas as 22894 colunas, ou seja, de todos os SNP's. Existem 7
>>> deles que não conseguem ser selecionados por serem declarados como falsos.
>>> Alguém poderia me ajudar ? Desde já agradeço.
>>>
>>> Att,
>>>
>>> Giselle
>>>
>>>
>>> ROTINA:
>>> #1)Lendo arquivo genotipos
>>> gen=read.table("matriz_genotipos.txt",h=T)#lendo arquivo genotipos
>>> dim(gen)#90 x 24165. Tem que colocar o nome dos cruzamentos na primerira
>>> coluna
>>> head(gen)
>>>
>>> #2)Gerando o arquivo com o nome dos SNP's selecionados
>>> nomes<- read.table("D_F_nomes.txt",h=F, sep=",",row.names=1,quote="")
>>> dim(nomes)#90 x 0
>>>
>>> #3)Arquivo de genótipos com os indivíduos nas linhas e com todos SNP's nas
>>> colunas
>>> gen1<-cbind(nomes,gen)
>>> head(gen1)#juntou !
>>> dim(gen1)#90 x 24165
>>>
>>> #4)Lendo o arquivo de frequência alélica
>>> freq=read.table("chr1_alefreq.txt",h=T) #lendo arquivo freq alel
>>> dim(freq)#22894 x 4
>>> head(freq)
>>>
>>> #5) Gerando o arquivo com os SNP's selecionados pela MAF
>>> lista_SNP_sel<- freq$nun_snp_freq
>>> head(lista_SNP_sel)#Está como fator
>>> list<-as.character(lista_SNP_sel)
>>> head(list)
>>> length(list)
>>> dim(gen1)
>>>
>>> #6)Verificando se os SNP's selecionados são realmente os 22894
>>> selecionados pela MAF
>>> table(list%in%colnames(gen1))
>>>
>>> #SURPRESA:Existem 7 SNP's lidos como falsos e por isso não completam os
>>> 22894 !
>>> logico<-colnames(gen1)%in%list
>>> head(logico)
>>> head(gen1)
>>> head(list)
>>> gen2<- gen1[,logico]
>>> head(gen2)
>>> dim(gen2)#90 x 22887 ( Existem 7 snps que estão sendo declarados como
>>> falsos, por que ?)
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
>> mínimo reproduzível.


Mais detalhes sobre a lista de discussão R-br