[R-br] Como excluir linhas repetidas sem excluir os missings
Augusto Ribas
ribas.aca em gmail.com
Terça Abril 26 12:35:17 BRT 2016
Segue um exemplo, veja se é isso que você quer fazer.
PROCESSO<-c("5.157.658-4","5.155.855-8","5.153.696-8","5.153.696-8","5.154.220-6",NA,NA,NA,"5.155.401-1","5.155.960-6",NA,"5.157.157-7","5.157.658-4","5.157.658-4")
dados<-data.frame(Coluna1=NA,PROCESSO,Coluna3=NA)
###OS dados devem estar assim, note que eu adicionei uns 3 casos duplicadas
aos dados
dados
###Denovo fazemos um indice, mas vamos querer saber quem não é vaziu, note
que o ! inverte a saida do is.na
vaziu<-!is.na(dados$PROCESSO)
###E encontramos os duplicados com a função duplicated, note o que ela faz
no exemplo
duplicated(c(1,1,2,3))
duplicado<-duplicated(dados$PROCESSO)
###Agora é so fazer um teste logico, pegar quem não é vaziu e é duplicado
indice<-which(!(vaziu & duplicado))
##Agora é so usar o indice para preencher a coluna
dados_semcopias<-dados[indice,]
dados_semcopias
Em 22 de abril de 2016 19:27, Amikobh <amikobh em gmail.com> escreveu:
> Prezados,
>
> Tenho um banco com mais de 8000 linhas e 27 variáveis.
>
> Uma das variáveis é a "Processo". Nela, tenho várias linhas em branco e
> dados repetidos. Como faço para excluir as linhas duplicadas sem excluir as
> que estão em branco?
>
> De tal forma que depois eu tenha um novo banco com estas modificações.
>
> Agradecido pela ajuda!
>
>
> PROCESSO
> 5.155.855-8
>
> 5.153.696-8
> 5.154.220-6
>
>
>
> 5.154.220-6
> 5.155.960-6
>
> 5.157.157-7
> 5.154.220-6
>
> Elerson
>
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e fornea cdigo
> mnimo reproduzvel.
--
Grato
Augusto C. A. Ribas
Site Pessoal: http://recologia.com.br/ <http://augustoribas.heliohost.org>
Github: https://github.com/Squiercg
Lattes: http://lattes.cnpq.br/7355685961127056
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160426/36be1f55/attachment.html>
Mais detalhes sobre a lista de discussão R-br