[R-br] Como excluir linhas repetidas sem excluir os missings
Amikobh
amikobh em gmail.com
Quarta Abril 27 12:25:12 BRT 2016
Prezado,
Não estou conseguindo fazer de tal forma que conserve as outras
variáveis e linhas
Às 12:35 de 26/04/2016, Augusto Ribas escreveu:
> Segue um exemplo, veja se é isso que você quer fazer.
>
> PROCESSO<-c("5.157.658-4","5.155.855-8","5.153.696-8","5.153.696-8","5.154.220-6",NA,NA,NA,"5.155.401-1","5.155.960-6",NA,"5.157.157-7","5.157.658-4","5.157.658-4")
> dados<-data.frame(Coluna1=NA,PROCESSO,Coluna3=NA)
>
> ###OS dados devem estar assim, note que eu adicionei uns 3 casos
> duplicadas aos dados
> dados
>
> ###Denovo fazemos um indice, mas vamos querer saber quem não é vaziu,
> note que o ! inverte a saida do is.na <http://is.na>
> vaziu<-!is.na <http://is.na>(dados$PROCESSO)
>
> ###E encontramos os duplicados com a função duplicated, note o que ela
> faz no exemplo
> duplicated(c(1,1,2,3))
> duplicado<-duplicated(dados$PROCESSO)
>
> ###Agora é so fazer um teste logico, pegar quem não é vaziu e é duplicado
> indice<-which(!(vaziu & duplicado))
>
> ##Agora é so usar o indice para preencher a coluna
> dados_semcopias<-dados[indice,]
>
> dados_semcopias
>
> Em 22 de abril de 2016 19:27, Amikobh <amikobh em gmail.com
> <mailto:amikobh em gmail.com>> escreveu:
>
> Prezados,
>
> Tenho um banco com mais de 8000 linhas e 27 variáveis.
>
> Uma das variáveis é a "Processo". Nela, tenho várias linhas em
> branco e dados repetidos. Como faço para excluir as linhas
> duplicadas sem excluir as que estão em branco?
>
> De tal forma que depois eu tenha um novo banco com estas modificações.
>
> Agradecido pela ajuda!
>
>
> PROCESSO
> 5.155.855-8
>
> 5.153.696-8
> 5.154.220-6
>
>
>
> 5.154.220-6
> 5.155.960-6
>
> 5.157.157-7
> 5.154.220-6
>
> Elerson
>
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
> fornea cdigo mnimo reproduzvel.
>
>
>
>
> --
> Grato
> Augusto C. A. Ribas
> Site Pessoal: http://recologia.com.br/
> Github: https://github.com/Squiercg
> Lattes: http://lattes.cnpq.br/7355685961127056
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160427/b355ca9c/attachment.html>
Mais detalhes sobre a lista de discussão R-br