[R-br] Como excluir linhas repetidas sem excluir os missings

Amikobh amikobh em gmail.com
Quarta Abril 27 12:25:12 BRT 2016


Prezado,

Não estou conseguindo fazer de tal forma que conserve as outras 
variáveis e linhas

Às 12:35 de 26/04/2016, Augusto Ribas escreveu:
> Segue um exemplo, veja se é isso que você quer fazer.
>
> PROCESSO<-c("5.157.658-4","5.155.855-8","5.153.696-8","5.153.696-8","5.154.220-6",NA,NA,NA,"5.155.401-1","5.155.960-6",NA,"5.157.157-7","5.157.658-4","5.157.658-4")
> dados<-data.frame(Coluna1=NA,PROCESSO,Coluna3=NA)
>
> ###OS dados devem estar assim, note que eu adicionei uns 3 casos 
> duplicadas aos dados
> dados
>
> ###Denovo fazemos um indice, mas vamos querer saber quem não é vaziu, 
> note que o ! inverte a saida do is.na <http://is.na>
> vaziu<-!is.na <http://is.na>(dados$PROCESSO)
>
> ###E encontramos os duplicados com a função duplicated, note o que ela 
> faz no exemplo
> duplicated(c(1,1,2,3))
> duplicado<-duplicated(dados$PROCESSO)
>
> ###Agora é so fazer um teste logico, pegar quem não é vaziu e é duplicado
> indice<-which(!(vaziu & duplicado))
>
> ##Agora é so usar o indice para preencher a coluna
> dados_semcopias<-dados[indice,]
>
> dados_semcopias
>
> Em 22 de abril de 2016 19:27, Amikobh <amikobh em gmail.com 
> <mailto:amikobh em gmail.com>> escreveu:
>
>     Prezados,
>
>     Tenho um banco com mais de 8000 linhas e 27 variáveis.
>
>     Uma das variáveis é a "Processo". Nela, tenho várias linhas em
>     branco e dados repetidos. Como faço para excluir as linhas
>     duplicadas sem excluir as que estão em branco?
>
>     De tal forma que depois eu tenha um novo banco com estas modificações.
>
>     Agradecido pela ajuda!
>
>
>     PROCESSO
>     5.155.855-8
>
>     5.153.696-8
>     5.154.220-6
>
>
>
>     5.154.220-6
>     5.155.960-6
>
>     5.157.157-7
>     5.154.220-6
>
>     Elerson
>
>
>
>
>
>     _______________________________________________
>     R-br mailing list
>     R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>     https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>     Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>     fornea cdigo mnimo reproduzvel.
>
>
>
>
> -- 
> Grato
> Augusto C. A. Ribas
> Site Pessoal: http://recologia.com.br/
> Github: https://github.com/Squiercg
> Lattes: http://lattes.cnpq.br/7355685961127056
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160427/b355ca9c/attachment.html>


Mais detalhes sobre a lista de discussão R-br