[R-br] Problemas em cortar linhas iguais

Leandro Marino leandromarino em leandromarino.com.br
Segunda Fevereiro 20 16:16:03 BRT 2017


​Uma solução é em uma variavel nova remover todos os espaços e fazer a
mesma análise.

para remover espacos

variavel_nova <- gsub(" ","", variavel_velha)​

Em 20 de fevereiro de 2017 16:03, Amiko Bh via R-br <
r-br em listas.c3sl.ufpr.br> escreveu:

> Pessoal:
>
> Dado o DF, com o seguinte nomes fictícios:
>
> *NOME*
>
> *FILIACAO*
>
> AENDER XXXXX AMORIM
>
> APARECIDA XXXXX AMORIM
>
> AGAPE XXXXX SILVA
>
> MARISA IRENEIA DE SOUZA SILVA
>
> AGATIL XXXXX OLIVEIRA
>
> VANESSA XXXXX DA COSTA
>
> AGATIL XXXXX OLIVEIRA
>
> VANESSA XXXXX DA COSTA
>
> AGATIL XXXXX OLIVEIRA
>
> VANESSA XXXXX DA COSTA
>
> AGNALDO XXXXX SANTOS BORGES
>
> MIRTES XXXXX LUCIANO
>
> AGUIDA XXXXX LISBOA
>
> DIVA XXXXX LISBOA
>
> AGUINALDO XXXXX PAIXAO
>
> ROSANE XXXXX PAIXAO
>
> AILTON XXXXX DOS SANTOS
>
> PATRICIA XXXXX ARAUJO
>
> AILTON XXXXX ESTEVES
>
> MARIA XXXXX ESTEVES
>
> AILTON XXXXX JUNIOR
>
> FLAVIA XXXXX MARTINS
>
>
> Uso o seguinte para cortar os nomes repetidos:
>
> banco_sem_nome_repetido <- df[!duplicated(data.frame(df$NOME,
> df$FILIACAO)),]
>
> Meu problema: o script resulta o seguinte df:
>
>
> *NOME*
>
> *FILIACAO*
>
> AENDER XXXXX AMORIM
>
> APARECIDA XXXXX AMORIM
>
> AGAPE XXXXX SILVA
>
> MARISA IRENEIA DE SOUZA SILVA
>
> AGATIL XXXXX OLIVEIRA
>
> VANESSA XXXXX DA COSTA
>
> AGATIL XXXXX OLIVEIRA
>
> VANESSA XXXXX DA COSTA
>
> AGNALDO XXXXX SANTOS BORGES
>
> MIRTES XXXXX LUCIANO
>
> AGUIDA XXXXX LISBOA
>
> DIVA XXXXX LISBOA
>
> AGUINALDO XXXXX PAIXAO
>
> ROSANE XXXXX PAIXAO
>
> AILTON XXXXX DOS SANTOS
>
> PATRICIA XXXXX ARAUJO
>
> AILTON XXXXX ESTEVES
>
> MARIA XXXXX ESTEVES
>
> AILTON XXXXX JUNIOR
>
> FLAVIA XXXXX MARTINS
>
> Observe-se que:
>
> AGATIL XXXXX OLIVEIRA
>
> VANESSA XXXXX DA COSTA
>
> AGATIL XXXXX OLIVEIRA
>
> VANESSA XXXXX DA COSTA
>
> Não é cortada a linha porque após o OLIVEIRA tem um espaço.
>
> O banco é enorme e tem vários casos iguais ao citado. Alguma solução?
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20170220/14ceb172/attachment.html>


Mais detalhes sobre a lista de discussão R-br