[R-br] Problemas em cortar linhas iguais
Amiko Bh
amikobh em gmail.com
Segunda Fevereiro 20 16:03:01 BRT 2017
Pessoal:
Dado o DF, com o seguinte nomes fictícios:
*NOME*
*FILIACAO*
AENDER XXXXX AMORIM
APARECIDA XXXXX AMORIM
AGAPE XXXXX SILVA
MARISA IRENEIA DE SOUZA SILVA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGNALDO XXXXX SANTOS BORGES
MIRTES XXXXX LUCIANO
AGUIDA XXXXX LISBOA
DIVA XXXXX LISBOA
AGUINALDO XXXXX PAIXAO
ROSANE XXXXX PAIXAO
AILTON XXXXX DOS SANTOS
PATRICIA XXXXX ARAUJO
AILTON XXXXX ESTEVES
MARIA XXXXX ESTEVES
AILTON XXXXX JUNIOR
FLAVIA XXXXX MARTINS
Uso o seguinte para cortar os nomes repetidos:
banco_sem_nome_repetido <- df[!duplicated(data.frame(df$NOME,
df$FILIACAO)),]
Meu problema: o script resulta o seguinte df:
*NOME*
*FILIACAO*
AENDER XXXXX AMORIM
APARECIDA XXXXX AMORIM
AGAPE XXXXX SILVA
MARISA IRENEIA DE SOUZA SILVA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGNALDO XXXXX SANTOS BORGES
MIRTES XXXXX LUCIANO
AGUIDA XXXXX LISBOA
DIVA XXXXX LISBOA
AGUINALDO XXXXX PAIXAO
ROSANE XXXXX PAIXAO
AILTON XXXXX DOS SANTOS
PATRICIA XXXXX ARAUJO
AILTON XXXXX ESTEVES
MARIA XXXXX ESTEVES
AILTON XXXXX JUNIOR
FLAVIA XXXXX MARTINS
Observe-se que:
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
Não é cortada a linha porque após o OLIVEIRA tem um espaço.
O banco é enorme e tem vários casos iguais ao citado. Alguma solução?
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20170220/7d3c6961/attachment.html>
Mais detalhes sobre a lista de discussão R-br