[R-br] Problemas em cortar linhas iguais

Amiko Bh amikobh em gmail.com
Segunda Fevereiro 20 16:03:01 BRT 2017


Pessoal:

Dado o DF, com o seguinte nomes fictícios:

*NOME*

*FILIACAO*

AENDER XXXXX AMORIM

APARECIDA XXXXX AMORIM

AGAPE XXXXX SILVA

MARISA IRENEIA DE SOUZA SILVA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGNALDO XXXXX SANTOS BORGES

MIRTES XXXXX LUCIANO

AGUIDA XXXXX LISBOA

DIVA XXXXX LISBOA

AGUINALDO XXXXX PAIXAO

ROSANE XXXXX PAIXAO

AILTON XXXXX DOS SANTOS

PATRICIA XXXXX ARAUJO

AILTON XXXXX ESTEVES

MARIA XXXXX ESTEVES

AILTON XXXXX JUNIOR

FLAVIA XXXXX MARTINS


Uso o seguinte para cortar os nomes repetidos:

banco_sem_nome_repetido <- df[!duplicated(data.frame(df$NOME,
df$FILIACAO)),]

Meu problema: o script resulta o seguinte df:


*NOME*

*FILIACAO*

AENDER XXXXX AMORIM

APARECIDA XXXXX AMORIM

AGAPE XXXXX SILVA

MARISA IRENEIA DE SOUZA SILVA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGNALDO XXXXX SANTOS BORGES

MIRTES XXXXX LUCIANO

AGUIDA XXXXX LISBOA

DIVA XXXXX LISBOA

AGUINALDO XXXXX PAIXAO

ROSANE XXXXX PAIXAO

AILTON XXXXX DOS SANTOS

PATRICIA XXXXX ARAUJO

AILTON XXXXX ESTEVES

MARIA XXXXX ESTEVES

AILTON XXXXX JUNIOR

FLAVIA XXXXX MARTINS

Observe-se que:

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

Não é cortada a linha porque após o OLIVEIRA tem um espaço.

O banco é enorme e tem vários casos iguais ao citado. Alguma solução?
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20170220/7d3c6961/attachment.html>


Mais detalhes sobre a lista de discussão R-br