[R-br] Problemas em cortar linhas iguais

20 Fev 2017

      Pessoal:

Dado o DF, com o seguinte nomes fictícios:

*NOME*

*FILIACAO*

AENDER XXXXX AMORIM

APARECIDA XXXXX AMORIM

AGAPE XXXXX SILVA

MARISA IRENEIA DE SOUZA SILVA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGNALDO XXXXX SANTOS BORGES

MIRTES XXXXX LUCIANO

AGUIDA XXXXX LISBOA

DIVA XXXXX LISBOA

AGUINALDO XXXXX PAIXAO

ROSANE XXXXX PAIXAO

AILTON XXXXX DOS SANTOS

PATRICIA XXXXX ARAUJO

AILTON XXXXX ESTEVES

MARIA XXXXX ESTEVES

AILTON XXXXX JUNIOR

FLAVIA XXXXX MARTINS

Uso o seguinte para cortar os nomes repetidos:

banco_sem_nome_repetido <- df[!duplicated(data.frame(df$NOME,
df$FILIACAO)),]

Meu problema: o script resulta o seguinte df:

*NOME*

*FILIACAO*

AENDER XXXXX AMORIM

APARECIDA XXXXX AMORIM

AGAPE XXXXX SILVA

MARISA IRENEIA DE SOUZA SILVA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGNALDO XXXXX SANTOS BORGES

MIRTES XXXXX LUCIANO

AGUIDA XXXXX LISBOA

DIVA XXXXX LISBOA

AGUINALDO XXXXX PAIXAO

ROSANE XXXXX PAIXAO

AILTON XXXXX DOS SANTOS

PATRICIA XXXXX ARAUJO

AILTON XXXXX ESTEVES

MARIA XXXXX ESTEVES

AILTON XXXXX JUNIOR

FLAVIA XXXXX MARTINS

Observe-se que:

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

Não é cortada a linha porque após o OLIVEIRA tem um espaço.

O banco é enorme e tem vários casos iguais ao citado. Alguma solução?

[R-br] Problemas em cortar linhas iguais

Amiko Bh