
Pessoal: Dado o DF, com o seguinte nomes fictícios: *NOME* *FILIACAO* AENDER XXXXX AMORIM APARECIDA XXXXX AMORIM AGAPE XXXXX SILVA MARISA IRENEIA DE SOUZA SILVA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGNALDO XXXXX SANTOS BORGES MIRTES XXXXX LUCIANO AGUIDA XXXXX LISBOA DIVA XXXXX LISBOA AGUINALDO XXXXX PAIXAO ROSANE XXXXX PAIXAO AILTON XXXXX DOS SANTOS PATRICIA XXXXX ARAUJO AILTON XXXXX ESTEVES MARIA XXXXX ESTEVES AILTON XXXXX JUNIOR FLAVIA XXXXX MARTINS Uso o seguinte para cortar os nomes repetidos: banco_sem_nome_repetido <- df[!duplicated(data.frame(df$NOME, df$FILIACAO)),] Meu problema: o script resulta o seguinte df: *NOME* *FILIACAO* AENDER XXXXX AMORIM APARECIDA XXXXX AMORIM AGAPE XXXXX SILVA MARISA IRENEIA DE SOUZA SILVA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGNALDO XXXXX SANTOS BORGES MIRTES XXXXX LUCIANO AGUIDA XXXXX LISBOA DIVA XXXXX LISBOA AGUINALDO XXXXX PAIXAO ROSANE XXXXX PAIXAO AILTON XXXXX DOS SANTOS PATRICIA XXXXX ARAUJO AILTON XXXXX ESTEVES MARIA XXXXX ESTEVES AILTON XXXXX JUNIOR FLAVIA XXXXX MARTINS Observe-se que: AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA AGATIL XXXXX OLIVEIRA VANESSA XXXXX DA COSTA Não é cortada a linha porque após o OLIVEIRA tem um espaço. O banco é enorme e tem vários casos iguais ao citado. Alguma solução?