Pessoal:
Dado o DF, com o seguinte nomes fictícios:
NOME
FILIACAO
AENDER XXXXX AMORIM
APARECIDA XXXXX AMORIM
AGAPE XXXXX SILVA
MARISA IRENEIA DE SOUZA SILVA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGNALDO XXXXX SANTOS BORGES
MIRTES XXXXX LUCIANO
AGUIDA XXXXX LISBOA
DIVA XXXXX LISBOA
AGUINALDO XXXXX PAIXAO
ROSANE XXXXX PAIXAO
AILTON XXXXX DOS SANTOS
PATRICIA XXXXX ARAUJO
AILTON XXXXX ESTEVES
MARIA XXXXX ESTEVES
AILTON XXXXX JUNIOR
FLAVIA XXXXX MARTINS
Uso o seguinte para cortar os nomes repetidos:
banco_sem_nome_repetido <- df[!duplicated(data.frame(df$
NOME, df$FILIACAO)),]
Meu problema: o script resulta o seguinte df:
NOME
FILIACAO
AENDER XXXXX AMORIM
APARECIDA XXXXX AMORIM
AGAPE XXXXX SILVA
MARISA IRENEIA DE SOUZA SILVA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGNALDO XXXXX SANTOS BORGES
MIRTES XXXXX LUCIANO
AGUIDA XXXXX LISBOA
DIVA XXXXX LISBOA
AGUINALDO XXXXX PAIXAO
ROSANE XXXXX PAIXAO
AILTON XXXXX DOS SANTOS
PATRICIA XXXXX ARAUJO
AILTON XXXXX ESTEVES
MARIA XXXXX ESTEVES
AILTON XXXXX JUNIOR
FLAVIA XXXXX MARTINS
Observe-se que:
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
AGATIL XXXXX OLIVEIRA
VANESSA XXXXX DA COSTA
Não é cortada a linha porque após o OLIVEIRA tem um espaço.
O banco é enorme e tem vários casos iguais ao citado. Alguma solução?
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia ) e forneça código mínimo reproduzível.