​Uma solução é em uma variavel nova remover todos os espaços e fazer a mesma análise.

para remover espacos

variavel_nova <- gsub(" ","", variavel_velha)​

Em 20 de fevereiro de 2017 16:03, Amiko Bh via R-br <r-br@listas.c3sl.ufpr.br> escreveu:

Pessoal:

Dado o DF, com o seguinte nomes fictícios:

NOME

FILIACAO

AENDER XXXXX AMORIM

APARECIDA XXXXX AMORIM

AGAPE XXXXX SILVA

MARISA IRENEIA DE SOUZA SILVA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGNALDO XXXXX SANTOS BORGES

MIRTES XXXXX LUCIANO

AGUIDA XXXXX LISBOA

DIVA XXXXX LISBOA

AGUINALDO XXXXX PAIXAO

ROSANE XXXXX PAIXAO

AILTON XXXXX DOS SANTOS

PATRICIA XXXXX ARAUJO

AILTON XXXXX ESTEVES

MARIA XXXXX ESTEVES

AILTON XXXXX JUNIOR

FLAVIA XXXXX MARTINS


Uso o seguinte para cortar os nomes repetidos:

banco_sem_nome_repetido <- df[!duplicated(data.frame(df$NOME, df$FILIACAO)),]

Meu problema: o script resulta o seguinte df:


NOME

FILIACAO

AENDER XXXXX AMORIM

APARECIDA XXXXX AMORIM

AGAPE XXXXX SILVA

MARISA IRENEIA DE SOUZA SILVA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGNALDO XXXXX SANTOS BORGES

MIRTES XXXXX LUCIANO

AGUIDA XXXXX LISBOA

DIVA XXXXX LISBOA

AGUINALDO XXXXX PAIXAO

ROSANE XXXXX PAIXAO

AILTON XXXXX DOS SANTOS

PATRICIA XXXXX ARAUJO

AILTON XXXXX ESTEVES

MARIA XXXXX ESTEVES

AILTON XXXXX JUNIOR

FLAVIA XXXXX MARTINS

Observe-se que:

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

AGATIL XXXXX OLIVEIRA

VANESSA XXXXX DA COSTA

Não é cortada a linha porque após o OLIVEIRA tem um espaço.

O banco é enorme e tem vários casos iguais ao citado. Alguma solução?


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.