[R-br] Record Linkage - compare.dedup

Fátima Lima Paula fatima.lima.paula em gmail.com
Segunda Novembro 12 18:18:16 BRST 2012


Prezados, estou começando a estudar o artigo enviado como sugestão de
leitura sobre o RecordLinkage.
Logo no início diz que a função compare.dedup serve para deduplicação de um
banco simples.
Ou seja, pelo que entendi por essa função conseguimos os pares do banco.
Bem, tentei e retornou um erro.
Aí vai o CMR (é isso mesmo?).

nome1=c("ANITA","ULISSES","CREUSA","HILDA","ANITA")
nome3=c("COSTA","SILVA","RAMALHO","ALVES","COSTA")
datanas=c("1947-06-01","1925-08-09","1946-02-03","1931-09-23","1947-06-01")
teste=data.frame(nome1,nome3,datanas)
teste
    nome1   nome3    datanas
1   ANITA   COSTA 1947-06-01
2 ULISSES   SILVA 1925-08-09
3  CREUSA RAMALHO 1946-02-03
4   HILDA   ALVES 1931-09-23
5   ANITA   COSTA 1947-06-01
rpairs=compare.dedup(teste, identity=identity.teste)
Erro em identical(identity, NA) : objeto 'identity.teste' não encontrado


Alguém que já tenha feito um linkage usando esse pacote pode me ajudar?
Obrigada
Fátima
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121112/04c9bfd6/attachment.html>


Mais detalhes sobre a lista de discussão R-br