[R-br] Record Linkage - compare.dedup
Fátima Lima Paula
fatima.lima.paula em gmail.com
Segunda Novembro 12 18:18:16 BRST 2012
Prezados, estou começando a estudar o artigo enviado como sugestão de
leitura sobre o RecordLinkage.
Logo no início diz que a função compare.dedup serve para deduplicação de um
banco simples.
Ou seja, pelo que entendi por essa função conseguimos os pares do banco.
Bem, tentei e retornou um erro.
Aí vai o CMR (é isso mesmo?).
nome1=c("ANITA","ULISSES","CREUSA","HILDA","ANITA")
nome3=c("COSTA","SILVA","RAMALHO","ALVES","COSTA")
datanas=c("1947-06-01","1925-08-09","1946-02-03","1931-09-23","1947-06-01")
teste=data.frame(nome1,nome3,datanas)
teste
nome1 nome3 datanas
1 ANITA COSTA 1947-06-01
2 ULISSES SILVA 1925-08-09
3 CREUSA RAMALHO 1946-02-03
4 HILDA ALVES 1931-09-23
5 ANITA COSTA 1947-06-01
rpairs=compare.dedup(teste, identity=identity.teste)
Erro em identical(identity, NA) : objeto 'identity.teste' não encontrado
Alguém que já tenha feito um linkage usando esse pacote pode me ajudar?
Obrigada
Fátima
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121112/04c9bfd6/attachment.html>
Mais detalhes sobre a lista de discussão R-br