[R-br] Identificar cadastros com dados diferentes

Rubem Kaipper Ceratti rubem_ceratti em yahoo.com.br
Sexta Novembro 9 22:40:49 BRST 2012


Segue uma solução:


library(data.table)

funID <- function(x) nrow(unique(x))

dt.dados <- data.table(dados)
dt.dados[, list(N = funID(.SD)), by = list(ID, CONTRATO)][N > 1]


Eu ia dar a sugestão de usar um split + lapply + do.call, mas poderia ser problemático se houvesse um número grande de combinações ID x CONTRATO.

att,
Rubem
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121109/0e8cfd1e/attachment.html>


Mais detalhes sobre a lista de discussão R-br