[R-br] Identificar cadastros com dados diferentes

Rodrigo Coster rcoster em gmail.com
Segunda Novembro 12 09:22:41 BRST 2012


Rubem, deu certo aqui. Obrigado!

Só a cargo de curiosidade, outra solução que encontrei:

temp <-
dados[!duplicated(data.frame(dados$ID,dados$CONTRATO,dados$INFO1,dados$INFO2)),]
temp <- temp[duplicated(data.frame(temp$ID,temp$CONTRATO)),]
temp <- temp[!duplicated(data.frame(temp$ID,temp$CONTRATO)),]


On Fri, Nov 9, 2012 at 10:40 PM, Rubem Kaipper Ceratti <
rubem_ceratti em yahoo.com.br> wrote:

> Segue uma solução:
>
> library(data.table)
>
> funID <- function(x) nrow(unique(x))
>
> dt.dados <- data.table(dados)
> dt.dados[, list(N = funID(.SD)), by = list(ID, CONTRATO)][N > 1]
> Eu ia dar a sugestão de usar um split + lapply + do.call, mas poderia ser
> problemático se houvesse um número grande de combinações ID x CONTRATO.
>
> att,
> Rubem
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121112/830d3539/attachment.html>


Mais detalhes sobre a lista de discussão R-br