[R-br] Identificar cadastros com dados diferentes

Rodrigo Coster rcoster em gmail.com
Sexta Novembro 9 21:16:39 BRST 2012


Caros, venho mais uma vez solicitar a ajuda de vocês. O sistema de onde
trabalho me fornece um relatório que tem 13 informações, mas só 4
informações primordiais: ID, Contrato, Info1 e Info2. Os relatórios são
mensais e cada ID pode ter mais de um contrato (mas somente um por mês).
Estou montando um relatório geral, juntando informações dos últimos 5 anos.
Era esperado que, para cada combinação ID-Contrato, Info1 e Info2 fossem
iguais em todos os meses, mas não é o que está acontecendo, e preciso
identificar os pares ID-Contrato que isso não ocorre, só que não me veio a
cabeça nenhuma maneira prática de fazer isso.

Por exemplo:
(dados <- structure(list(ID = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 4L, 4L, 4L, 4L,
4L, 4L, 4L), CONTRATO = c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 1L, 1L,
1L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 2L, 2L, 2L), INFO1 = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 2L, 2L, 2L), INFO2 = c(1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L,
1L, 1L, 2L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L,
1L, 2L, 2L, 2L)), .Names = c("ID", "CONTRATO", "INFO1", "INFO2"
), class = "data.frame", row.names = c(NA, -29L)))


Nesse exemplo ele deveria identificar:
ID: 1 Contrato: 2
ID: 2 Contrato: 2
ID: 3 Contrato: 1

O banco total (a junção de todos relatórios) possui 200.000 linhas,
portanto estou buscando alternativas antes de vasculhar linha por linha num
for.


Valeu!
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20121109/bf1ae8bd/attachment.html>


Mais detalhes sobre a lista de discussão R-br