[R-br] Data Compare (Epi info)
Henrique Dallazuanna
wwwhsd em gmail.com
Sábado Junho 1 21:27:01 BRT 2013
Tente assim:
subset(unique(rbind(df1, df2)), ID %in% sort(ID[duplicated(ID)]))
2013/5/24 Sérgio Henrique almeida da silva ju <sergio.edfisica em gmail.com>
> Obrigado Benilton
>
> Desculpe tê-lo feito digitar.
>
> Mas eu gostaria que a função me retornasse além do ID do erro de dgitação,
> mas também os valores discordantes, isso tudo em uma matrix ou um
> data.frama.
>
> Obrigado mais uma vez
>
> Abraços
>
>
> Em 24 de maio de 2013 15:42, Benilton Carvalho <beniltoncarvalho em gmail.com
> > escreveu:
>
> Poxa... um exemplo reproduzivel ajudaria tanto quem tirar o proprio
>> tempo para poder te ajudar.... (leia-se: se eu tenho q digitar
>> comandos para ter o seu conjunto de dados de exemplo, entao nao e' um
>> exemplo reproduzivel.... caso ideal para um consultor, que recebe por
>> hora trabalhada....)
>>
>> df1 = data.frame(ID=1:5, idade=c(15, 20, 18, 19, 20), sexo=c('M', 'M',
>> 'F', 'F', 'M'))
>> df2 = data.frame(ID=1:5, idade=c(15, 21, 18, 19, 20), sexo=c('M', 'M',
>> 'F', 'M', 'M'))
>> which(!apply(df1 == df2, 1, all))
>>
>> b
>>
>> Em 24 de maio de 2013 14:36, Sérgio Henrique almeida da silva ju
>> <sergio.edfisica em gmail.com> escreveu:
>> > Prezados
>> >
>> > Alguém tem algum script no R que compara dois bancos de dados, como no
>> data
>> > compare do epiinfo ou validate do epidata?
>> >
>> > De qualquer forma eles comparam os dados de dois bancos de dados,
>> contendo
>> > as mesmas variáveis, mas que foram digitados por pessoas diferentes.
>> >
>> > Ex.:
>> >
>> > Digitador 1 (Banco1)
>> >
>> > ID idade sexo
>> > 1 15 M
>> > 2 20 M
>> > 3 18 F
>> > 4 19 F
>> > 5 20 M
>> >
>> > Digitador 2 (Banco2)
>> >
>> > ID idade sexo
>> > 1 15 M
>> > 2 21 M
>> > 3 18 F
>> > 4 19 M
>> > 5 20 M
>> > Nesse caso houve discordância na digitação no ID 2 e no 4.
>> >
>> > Gostaria de fazer uma função que me aponte essas discordância, alguém
>> tem
>> > alguma ideia?
>> >
>> > Abraços
>> >
>> >
>> > --
>> > Sérgio Henrique Almeida da Silva Junior
>> > Doutorando em Epidemiologia em Saúde Pública
>> > Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
>> > http://lattes.cnpq.br/1611345552843383
>> > Tel: (21) 68463637
>> > http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
>> >
>> > _______________________________________________
>> > R-br mailing list
>> > R-br em listas.c3sl.ufpr.br
>> > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código
>> > mínimo reproduzível.
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> Sérgio Henrique Almeida da Silva Junior
> Doutorando em Epidemiologia em Saúde Pública
> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
> http://lattes.cnpq.br/1611345552843383
> Tel: (21) 68463637
> http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
--
Henrique Dallazuanna
Curitiba-Paraná-Brasil
25° 25' 40" S 49° 16' 22" O
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130601/e0269313/attachment.html>
Mais detalhes sobre a lista de discussão R-br