Data Compare (Epi info)

Prezados Alguém tem algum script no R que compara dois bancos de dados, como no data compare do epiinfo ou validate do epidata? De qualquer forma eles comparam os dados de dois bancos de dados, contendo as mesmas variáveis, mas que foram digitados por pessoas diferentes. Ex.: Digitador 1 (Banco1) ID idade sexo 1 15 M 2 20 M 3 18 F 4 19 F 5 20 M Digitador 2 (Banco2) ID idade sexo 1 15 M 2 21 M 3 18 F 4 19 M 5 20 M Nesse caso houve discordância na digitação no ID 2 e no 4. Gostaria de fazer uma função que me aponte essas discordância, alguém tem alguma ideia? Abraços -- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro

Poxa... um exemplo reproduzivel ajudaria tanto quem tirar o proprio tempo para poder te ajudar.... (leia-se: se eu tenho q digitar comandos para ter o seu conjunto de dados de exemplo, entao nao e' um exemplo reproduzivel.... caso ideal para um consultor, que recebe por hora trabalhada....) df1 = data.frame(ID=1:5, idade=c(15, 20, 18, 19, 20), sexo=c('M', 'M', 'F', 'F', 'M')) df2 = data.frame(ID=1:5, idade=c(15, 21, 18, 19, 20), sexo=c('M', 'M', 'F', 'M', 'M')) which(!apply(df1 == df2, 1, all)) b Em 24 de maio de 2013 14:36, Sérgio Henrique almeida da silva ju <sergio.edfisica@gmail.com> escreveu:
Prezados
Alguém tem algum script no R que compara dois bancos de dados, como no data compare do epiinfo ou validate do epidata?
De qualquer forma eles comparam os dados de dois bancos de dados, contendo as mesmas variáveis, mas que foram digitados por pessoas diferentes.
Ex.:
Digitador 1 (Banco1)
ID idade sexo 1 15 M 2 20 M 3 18 F 4 19 F 5 20 M
Digitador 2 (Banco2)
ID idade sexo 1 15 M 2 21 M 3 18 F 4 19 M 5 20 M Nesse caso houve discordância na digitação no ID 2 e no 4.
Gostaria de fazer uma função que me aponte essas discordância, alguém tem alguma ideia?
Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Estimados colegas, tenho um fatorial 12 clones avaliados em 4 anos com 4 repetições os dados completos, e 5 variáveis medidas. Tenho duvidas sobre como abordar o analise do experimento, intentando ver todas as variáveis no fatorial. Vcs sugerem algum caminho? 2013/5/24 Benilton Carvalho <beniltoncarvalho@gmail.com>
Poxa... um exemplo reproduzivel ajudaria tanto quem tirar o proprio tempo para poder te ajudar.... (leia-se: se eu tenho q digitar comandos para ter o seu conjunto de dados de exemplo, entao nao e' um exemplo reproduzivel.... caso ideal para um consultor, que recebe por hora trabalhada....)
df1 = data.frame(ID=1:5, idade=c(15, 20, 18, 19, 20), sexo=c('M', 'M', 'F', 'F', 'M')) df2 = data.frame(ID=1:5, idade=c(15, 21, 18, 19, 20), sexo=c('M', 'M', 'F', 'M', 'M')) which(!apply(df1 == df2, 1, all))
b
Em 24 de maio de 2013 14:36, Sérgio Henrique almeida da silva ju <sergio.edfisica@gmail.com> escreveu:
Prezados
Alguém tem algum script no R que compara dois bancos de dados, como no data compare do epiinfo ou validate do epidata?
De qualquer forma eles comparam os dados de dois bancos de dados, contendo as mesmas variáveis, mas que foram digitados por pessoas diferentes.
Ex.:
Digitador 1 (Banco1)
ID idade sexo 1 15 M 2 20 M 3 18 F 4 19 F 5 20 M
Digitador 2 (Banco2)
ID idade sexo 1 15 M 2 21 M 3 18 F 4 19 M 5 20 M Nesse caso houve discordância na digitação no ID 2 e no 4.
Gostaria de fazer uma função que me aponte essas discordância, alguém tem alguma ideia?
Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- *Juan Manuel Otálora Villamil* Doutorando: Recursos Geneticos Vegetais UFSC

Obrigado Benilton Desculpe tê-lo feito digitar. Mas eu gostaria que a função me retornasse além do ID do erro de dgitação, mas também os valores discordantes, isso tudo em uma matrix ou um data.frama. Obrigado mais uma vez Abraços Em 24 de maio de 2013 15:42, Benilton Carvalho <beniltoncarvalho@gmail.com>escreveu:
Poxa... um exemplo reproduzivel ajudaria tanto quem tirar o proprio tempo para poder te ajudar.... (leia-se: se eu tenho q digitar comandos para ter o seu conjunto de dados de exemplo, entao nao e' um exemplo reproduzivel.... caso ideal para um consultor, que recebe por hora trabalhada....)
df1 = data.frame(ID=1:5, idade=c(15, 20, 18, 19, 20), sexo=c('M', 'M', 'F', 'F', 'M')) df2 = data.frame(ID=1:5, idade=c(15, 21, 18, 19, 20), sexo=c('M', 'M', 'F', 'M', 'M')) which(!apply(df1 == df2, 1, all))
b
Em 24 de maio de 2013 14:36, Sérgio Henrique almeida da silva ju <sergio.edfisica@gmail.com> escreveu:
Prezados
Alguém tem algum script no R que compara dois bancos de dados, como no data compare do epiinfo ou validate do epidata?
De qualquer forma eles comparam os dados de dois bancos de dados, contendo as mesmas variáveis, mas que foram digitados por pessoas diferentes.
Ex.:
Digitador 1 (Banco1)
ID idade sexo 1 15 M 2 20 M 3 18 F 4 19 F 5 20 M
Digitador 2 (Banco2)
ID idade sexo 1 15 M 2 21 M 3 18 F 4 19 M 5 20 M Nesse caso houve discordância na digitação no ID 2 e no 4.
Gostaria de fazer uma função que me aponte essas discordância, alguém tem alguma ideia?
Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro

Juan, Interessante essa sua questão. Eu ja fiz isso no EpiData e no Stata ha muitos anos mas nunca fiz no R. Procurei rapidamente no R-sitesearch e apreceram algumas coisas. Dei uma lida rápida mas não tenho certeza se alguma coisa faz exatamente o que voce quer. Se nenhuma desses links te ajudar eu te ajudo. http://finzi.psych.upenn.edu/R/library/compare/doc/compare-intro.pdf http://finzi.psych.upenn.edu/R/library/compare/html/00Index.html http://finzi.psych.upenn.edu/R/library/compare/html/compareEqual.html Dr. Pedro Emmanuel A. A. do Brasil http://blog.ipec.fiocruz.br/lapclin-chagas/ Curriculum Lattes: http://lattes.cnpq.br/6597654894290806 ResearchGate.net: https://www.researchgate.net/profile/Pedro_Brasil2/ Instituto Nacional de Infectologia/Instituto de Pesquisa Clínica Evandro Chagas Fundação Oswaldo Cruz Rio de Janeiro - Brasil Av. Brasil 4365, CEP 21040-360, Tel 55 21 3865-9648 e-mail: pedro.brasil@ipec.fiocruz.br e-mail: emmanuel.brasil@gmail.com ---Apoio aos softwares livres www.zotero.org - gerenciamento de referências bibliográficas. www.broffice.org ou www.libreoffice.org - textos, planilhas ou apresentações. www.epidata.dk - entrada de dados. www.r-project.org - análise de dados. www.ubuntu.com - sistema operacional Em 24 de maio de 2013 15:05, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
Obrigado Benilton
Desculpe tê-lo feito digitar.
Mas eu gostaria que a função me retornasse além do ID do erro de dgitação, mas também os valores discordantes, isso tudo em uma matrix ou um data.frama.
Obrigado mais uma vez
Abraços
Em 24 de maio de 2013 15:42, Benilton Carvalho <beniltoncarvalho@gmail.com
escreveu:
Poxa... um exemplo reproduzivel ajudaria tanto quem tirar o proprio
tempo para poder te ajudar.... (leia-se: se eu tenho q digitar comandos para ter o seu conjunto de dados de exemplo, entao nao e' um exemplo reproduzivel.... caso ideal para um consultor, que recebe por hora trabalhada....)
df1 = data.frame(ID=1:5, idade=c(15, 20, 18, 19, 20), sexo=c('M', 'M', 'F', 'F', 'M')) df2 = data.frame(ID=1:5, idade=c(15, 21, 18, 19, 20), sexo=c('M', 'M', 'F', 'M', 'M')) which(!apply(df1 == df2, 1, all))
b
Em 24 de maio de 2013 14:36, Sérgio Henrique almeida da silva ju <sergio.edfisica@gmail.com> escreveu:
Prezados
Alguém tem algum script no R que compara dois bancos de dados, como no data compare do epiinfo ou validate do epidata?
De qualquer forma eles comparam os dados de dois bancos de dados, contendo as mesmas variáveis, mas que foram digitados por pessoas diferentes.
Ex.:
Digitador 1 (Banco1)
ID idade sexo 1 15 M 2 20 M 3 18 F 4 19 F 5 20 M
Digitador 2 (Banco2)
ID idade sexo 1 15 M 2 21 M 3 18 F 4 19 M 5 20 M Nesse caso houve discordância na digitação no ID 2 e no 4.
Gostaria de fazer uma função que me aponte essas discordância, alguém tem alguma ideia?
Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Tente assim: subset(unique(rbind(df1, df2)), ID %in% sort(ID[duplicated(ID)])) 2013/5/24 Sérgio Henrique almeida da silva ju <sergio.edfisica@gmail.com>
Obrigado Benilton
Desculpe tê-lo feito digitar.
Mas eu gostaria que a função me retornasse além do ID do erro de dgitação, mas também os valores discordantes, isso tudo em uma matrix ou um data.frama.
Obrigado mais uma vez
Abraços
Em 24 de maio de 2013 15:42, Benilton Carvalho <beniltoncarvalho@gmail.com
escreveu:
Poxa... um exemplo reproduzivel ajudaria tanto quem tirar o proprio
tempo para poder te ajudar.... (leia-se: se eu tenho q digitar comandos para ter o seu conjunto de dados de exemplo, entao nao e' um exemplo reproduzivel.... caso ideal para um consultor, que recebe por hora trabalhada....)
df1 = data.frame(ID=1:5, idade=c(15, 20, 18, 19, 20), sexo=c('M', 'M', 'F', 'F', 'M')) df2 = data.frame(ID=1:5, idade=c(15, 21, 18, 19, 20), sexo=c('M', 'M', 'F', 'M', 'M')) which(!apply(df1 == df2, 1, all))
b
Em 24 de maio de 2013 14:36, Sérgio Henrique almeida da silva ju <sergio.edfisica@gmail.com> escreveu:
Prezados
Alguém tem algum script no R que compara dois bancos de dados, como no data compare do epiinfo ou validate do epidata?
De qualquer forma eles comparam os dados de dois bancos de dados, contendo as mesmas variáveis, mas que foram digitados por pessoas diferentes.
Ex.:
Digitador 1 (Banco1)
ID idade sexo 1 15 M 2 20 M 3 18 F 4 19 F 5 20 M
Digitador 2 (Banco2)
ID idade sexo 1 15 M 2 21 M 3 18 F 4 19 M 5 20 M Nesse caso houve discordância na digitação no ID 2 e no 4.
Gostaria de fazer uma função que me aponte essas discordância, alguém tem alguma ideia?
Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 68463637 http://www.linkedin.com/profile/view?id=250437145&trk=tab_pro
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Henrique Dallazuanna Curitiba-Paraná-Brasil 25° 25' 40" S 49° 16' 22" O
participantes (5)
-
Benilton Carvalho
-
Henrique Dallazuanna
-
juan manuel Otalora
-
Pedro Emmanuel Alvarenga Americano do Brasil
-
Sérgio Henrique almeida da silva ju