_______________________________________________Prezados,
Estamos escrevendo um artigo sobre os determinantes do trabalho infantil no Brasil, que utilizará os microdados da PNAD Contínua de 2021, relacionados à quinta visita. Estamos estruturando um script que consolida a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando algumas dificuldades.
O banco de dados em questão deve conter informações relativas à pessoa de referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), assim como informações referentes a criança entre 5 e 17 anos que esteja em situação de trabalho infantil (variável dummy que indique essa situação, número de crianças no domicílio que se enquadram neste quesito, sexo da criança, idade e etc.).
Contudo, não estamos conseguindo pensar em uma forma na qual consigamos executar essa ação no R. O grande problema é que, dado um domicílio que é identificado pela variável `chave_domicilio`, existirá diversas observações que abrangem as pessoas que pertencem a ele (pessoa responsável pelo domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se devemos incluir os pesos antes ou após a realização dessas manipulações. Estamos utilizando, basicamente, os pacotes survey, srvyr, PNADcIBGE e tidyverse para realizar a importação e manipulação das informações.
Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir?
Gratos desde já!
--Izabella M S VianaDoutoranda em Estatística (UFPE)Economista e Mestre em Economia (UFV)Professora Orientadora USP/ESALqEmail secundário: izabella.maria@ufpe.br
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.