Prezados,

Estamos escrevendo um artigo sobre os determinantes do trabalho infantil no Brasil, que utilizará os microdados da PNAD Contínua de 2021, relacionados à quinta visita. Estamos estruturando um script que consolida a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando algumas dificuldades.

O banco de dados em questão deve conter informações relativas à pessoa de referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), assim como informações referentes a criança entre 5 e 17 anos que esteja em situação de trabalho infantil (variável dummy que indique essa situação, número de crianças no domicílio que se enquadram neste quesito, sexo da criança, idade e etc.).

Contudo, não estamos conseguindo pensar em uma forma na qual consigamos executar essa ação no R. O grande problema é que, dado um domicílio que é identificado pela variável `chave_domicilio`, existirá diversas observações que abrangem as pessoas que pertencem a ele (pessoa responsável pelo domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se devemos incluir os pesos antes ou após a realização dessas manipulações. Estamos utilizando, basicamente, os pacotes survey, srvyr, PNADcIBGE e tidyverse para realizar a importação e manipulação das informações.

Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir?

Gratos desde já!


--
Izabella M S Viana
Doutoranda em Estatística (UFPE)
Economista e Mestre em Economia (UFV)
Professora Orientadora USP/ESALq
Email secundário: izabella.maria@ufpe.br