Izabella,

Pela descrição feita no seu texto, parece que vc enfrenta um aspecto de "arquitetura de banco de dados", onde uma chave é usada para conectar logicamente várias "tabelas" no sentido de BD, enquanto o R espera um dataframe que é uma tabela mais consolidada ou como diria um analista de BD « na 1ª forma normal ».

Seu script deverá usar os subpacotes de tidyverse e colocar as variáveis de interesse todas como colunas duma única linha identificável com com 'chave_domicilio'¹.

Daí pós processar esse dataframe colocando pesos, agregando, calculando as var dummy, etc. ficará mais fácil.

HTH
--
Cesar Rabak

[1] Em particular veja as funções cast e eventualmente para reverter ou conferir a melt desse pacote.

On Wed, Apr 2, 2025 at 10:54 AM Izabella Maria Viana por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:

Prezados,

Estamos escrevendo um artigo sobre os determinantes do trabalho infantil no Brasil, que utilizará os microdados da PNAD Contínua de 2021, relacionados à quinta visita. Estamos estruturando um script que consolida a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando algumas dificuldades.

O banco de dados em questão deve conter informações relativas à pessoa de referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), assim como informações referentes a criança entre 5 e 17 anos que esteja em situação de trabalho infantil (variável dummy que indique essa situação, número de crianças no domicílio que se enquadram neste quesito, sexo da criança, idade e etc.).

Contudo, não estamos conseguindo pensar em uma forma na qual consigamos executar essa ação no R. O grande problema é que, dado um domicílio que é identificado pela variável `chave_domicilio`, existirá diversas observações que abrangem as pessoas que pertencem a ele (pessoa responsável pelo domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se devemos incluir os pesos antes ou após a realização dessas manipulações. Estamos utilizando, basicamente, os pacotes survey, srvyr, PNADcIBGE e tidyverse para realizar a importação e manipulação das informações.

Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir?

Gratos desde já!


--
Izabella M S Viana
Doutoranda em Estatística (UFPE)
Economista e Mestre em Economia (UFV)
Professora Orientadora USP/ESALq
Email secundário: izabella.maria@ufpe.br
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.