<div dir="ltr">Izabella,<div><br></div><div>Pela descrição feita no seu texto, parece que vc enfrenta um aspecto de "arquitetura de banco de dados", onde uma chave é usada para conectar logicamente várias "tabelas" no sentido de BD, enquanto o R espera um <i>dataframe</i> que é uma tabela mais consolidada ou como diria um analista de BD « na 1ª forma normal ».<br><br>Seu script deverá usar os subpacotes de <i>tidyverse</i> e colocar as variáveis de interesse todas como colunas duma única linha identificável com com 'chave_domicilio'¹.</div><div><br></div><div>Daí pós processar esse dataframe colocando pesos, agregando, calculando as var dummy, etc. ficará mais fácil.</div><div><br></div><div>HTH</div><div>--</div><div>Cesar Rabak</div><div><br></div><div>[1] Em particular veja as funções <font face="monospace">cast </font><font face="arial, sans-serif">e eventualmente para reverter ou conferir a</font><font face="monospace"> melt </font><font face="arial, sans-serif">desse pacote.</font></div></div><br><div class="gmail_quote gmail_quote_container"><div dir="ltr" class="gmail_attr">On Wed, Apr 2, 2025 at 10:54 AM Izabella Maria Viana por (R-br) <<a href="mailto:r-br@listas.c3sl.ufpr.br">r-br@listas.c3sl.ufpr.br</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div><span><p>Prezados,</p><p>Estamos escrevendo um artigo sobre os determinantes do trabalho infantil no Brasil, que utilizará os microdados da PNAD Contínua de 2021, relacionados à quinta visita. Estamos estruturando um script que consolida a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando algumas dificuldades.</p><p>O banco de dados em questão deve conter informações relativas à pessoa de referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), assim como informações referentes a criança entre 5 e 17 anos que esteja em situação de trabalho infantil (variável<i> dummy</i> que indique essa situação, número de crianças no domicílio que se enquadram neste quesito, sexo da criança, idade e etc.).</p><p>Contudo, não estamos conseguindo pensar em uma forma na qual consigamos executar essa ação no R. O grande problema é que, dado um domicílio que é identificado pela variável `chave_domicilio`, existirá diversas observações que abrangem as pessoas que pertencem a ele (pessoa responsável pelo domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se devemos incluir os pesos antes ou após a realização dessas manipulações. Estamos utilizando, basicamente, os pacotes <i>survey, srvyr, PNADcIBGE e tidyverse</i> para realizar a importação e manipulação das informações.</p><p>Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir?</p><p>Gratos desde já!</p></span></div><div><br></div><span class="gmail_signature_prefix">-- </span><br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div>Izabella M S Viana</div>Doutoranda em Estatística (UFPE)<div>Economista e Mestre em Economia (UFV)</div><div>Professora Orientadora USP/ESALq<br><div>Email secundário: <a href="mailto:izabella.maria@ufpe.br" target="_blank">izabella.maria@ufpe.br</a></div></div></div></div></div></div>
_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" rel="noreferrer" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" rel="noreferrer" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</blockquote></div>