[R-br] Pnad e trabalho infantil

Cesar Rabak cesar.rabak em gmail.com
Qua Abr 2 14:26:07 -03 2025


Izabella,

Pela descrição feita no seu texto, parece que vc enfrenta um aspecto de
"arquitetura de banco de dados", onde uma chave é usada para conectar
logicamente várias "tabelas" no sentido de BD, enquanto o R espera um
*dataframe* que é uma tabela mais consolidada ou como diria um analista de
BD « na 1ª forma normal ».

Seu script deverá usar os subpacotes de *tidyverse* e colocar as variáveis
de interesse todas como colunas duma única linha identificável com com
'chave_domicilio'¹.

Daí pós processar esse dataframe colocando pesos, agregando, calculando as
var dummy, etc. ficará mais fácil.

HTH
--
Cesar Rabak

[1] Em particular veja as funções cast e eventualmente para reverter ou
conferir a melt desse pacote.

On Wed, Apr 2, 2025 at 10:54 AM Izabella Maria Viana por (R-br) <
r-br em listas.c3sl.ufpr.br> wrote:

> Prezados,
>
> Estamos escrevendo um artigo sobre os determinantes do trabalho infantil
> no Brasil, que utilizará os microdados da PNAD Contínua de 2021,
> relacionados à quinta visita. Estamos estruturando um script que consolida
> a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando
> algumas dificuldades.
>
> O banco de dados em questão deve conter informações relativas à pessoa de
> referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.),
> assim como informações referentes a criança entre 5 e 17 anos que esteja em
> situação de trabalho infantil (variável* dummy* que indique essa
> situação, número de crianças no domicílio que se enquadram neste quesito,
> sexo da criança, idade e etc.).
>
> Contudo, não estamos conseguindo pensar em uma forma na qual consigamos
> executar essa ação no R. O grande problema é que, dado um domicílio que é
> identificado pela variável `chave_domicilio`, existirá diversas observações
> que abrangem as pessoas que pertencem a ele (pessoa responsável pelo
> domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se
> devemos incluir os pesos antes ou após a realização dessas manipulações.
> Estamos utilizando, basicamente, os pacotes *survey, srvyr, PNADcIBGE e
> tidyverse* para realizar a importação e manipulação das informações.
>
> Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir?
>
> Gratos desde já!
>
> --
> Izabella M S Viana
> Doutoranda em Estatística (UFPE)
> Economista e Mestre em Economia (UFV)
> Professora Orientadora USP/ESALq
> Email secundário: izabella.maria em ufpe.br
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20250402/3e7c062c/attachment.htm>


Mais detalhes sobre a lista de discussão R-br