From izabellam29 em gmail.com Wed Apr 2 10:53:41 2025 From: izabellam29 em gmail.com (Izabella Maria Viana) Date: Wed, 2 Apr 2025 10:53:41 -0300 Subject: [R-br] Pnad e trabalho infantil Message-ID: Prezados, Estamos escrevendo um artigo sobre os determinantes do trabalho infantil no Brasil, que utilizará os microdados da PNAD Contínua de 2021, relacionados à quinta visita. Estamos estruturando um script que consolida a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando algumas dificuldades. O banco de dados em questão deve conter informações relativas à pessoa de referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), assim como informações referentes a criança entre 5 e 17 anos que esteja em situação de trabalho infantil (variável* dummy* que indique essa situação, número de crianças no domicílio que se enquadram neste quesito, sexo da criança, idade e etc.). Contudo, não estamos conseguindo pensar em uma forma na qual consigamos executar essa ação no R. O grande problema é que, dado um domicílio que é identificado pela variável `chave_domicilio`, existirá diversas observações que abrangem as pessoas que pertencem a ele (pessoa responsável pelo domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se devemos incluir os pesos antes ou após a realização dessas manipulações. Estamos utilizando, basicamente, os pacotes *survey, srvyr, PNADcIBGE e tidyverse* para realizar a importação e manipulação das informações. Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir? Gratos desde já! -- Izabella M S Viana Doutoranda em Estatística (UFPE) Economista e Mestre em Economia (UFV) Professora Orientadora USP/ESALq Email secundário: izabella.maria em ufpe.br -------------- Próxima Parte ---------- Um anexo em HTML foi limpo... URL: From vinynegrelli em gmail.com Wed Apr 2 11:05:24 2025 From: vinynegrelli em gmail.com (=?UTF-8?Q?Vin=C3=ADcius_Lionel=2DMateus?=) Date: Wed, 2 Apr 2025 11:05:24 -0300 Subject: [R-br] Pnad e trabalho infantil In-Reply-To: References: Message-ID: Olá, Izabella! Seu trabalho é muito interessante. Mas, vai auxiliar ter algum código para reproduzir. (*Observação 1*) Penso que seria interessante você criar um lista das características de cada variável: um *codebook*. Mesmo que para você esteja claro, assim você conseguirá com mais colegas, mesmo que não estejam familiarizados com sua pesquisa. (*Observação 2*) Você fala sobre uma variável dummy, e depois salta para a questão dos pesos. Não entendi a transição. Você teve algum erro no código de algum dos pacotes que você usou? (*Observação 3*) Cordialmente, Vinícius On Wed, Apr 2, 2025, 10:54 Izabella Maria Viana por (R-br) < r-br em listas.c3sl.ufpr.br> wrote: > Prezados, > > Estamos escrevendo um artigo sobre os determinantes do trabalho infantil > no Brasil, que utilizará os microdados da PNAD Contínua de 2021, > relacionados à quinta visita. Estamos estruturando um script que consolida > a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando > algumas dificuldades. > > O banco de dados em questão deve conter informações relativas à pessoa de > referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), > assim como informações referentes a criança entre 5 e 17 anos que esteja em > situação de trabalho infantil (variável* dummy* que indique essa > situação, número de crianças no domicílio que se enquadram neste quesito, > sexo da criança, idade e etc.). > > Contudo, não estamos conseguindo pensar em uma forma na qual consigamos > executar essa ação no R. O grande problema é que, dado um domicílio que é > identificado pela variável `chave_domicilio`, existirá diversas observações > que abrangem as pessoas que pertencem a ele (pessoa responsável pelo > domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se > devemos incluir os pesos antes ou após a realização dessas manipulações. > Estamos utilizando, basicamente, os pacotes *survey, srvyr, PNADcIBGE e > tidyverse* para realizar a importação e manipulação das informações. > > Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir? > > Gratos desde já! > > -- > Izabella M S Viana > Doutoranda em Estatística (UFPE) > Economista e Mestre em Economia (UFV) > Professora Orientadora USP/ESALq > Email secundário: izabella.maria em ufpe.br > _______________________________________________ > R-br mailing list > R-br em listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. > -------------- Próxima Parte ---------- Um anexo em HTML foi limpo... URL: From bodevan.ec em gmail.com Wed Apr 2 12:38:07 2025 From: bodevan.ec em gmail.com (Emerson Cotta Bodevan) Date: Wed, 2 Apr 2025 12:38:07 -0300 Subject: [R-br] TukeyHSD In-Reply-To: References: Message-ID: @Cesar Obrigado pelas considerações. Muito pertinentes. Desculpe a demora em retornar. Abraço. *Emerson* Em sex., 28 de mar. de 2025 13:37, Cesar Rabak escreveu: > Como apoio à minha última observação cito dois autores, que eu coloco nos > meus relatórios quando é feita uma análise estatística: HTH > > ?*Always present effect sizes for primary outcomes ? If the units of > measurement are meaningful on a practical level ?, then we usually prefer > an unstardardized measurement to a standardized measure*.? > > ? *(Wilkison, L., 1999)**.* > > ?*In the post p <0.05 era, scientific argumentation is not based on > whether a p-value is small enough or not. Attention is paid to effect sizes > and confidence intervals. Evidence is thought of as being continuous rather > than some sort of dichotomy*.? > > ? *Ron Wasserstein, executive director of the American Statistical > Association**, 2016.* > > > HTH > > -- > > Cesar Rabak > > On Fri, Mar 28, 2025 at 1:13?PM Cesar Rabak wrote: > >> @Emerson: >> >> Considere adicionar às suas análises uma medida e discussão sobre os >> tamanhos dos efeitos observados. >> >> Ademais, além da diferença mínima detectável dada pelo teste *post hoc* utilizado, >> aconselho a verificar qual a acurácia (ou pensando estatisticamente, o >> intervalo de confiança) das medidas da variável resposta, que tendo sido >> feito a ANOVA, pressuponho seja contínua, pelo menos intervalar. >> >> HTH >> >> -- >> Cesar Rabak >> >> >> >> On Fri, Mar 28, 2025 at 8:49?AM Emerson Cotta Bodevan < >> bodevan.ec em gmail.com> wrote: >> >>> Prezados, bom dia. >>> >>> Primeiramente, obrigado a todos pelo rápido retorno. >>> >>> Marcelo e Fernando... todas as soluções apresentadas funcionaram >>> direitinho. Obrigado. >>> >>> Luiz e Cesar... obrigado pelas considerações. São 24 tratamentos, o que >>> nos leva a 276 comparações dois a dois. Mas consigo separar em blocos de 8 >>> tratamentos. Acredito que as discussões serão mais ricas e o teste mais >>> adequado. Obrigado mais uma vez. >>> >>> Abraços. >>> >>> *Emerson* >>> >>> >>> Em qui., 27 de mar. de 2025 às 23:50, Cesar Rabak por (R-br) < >>> r-br em listas.c3sl.ufpr.br> escreveu: >>> >>>> Pegando carona na resposta do Luiz Alexandre sobre a inadequação do >>>> número de tratamentos, que eu concordo, gostaria de acrescentar que >>>> parece-me que há poucos casos para o número de tratamentos (a divisão do nº >>>> de casos pelo dos tratamentos não dá nem inteiro, o que me leva a pensar >>>> que ANOVA pode estar desbalanceada, também...). >>>> >>>> Uma outra questão mais prática é por que a ANOVA precisa de tantas >>>> linhas, a menos que sua formulação inclua interações entre os tratamentos. >>>> >>>> HTH >>>> >>>> On Thu, Mar 27, 2025 at 6:01?PM Luiz Peternelli por (R-br) < >>>> r-br em listas.c3sl.ufpr.br> wrote: >>>> >>>>> Olá. >>>>> Você precisa fazer isso no R? Fará essa análise comparativa de maneira >>>>> recorrente, ou somente uma vez e apresentará os resultados num paper? >>>>> Se fará somente uma vez e se todos os tratamentos tiverem o mesmo >>>>> número de repetições, fazer à mão é extremamente simples, já q o delta da >>>>> diferença mínima significativa será único. >>>>> >>>>> Outro ponto importante: na prática usar esse teste quando se tem muito >>>>> tratamentos é inadequado. Só vai trazer mais confusão interpretativa do que >>>>> auxílio em tomada de decisão. >>>>> >>>>> Abraços >>>>> >>>>> ?Luiz Alexandre Peternelli >>>>> >>>>> >>>>> >>>>> >>>>> >>>>> On Thu, Mar 27, 2025 at 16:06 Marcelo Laia por (R-br) < >>>>> r-br em listas.c3sl.ufpr.br> wrote: >>>>> >>>>>> Oi Emerson, você já testou uma das três opções abaixo? >>>>>> >>>>>> Opção 1: Aumentar o limite de impressão >>>>>> >>>>>> options(max.print = 10000) # ou qualquer valor maior que o número de >>>>>> linhas >>>>>> print(resultado) >>>>>> >>>>>> Opção 2: Acessar diretamente os resultados >>>>>> >>>>>> resultado$`nome_do_fator` # substitua pelo nome real do fator >>>>>> >>>>>> Exemplo: >>>>>> >>>>>> resultado <- TukeyHSD(aov(valor ~ tratamento, data = dados)) >>>>>> View(resultado$tratamento) # abrir em visualização tabular >>>>>> >>>>>> Opção 3: Exportar para Excel ou CSV >>>>>> >>>>>> write.csv(resultado$tratamento, "tukey_resultados.csv") >>>>>> >>>>>> Teoricamente, essas abordagens permitirão acessar todas as >>>>>> comparações, inclusive as omitidas. >>>>>> >>>>>> Marcelo >>>>>> >>>>>> Enviado a partir de dispositivo móvel >>>>>> https://linktr.ee/marcelolaia >>>>>> >>>>>> Em qui., 27 de mar. de 2025, 15:08, Emerson Cotta Bodevan por (R-br) < >>>>>> r-br em listas.c3sl.ufpr.br> escreveu: >>>>>> >>>>>>> Prezados, boa tarde. >>>>>>> >>>>>>> Fiz um teste de Tukey, usando o comando >>>>>>> >>>>>>> resultado<-TukeyHSD(resultado de uma anova) >>>>>>> >>>>>>> O arquivo tem 276 linhas (24 tratamentos diferentes). >>>>>>> >>>>>>> Como faço para ver todas as comparações? >>>>>>> >>>>>>> Pergunto porque o R da a mensagem >>>>>>> >>>>>>> [ reached getOption("max.print") -- omitted 26 rows ] >>>>>>> >>>>>>> >>>>>>> Entendo que ele omitiu 26 linhas. >>>>>>> >>>>>>> OBS.: Preciso dos resultados para preencher as letras que >>>>>>> diferenciam as linhas na tabela de resultados. >>>>>>> >>>>>>> >>>>>>> >>>>>>> Agradeço qualquer ajuda. >>>>>>> >>>>>>> *Emerson* >>>>>>> _______________________________________________ >>>>>>> R-br mailing list >>>>>>> R-br em listas.c3sl.ufpr.br >>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >>>>>>> forneça código mínimo reproduzível. >>>>>>> >>>>>> _______________________________________________ >>>>>> R-br mailing list >>>>>> R-br em listas.c3sl.ufpr.br >>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>>>>> código mínimo reproduzível. >>>>>> >>>>> _______________________________________________ >>>>> R-br mailing list >>>>> R-br em listas.c3sl.ufpr.br >>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>>>> código mínimo reproduzível. >>>>> >>>> _______________________________________________ >>>> R-br mailing list >>>> R-br em listas.c3sl.ufpr.br >>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>>> código mínimo reproduzível. >>>> >>> -------------- Próxima Parte ---------- Um anexo em HTML foi limpo... URL: From abreums em gmail.com Wed Apr 2 13:22:49 2025 From: abreums em gmail.com (Marcos Abreu) Date: Wed, 2 Apr 2025 13:22:49 -0300 Subject: [R-br] Pnad e trabalho infantil In-Reply-To: References: Message-ID: Olá. Se você utilizar o pacote survey (ou srvyr) para fazer a leitura das variáveis, o resultado da pesquisa estará com os pesos ajustados. O que responde "não temos certeza se devemos incluir os pesos antes ou após a realização dessas manipulações". Se você estiver lendo a partir das tabelas baixadas, você precisará especificar a coluna dos pesos, mas talvez seja mais fácil utilizar o pacote PNADcIBGE para acessar os dados. Este link do pacote tem exemplos de como fazer: https://rpubs.com/gabriel-assuncao-ibge/pnadc Isto ajuda? Ou entendi errado seu problema? Por favor, fique a vontade de me corrigir se entendi errado. Atte Em qua., 2 de abr. de 2025 às 10:54, Izabella Maria Viana por (R-br) < r-br em listas.c3sl.ufpr.br> escreveu: > Prezados, > > Estamos escrevendo um artigo sobre os determinantes do trabalho infantil > no Brasil, que utilizará os microdados da PNAD Contínua de 2021, > relacionados à quinta visita. Estamos estruturando um script que consolida > a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando > algumas dificuldades. > > O banco de dados em questão deve conter informações relativas à pessoa de > referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), > assim como informações referentes a criança entre 5 e 17 anos que esteja em > situação de trabalho infantil (variável* dummy* que indique essa > situação, número de crianças no domicílio que se enquadram neste quesito, > sexo da criança, idade e etc.). > > Contudo, não estamos conseguindo pensar em uma forma na qual consigamos > executar essa ação no R. O grande problema é que, dado um domicílio que é > identificado pela variável `chave_domicilio`, existirá diversas observações > que abrangem as pessoas que pertencem a ele (pessoa responsável pelo > domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se > devemos incluir os pesos antes ou após a realização dessas manipulações. > Estamos utilizando, basicamente, os pacotes *survey, srvyr, PNADcIBGE e > tidyverse* para realizar a importação e manipulação das informações. > > Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir? > > Gratos desde já! > > -- > Izabella M S Viana > Doutoranda em Estatística (UFPE) > Economista e Mestre em Economia (UFV) > Professora Orientadora USP/ESALq > Email secundário: izabella.maria em ufpe.br > _______________________________________________ > R-br mailing list > R-br em listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. > -- Marcos Abreu ------------------------ -------------- Próxima Parte ---------- Um anexo em HTML foi limpo... URL: From cesar.rabak em gmail.com Wed Apr 2 14:16:36 2025 From: cesar.rabak em gmail.com (Cesar Rabak) Date: Wed, 2 Apr 2025 14:16:36 -0300 Subject: [R-br] TukeyHSD In-Reply-To: References: Message-ID: Sem problemas! A vida de pesquisador é dura... eu bem o sei! Meus augúrios de bom trabalho a você. sds On Wed, Apr 2, 2025 at 12:38?PM Emerson Cotta Bodevan wrote: > @Cesar > > Obrigado pelas considerações. Muito pertinentes. > > Desculpe a demora em retornar. > > Abraço. > > > *Emerson* > > Em sex., 28 de mar. de 2025 13:37, Cesar Rabak > escreveu: > >> Como apoio à minha última observação cito dois autores, que eu coloco nos >> meus relatórios quando é feita uma análise estatística: HTH >> >> ?*Always present effect sizes for primary outcomes ? If the units of >> measurement are meaningful on a practical level ?, then we usually prefer >> an unstardardized measurement to a standardized measure*.? >> >> ? *(Wilkison, L., 1999)**.* >> >> ?*In the post p <0.05 era, scientific argumentation is not based on >> whether a p-value is small enough or not. Attention is paid to effect sizes >> and confidence intervals. Evidence is thought of as being continuous rather >> than some sort of dichotomy*.? >> >> ? *Ron Wasserstein, executive director of the American Statistical >> Association**, 2016.* >> >> >> HTH >> >> -- >> >> Cesar Rabak >> >> On Fri, Mar 28, 2025 at 1:13?PM Cesar Rabak >> wrote: >> >>> @Emerson: >>> >>> Considere adicionar às suas análises uma medida e discussão sobre os >>> tamanhos dos efeitos observados. >>> >>> Ademais, além da diferença mínima detectável dada pelo teste *post hoc* utilizado, >>> aconselho a verificar qual a acurácia (ou pensando estatisticamente, o >>> intervalo de confiança) das medidas da variável resposta, que tendo sido >>> feito a ANOVA, pressuponho seja contínua, pelo menos intervalar. >>> >>> HTH >>> >>> -- >>> Cesar Rabak >>> >>> >>> >>> On Fri, Mar 28, 2025 at 8:49?AM Emerson Cotta Bodevan < >>> bodevan.ec em gmail.com> wrote: >>> >>>> Prezados, bom dia. >>>> >>>> Primeiramente, obrigado a todos pelo rápido retorno. >>>> >>>> Marcelo e Fernando... todas as soluções apresentadas funcionaram >>>> direitinho. Obrigado. >>>> >>>> Luiz e Cesar... obrigado pelas considerações. São 24 tratamentos, o que >>>> nos leva a 276 comparações dois a dois. Mas consigo separar em blocos de 8 >>>> tratamentos. Acredito que as discussões serão mais ricas e o teste mais >>>> adequado. Obrigado mais uma vez. >>>> >>>> Abraços. >>>> >>>> *Emerson* >>>> >>>> >>>> Em qui., 27 de mar. de 2025 às 23:50, Cesar Rabak por (R-br) < >>>> r-br em listas.c3sl.ufpr.br> escreveu: >>>> >>>>> Pegando carona na resposta do Luiz Alexandre sobre a inadequação do >>>>> número de tratamentos, que eu concordo, gostaria de acrescentar que >>>>> parece-me que há poucos casos para o número de tratamentos (a divisão do nº >>>>> de casos pelo dos tratamentos não dá nem inteiro, o que me leva a pensar >>>>> que ANOVA pode estar desbalanceada, também...). >>>>> >>>>> Uma outra questão mais prática é por que a ANOVA precisa de tantas >>>>> linhas, a menos que sua formulação inclua interações entre os tratamentos. >>>>> >>>>> HTH >>>>> >>>>> On Thu, Mar 27, 2025 at 6:01?PM Luiz Peternelli por (R-br) < >>>>> r-br em listas.c3sl.ufpr.br> wrote: >>>>> >>>>>> Olá. >>>>>> Você precisa fazer isso no R? Fará essa análise comparativa de >>>>>> maneira recorrente, ou somente uma vez e apresentará os resultados num >>>>>> paper? >>>>>> Se fará somente uma vez e se todos os tratamentos tiverem o mesmo >>>>>> número de repetições, fazer à mão é extremamente simples, já q o delta da >>>>>> diferença mínima significativa será único. >>>>>> >>>>>> Outro ponto importante: na prática usar esse teste quando se tem >>>>>> muito tratamentos é inadequado. Só vai trazer mais confusão interpretativa >>>>>> do que auxílio em tomada de decisão. >>>>>> >>>>>> Abraços >>>>>> >>>>>> ?Luiz Alexandre Peternelli >>>>>> >>>>>> >>>>>> >>>>>> >>>>>> >>>>>> On Thu, Mar 27, 2025 at 16:06 Marcelo Laia por (R-br) < >>>>>> r-br em listas.c3sl.ufpr.br> wrote: >>>>>> >>>>>>> Oi Emerson, você já testou uma das três opções abaixo? >>>>>>> >>>>>>> Opção 1: Aumentar o limite de impressão >>>>>>> >>>>>>> options(max.print = 10000) # ou qualquer valor maior que o número >>>>>>> de linhas >>>>>>> print(resultado) >>>>>>> >>>>>>> Opção 2: Acessar diretamente os resultados >>>>>>> >>>>>>> resultado$`nome_do_fator` # substitua pelo nome real do fator >>>>>>> >>>>>>> Exemplo: >>>>>>> >>>>>>> resultado <- TukeyHSD(aov(valor ~ tratamento, data = dados)) >>>>>>> View(resultado$tratamento) # abrir em visualização tabular >>>>>>> >>>>>>> Opção 3: Exportar para Excel ou CSV >>>>>>> >>>>>>> write.csv(resultado$tratamento, "tukey_resultados.csv") >>>>>>> >>>>>>> Teoricamente, essas abordagens permitirão acessar todas as >>>>>>> comparações, inclusive as omitidas. >>>>>>> >>>>>>> Marcelo >>>>>>> >>>>>>> Enviado a partir de dispositivo móvel >>>>>>> https://linktr.ee/marcelolaia >>>>>>> >>>>>>> Em qui., 27 de mar. de 2025, 15:08, Emerson Cotta Bodevan por (R-br) >>>>>>> escreveu: >>>>>>> >>>>>>>> Prezados, boa tarde. >>>>>>>> >>>>>>>> Fiz um teste de Tukey, usando o comando >>>>>>>> >>>>>>>> resultado<-TukeyHSD(resultado de uma anova) >>>>>>>> >>>>>>>> O arquivo tem 276 linhas (24 tratamentos diferentes). >>>>>>>> >>>>>>>> Como faço para ver todas as comparações? >>>>>>>> >>>>>>>> Pergunto porque o R da a mensagem >>>>>>>> >>>>>>>> [ reached getOption("max.print") -- omitted 26 rows ] >>>>>>>> >>>>>>>> >>>>>>>> Entendo que ele omitiu 26 linhas. >>>>>>>> >>>>>>>> OBS.: Preciso dos resultados para preencher as letras que >>>>>>>> diferenciam as linhas na tabela de resultados. >>>>>>>> >>>>>>>> >>>>>>>> >>>>>>>> Agradeço qualquer ajuda. >>>>>>>> >>>>>>>> *Emerson* >>>>>>>> _______________________________________________ >>>>>>>> R-br mailing list >>>>>>>> R-br em listas.c3sl.ufpr.br >>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >>>>>>>> forneça código mínimo reproduzível. >>>>>>>> >>>>>>> _______________________________________________ >>>>>>> R-br mailing list >>>>>>> R-br em listas.c3sl.ufpr.br >>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >>>>>>> forneça código mínimo reproduzível. >>>>>>> >>>>>> _______________________________________________ >>>>>> R-br mailing list >>>>>> R-br em listas.c3sl.ufpr.br >>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>>>>> código mínimo reproduzível. >>>>>> >>>>> _______________________________________________ >>>>> R-br mailing list >>>>> R-br em listas.c3sl.ufpr.br >>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>>>> código mínimo reproduzível. >>>>> >>>> -------------- Próxima Parte ---------- Um anexo em HTML foi limpo... URL: From cesar.rabak em gmail.com Wed Apr 2 14:26:07 2025 From: cesar.rabak em gmail.com (Cesar Rabak) Date: Wed, 2 Apr 2025 14:26:07 -0300 Subject: [R-br] Pnad e trabalho infantil In-Reply-To: References: Message-ID: Izabella, Pela descrição feita no seu texto, parece que vc enfrenta um aspecto de "arquitetura de banco de dados", onde uma chave é usada para conectar logicamente várias "tabelas" no sentido de BD, enquanto o R espera um *dataframe* que é uma tabela mais consolidada ou como diria um analista de BD « na 1ª forma normal ». Seu script deverá usar os subpacotes de *tidyverse* e colocar as variáveis de interesse todas como colunas duma única linha identificável com com 'chave_domicilio'¹. Daí pós processar esse dataframe colocando pesos, agregando, calculando as var dummy, etc. ficará mais fácil. HTH -- Cesar Rabak [1] Em particular veja as funções cast e eventualmente para reverter ou conferir a melt desse pacote. On Wed, Apr 2, 2025 at 10:54?AM Izabella Maria Viana por (R-br) < r-br em listas.c3sl.ufpr.br> wrote: > Prezados, > > Estamos escrevendo um artigo sobre os determinantes do trabalho infantil > no Brasil, que utilizará os microdados da PNAD Contínua de 2021, > relacionados à quinta visita. Estamos estruturando um script que consolida > a base de dados que irá subsidiar o nosso artigo, porém estamos enfrentando > algumas dificuldades. > > O banco de dados em questão deve conter informações relativas à pessoa de > referência (por exemplo: sexo, raça, escolaridade, estado civil e etc.), > assim como informações referentes a criança entre 5 e 17 anos que esteja em > situação de trabalho infantil (variável* dummy* que indique essa > situação, número de crianças no domicílio que se enquadram neste quesito, > sexo da criança, idade e etc.). > > Contudo, não estamos conseguindo pensar em uma forma na qual consigamos > executar essa ação no R. O grande problema é que, dado um domicílio que é > identificado pela variável `chave_domicilio`, existirá diversas observações > que abrangem as pessoas que pertencem a ele (pessoa responsável pelo > domicílio, cônjuge, crianças e etc.). Além disso, não temos certeza se > devemos incluir os pesos antes ou após a realização dessas manipulações. > Estamos utilizando, basicamente, os pacotes *survey, srvyr, PNADcIBGE e > tidyverse* para realizar a importação e manipulação das informações. > > Vocês têm alguma sugestão de manipulação ou que caminho devemos seguir? > > Gratos desde já! > > -- > Izabella M S Viana > Doutoranda em Estatística (UFPE) > Economista e Mestre em Economia (UFV) > Professora Orientadora USP/ESALq > Email secundário: izabella.maria em ufpe.br > _______________________________________________ > R-br mailing list > R-br em listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. > -------------- Próxima Parte ---------- Um anexo em HTML foi limpo... URL: