Ajuda com amostra pequena

Bom dia Recebi um conjunto de dados (summary abaixo) para análise, porém vejo alguns problemas: 1. Amostra muito pequena, apenas 17 registros 2. Algumas variáveis com categorias ocorrendo apenas um ou duas vezes como sexo (SEX) por exemplo 3. Variável idade (IDA) e numero de alunos na sala (NAL) com muitas categoria 4. Variável gerenciamento (GBY) não possui variabilidade Esse é um banco de dados sobre bullying na escola, preciso analisar a capacidade do coordenador em definir bullying (DBY) reconhecer bullying (RBY) e gerenciar bullying (GBY) Alguem pode sugerir que tipo de ações eu poderia executar para conseguir fazer alguma análise sobre esses dados ou me dizer se é impossível fazer isso? -- *In Jesu et Maria* *Obrigado* *Prof. Elias Carvalho* *"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he who has been able to understand the cause of things"*

Bom dia, Primeiramente acho importante analisar os tipos de variáveis para ver que tipos de análises podem ser feitas. Há um problema no formato das categorias IDA, TGE, NAL e NAS, que são dados numéricos mas já foram sumarizados em categorias (dados categóricos). O resultado é que com isso temos menor poder de análise. Quanto à variabilidade dos dados, as variáveis SEX, FPO, EES, ESJ, IJS, DBY e GBY (última coluna) possuem variabilidade muito baixa. Assim, como você disse, isso também reduz o poder de análise. O ideal seria pedir os dados novamente em um novo formato, sem as sumarizações citadas nas variáveis IDA, TGE, NAL e NAS para ampliar o número de análise possíveis. Se não for viável, o que você pode fazer é cruzar variáveis como SEX, IDA, TGE, NAS e NAL com aquelas cuja resposta foi sim e não e fazer um teste qui-quadrado para verificar a independência delas para poder tirar conclusões. Por fim, idealmente aquelas variáveis com baixa variabilidade (SEX, FPO, EES, ESJ, IJS, DBY e GBY) deveriam ser desconsideradas, deixando apenas REL e RBY para serem comparadas com IDA, TGE, NAL e NAS, além das comparações entre si no grupo de variáveis IDA, TGE, NAL e NAS. Minha posição é a seguinte: se isso for suficiente para responder sua pergunta de pesquisa , apesar das limitações apontadas, sua análise é possível, caso contrário peça um novo conjunto de dados mais adequado ou informe os problemas (provavelmente devido à formulação do questionário). Espero ter dado minha contribuição, e caso a opinião profissional de vocês divergir de algum ponto que comentei, por favor se manifestem para complementar e/ou contribuir com a resposta do Professor Elias Carvalho. att, RodrigoDoutorando em Estudos LinguísticosUniversidade Federal de Minas Gerais Em sexta-feira, 1 de junho de 2018 07:48:27 BRT, Elias Carvalho via R-br <r-br@listas.c3sl.ufpr.br> escreveu: Bom dia Recebi um conjunto de dados (summary abaixo) para análise, porém vejo alguns problemas: - Amostra muito pequena, apenas 17 registros - Algumas variáveis com categorias ocorrendo apenas um ou duas vezes como sexo (SEX) por exemplo - Variável idade (IDA) e numero de alunos na sala (NAL) com muitas categoria - Variável gerenciamento (GBY) não possui variabilidade Esse é um banco de dados sobre bullying na escola, preciso analisar a capacidade do coordenador em definir bullying (DBY) reconhecer bullying (RBY) e gerenciar bullying (GBY) Alguem pode sugerir que tipo de ações eu poderia executar para conseguir fazer alguma análise sobre esses dados ou me dizer se é impossível fazer isso? -- In Jesu et Maria ObrigadoProf. Elias Carvalho "Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he who has been able to understand the cause of things"_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.

Caro Elias, Antes de mergulhar no poço dos dados, vale a seguinte pergunta (que veja só você é *decorrente* da filosofia esposada por Virgílio) : « Qual foi o processo que gerou esses dados? » A amostra foi AAS? Como cada nível de cada fator foi determinado/calculado? Deixo-o com o seguinte pensamento: HTH "The quality of a survey is best judged not by its size, scope, or prominence, but by how much attention is given to [preventing, measuring and] dealing with the many important problems that can arise." *— "What is a Survey?", American Statistical Association* HTH -- Cesar Rabak 2018-06-01 7:47 GMT-03:00 Elias Carvalho via R-br <r-br@listas.c3sl.ufpr.br> :
Bom dia
Recebi um conjunto de dados (summary abaixo) para análise, porém vejo alguns problemas:
1. Amostra muito pequena, apenas 17 registros 2. Algumas variáveis com categorias ocorrendo apenas um ou duas vezes como sexo (SEX) por exemplo 3. Variável idade (IDA) e numero de alunos na sala (NAL) com muitas categoria 4. Variável gerenciamento (GBY) não possui variabilidade
Esse é um banco de dados sobre bullying na escola, preciso analisar a capacidade do coordenador em definir bullying (DBY) reconhecer bullying (RBY) e gerenciar bullying (GBY)
Alguem pode sugerir que tipo de ações eu poderia executar para conseguir fazer alguma análise sobre esses dados ou me dizer se é impossível fazer isso?
--
*In Jesu et Maria* *Obrigado* *Prof. Elias Carvalho*
*"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he who has been able to understand the cause of things"*
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Cesar Rabak
-
Elias Carvalho
-
Rodrigo Araújo e Castro