
Rapaz! Com 24 variáveis e apenas 40 objetos, que entendo aqui como número de dados, amostras ou "linhas" do banco de dados, você se arrisca a fazer um sobreajuste (*overfitting*)¹ e não uma análise estatística! Ademais, com dados faltantes em alguns casos você ainda vai uma nova questão do que esses dados imputados poderia significar se essa for a saída encontrada ou se a alternativa for descartar casos com dados faltantes. . . HTH -- Cesar Rabak [1] V. também a respeito da "one in ten rule", embora o número dez pode precisar ser maior como no seu caso que além de multivariada tem dados faltantes. On Wed, May 29, 2019 at 2:06 PM Caio Correa por (R-br) < r-br@listas.c3sl.ufpr.br> wrote:
<quote author='R-br mailing list'> Boa tarde Prezados.
Estou a tratar dados experimentais em excel, sendo que alguns dados estão em falta em relação a algumas variáveis e objetos (entradas em Excel).
Vou realizar a análise multivariada com dados de uma planilha (40 objetos versus 24 colunas de dados), mas antes, eu tenho que prever os dados em falta de algumas células.
Por gentileza alguém teria recomendação de script no R com a implementação dos métodos?
- Método do algoritmo E-M (Expectativa-Maximização) que pressupõe a normalidade dos dados referentes às variáveis de resposta
e
- Modelo de regressão logística. A equação gerada permitiria estimar os valores dos dados perdidos. Não assume uma distribuição normal das variáveis de resposta. Ao contrário da regressão linear cujos dados variam de - ∞ a + ∞, na regressão logística eles variam de 0 a 1 e, portanto, são apropriados para variáveis cujos valores variam de 0 a 1.
Em vista do exposto, alguém poderia me ajudar ou recomendar alguém que saiba implementar esses métodos no R?
Grato pela atenção.
Obrigado
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel. </quote> Quoted from:
http://r-br.2285057.n4.nabble.com/R-br-Aplicacao-de-metodos-de-dados-faltant...
Dê uma olhada nesse post...
https://towardsdatascience.com/6-different-ways-to-compensate-for-missing-va...
_____________________________________ Sent from http://r-br.2285057.n4.nabble.com
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e fornea cdigo mnimo reproduzvel.