[R-br] Aplicação de métodos de dados faltantes no ambiente R

Cesar Rabak cesar.rabak em gmail.com
Sex Maio 31 11:23:40 -03 2019


Rapaz!

Com 24 variáveis e apenas 40 objetos, que entendo aqui como número de
dados, amostras ou "linhas" do banco de dados, você se arrisca a fazer um
sobreajuste (*overfitting*)¹ e não uma análise estatística!

Ademais, com dados faltantes em alguns casos você ainda vai uma nova
questão do que esses dados imputados poderia significar se essa for a saída
encontrada ou se a alternativa for descartar casos com dados faltantes. . .

HTH
--
Cesar Rabak

[1] V. também a respeito da "one in ten rule", embora o número dez pode
precisar ser maior como no seu caso que além de multivariada tem dados
faltantes.


On Wed, May 29, 2019 at 2:06 PM Caio Correa por (R-br) <
r-br em listas.c3sl.ufpr.br> wrote:

> <quote author='R-br mailing list'>
> Boa tarde Prezados.
>
> Estou a tratar dados experimentais em excel, sendo que alguns dados estão
> em falta em relação a algumas variáveis e objetos (entradas em Excel).
>
> Vou realizar a análise multivariada com dados de uma planilha (40 objetos
> versus 24 colunas de dados), mas antes, eu tenho que prever os dados em
> falta de algumas células.
>
> Por gentileza alguém teria recomendação de script no R com a implementação
> dos métodos?
>
> - Método do algoritmo E-M (Expectativa-Maximização) que pressupõe a
> normalidade dos dados referentes às variáveis de resposta
>
> e
>
> - Modelo de regressão logística. A equação gerada permitiria estimar os
> valores dos dados perdidos. Não assume uma distribuição normal das
> variáveis de resposta. Ao contrário da regressão linear cujos dados variam
> de - ∞ a + ∞, na regressão logística eles variam de 0 a 1 e, portanto, são
> apropriados para variáveis cujos valores variam de 0 a 1.
>
> Em vista do exposto, alguém poderia me ajudar ou recomendar alguém que
> saiba implementar esses métodos no R?
>
>
> Grato pela atenção.
>
> Obrigado
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a
> c�digo
> m�nimo reproduz�vel.
> </quote>
> Quoted from:
>
> http://r-br.2285057.n4.nabble.com/R-br-Aplicacao-de-metodos-de-dados-faltantes-no-ambiente-R-tp4668543.html
>
>
> Dê uma olhada nesse post...
>
> https://towardsdatascience.com/6-different-ways-to-compensate-for-missing-values-data-imputation-with-examples-6022d9ca0779
>
> _____________________________________
> Sent from http://r-br.2285057.n4.nabble.com
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e fornea cdigo
> mnimo reproduzvel.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20190531/b51d3e2a/attachment.html>


Mais detalhes sobre a lista de discussão R-br