[R-br] Ajuda com Knn Cross Validation

Marcus Nunes marcus.nunes em gmail.com
Qui Set 12 07:36:25 -03 2019


Eu não entendi duas coisas:

1. Por que utilizar "repeatedcv" como method se a ideia é fazer apenas a
validação cruzada simples? Basta usar "cv" se a validação cruzada não for
repetida.

2. Particularmente, nunca vi ninguém fazer validação cruzada com mais de 10
folds. No teu caso, tu está usando 683. Desconfio que, ao rodar o algoritmo
e fazer as reamostragens para criar os conjuntos de treinamento e validação
intermediários, acabem faltando observações justamente para estas etapas de
validação intermediárias. Estude um pouco mais sobre validação cruzada e
utilize number = 5 que o teu algoritmo deve rodar satisfatoriamente.




On Thu, Sep 12, 2019, 06:17 Juliana DS por (R-br) <r-br em listas.c3sl.ufpr.br>
wrote:

> Olá pessoal, bom dia!
>
> Preciso rodar um código, mas estou com um erro.
> Poderiam me ajudar,por favor?
>
>
> library(MASS)
> library(class)
> library(caret)
> library(e1071)
>
> biopsyX = na.omit(biopsy[,-c(1)]) # Removi a coluna ID
> is.na(biopsyX$V6)
> biopsyX <- na.omit(biopsyX)    # Omitir os valores NA
> str(biopsyX)
>
>
> set.seed(1984)
>
> ctrl <- trainControl(method="repeatedcv", number=683)
> nn_grid <- expand.grid(k=c(1:12))
> best_knn <- train(class ~ ., data=biopsyX, method="knn", trControl=ctrl,
> preProcess = c("center", "scale"), tuneGrid=nn_grid)
> print(best_knn)
>
>
> O meu código trava na linha de treinar o modelo, e me retorna o seguinte
> erro:
> "Warning message:
> In nominalTrainWorkflow(x = x, y = y, wts = weights, info = trainInfo,  :
>   There were missing values in resampled performance measures."
>
> Eu não tenho valores NA na minha base... não estou entendendo o erro.
>
> Outra dúvida: Está correto o ordem do código? O seed deveria ficar após a
> linha do ctrl?
>
> Obrigada
> Juliana
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20190912/dd984682/attachment.html>


Mais detalhes sobre a lista de discussão R-br