Exemplos de categorização!
idade<-c(102,20,54,19,80,20,5,45,10,68,40)
classificação<-ifelse(idade >= 70,"Velho","Jovem")
final<- data.frame(idade,classificação)
final
idades<-c(102,20,54,19,80,20,6,45,10,68,40,25,105,8,1)
Idades<-sort(idades)
Classificão<-cut(Idades,c(0,18,35,65,max(Idades)),labels=c('Muito Jovem','Jovem','Velho','Muito Velho'))
final2<- data.frame(Idades,Classificão)
final2
idade<-c(102,20,54,19,80,20,5,45,10,68,89)
n<-length(idade)
y<-character()
for (i in 1:n)
{
classif1<-if(idade[i]<=40) y[i]<-"Muito jovem"
classif2<-if(idade[i]>40 & idade[i]<=60) y[i]<-"Jovem"
classif3<-if(idade[i]>60 & idade[i]<80) y[i]<-"Velho"
classif4.<-if(idade[i]>=80) y[i]<-"Muito Velho"
}
a<-data.frame(idade,y)
a
André Oliveira Souza.
Graduação em Matemática, mestrado em estatística aplicada.Instituto Federal de Educação, Ciência e Tecnologia do Espirito Santo. IFES
Em Quarta-feira, 27 de Abril de 2016 11:56, Elias Carvalho <ecacarva@gmail.com> escreveu:
Obrigado pelo retorno Cesar
O que quero dizer com normalização é o seguinte: meu algoritmo calcula dependências entre as variáveis, então minha dúvida é:
Fica correto comparar Smoke com: "Yes" ou "No" vs Diabetes com: 83, 79, 130?
Ou seria melhor (como penso) categorizar diabetes com "Sem diabetes", "Pré-diabetes", "Diabetes".
Desulpe pela pergunta talvez obvia, embora tenha estudado estatística a uns dois anos, ainda me considero muito novo e com muito a aprender.