
Pessoal To com dados de um banco aqui assim: Group of Age: 1,2,3,4,5 Smoke...........: Yes / No Diabetes........: 83, 79, 130 (Nível de Glicemia) BMI.................: 41.6, 21.6, 34.2 Systilic Pressure: 130, 1140, 160 Preciso rodar um algoritmo para gerar uma rede bayesiana a partir desses dados. Só gostaria de confirmar o seguinte: para obter um resultado mais acurado eu preciso normalizar esses dados certo ? Alguém poderia sugerir um bom pacote para esse tipo de normalização.

Como seus dados estão categorizados seria necessário entender o quê você quis dizer por "normalização". . . 2016-04-26 14:59 GMT-03:00 Elias Carvalho <ecacarva@gmail.com>:
Pessoal
To com dados de um banco aqui assim:
Group of Age: 1,2,3,4,5 Smoke...........: Yes / No Diabetes........: 83, 79, 130 (Nível de Glicemia) BMI.................: 41.6, 21.6, 34.2 Systilic Pressure: 130, 1140, 160
Preciso rodar um algoritmo para gerar uma rede bayesiana a partir desses dados.
Só gostaria de confirmar o seguinte: para obter um resultado mais acurado eu preciso normalizar esses dados certo ?
Alguém poderia sugerir um bom pacote para esse tipo de normalização.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Obrigado pelo retorno Cesar O que quero dizer com normalização é o seguinte: meu algoritmo calcula dependências entre as variáveis, então minha dúvida é: Fica correto comparar Smoke com: "Yes" ou "No" vs Diabetes com: 83, 79, 130? Ou seria melhor (como penso) categorizar diabetes com "Sem diabetes", "Pré-diabetes", "Diabetes". Desulpe pela pergunta talvez obvia, embora tenha estudado estatística a uns dois anos, ainda me considero muito novo e com muito a aprender. Em 26 de abril de 2016 18:01, Cesar Rabak [via R-br] < ml-node+s2285057n4666043h13@n4.nabble.com> escreveu:
Como seus dados estão categorizados seria necessário entender o quê você quis dizer por "normalização". . .
2016-04-26 14:59 GMT-03:00 Elias Carvalho <[hidden email] <http:///user/SendEmail.jtp?type=node&node=4666043&i=0>>:
Pessoal
To com dados de um banco aqui assim:
Group of Age: 1,2,3,4,5 Smoke...........: Yes / No Diabetes........: 83, 79, 130 (Nível de Glicemia) BMI.................: 41.6, 21.6, 34.2 Systilic Pressure: 130, 1140, 160
Preciso rodar um algoritmo para gerar uma rede bayesiana a partir desses dados.
Só gostaria de confirmar o seguinte: para obter um resultado mais acurado eu preciso normalizar esses dados certo ?
Alguém poderia sugerir um bom pacote para esse tipo de normalização.
_______________________________________________ R-br mailing list [hidden email] <http:///user/SendEmail.jtp?type=node&node=4666043&i=1> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list [hidden email] <http:///user/SendEmail.jtp?type=node&node=4666043&i=2> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
------------------------------ If you reply to this email, your message will be added to the discussion below: http://r-br.2285057.n4.nabble.com/R-br-Normalizacao-tp4666038p4666043.html To unsubscribe from R-br, click here <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=ZWNhY2FydmFAZ21haWwuY29tfDMzNTc5ODJ8ODU0NTY5ODcx> . NAML <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
-- Best regards... 8^) “The mind that is open to new ideas never come back to its original size” *Albert Einstein* _____________________________________________ Prof. Elias César Araújo de Carvalho CV: http://lattes.cnpq.br/4248328961021251

Exemplos de categorização! idade<-c(102,20,54,19,80,20,5,45,10,68,40)classificação<-ifelse(idade >= 70,"Velho","Jovem") final<- data.frame(idade,classificação)final idades<-c(102,20,54,19,80,20,6,45,10,68,40,25,105,8,1) Idades<-sort(idades)Classificão<-cut(Idades,c(0,18,35,65,max(Idades)),labels=c('Muito Jovem','Jovem','Velho','Muito Velho')) final2<- data.frame(Idades,Classificão) final2 idade<-c(102,20,54,19,80,20,5,45,10,68,89) n<-length(idade) y<-character() for (i in 1:n) { classif1<-if(idade[i]<=40) y[i]<-"Muito jovem" classif2<-if(idade[i]>40 & idade[i]<=60) y[i]<-"Jovem" classif3<-if(idade[i]>60 & idade[i]<80) y[i]<-"Velho" classif4.<-if(idade[i]>=80) y[i]<-"Muito Velho" } a<-data.frame(idade,y) a André Oliveira Souza. Graduação em Matemática, mestrado em estatística aplicada.Instituto Federal de Educação, Ciência e Tecnologia do Espirito Santo. IFES Em Quarta-feira, 27 de Abril de 2016 11:56, Elias Carvalho <ecacarva@gmail.com> escreveu: Obrigado pelo retorno Cesar O que quero dizer com normalização é o seguinte: meu algoritmo calcula dependências entre as variáveis, então minha dúvida é: Fica correto comparar Smoke com: "Yes" ou "No" vs Diabetes com: 83, 79, 130? Ou seria melhor (como penso) categorizar diabetes com "Sem diabetes", "Pré-diabetes", "Diabetes". Desulpe pela pergunta talvez obvia, embora tenha estudado estatística a uns dois anos, ainda me considero muito novo e com muito a aprender. Em 26 de abril de 2016 18:01, Cesar Rabak [via R-br] <ml-node+s2285057n4666043h13@n4.nabble.com> escreveu: Como seus dados estão categorizados seria necessário entender o quê você quis dizer por "normalização". . . 2016-04-26 14:59 GMT-03:00 Elias Carvalho <[hidden email]>: Pessoal To com dados de um banco aqui assim: Group of Age: 1,2,3,4,5 Smoke...........: Yes / No Diabetes........: 83, 79, 130 (Nível de Glicemia) BMI.................: 41.6, 21.6, 34.2 Systilic Pressure: 130, 1140, 160 Preciso rodar um algoritmo para gerar uma rede bayesiana a partir desses dados. Só gostaria de confirmar o seguinte: para obter um resultado mais acurado eu preciso normalizar esses dados certo ? Alguém poderia sugerir um bom pacote para esse tipo de normalização. _______________________________________________ R-br mailing list [hidden email] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível. _______________________________________________ R-br mailing list [hidden email] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel. If you reply to this email, your message will be added to the discussion below: http://r-br.2285057.n4.nabble.com/R-br-Normalizacao-tp4666038p4666043.html To unsubscribe from R-br, click here. NAML -- Best regards... 8^) “The mind that is open to new ideas never come backto its original size” Albert Einstein _____________________________________________ Prof. Elias César Araújo de Carvalho CV: http://lattes.cnpq.br/4248328961021251 _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo reproduz�el.

Caro Elias, Pensando de maneira mais geral, sem especifidade para s/necessidade de fazer uma Rede Bayesiana, a análise para as variáveis "Smoke" x "Diabetes" poderia ser feita com a diabetes considerada uma variável numérica ou categorizada (com os nomes dados por você), aliás de forma análoga com a pressão sistólica, etc. Obviamente o tipo de análise seria diferente do ponto de vista estatístico/matemático, ou melhor dizendo a "técnica" para analisar seria especificamente diferente para levar em conta os tipos de dados. Com essa sua resposta, acho que você está em dúvida se os seus dados devem ser tratados como variáveis numéricas ou categóricas. HTH -- Cesar Rabak 2016-04-27 11:55 GMT-03:00 Elias Carvalho <ecacarva@gmail.com>:
Obrigado pelo retorno Cesar
O que quero dizer com normalização é o seguinte: meu algoritmo calcula dependências entre as variáveis, então minha dúvida é:
Fica correto comparar Smoke com: "Yes" ou "No" vs Diabetes com: 83, 79, 130?
Ou seria melhor (como penso) categorizar diabetes com "Sem diabetes", "Pré-diabetes", "Diabetes".
Desulpe pela pergunta talvez obvia, embora tenha estudado estatística a uns dois anos, ainda me considero muito novo e com muito a aprender.
Em 26 de abril de 2016 18:01, Cesar Rabak [via R-br] < ml-node+s2285057n4666043h13@n4.nabble.com> escreveu:
Como seus dados estão categorizados seria necessário entender o quê você quis dizer por "normalização". . .
2016-04-26 14:59 GMT-03:00 Elias Carvalho <[hidden email] <http:///user/SendEmail.jtp?type=node&node=4666043&i=0>>:
Pessoal
To com dados de um banco aqui assim:
Group of Age: 1,2,3,4,5 Smoke...........: Yes / No Diabetes........: 83, 79, 130 (Nível de Glicemia) BMI.................: 41.6, 21.6, 34.2 Systilic Pressure: 130, 1140, 160
Preciso rodar um algoritmo para gerar uma rede bayesiana a partir desses dados.
Só gostaria de confirmar o seguinte: para obter um resultado mais acurado eu preciso normalizar esses dados certo ?
Alguém poderia sugerir um bom pacote para esse tipo de normalização.
_______________________________________________ R-br mailing list [hidden email] <http:///user/SendEmail.jtp?type=node&node=4666043&i=1> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list [hidden email] <http:///user/SendEmail.jtp?type=node&node=4666043&i=2> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
------------------------------ If you reply to this email, your message will be added to the discussion below: http://r-br.2285057.n4.nabble.com/R-br-Normalizacao-tp4666038p4666043.html To unsubscribe from R-br, click here <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=ZWNhY2FydmFAZ21haWwuY29tfDMzNTc5ODJ8ODU0NTY5ODcx> . NAML <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
-- Best regards... 8^)
“The mind that is open to new ideas never come back to its original size” *Albert Einstein*
_____________________________________________ Prof. Elias César Araújo de Carvalho CV: http://lattes.cnpq.br/4248328961021251
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Andre Oliveira
-
Cesar Rabak
-
Elias Carvalho