Estabelecer um corte classificatório sem uma referencia, ou seja, corte para um preditor que tenta prever um desfecho, me parece arbitrário. No entanto ha algumas técnicas que tentam fazer isso como o "k mais próximo" e redes neurais não supervisionadas. Mas nao posso dizer que tenho familiaridade com essas técnicas. 

Abraço forte e que a força esteja com você,

Dr. Pedro Emmanuel A. A. do Brasil
Instituto de Pesquisa Clínica Evandro Chagas
Fundação Oswaldo Cruz
Rio de Janeiro - Brasil
Av. Brasil 4365,
CEP 21040-360,
Tel 55 21 3865-9648
email: pedro.brasil@ipec.fiocruz.br
email: emmanuel.brasil@gmail.com

---Apoio aos softwares livres
www.zotero.org - gerenciamento de referências bibliográficas.
www.broffice.org ou www.libreoffice.org - textos, planilhas ou apresentações.
www.epidata.dk - entrada de dados.
www.r-project.org - análise de dados.
www.ubuntu.com - sistema operacional


Em 9 de setembro de 2011 10:31, Daniel Dantas <daniel.dantas@hotmail.com> escreveu:
Bom dia a cada um de vocês amigos de lista,
 
Preciso de uma ajuda relacionado à cortes classificatórios em uma base de dados.
 
Tenho informações de uma amostra n funcionários que solicitam atestado médico em dias, ou seja, tal funcionário no ano ausentou-se do trabalho, por exemplo, 5, 10, 40,... ou 100 dias.
 
O problema é: Preciso estabelecer um corte para classificar o quanto posso considerar como MUITO/ALTO os dias folgas do funcionário.
 
Como não conheço a distribuição dos dados o pensei foi: classificar como alto a média + 1 ou 2 desvios padrão. Nessa perspectiva, eu poderia cometer algum equívoco? Na opinião de vocês, qual seria o melhor método para classificar como ALTO os dias de folga?
 
 
O meu muito obrigado para quem puder me ajudar,
Daniel

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.