Classificação por intervalo de confiança

Bom dia Pessoal, Tenho duas variáveis artificiais, sendo: z1<-rnorm(n=100, mean=0.73436, sd=0.104739) z2<-rnorm(n=100, mean=0.69173, sd=0.104492) Depois fiz a concatenação delas: z<-c(z1,z2) Agora gostaria de criar uma nova coluna de classificação onde os valores que estiverem dentro do intervalo de confiança 0.69173±0.008838306, fossem classificados como "atacado" e fora dele como "sadio", alguém poderia me dar uma luz? Obrigado, -- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 ======================================================================

classificacao <- ifelse((z <= 0.69173+0.008838306) & (z >= 0.69173-0.008838306), "atacado", "sadio") cbind(z, classificacao) 2014-07-02 10:36 GMT-03:00 ASANTOS <alexandresantosbr@yahoo.com.br>:
Bom dia Pessoal,
Tenho duas variáveis artificiais, sendo:
z1<-rnorm(n=100, mean=0.73436, sd=0.104739) z2<-rnorm(n=100, mean=0.69173, sd=0.104492)
Depois fiz a concatenação delas:
z<-c(z1,z2)
Agora gostaria de criar uma nova coluna de classificação onde os valores que estiverem dentro do intervalo de confiança 0.69173±0.008838306, fossem classificados como "atacado" e fora dele como "sadio", alguém poderia me dar uma luz?
Obrigado,
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 ======================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Marcus Nunes http://marcusnunes.me/

Obrigado Marcus, Em 02/07/2014 09:44, Marcus Nunes escreveu:
classificacao <- ifelse((z <= 0.69173+0.008838306) & (z >= 0.69173-0.008838306), "atacado", "sadio")
cbind(z, classificacao)
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 ======================================================================

Pensando que você pode aumentar o número de classes, a findInterval() é interessante. z1 <- rnorm(n=100, mean=0.73436, sd=0.104739) z2 <- rnorm(n=100, mean=0.69173, sd=0.104492) z <- c(z1,z2) status <- rep("sadio", length(z)) i <- 0.69173+c(-1,1)*0.008838306 fi <- findInterval(z, i) status[fi==1] <- "atacado" plot(z, col=fi+1) abline(h=i, lty=2) Vai uma dúvida minha que tá fora do escopo. Você tá classificando novas observações (observações futuras) pelo intervalo de confiança (para um parâmetro) gerado em uma análise. Talvez isso não seja adequado. O nível de confiança desse intervalo (95%) não significa que 95% das observações serão classificadas como "atacada". 95% é o nível de cobertura do intervalo que representa a probabilidade dele conter o parâmetro. Não seria mais apropriado um intervalo de predição (para observação futura)? À disposição. Walmes.

Exatamente Walmes, Eu estava fazendo errado como comentou, queria classificar novas observações para áreas não utilizadas para calcular a média e o intervalo de confiança. Uma particularidade dos dados, são que são oriundos de um cálculo de índice de índice de vegetação por diferença normalizada (NDVI), portanto, qualquer valor abaixo de 0.69173 indicam áreas atacadas e acima disto sadias. Teria alguma sugestão de que abordagem eu poderia utilizar para fazer a predição de áreas atacadas ou não? Obrigado, Alexandre Em 02/07/2014 10:24, walmes . escreveu:
Pensando que você pode aumentar o número de classes, a findInterval() é interessante.
z1 <- rnorm(n=100, mean=0.73436, sd=0.104739) z2 <- rnorm(n=100, mean=0.69173, sd=0.104492) z <- c(z1,z2)
status <- rep("sadio", length(z)) i <- 0.69173+c(-1,1)*0.008838306 fi <- findInterval(z, i) status[fi==1] <- "atacado"
plot(z, col=fi+1) abline(h=i, lty=2)
Vai uma dúvida minha que tá fora do escopo. Você tá classificando novas observações (observações futuras) pelo intervalo de confiança (para um parâmetro) gerado em uma análise. Talvez isso não seja adequado. O nível de confiança desse intervalo (95%) não significa que 95% das observações serão classificadas como "atacada". 95% é o nível de cobertura do intervalo que representa a probabilidade dele conter o parâmetro. Não seria mais apropriado um intervalo de predição (para observação futura)?
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes: http://lattes.cnpq.br/1360403201088680 ======================================================================

Walmes, Fiz a predição sobre um modelo linear abaixo, isto parece correto: ## Dados artificiais z1 <- rnorm(n=100, mean=0.73436, sd=0.104739) z2 <- rnorm(n=100, mean=0.60173, sd=0.054492) z <- c(z1,z2) x1<-rep("sadio",length(z)/2) x2<-rep("atacado",length(z)/2) x<-c(x1,x2) status <- rep("sadio", length(z)) i <- 0.69173+c(-1,1)*0.008838306 fi <- findInterval(z, i) status[fi==1] <- "atacado" #Ajuste do modelo m.1<-lm(z~x) prd<-predict(m.1, interval=c("prediction")) ## Representação gráfica plot(z, col=fi+1) abline(h=i, lty=2) matlines(prd[,c("lwr","upr")], col="red") Obrigado, Alexandre Em 02/07/2014 12:20, ASANTOS escreveu:
Exatamente Walmes,
Eu estava fazendo errado como comentou, queria classificar novas observações para áreas não utilizadas para calcular a média e o intervalo de confiança. Uma particularidade dos dados, são que são oriundos de um cálculo de índice de índice de vegetação por diferença normalizada (NDVI), portanto, qualquer valor abaixo de 0.69173 indicam áreas atacadas e acima disto sadias. Teria alguma sugestão de que abordagem eu poderia utilizar para fazer a predição de áreas atacadas ou não?
Obrigado,
Alexandre
Em 02/07/2014 10:24, walmes . escreveu:
Pensando que você pode aumentar o número de classes, a findInterval() é interessante.
z1 <- rnorm(n=100, mean=0.73436, sd=0.104739) z2 <- rnorm(n=100, mean=0.69173, sd=0.104492) z <- c(z1,z2)
status <- rep("sadio", length(z)) i <- 0.69173+c(-1,1)*0.008838306 fi <- findInterval(z, i) status[fi==1] <- "atacado"
plot(z, col=fi+1) abline(h=i, lty=2)
Vai uma dúvida minha que tá fora do escopo. Você tá classificando novas observações (observações futuras) pelo intervalo de confiança (para um parâmetro) gerado em uma análise. Talvez isso não seja adequado. O nível de confiança desse intervalo (95%) não significa que 95% das observações serão classificadas como "atacada". 95% é o nível de cobertura do intervalo que representa a probabilidade dele conter o parâmetro. Não seria mais apropriado um intervalo de predição (para observação futura)?
À disposição. Walmes.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes:http://lattes.cnpq.br/1360403201088680 ======================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- ====================================================================== Alexandre dos Santos Proteção Florestal IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso Campus Cáceres Caixa Postal 244 Avenida dos Ramires, s/n Bairro: Distrito Industrial Cáceres - MT CEP: 78.200-000 Fone: (+55) 65 8132-8112 (TIM) (+55) 65 9686-6970 (VIVO) e-mails:alexandresantosbr@yahoo.com.br alexandre.santos@cas.ifmt.edu.br Lattes:http://lattes.cnpq.br/1360403201088680 ======================================================================
participantes (3)
-
ASANTOS
-
Marcus Nunes
-
walmes .