[R-br] Validação Cruzada e Krigagem

Elias T. Krainski eliaskrainski em yahoo.com.br
Quinta Maio 15 09:05:11 BRT 2014


Caros,

Gostaria de contribuir com 'alguns centavos' genericos.

1.a) A estimacao de parametros baseada em variograma (V) e' extremamente 
dependente do variograma (ja pontuado aqui que apenas 6 pontos pode nao 
ser razoavel). Esta abordagem e' chamada (por alguns poucos) de metodo 
dos momentos (http://www.jstor.org/stable/1400419)

1.b) abordagem de V comparada com a abordagem baseada em modelos (por 
exemplo maxima verosimilhanca ML) e' equivalente a ajustar uma 
distribuicao a um histograma em vez de ajusta-la aos dados propriamente 
dito. Exemplo: estimar a media de uma distribuicao normal
   n = 30
   x = rnorm(n)
   h = hist(x, plot=FALSE)
   c(v=sum(h$mids * h$counts/n), ml=mean(x))

1.c) Considerando 1.a) e 1.b), a escolha da abordagem a ser usada para 
estimar os parametros e' dependente da preferencia filosofica. Prefiro V 
ou assumir uma distribuicao aos dados?

2.a) Ja foi comentado sobre a distancia minima de 10m. Se 10m e' 
relativamente grande em relacao ao alcance, isso e' ruim.

2.b) Observando o 'design' dos pontos nota-se que e' um grid 
(extremamente regular). Me parece que o melhor design seria uma mescla 
entre regular (para cobrir bem toda a area) e aleatorio (para se ter um 
bom rol de distancias).

3.a) Geralmente caimos num dilema quando temos varias medidas de 
ajuste... No caso de geoestatistica, temos dois objetivos: O primeiro e' 
descrever o processo (qual funcao de correlacao, parametros). O segundo 
e' fazer predicao. Se o foco e' descricao, considere medidas baseadas no 
ajuste do modelo aos dados, AIC, por exemplo (para alguns e' dificil 
entender porque o tal BIC tem esse nome visto que nenhuma analise 
Bayesiana foi feita). Se foco e' predicao, esqueca considere medidas 
baseadas em predicao.

aT+,
Elias.

On 15/05/14 13:24, Hélio Gallo Rocha wrote:
> Caros Hélder e Éder.
>
> Vou dar minha opinião, mas como o Éder, é para tentar ajudar.
>
> Como o Éder comentou no item (6), seis pontos parece ser uma 
> quantidade pequena e como a distância minima é de 10 m, então teria de 
> aumentar a distância máxima para uns 80%, teria de testar.
>
> Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas 
> foi o que apresentou o mais alto valor de AIC. Se for seguir este 
> indicativo, este seria o pior modelo.
>
> Pelo que andei lendo, a seleção do modelo seria pela observação do 
> mapa da variância da krigagem. O que apresenta a menor variância é o 
> selecionado.
>
> Observando a escala dos dois mapas da variância,  o ajustado por OLS 
> apresenta valores inferiores indicando menor variância, o que seria, 
> melhor ajuste, mas como disse antes, o modelo gaussiano ajustado por 
> ML, analisando pelo AIC, é o pior.
>
> Abraço
>
> Hélio
>
>
> Em 14 de maio de 2014 16:39, Hélder [via R-br] 
> <ml-node+s2285057n4662125h43 em n4.nabble.com 
> <mailto:ml-node+s2285057n4662125h43 em n4.nabble.com>> escreveu:
>
>     Gostaria de tirar algumas dúvidas, desde já peço desculpas se
>     cometi algum deslize, tenho tentado evoluir na utilização do R me
>     baseando apenas em tutoriais, e nas orientações que recebo aqui do
>     grupo.
>
>     A validação cruzada no pacote Geo R nos fornece como resultado: o
>     Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro
>     médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por
>     cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos
>     modelos por Máxima Verossimilhança, quando do ajuste do modelo.
>
>     1) Todos estes parâmetros possuem igual nível de importância na
>     análise, ou algum deles tem peso maior?
>     2) Estou analisando cada um dos parâmetros e o modelo que "vence"
>     na maior parte deles admito que é o melhor modelo, esta forma de
>     analisar está correta?
>     3) Analisando-se o melhor modelo (escolhido como na pergunta 2)
>     com o Gráfico do Semivariograma Teórico ajustado, nem sempre este
>     parece que é o melhor modelo ajustado, nestes casos, deve
>     prevalecer a análise da validação cruzada ou a visual?
>     4) Comparando os resultados da krigagem do modelo escolhido pela
>     Validação Cruzada com o obtido pela análise visual, a krigagem
>     utilizando como modelo o semivariograma "melhor" visualmente
>     parece representar adequadamente o variação do fenômeno na área,
>     nestes casos o que vocês sugerem?
>     5) Em alguns casos a Validação cruzada retornou como resultado NAN
>     e INF, trata-se de algum problema com os dados?
>
>     Caso concreto:
>
>     A tabela abaixo traz os resultados da validação cruzada da
>     variável condutividade hidráulica Ks, por dois métodos (Mínimos
>     Quadrados e Máxima Verossimilhança),  pela interpretação dos
>     resultados, o modelo Gaussiano por Máxima Verossimilhança seria o
>     melhor modelo a meu ver.
>
>     	
>     	
>     	
>     	
>     	
>     	
>     	
>     	
>     	
>     *Variável* 	*Método* 	*Modelo* 	*EM* 	*ER* 	*Sem* 	*Ser* 	*EA*
>     *AIC* 	*BIC*
>     *
>     * 	OLS 	Esférico 	-1,27E-16 	-6,42E-16 	0,19729 	*1,01442* 	6,51815 	
>     	
>
>     	OLS 	Exponencial 	*-0,00132* 	*-0,00346* 	*0,17911* 	0,95090
>     5,99872 	
>     	
>
>     	OLS 	Gaussiano 	-0,00097 	-0,00259 	0,18444 	0,98982 	*5,87635* 	
>     	
>     *Ks* 	ML 	Esférico 	-5,18E-16 	-2,69E-015 	0,19729 	1,02439
>     6,51815 	-12,18 	-5,233
>     *
>     * 	ML 	Exponencial 	-0,00118 	-0,00327 	0,18002 	1,01035
>     5,91153 	-15,24 	-8,29
>
>     	ML 	Gaussiano 	*-0,00134* 	*-0,00372* 	0,17934 	*1,00992*
>     5,89874 	*-15,35* 	*-8,4*
>
>     	
>     	
>     	
>     	
>     	
>     	
>     	
>     	
>     	
>
>     Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois
>     métodos, o da esquerda é por OLS e o da direita é por ML, o modelo
>     Gaussiano está em verde, analisando visualmente achei que o Modelo
>     Gaussiano por OLS está melhor ajustado:
>     Nas figuras abaixo estão os resultados da krigagem comparando os
>     dois modelos, o primeiro Gaussiano por OLS:
>
>     O segundo Gaussiano por ML:
>
>     Desde já agradeço a toda ajuda,
>
>     /*Hélder Gramacho */
>     Recife-PE / /
>     /[hidden email]
>     <http://user/SendEmail.jtp?type=node&node=4662125&i=0>/
>     /
>
>
>     _______________________________________________
>     R-br mailing list
>     [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=1>
>     https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>     Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>     forneça código mínimo reproduzível.
>
>     ------------------------------------------------------------------------
>     If you reply to this email, your message will be added to the
>     discussion below:
>     http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp4662125.html
>
>     To unsubscribe from R-br, click here
>     <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4>.
>     NAML
>     <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
>
>
>
>
>
> -- 
> Hélio Gallo Rocha
> IFSULDEMINAS - Câmpus Muzambinho
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140515/ac24ede0/attachment.html>


Mais detalhes sobre a lista de discussão R-br