[R-br] Validação Cruzada e Krigagem
Elias T. Krainski
eliaskrainski em yahoo.com.br
Quinta Maio 15 09:05:11 BRT 2014
Caros,
Gostaria de contribuir com 'alguns centavos' genericos.
1.a) A estimacao de parametros baseada em variograma (V) e' extremamente
dependente do variograma (ja pontuado aqui que apenas 6 pontos pode nao
ser razoavel). Esta abordagem e' chamada (por alguns poucos) de metodo
dos momentos (http://www.jstor.org/stable/1400419)
1.b) abordagem de V comparada com a abordagem baseada em modelos (por
exemplo maxima verosimilhanca ML) e' equivalente a ajustar uma
distribuicao a um histograma em vez de ajusta-la aos dados propriamente
dito. Exemplo: estimar a media de uma distribuicao normal
n = 30
x = rnorm(n)
h = hist(x, plot=FALSE)
c(v=sum(h$mids * h$counts/n), ml=mean(x))
1.c) Considerando 1.a) e 1.b), a escolha da abordagem a ser usada para
estimar os parametros e' dependente da preferencia filosofica. Prefiro V
ou assumir uma distribuicao aos dados?
2.a) Ja foi comentado sobre a distancia minima de 10m. Se 10m e'
relativamente grande em relacao ao alcance, isso e' ruim.
2.b) Observando o 'design' dos pontos nota-se que e' um grid
(extremamente regular). Me parece que o melhor design seria uma mescla
entre regular (para cobrir bem toda a area) e aleatorio (para se ter um
bom rol de distancias).
3.a) Geralmente caimos num dilema quando temos varias medidas de
ajuste... No caso de geoestatistica, temos dois objetivos: O primeiro e'
descrever o processo (qual funcao de correlacao, parametros). O segundo
e' fazer predicao. Se o foco e' descricao, considere medidas baseadas no
ajuste do modelo aos dados, AIC, por exemplo (para alguns e' dificil
entender porque o tal BIC tem esse nome visto que nenhuma analise
Bayesiana foi feita). Se foco e' predicao, esqueca considere medidas
baseadas em predicao.
aT+,
Elias.
On 15/05/14 13:24, Hélio Gallo Rocha wrote:
> Caros Hélder e Éder.
>
> Vou dar minha opinião, mas como o Éder, é para tentar ajudar.
>
> Como o Éder comentou no item (6), seis pontos parece ser uma
> quantidade pequena e como a distância minima é de 10 m, então teria de
> aumentar a distância máxima para uns 80%, teria de testar.
>
> Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas
> foi o que apresentou o mais alto valor de AIC. Se for seguir este
> indicativo, este seria o pior modelo.
>
> Pelo que andei lendo, a seleção do modelo seria pela observação do
> mapa da variância da krigagem. O que apresenta a menor variância é o
> selecionado.
>
> Observando a escala dos dois mapas da variância, o ajustado por OLS
> apresenta valores inferiores indicando menor variância, o que seria,
> melhor ajuste, mas como disse antes, o modelo gaussiano ajustado por
> ML, analisando pelo AIC, é o pior.
>
> Abraço
>
> Hélio
>
>
> Em 14 de maio de 2014 16:39, Hélder [via R-br]
> <ml-node+s2285057n4662125h43 em n4.nabble.com
> <mailto:ml-node+s2285057n4662125h43 em n4.nabble.com>> escreveu:
>
> Gostaria de tirar algumas dúvidas, desde já peço desculpas se
> cometi algum deslize, tenho tentado evoluir na utilização do R me
> baseando apenas em tutoriais, e nas orientações que recebo aqui do
> grupo.
>
> A validação cruzada no pacote Geo R nos fornece como resultado: o
> Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro
> médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por
> cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos
> modelos por Máxima Verossimilhança, quando do ajuste do modelo.
>
> 1) Todos estes parâmetros possuem igual nível de importância na
> análise, ou algum deles tem peso maior?
> 2) Estou analisando cada um dos parâmetros e o modelo que "vence"
> na maior parte deles admito que é o melhor modelo, esta forma de
> analisar está correta?
> 3) Analisando-se o melhor modelo (escolhido como na pergunta 2)
> com o Gráfico do Semivariograma Teórico ajustado, nem sempre este
> parece que é o melhor modelo ajustado, nestes casos, deve
> prevalecer a análise da validação cruzada ou a visual?
> 4) Comparando os resultados da krigagem do modelo escolhido pela
> Validação Cruzada com o obtido pela análise visual, a krigagem
> utilizando como modelo o semivariograma "melhor" visualmente
> parece representar adequadamente o variação do fenômeno na área,
> nestes casos o que vocês sugerem?
> 5) Em alguns casos a Validação cruzada retornou como resultado NAN
> e INF, trata-se de algum problema com os dados?
>
> Caso concreto:
>
> A tabela abaixo traz os resultados da validação cruzada da
> variável condutividade hidráulica Ks, por dois métodos (Mínimos
> Quadrados e Máxima Verossimilhança), pela interpretação dos
> resultados, o modelo Gaussiano por Máxima Verossimilhança seria o
> melhor modelo a meu ver.
>
>
>
>
>
>
>
>
>
>
> *Variável* *Método* *Modelo* *EM* *ER* *Sem* *Ser* *EA*
> *AIC* *BIC*
> *
> * OLS Esférico -1,27E-16 -6,42E-16 0,19729 *1,01442* 6,51815
>
>
> OLS Exponencial *-0,00132* *-0,00346* *0,17911* 0,95090
> 5,99872
>
>
> OLS Gaussiano -0,00097 -0,00259 0,18444 0,98982 *5,87635*
>
> *Ks* ML Esférico -5,18E-16 -2,69E-015 0,19729 1,02439
> 6,51815 -12,18 -5,233
> *
> * ML Exponencial -0,00118 -0,00327 0,18002 1,01035
> 5,91153 -15,24 -8,29
>
> ML Gaussiano *-0,00134* *-0,00372* 0,17934 *1,00992*
> 5,89874 *-15,35* *-8,4*
>
>
>
>
>
>
>
>
>
>
>
> Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois
> métodos, o da esquerda é por OLS e o da direita é por ML, o modelo
> Gaussiano está em verde, analisando visualmente achei que o Modelo
> Gaussiano por OLS está melhor ajustado:
> Nas figuras abaixo estão os resultados da krigagem comparando os
> dois modelos, o primeiro Gaussiano por OLS:
>
> O segundo Gaussiano por ML:
>
> Desde já agradeço a toda ajuda,
>
> /*Hélder Gramacho */
> Recife-PE / /
> /[hidden email]
> <http://user/SendEmail.jtp?type=node&node=4662125&i=0>/
> /
>
>
> _______________________________________________
> R-br mailing list
> [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=1>
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
> forneça código mínimo reproduzível.
>
> ------------------------------------------------------------------------
> If you reply to this email, your message will be added to the
> discussion below:
> http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp4662125.html
>
> To unsubscribe from R-br, click here
> <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4>.
> NAML
> <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
>
>
>
>
>
> --
> Hélio Gallo Rocha
> IFSULDEMINAS - Câmpus Muzambinho
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140515/ac24ede0/attachment.html>
Mais detalhes sobre a lista de discussão R-br