Caros,

Gostaria de contribuir com 'alguns centavos' genericos.

1.a) A estimacao de parametros baseada em variograma (V) e' extremamente dependente do variograma (ja pontuado aqui que apenas 6 pontos pode nao ser razoavel). Esta abordagem e' chamada (por alguns poucos) de metodo dos momentos (http://www.jstor.org/stable/1400419)

1.b) abordagem de V comparada com a abordagem baseada em modelos (por exemplo maxima verosimilhanca ML) e' equivalente a ajustar uma distribuicao a um histograma em vez de ajusta-la aos dados propriamente dito. Exemplo: estimar a media de uma distribuicao normal
  n = 30
  x = rnorm(n)
  h = hist(x, plot=FALSE)
  c(v=sum(h$mids * h$counts/n), ml=mean(x))

1.c) Considerando 1.a) e 1.b), a escolha da abordagem a ser usada para estimar os parametros e' dependente da preferencia filosofica. Prefiro V ou assumir uma distribuicao aos dados?

2.a) Ja foi comentado sobre a distancia minima de 10m. Se 10m e' relativamente grande em relacao ao alcance, isso e' ruim.

2.b) Observando o 'design' dos pontos nota-se que e' um grid (extremamente regular). Me parece que o melhor design seria uma mescla entre regular (para cobrir bem toda a area) e aleatorio (para se ter um bom rol de distancias).

3.a) Geralmente caimos num dilema quando temos varias medidas de ajuste... No caso de geoestatistica, temos dois objetivos: O primeiro e' descrever o processo (qual funcao de correlacao, parametros). O segundo e' fazer predicao. Se o foco e' descricao, considere medidas baseadas no ajuste do modelo aos dados, AIC, por exemplo (para alguns e' dificil entender porque o tal BIC tem esse nome visto que nenhuma analise Bayesiana foi feita). Se foco e' predicao, esqueca considere medidas baseadas em predicao.

aT+,
Elias.

On 15/05/14 13:24, Hélio Gallo Rocha wrote:
Caros Hélder e Éder.

Vou dar minha opinião, mas como o Éder, é para tentar ajudar.

Como o Éder comentou no item (6), seis pontos parece ser uma quantidade pequena e como a distância minima é de 10 m, então teria de aumentar a distância máxima para uns 80%, teria de testar.

Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas foi o que apresentou o mais alto valor de AIC. Se for seguir este indicativo, este seria o pior modelo.

Pelo que andei lendo, a seleção do modelo seria pela observação do mapa da variância da krigagem. O que apresenta a menor variância é o selecionado.

Observando a escala dos dois mapas da variância,  o ajustado por OLS apresenta valores inferiores indicando menor variância, o que seria, melhor ajuste, mas como disse antes, o modelo gaussiano ajustado por ML, analisando pelo AIC, é o pior.

Abraço

Hélio


Em 14 de maio de 2014 16:39, Hélder [via R-br] <ml-node+s2285057n4662125h43@n4.nabble.com> escreveu:
Gostaria de tirar algumas dúvidas, desde já peço desculpas se cometi algum deslize, tenho tentado evoluir na utilização do R me baseando apenas em tutoriais, e nas orientações que recebo aqui do grupo.

A validação cruzada no pacote Geo R nos fornece como resultado: o Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos modelos por Máxima Verossimilhança, quando do ajuste do modelo.

1) Todos estes parâmetros possuem igual nível de importância na análise, ou algum deles tem peso maior?
2) Estou analisando cada um dos parâmetros e o modelo que "vence" na maior parte deles admito que é o melhor modelo, esta forma de analisar está correta?
3) Analisando-se o melhor modelo (escolhido como na pergunta 2) com o Gráfico do Semivariograma Teórico ajustado, nem sempre este parece que é o melhor modelo ajustado, nestes casos, deve prevalecer a análise da validação cruzada ou a visual?
4) Comparando os resultados da krigagem do modelo escolhido pela Validação Cruzada com o obtido pela análise visual, a krigagem utilizando como modelo o semivariograma "melhor" visualmente parece representar adequadamente o variação do fenômeno na área, nestes casos o que vocês sugerem?
5) Em alguns casos a Validação cruzada retornou como resultado NAN e INF, trata-se de algum problema com os dados?

Caso concreto:

A tabela abaixo traz os resultados da validação cruzada da variável condutividade hidráulica Ks, por dois métodos (Mínimos Quadrados e Máxima Verossimilhança),  pela interpretação dos resultados, o modelo Gaussiano por Máxima Verossimilhança seria o melhor modelo a meu ver.










Variável Método Modelo EM ER Sem Ser EA AIC BIC

OLS Esférico -1,27E-16 -6,42E-16 0,19729 1,01442 6,51815


OLS Exponencial -0,00132 -0,00346 0,17911 0,95090 5,99872


OLS Gaussiano -0,00097 -0,00259 0,18444 0,98982 5,87635

Ks ML Esférico -5,18E-16 -2,69E-015 0,19729 1,02439 6,51815 -12,18 -5,233

ML Exponencial -0,00118 -0,00327 0,18002 1,01035 5,91153 -15,24 -8,29

ML Gaussiano -0,00134 -0,00372 0,17934 1,00992 5,89874 -15,35 -8,4










Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois métodos, o da esquerda é por OLS e o da direita é por ML, o modelo Gaussiano está em verde, analisando visualmente achei que o Modelo Gaussiano por OLS está melhor ajustado:
Nas figuras abaixo estão os resultados da krigagem comparando os dois modelos, o primeiro Gaussiano por OLS:

​O segundo Gaussiano por ML:

​Desde já agradeço a toda ajuda,

Hélder Gramacho 
Recife-PE / 


_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.


If you reply to this email, your message will be added to the discussion below:
http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp4662125.html
To unsubscribe from R-br, click here.
NAML



--
Hélio Gallo Rocha
IFSULDEMINAS - Câmpus Muzambinho


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.