[R-br] Validação Cruzada e Krigagem
Helder Gramacho
agrohelder em gmail.com
Quinta Maio 15 19:57:37 BRT 2014
Olá Hélio, Éder e Elias,
Agradeço pelas considerações, vou direcionar os estudos para as questões
abordadas por vocês.
Obrigado,
*Hélder Gramacho *
Recife-PE /
*agrohelder em gmail.com <agrohelder em hotmail.com>*
Em 15 de maio de 2014 09:05, Elias T. Krainski
<eliaskrainski em yahoo.com.br>escreveu:
> Caros,
>
> Gostaria de contribuir com 'alguns centavos' genericos.
>
> 1.a) A estimacao de parametros baseada em variograma (V) e' extremamente
> dependente do variograma (ja pontuado aqui que apenas 6 pontos pode nao ser
> razoavel). Esta abordagem e' chamada (por alguns poucos) de metodo dos
> momentos (http://www.jstor.org/stable/1400419)
>
> 1.b) abordagem de V comparada com a abordagem baseada em modelos (por
> exemplo maxima verosimilhanca ML) e' equivalente a ajustar uma distribuicao
> a um histograma em vez de ajusta-la aos dados propriamente dito. Exemplo:
> estimar a media de uma distribuicao normal
> n = 30
> x = rnorm(n)
> h = hist(x, plot=FALSE)
> c(v=sum(h$mids * h$counts/n), ml=mean(x))
>
> 1.c) Considerando 1.a) e 1.b), a escolha da abordagem a ser usada para
> estimar os parametros e' dependente da preferencia filosofica. Prefiro V ou
> assumir uma distribuicao aos dados?
>
> 2.a) Ja foi comentado sobre a distancia minima de 10m. Se 10m e'
> relativamente grande em relacao ao alcance, isso e' ruim.
>
> 2.b) Observando o 'design' dos pontos nota-se que e' um grid (extremamente
> regular). Me parece que o melhor design seria uma mescla entre regular
> (para cobrir bem toda a area) e aleatorio (para se ter um bom rol de
> distancias).
>
> 3.a) Geralmente caimos num dilema quando temos varias medidas de ajuste...
> No caso de geoestatistica, temos dois objetivos: O primeiro e' descrever o
> processo (qual funcao de correlacao, parametros). O segundo e' fazer
> predicao. Se o foco e' descricao, considere medidas baseadas no ajuste do
> modelo aos dados, AIC, por exemplo (para alguns e' dificil entender porque
> o tal BIC tem esse nome visto que nenhuma analise Bayesiana foi feita). Se
> foco e' predicao, esqueca considere medidas baseadas em predicao.
>
> aT+,
> Elias.
>
>
> On 15/05/14 13:24, Hélio Gallo Rocha wrote:
>
> Caros Hélder e Éder.
>
> Vou dar minha opinião, mas como o Éder, é para tentar ajudar.
>
> Como o Éder comentou no item (6), seis pontos parece ser uma quantidade
> pequena e como a distância minima é de 10 m, então teria de aumentar a
> distância máxima para uns 80%, teria de testar.
>
> Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas foi
> o que apresentou o mais alto valor de AIC. Se for seguir este indicativo,
> este seria o pior modelo.
>
> Pelo que andei lendo, a seleção do modelo seria pela observação do mapa
> da variância da krigagem. O que apresenta a menor variância é o selecionado.
>
> Observando a escala dos dois mapas da variância, o ajustado por OLS
> apresenta valores inferiores indicando menor variância, o que seria, melhor
> ajuste, mas como disse antes, o modelo gaussiano ajustado por ML,
> analisando pelo AIC, é o pior.
>
> Abraço
>
> Hélio
>
>
> Em 14 de maio de 2014 16:39, Hélder [via R-br] <
> ml-node+s2285057n4662125h43 em n4.nabble.com> escreveu:
>
>> Gostaria de tirar algumas dúvidas, desde já peço desculpas se cometi
>> algum deslize, tenho tentado evoluir na utilização do R me baseando apenas
>> em tutoriais, e nas orientações que recebo aqui do grupo.
>>
>> A validação cruzada no pacote Geo R nos fornece como resultado: o Erro
>> Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro médio (SEM),
>> Desvio padrão do erro reduzido (SER) e obtenho por cálculo o Erro Absoluto
>> (EA), também consigo o AIC e BIC nos modelos por Máxima Verossimilhança,
>> quando do ajuste do modelo.
>>
>> 1) Todos estes parâmetros possuem igual nível de importância na
>> análise, ou algum deles tem peso maior?
>> 2) Estou analisando cada um dos parâmetros e o modelo que "vence" na
>> maior parte deles admito que é o melhor modelo, esta forma de analisar está
>> correta?
>> 3) Analisando-se o melhor modelo (escolhido como na pergunta 2) com o
>> Gráfico do Semivariograma Teórico ajustado, nem sempre este parece que é o
>> melhor modelo ajustado, nestes casos, deve prevalecer a análise da
>> validação cruzada ou a visual?
>> 4) Comparando os resultados da krigagem do modelo escolhido pela
>> Validação Cruzada com o obtido pela análise visual, a krigagem utilizando
>> como modelo o semivariograma "melhor" visualmente parece representar
>> adequadamente o variação do fenômeno na área, nestes casos o que vocês
>> sugerem?
>> 5) Em alguns casos a Validação cruzada retornou como resultado NAN e INF,
>> trata-se de algum problema com os dados?
>>
>> Caso concreto:
>>
>> A tabela abaixo traz os resultados da validação cruzada da variável
>> condutividade hidráulica Ks, por dois métodos (Mínimos Quadrados e Máxima
>> Verossimilhança), pela interpretação dos resultados, o modelo Gaussiano
>> por Máxima Verossimilhança seria o melhor modelo a meu ver.
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>> *Variável* *Método* *Modelo* *EM* *ER* *Sem* *Ser* *EA* *AIC* *BIC*
>> OLS Esférico -1,27E-16 -6,42E-16 0,19729 *1,01442* 6,51815
>>
>>
>> OLS Exponencial *-0,00132* *-0,00346* *0,17911* 0,95090 5,99872
>>
>>
>> OLS Gaussiano -0,00097 -0,00259 0,18444 0,98982 *5,87635*
>>
>> *Ks* ML Esférico -5,18E-16 -2,69E-015 0,19729 1,02439 6,51815 -12,18
>> -5,233
>> ML Exponencial -0,00118 -0,00327 0,18002 1,01035 5,91153 -15,24 -8,29
>> ML Gaussiano *-0,00134* *-0,00372* 0,17934 *1,00992* 5,89874 *-15,35*
>> *-8,4*
>>
>>
>>
>>
>>
>>
>>
>>
>>
>> Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois
>> métodos, o da esquerda é por OLS e o da direita é por ML, o modelo
>> Gaussiano está em verde, analisando visualmente achei que o Modelo
>> Gaussiano por OLS está melhor ajustado:
>> Nas figuras abaixo estão os resultados da krigagem comparando os dois
>> modelos, o primeiro Gaussiano por OLS:
>>
>> O segundo Gaussiano por ML:
>>
>> Desde já agradeço a toda ajuda,
>>
>> *Hélder Gramacho *
>> Recife-PE /
>> * [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=0> *
>>
>>
>> _______________________________________________
>> R-br mailing list
>> [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=1>
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>> ------------------------------
>> If you reply to this email, your message will be added to the
>> discussion below:
>>
>> http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp4662125.html
>> To unsubscribe from R-br, click here<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4>
>> .
>> NAML<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
>>
>
>
>
> --
> Hélio Gallo Rocha
> IFSULDEMINAS - Câmpus Muzambinho
>
>
> _______________________________________________
> R-br mailing listR-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140515/5de05ab9/attachment.html>
Mais detalhes sobre a lista de discussão R-br