
Gostaria de tirar algumas dúvidas, desde já peço desculpas se cometi algum deslize, tenho tentado evoluir na utilização do R me baseando apenas em tutoriais, e nas orientações que recebo aqui do grupo. A validação cruzada no pacote Geo R nos fornece como resultado: o Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos modelos por Máxima Verossimilhança, quando do ajuste do modelo. 1) Todos estes parâmetros possuem igual nível de importância na análise, ou algum deles tem peso maior? 2) Estou analisando cada um dos parâmetros e o modelo que "vence" na maior parte deles admito que é o melhor modelo, esta forma de analisar está correta? 3) Analisando-se o melhor modelo (escolhido como na pergunta 2) com o Gráfico do Semivariograma Teórico ajustado, nem sempre este parece que é o melhor modelo ajustado, nestes casos, deve prevalecer a análise da validação cruzada ou a visual? 4) Comparando os resultados da krigagem do modelo escolhido pela Validação Cruzada com o obtido pela análise visual, a krigagem utilizando como modelo o semivariograma "melhor" visualmente parece representar adequadamente o variação do fenômeno na área, nestes casos o que vocês sugerem? 5) Em alguns casos a Validação cruzada retornou como resultado NAN e INF, trata-se de algum problema com os dados? Caso concreto: A tabela abaixo traz os resultados da validação cruzada da variável condutividade hidráulica Ks, por dois métodos (Mínimos Quadrados e Máxima Verossimilhança), pela interpretação dos resultados, o modelo Gaussiano por Máxima Verossimilhança seria o melhor modelo a meu ver. *Variável* *Método* *Modelo* *EM* *ER* *Sem* *Ser* *EA* *AIC* *BIC* OLS Esférico -1,27E-16 -6,42E-16 0,19729 *1,01442* 6,51815 OLS Exponencial *-0,00132* *-0,00346* *0,17911* 0,95090 5,99872 OLS Gaussiano -0,00097 -0,00259 0,18444 0,98982 *5,87635* *Ks* ML Esférico -5,18E-16 -2,69E-015 0,19729 1,02439 6,51815 -12,18 -5,233 ML Exponencial -0,00118 -0,00327 0,18002 1,01035 5,91153 -15,24 -8,29 ML Gaussiano *-0,00134* *-0,00372* 0,17934 *1,00992* 5,89874 *-15,35* *-8,4* Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois métodos, o da esquerda é por OLS e o da direita é por ML, o modelo Gaussiano está em verde, analisando visualmente achei que o Modelo Gaussiano por OLS está melhor ajustado: Nas figuras abaixo estão os resultados da krigagem comparando os dois modelos, o primeiro Gaussiano por OLS: O segundo Gaussiano por ML: Desde já agradeço a toda ajuda, *Hélder Gramacho * Recife-PE / * agrohelder@gmail.com <agrohelder@hotmail.com>*

Hélder, boa noite! Minha experiência na geoestatística também é recente, de modo que as considerações que irei colocar são passíveis de erro e devem ser encaradas mais como uma impressão pessoal sobre o assunto, baseado no que já tive oportunidade de ver e fazer. 1) Importância dos parâmetros: mais do que eleger um mais importante, acredito que a estratégia seja conduzir a análise baseando-se na coerência entre eles. Além dos parâmetros listados também é importante e avaliar e apresentar os parâmetros do ajuste (pepita, patamar e alcance) e a relação entre eles (Grau de Dependência Espacial, p. ex.). No caso de ajuste por likfit(), acredito que AIC/BIC possam considerados de especial importância. 2) Melhores parâmetros gerais vs. melhor modelo: os parâmetros servem como indicação, pra direcionar e restringir a análise. O que eu faço inicialmente é selecionar um grupo de melhores modelos para prosseguir com a análise e validação cruzada. 3) Validação cruzada vs. análise visual: não adianta ter um resultado melhor nos parâmetros se a análise visual estiver indicando problema (como no exemplo que segue). 4) Comparando os resultados e representação adequada: acredito que deva dar preferência para aquilo que você consegue explicar. Dentre diversos modelos válidos, optar pelo mais simples. 5) Resultados NAN e INF: suponho que seja problema com a amostragem realizada ou com os parâmetros indicados pra variografia. O ajustamento está baseado em apenas 6 conjuntos de pontos e o primeiro conjunto de pontos aparece só por volta do valor 10, deixando o primeiro trecho do variograma sem balizamento pro ajuste. O primeiro segmento é o mais importante pra nortear o ajustamento, pois descreve as relações de dependência nas distâncias menores. Talvez o erro encontrado na VC seja decorrente de uma função inconsistente, apesar de retornar parâmetros aceitáveis. Talvez você possa melhorar a distribuição dos conjuntos de pontos ou então aumentar a distância do variograma. Como dito anteriormente, é mais um palpite do que qualquer outra coisa. Também vou acompanhar a resposta dos demais colegas pra aprender um pouco mais. Espero que ajude, Éder Comunello <c <comunello.eder@gmail.com>omunello.eder@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W]

Olá Éder, boa noite! Estes dados são de uma área pequena, trata-se de um grid com 42 pontos apenas, a distância mínima entre os pontos é de 10m e a máxima é de 78m, considerei a metade da distância máxima para gerar o semivariograma. Todos os pontos do semivariograma foram obtidos com mais de 30 pares de pontos. Muito obrigado pelas suas importantes considerações, *Hélder Gramacho * Recife-PE / *agrohelder@gmail.com <agrohelder@hotmail.com>* Em 14 de maio de 2014 20:58, Éder Comunello <comunello.eder@gmail.com>escreveu:
Hélder, boa noite!
Minha experiência na geoestatística também é recente, de modo que as considerações que irei colocar são passíveis de erro e devem ser encaradas mais como uma impressão pessoal sobre o assunto, baseado no que já tive oportunidade de ver e fazer.
1) Importância dos parâmetros: mais do que eleger um mais importante, acredito que a estratégia seja conduzir a análise baseando-se na coerência entre eles. Além dos parâmetros listados também é importante e avaliar e apresentar os parâmetros do ajuste (pepita, patamar e alcance) e a relação entre eles (Grau de Dependência Espacial, p. ex.). No caso de ajuste por likfit(), acredito que AIC/BIC possam considerados de especial importância.
2) Melhores parâmetros gerais vs. melhor modelo: os parâmetros servem como indicação, pra direcionar e restringir a análise. O que eu faço inicialmente é selecionar um grupo de melhores modelos para prosseguir com a análise e validação cruzada.
3) Validação cruzada vs. análise visual: não adianta ter um resultado melhor nos parâmetros se a análise visual estiver indicando problema (como no exemplo que segue).
4) Comparando os resultados e representação adequada: acredito que deva dar preferência para aquilo que você consegue explicar. Dentre diversos modelos válidos, optar pelo mais simples.
5) Resultados NAN e INF: suponho que seja problema com a amostragem realizada ou com os parâmetros indicados pra variografia. O ajustamento está baseado em apenas 6 conjuntos de pontos e o primeiro conjunto de pontos aparece só por volta do valor 10, deixando o primeiro trecho do variograma sem balizamento pro ajuste. O primeiro segmento é o mais importante pra nortear o ajustamento, pois descreve as relações de dependência nas distâncias menores. Talvez o erro encontrado na VC seja decorrente de uma função inconsistente, apesar de retornar parâmetros aceitáveis. Talvez você possa melhorar a distribuição dos conjuntos de pontos ou então aumentar a distância do variograma.
Como dito anteriormente, é mais um palpite do que qualquer outra coisa. Também vou acompanhar a resposta dos demais colegas pra aprender um pouco mais. Espero que ajude,
Éder Comunello <c <comunello.eder@gmail.com>omunello.eder@gmail.com> Dourados, MS - [22 16.5'S, 54 49'W]
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Caros Hélder e Éder. Vou dar minha opinião, mas como o Éder, é para tentar ajudar. Como o Éder comentou no item (6), seis pontos parece ser uma quantidade pequena e como a distância minima é de 10 m, então teria de aumentar a distância máxima para uns 80%, teria de testar. Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas foi o que apresentou o mais alto valor de AIC. Se for seguir este indicativo, este seria o pior modelo. Pelo que andei lendo, a seleção do modelo seria pela observação do mapa da variância da krigagem. O que apresenta a menor variância é o selecionado. Observando a escala dos dois mapas da variância, o ajustado por OLS apresenta valores inferiores indicando menor variância, o que seria, melhor ajuste, mas como disse antes, o modelo gaussiano ajustado por ML, analisando pelo AIC, é o pior. Abraço Hélio Em 14 de maio de 2014 16:39, Hélder [via R-br] < ml-node+s2285057n4662125h43@n4.nabble.com> escreveu:
Gostaria de tirar algumas dúvidas, desde já peço desculpas se cometi algum deslize, tenho tentado evoluir na utilização do R me baseando apenas em tutoriais, e nas orientações que recebo aqui do grupo.
A validação cruzada no pacote Geo R nos fornece como resultado: o Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos modelos por Máxima Verossimilhança, quando do ajuste do modelo.
1) Todos estes parâmetros possuem igual nível de importância na análise, ou algum deles tem peso maior? 2) Estou analisando cada um dos parâmetros e o modelo que "vence" na maior parte deles admito que é o melhor modelo, esta forma de analisar está correta? 3) Analisando-se o melhor modelo (escolhido como na pergunta 2) com o Gráfico do Semivariograma Teórico ajustado, nem sempre este parece que é o melhor modelo ajustado, nestes casos, deve prevalecer a análise da validação cruzada ou a visual? 4) Comparando os resultados da krigagem do modelo escolhido pela Validação Cruzada com o obtido pela análise visual, a krigagem utilizando como modelo o semivariograma "melhor" visualmente parece representar adequadamente o variação do fenômeno na área, nestes casos o que vocês sugerem? 5) Em alguns casos a Validação cruzada retornou como resultado NAN e INF, trata-se de algum problema com os dados?
Caso concreto:
A tabela abaixo traz os resultados da validação cruzada da variável condutividade hidráulica Ks, por dois métodos (Mínimos Quadrados e Máxima Verossimilhança), pela interpretação dos resultados, o modelo Gaussiano por Máxima Verossimilhança seria o melhor modelo a meu ver.
*Variável* *Método* *Modelo* *EM* *ER* *Sem* *Ser* *EA* *AIC* *BIC* OLS Esférico -1,27E-16 -6,42E-16 0,19729 *1,01442* 6,51815
OLS Exponencial *-0,00132* *-0,00346* *0,17911* 0,95090 5,99872
OLS Gaussiano -0,00097 -0,00259 0,18444 0,98982 *5,87635*
*Ks* ML Esférico -5,18E-16 -2,69E-015 0,19729 1,02439 6,51815 -12,18 -5,233 ML Exponencial -0,00118 -0,00327 0,18002 1,01035 5,91153 -15,24 -8,29 ML Gaussiano *-0,00134* *-0,00372* 0,17934 *1,00992* 5,89874 *-15,35* *-8,4*
Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois métodos, o da esquerda é por OLS e o da direita é por ML, o modelo Gaussiano está em verde, analisando visualmente achei que o Modelo Gaussiano por OLS está melhor ajustado: Nas figuras abaixo estão os resultados da krigagem comparando os dois modelos, o primeiro Gaussiano por OLS:
O segundo Gaussiano por ML:
Desde já agradeço a toda ajuda,
*Hélder Gramacho * Recife-PE / * [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=0>*
_______________________________________________ R-br mailing list [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=1> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
------------------------------ If you reply to this email, your message will be added to the discussion below:
http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp466212... To unsubscribe from R-br, click here<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4> . NAML<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
-- Hélio Gallo Rocha IFSULDEMINAS - Câmpus Muzambinho

Caros, Gostaria de contribuir com 'alguns centavos' genericos. 1.a) A estimacao de parametros baseada em variograma (V) e' extremamente dependente do variograma (ja pontuado aqui que apenas 6 pontos pode nao ser razoavel). Esta abordagem e' chamada (por alguns poucos) de metodo dos momentos (http://www.jstor.org/stable/1400419) 1.b) abordagem de V comparada com a abordagem baseada em modelos (por exemplo maxima verosimilhanca ML) e' equivalente a ajustar uma distribuicao a um histograma em vez de ajusta-la aos dados propriamente dito. Exemplo: estimar a media de uma distribuicao normal n = 30 x = rnorm(n) h = hist(x, plot=FALSE) c(v=sum(h$mids * h$counts/n), ml=mean(x)) 1.c) Considerando 1.a) e 1.b), a escolha da abordagem a ser usada para estimar os parametros e' dependente da preferencia filosofica. Prefiro V ou assumir uma distribuicao aos dados? 2.a) Ja foi comentado sobre a distancia minima de 10m. Se 10m e' relativamente grande em relacao ao alcance, isso e' ruim. 2.b) Observando o 'design' dos pontos nota-se que e' um grid (extremamente regular). Me parece que o melhor design seria uma mescla entre regular (para cobrir bem toda a area) e aleatorio (para se ter um bom rol de distancias). 3.a) Geralmente caimos num dilema quando temos varias medidas de ajuste... No caso de geoestatistica, temos dois objetivos: O primeiro e' descrever o processo (qual funcao de correlacao, parametros). O segundo e' fazer predicao. Se o foco e' descricao, considere medidas baseadas no ajuste do modelo aos dados, AIC, por exemplo (para alguns e' dificil entender porque o tal BIC tem esse nome visto que nenhuma analise Bayesiana foi feita). Se foco e' predicao, esqueca considere medidas baseadas em predicao. aT+, Elias. On 15/05/14 13:24, Hélio Gallo Rocha wrote:
Caros Hélder e Éder.
Vou dar minha opinião, mas como o Éder, é para tentar ajudar.
Como o Éder comentou no item (6), seis pontos parece ser uma quantidade pequena e como a distância minima é de 10 m, então teria de aumentar a distância máxima para uns 80%, teria de testar.
Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas foi o que apresentou o mais alto valor de AIC. Se for seguir este indicativo, este seria o pior modelo.
Pelo que andei lendo, a seleção do modelo seria pela observação do mapa da variância da krigagem. O que apresenta a menor variância é o selecionado.
Observando a escala dos dois mapas da variância, o ajustado por OLS apresenta valores inferiores indicando menor variância, o que seria, melhor ajuste, mas como disse antes, o modelo gaussiano ajustado por ML, analisando pelo AIC, é o pior.
Abraço
Hélio
Em 14 de maio de 2014 16:39, Hélder [via R-br] <ml-node+s2285057n4662125h43@n4.nabble.com <mailto:ml-node+s2285057n4662125h43@n4.nabble.com>> escreveu:
Gostaria de tirar algumas dúvidas, desde já peço desculpas se cometi algum deslize, tenho tentado evoluir na utilização do R me baseando apenas em tutoriais, e nas orientações que recebo aqui do grupo.
A validação cruzada no pacote Geo R nos fornece como resultado: o Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos modelos por Máxima Verossimilhança, quando do ajuste do modelo.
1) Todos estes parâmetros possuem igual nível de importância na análise, ou algum deles tem peso maior? 2) Estou analisando cada um dos parâmetros e o modelo que "vence" na maior parte deles admito que é o melhor modelo, esta forma de analisar está correta? 3) Analisando-se o melhor modelo (escolhido como na pergunta 2) com o Gráfico do Semivariograma Teórico ajustado, nem sempre este parece que é o melhor modelo ajustado, nestes casos, deve prevalecer a análise da validação cruzada ou a visual? 4) Comparando os resultados da krigagem do modelo escolhido pela Validação Cruzada com o obtido pela análise visual, a krigagem utilizando como modelo o semivariograma "melhor" visualmente parece representar adequadamente o variação do fenômeno na área, nestes casos o que vocês sugerem? 5) Em alguns casos a Validação cruzada retornou como resultado NAN e INF, trata-se de algum problema com os dados?
Caso concreto:
A tabela abaixo traz os resultados da validação cruzada da variável condutividade hidráulica Ks, por dois métodos (Mínimos Quadrados e Máxima Verossimilhança), pela interpretação dos resultados, o modelo Gaussiano por Máxima Verossimilhança seria o melhor modelo a meu ver.
*Variável* *Método* *Modelo* *EM* *ER* *Sem* *Ser* *EA* *AIC* *BIC* * * OLS Esférico -1,27E-16 -6,42E-16 0,19729 *1,01442* 6,51815
OLS Exponencial *-0,00132* *-0,00346* *0,17911* 0,95090 5,99872
OLS Gaussiano -0,00097 -0,00259 0,18444 0,98982 *5,87635*
*Ks* ML Esférico -5,18E-16 -2,69E-015 0,19729 1,02439 6,51815 -12,18 -5,233 * * ML Exponencial -0,00118 -0,00327 0,18002 1,01035 5,91153 -15,24 -8,29
ML Gaussiano *-0,00134* *-0,00372* 0,17934 *1,00992* 5,89874 *-15,35* *-8,4*
Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois métodos, o da esquerda é por OLS e o da direita é por ML, o modelo Gaussiano está em verde, analisando visualmente achei que o Modelo Gaussiano por OLS está melhor ajustado: Nas figuras abaixo estão os resultados da krigagem comparando os dois modelos, o primeiro Gaussiano por OLS:
O segundo Gaussiano por ML:
Desde já agradeço a toda ajuda,
/*Hélder Gramacho */ Recife-PE / / /[hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=0>/ /
_______________________________________________ R-br mailing list [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=1> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
------------------------------------------------------------------------ If you reply to this email, your message will be added to the discussion below: http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp466212...
To unsubscribe from R-br, click here <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4>. NAML <http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
-- Hélio Gallo Rocha IFSULDEMINAS - Câmpus Muzambinho
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Olá Hélio, Éder e Elias, Agradeço pelas considerações, vou direcionar os estudos para as questões abordadas por vocês. Obrigado, *Hélder Gramacho * Recife-PE / *agrohelder@gmail.com <agrohelder@hotmail.com>* Em 15 de maio de 2014 09:05, Elias T. Krainski <eliaskrainski@yahoo.com.br>escreveu:
Caros,
Gostaria de contribuir com 'alguns centavos' genericos.
1.a) A estimacao de parametros baseada em variograma (V) e' extremamente dependente do variograma (ja pontuado aqui que apenas 6 pontos pode nao ser razoavel). Esta abordagem e' chamada (por alguns poucos) de metodo dos momentos (http://www.jstor.org/stable/1400419)
1.b) abordagem de V comparada com a abordagem baseada em modelos (por exemplo maxima verosimilhanca ML) e' equivalente a ajustar uma distribuicao a um histograma em vez de ajusta-la aos dados propriamente dito. Exemplo: estimar a media de uma distribuicao normal n = 30 x = rnorm(n) h = hist(x, plot=FALSE) c(v=sum(h$mids * h$counts/n), ml=mean(x))
1.c) Considerando 1.a) e 1.b), a escolha da abordagem a ser usada para estimar os parametros e' dependente da preferencia filosofica. Prefiro V ou assumir uma distribuicao aos dados?
2.a) Ja foi comentado sobre a distancia minima de 10m. Se 10m e' relativamente grande em relacao ao alcance, isso e' ruim.
2.b) Observando o 'design' dos pontos nota-se que e' um grid (extremamente regular). Me parece que o melhor design seria uma mescla entre regular (para cobrir bem toda a area) e aleatorio (para se ter um bom rol de distancias).
3.a) Geralmente caimos num dilema quando temos varias medidas de ajuste... No caso de geoestatistica, temos dois objetivos: O primeiro e' descrever o processo (qual funcao de correlacao, parametros). O segundo e' fazer predicao. Se o foco e' descricao, considere medidas baseadas no ajuste do modelo aos dados, AIC, por exemplo (para alguns e' dificil entender porque o tal BIC tem esse nome visto que nenhuma analise Bayesiana foi feita). Se foco e' predicao, esqueca considere medidas baseadas em predicao.
aT+, Elias.
On 15/05/14 13:24, Hélio Gallo Rocha wrote:
Caros Hélder e Éder.
Vou dar minha opinião, mas como o Éder, é para tentar ajudar.
Como o Éder comentou no item (6), seis pontos parece ser uma quantidade pequena e como a distância minima é de 10 m, então teria de aumentar a distância máxima para uns 80%, teria de testar.
Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas foi o que apresentou o mais alto valor de AIC. Se for seguir este indicativo, este seria o pior modelo.
Pelo que andei lendo, a seleção do modelo seria pela observação do mapa da variância da krigagem. O que apresenta a menor variância é o selecionado.
Observando a escala dos dois mapas da variância, o ajustado por OLS apresenta valores inferiores indicando menor variância, o que seria, melhor ajuste, mas como disse antes, o modelo gaussiano ajustado por ML, analisando pelo AIC, é o pior.
Abraço
Hélio
Em 14 de maio de 2014 16:39, Hélder [via R-br] < ml-node+s2285057n4662125h43@n4.nabble.com> escreveu:
Gostaria de tirar algumas dúvidas, desde já peço desculpas se cometi algum deslize, tenho tentado evoluir na utilização do R me baseando apenas em tutoriais, e nas orientações que recebo aqui do grupo.
A validação cruzada no pacote Geo R nos fornece como resultado: o Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos modelos por Máxima Verossimilhança, quando do ajuste do modelo.
1) Todos estes parâmetros possuem igual nível de importância na análise, ou algum deles tem peso maior? 2) Estou analisando cada um dos parâmetros e o modelo que "vence" na maior parte deles admito que é o melhor modelo, esta forma de analisar está correta? 3) Analisando-se o melhor modelo (escolhido como na pergunta 2) com o Gráfico do Semivariograma Teórico ajustado, nem sempre este parece que é o melhor modelo ajustado, nestes casos, deve prevalecer a análise da validação cruzada ou a visual? 4) Comparando os resultados da krigagem do modelo escolhido pela Validação Cruzada com o obtido pela análise visual, a krigagem utilizando como modelo o semivariograma "melhor" visualmente parece representar adequadamente o variação do fenômeno na área, nestes casos o que vocês sugerem? 5) Em alguns casos a Validação cruzada retornou como resultado NAN e INF, trata-se de algum problema com os dados?
Caso concreto:
A tabela abaixo traz os resultados da validação cruzada da variável condutividade hidráulica Ks, por dois métodos (Mínimos Quadrados e Máxima Verossimilhança), pela interpretação dos resultados, o modelo Gaussiano por Máxima Verossimilhança seria o melhor modelo a meu ver.
*Variável* *Método* *Modelo* *EM* *ER* *Sem* *Ser* *EA* *AIC* *BIC* OLS Esférico -1,27E-16 -6,42E-16 0,19729 *1,01442* 6,51815
OLS Exponencial *-0,00132* *-0,00346* *0,17911* 0,95090 5,99872
OLS Gaussiano -0,00097 -0,00259 0,18444 0,98982 *5,87635*
*Ks* ML Esférico -5,18E-16 -2,69E-015 0,19729 1,02439 6,51815 -12,18 -5,233 ML Exponencial -0,00118 -0,00327 0,18002 1,01035 5,91153 -15,24 -8,29 ML Gaussiano *-0,00134* *-0,00372* 0,17934 *1,00992* 5,89874 *-15,35* *-8,4*
Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois métodos, o da esquerda é por OLS e o da direita é por ML, o modelo Gaussiano está em verde, analisando visualmente achei que o Modelo Gaussiano por OLS está melhor ajustado: Nas figuras abaixo estão os resultados da krigagem comparando os dois modelos, o primeiro Gaussiano por OLS:
O segundo Gaussiano por ML:
Desde já agradeço a toda ajuda,
*Hélder Gramacho * Recife-PE / * [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=0> *
_______________________________________________ R-br mailing list [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=1> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
------------------------------ If you reply to this email, your message will be added to the discussion below:
http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp466212... To unsubscribe from R-br, click here<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4> . NAML<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
-- Hélio Gallo Rocha IFSULDEMINAS - Câmpus Muzambinho
_______________________________________________ R-br mailing listR-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (4)
-
Elias T. Krainski
-
Helder Gramacho
-
Hélio Gallo Rocha
-
Éder Comunello