Não seria possível utilizar uma regressão Poisson, quasi-Poisson, binomial negativa etc. nos dados originais? Você poderia indicar o numerador da taxa como variável de resposta (inclusive zero, sem resposta), e o denominador (pessoas-tempo em risco, ao algo assim) como "offset". No caso da quasi-Poisson, nem seria necessário separar numerador e denominador; você poderia passar diretamente a taxa.
 
Leonardo Ferreira Fontenelle
 
 
Em Qua 10 jun. 2015, às 10:34, Samuel luna de almeida escreveu:
Muito obrigado Luis, Paulo e Luis!
 
São zero mesmo (locais onde não há casos para resultarem em taxas)...
 
Consegui gerar lm para a regressão espacial com os dados originais, com muitos zeros, porém com a variável normalizada acho q o "-inf" impede...
 
Será q eu consigo considerar os "-inf" como zero de algum modo? Ou `e o caso de encontrar um modelo/distribuição mais adequado mesmo?
 
Agradecido,
Samuel
 
Em 10 de junho de 2015 10:07, Paulo Justiniano <paulojus@leg.ufpr.br> escreveu:
 
log(0) = -Inf
 
Veja que voce tem muitos zeros, mais que 25% dos teus dados, visto que o 1o quartil ainda é zero
 
Não tenhosugestão específica mas acredito que voce poderia:
- ver se seus zeros são zeros mesmo ou valores "censurados" abaixo de um cento limite "de detecção"
 
- sendo zeros mesmo eu procurar por algum modelo/distribuição que permitisse modelar esta proporção bem razoável de zeros que voce tem nos teus dados
 
 
 
 
 
On Wed, 10 Jun 2015, Samuel luna de almeida wrote:
 
Bom dia pessoal,

Trabalhando com uma variável de taxas que que apresenta muitos valores baixos, fui aconselhado a transforma-la com aplicação de log normal antes de buscar
correlações...
A variável foi transformada e inserida no dataframe  passando a apresentar comportamento normal, no entanto apresenta alguns valores "-inf" como pode ser visto no
summary copiado abaixo:

TX_J04_10         LOGNTX_J04 
Min.   :   0.0       Min.   :-Inf 
1st Qu.:   0.0     1st Qu.:-Inf 
Median : 138.4    Median :  -4 
Mean   : 240.7    Mean   :-Inf 
3rd Qu.: 295.2    3rd Qu.:  -4 
Max.   :9626.1    Max.   :   0

Acredito que seja por isso que não estou conseguindo gerar lm para rodar regressão espacial, veja o erro que aparece:

> baseGN04_lm <- lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, data=baseG04)
Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
  NA/NaN/Inf in 'y'

Será que é por isso mesmo, alguém poderia me indicar uma resolução?
 
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
 
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.