
Caros, Estou fazendo um exercício teórico de regressão para estimar o efeito de um programa a partir da base de dados disponível no código baixo. library(foreign) lalonde <- read.dta(" http://dl.dropboxusercontent.com/u/7453595/BD_LAB/lalonde.dta") #carrega a base de dados str(lalonde) # variáveis # As variáveis re74, re75 e re78 contêm informações sobre o rendimento para os anos de 1974, 1975 e 1978, respectivamente. # A variável de tratamento t indica se o indivíduo participou do programa (t=1) ou se não participou do programa (t=0). # As demais variáveis contém características dos trabalhadores Trata-se de um experimento aleatório e quero mostrar que há aleatoriedade no experimento. Assim, estou rodando a seguinte regressão: regressao1 <- lm(re78 ~ t, data=lalonde) summary(regressao1) E em seguida incluindo os controles em uma outra regressão e gostaria de mostrar que o estimador de t (tratamento) varia pouco (cerca de U$ 100,00). regressao2 <- lm(re78 ~ t+age+educ+nodegree+black+hisp+married, data=lalonde) summary(regressao2) Assim, gostaria de fazer um teste para verificar se o estimador de t na regressão 1 é estatisticamente diferente da mesmo estimador na regressão 2. Está certo eu fazer da seguinte forma? install.packages("car") library(car) linearHypothesis(regressao2,"t=1794.3", test = "F") Desde já obrigado pelas ajudas. At. -- Adriano Borges Costa

Veja se isso faz sentido para o seu problema: talvez você possa testar a associação entre o tratamento e os demais preditores, em vez de comparar os dois modelos de regressão já apresentados. Mas isso se você realmente achar importante testar a associação. Por exemplo, num ensaio clínico randomizado, não faz sentido testar a hipótese de alocação aleatória. Em princípio, qualquer associação entre o tratamento alocado e as variáveis de exposição *é* aleatório, por menor que seja o valor de p. A supervisão de campo é quem vai dizer se houve violação do protocolo. E diferenças grandes entre o grupo de intervenção e o de controle podem precisar ser levadas em consideração nas análises, independentemente delas terem aparecido ao acaso ou não. Leonardo Ferreira Fontenelle[1] Em Ter 21 out. 2014, às 23:52, Adriano Borges Costa escreveu:
Caros,
Estou fazendo um exercício teórico de regressão para estimar o efeito de um programa a partir da base de dados disponível no código baixo.
library(foreign) lalonde <- read.dta("http://dl.dropboxusercontent.com/u/7453595/BD_LAB/lalonde.dta") #carrega a base de dados
str(lalonde) # variáveis
# As variáveis re74, re75 e re78 contêm informações sobre o rendimento # para os anos de 1974, 1975 e 1978, respectivamente. A variável de # tratamento t indica se o indivíduo participou do programa (t=1) ou # se não participou do programa (t=0). As demais variáveis contém # características dos trabalhadores
Trata-se de um experimento aleatório e quero mostrar que há aleatoriedade no experimento. Assim, estou rodando a seguinte regressão:
regressao1 <- lm(re78 ~ t, data=lalonde) summary(regressao1)
E em seguida incluindo os controles em uma outra regressão e gostaria de mostrar que o estimador de t (tratamento) varia pouco (cerca de U$ 100,00).
regressao2 <- lm(re78 ~ t+age+educ+nodegree+black+hisp+married, data=lalonde) summary(regressao2)
Assim, gostaria de fazer um teste para verificar se o estimador de t na regressão 1 é estatisticamente diferente da mesmo estimador na regressão 2.
Está certo eu fazer da seguinte forma?
install.packages("car") library(car) linearHypothesis(regressao2,"t=1794.3", test = "F")
Desde já obrigado pelas ajudas.
At.
-- Adriano Borges Costa _________________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
Links: 1. http://lattes.cnpq.br/9234772336296638

Adriano, Talvez eu tenha entendido mal, mas na regressão 1, o que você mede é o efeito do tratamento, e não a aleatoriedade, certo? Se seus dados foram gerados a partir de um experimento do tipo aleatório simples, então a diferença encontrada em re78 para t é o efeito estimado do tratamento. Portanto, nesse contexto, inferência causal pode ser entendida como um caso especial de predição em que o objetivo é prever o que aconteceria em diferentes opções de tratamento. Se você também tiver a informação contida em re78 para todos os sujeitos antes de serem atribuídos o tipo de tratamento, então você pode testar a média antes e depois para cada grupo a fim medir o erro experimental. Todavia, se o seu experimento for estratificado (idade, sexo etc) daí o melhor seria você pensar em algum tipo de regressão hierárquica. Apenas uma coisa, se você quiser você pode testar um modelo contra o outro usando: anova(modelo1, modelo2) Possivelmente você verá um ganho bem pequeno de um modelo para o outro ao custo de 6 graus de liberdade. Daniel 2014-10-22 0:14 GMT-02:00 Leonardo Ferreira Fontenelle <leonardof@leonardof.med.br>:
Veja se isso faz sentido para o seu problema: talvez você possa testar a associação entre o tratamento e os demais preditores, em vez de comparar os dois modelos de regressão já apresentados.
Mas isso se você realmente achar importante testar a associação. Por exemplo, num ensaio clínico randomizado, não faz sentido testar a hipótese de alocação aleatória. Em princípio, qualquer associação entre o tratamento alocado e as variáveis de exposição é aleatório, por menor que seja o valor de p. A supervisão de campo é quem vai dizer se houve violação do protocolo. E diferenças grandes entre o grupo de intervenção e o de controle podem precisar ser levadas em consideração nas análises, independentemente delas terem aparecido ao acaso ou não.
Leonardo Ferreira Fontenelle
Em Ter 21 out. 2014, às 23:52, Adriano Borges Costa escreveu:
Caros,
Estou fazendo um exercício teórico de regressão para estimar o efeito de um programa a partir da base de dados disponível no código baixo.
library(foreign) lalonde <- read.dta("http://dl.dropboxusercontent.com/u/7453595/BD_LAB/lalonde.dta") #carrega a base de dados
str(lalonde) # variáveis
# As variáveis re74, re75 e re78 contêm informações sobre o rendimento para os anos de 1974, 1975 e 1978, respectivamente. # A variável de tratamento t indica se o indivíduo participou do programa (t=1) ou se não participou do programa (t=0). # As demais variáveis contém características dos trabalhadores
Trata-se de um experimento aleatório e quero mostrar que há aleatoriedade no experimento. Assim, estou rodando a seguinte regressão:
regressao1 <- lm(re78 ~ t, data=lalonde) summary(regressao1)
E em seguida incluindo os controles em uma outra regressão e gostaria de mostrar que o estimador de t (tratamento) varia pouco (cerca de U$ 100,00).
regressao2 <- lm(re78 ~ t+age+educ+nodegree+black+hisp+married, data=lalonde) summary(regressao2)
Assim, gostaria de fazer um teste para verificar se o estimador de t na regressão 1 é estatisticamente diferente da mesmo estimador na regressão 2.
Está certo eu fazer da seguinte forma?
install.packages("car") library(car) linearHypothesis(regressao2,"t=1794.3", test = "F")
Desde já obrigado pelas ajudas.
At.
-- Adriano Borges Costa _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Obrigado pelas respostas Leonardo e Daniel. Concordo que a supervisão de campo tem que garantir os protocolos de aleatoriedade. No entanto, no exercício estou mostrando que de fato o tratamento e controle eram iguais no momento inicial em termos de renda e que após o treinamento eles se diferenciam. Mas quero mostrar também que o aumento da renda não está relacionada a nenhuma das características observáveis do beneficiários, apenas ao fato de terem participado do treinamento. Daniel, você entendeu o que eu quero fazer. Queria apenas mostrar que a inclusão de variáveis no segundo modelo não altera significativamente o efeito estimado do programa, justamente por estarmos tratando de um experimento aleatório simples. Você sabe se posso fazer um teste F para verificar se os dois parâmetros estimados são estatisticamente diferentes usando a função linearHypothesis? Obrigado Adriano Em 22 de outubro de 2014 00:14, Leonardo Ferreira Fontenelle < leonardof@leonardof.med.br> escreveu:
Veja se isso faz sentido para o seu problema: talvez você possa testar a associação entre o tratamento e os demais preditores, em vez de comparar os dois modelos de regressão já apresentados.
Mas isso se você realmente achar importante testar a associação. Por exemplo, num ensaio clínico randomizado, não faz sentido testar a hipótese de alocação aleatória. Em princípio, qualquer associação entre o tratamento alocado e as variáveis de exposição *é* aleatório, por menor que seja o valor de p. A supervisão de campo é quem vai dizer se houve violação do protocolo. E diferenças grandes entre o grupo de intervenção e o de controle podem precisar ser levadas em consideração nas análises, independentemente delas terem aparecido ao acaso ou não.
Leonardo Ferreira Fontenelle <http://lattes.cnpq.br/9234772336296638>
Em Ter 21 out. 2014, às 23:52, Adriano Borges Costa escreveu:
Caros,
Estou fazendo um exercício teórico de regressão para estimar o efeito de um programa a partir da base de dados disponível no código baixo.
library(foreign) lalonde <- read.dta(" http://dl.dropboxusercontent.com/u/7453595/BD_LAB/lalonde.dta") #carrega a base de dados
str(lalonde) # variáveis
# As variáveis re74, re75 e re78 contêm informações sobre o rendimento para os anos de 1974, 1975 e 1978, respectivamente. # A variável de tratamento t indica se o indivíduo participou do programa (t=1) ou se não participou do programa (t=0). # As demais variáveis contém características dos trabalhadores
Trata-se de um experimento aleatório e quero mostrar que há aleatoriedade no experimento. Assim, estou rodando a seguinte regressão:
regressao1 <- lm(re78 ~ t, data=lalonde) summary(regressao1)
E em seguida incluindo os controles em uma outra regressão e gostaria de mostrar que o estimador de t (tratamento) varia pouco (cerca de U$ 100,00) .
regressao2 <- lm(re78 ~ t+age+educ+nodegree+black+hisp+married, data=lalonde) summary(regressao2)
Assim, gostaria de fazer um teste para verificar se o estimador de t na regressão 1 é estatisticamente diferente da mesmo estimador na regressão 2.
Está certo eu fazer da seguinte forma?
install.packages("car") library(car) linearHypothesis(regressao2,"t=1794.3", test = "F")
Desde já obrigado pelas ajudas.
At.
-- Adriano Borges Costa *_______________________________________________* R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Adriano Borges Costa
participantes (3)
-
Adriano Borges Costa
-
Daniel Marcelino
-
Leonardo Ferreira Fontenelle