[R-br] Pergunta boba
Sérgio Henrique almeida da silva ju
sergio.edfisica em gmail.com
Sexta Abril 13 17:13:55 BRT 2012
Quais as implicações de fazer isso para futuro uso dos dados?
Em 13 de abril de 2012 17:05, Augusto Ribas <ribas.aca em gmail.com> escreveu:
> #abrindo seus dados como exemplo
>
> exemplo<-structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L,
>
> 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055",
> "0180019", "0180280", "0180567", "0180573", "0181106", "0181303",
> "0841583", "1634645", "1778689", "2082159", "2082161", "2087955",
> "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L,
> 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"),
> id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L,
> 2L), .Label = c(" ", "A309"), class = "factor"), dt_notific =
> c(13470537600,
> 13429670400, 13452307200, 13456713600, 13455417600, 13457232000,
> 13457145600, 13455504000, 13460342400, 13459046400), nu_ano =
> structure(c(1L,
> 2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c(" ", "2008",
> "2009"), class = "factor"), sg_uf_not = structure(c(27L,
> 25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label =
> c("Ignorado/exterior",
> "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá",
> "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte",
> "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais",
> "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná",
> "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul",
> "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"),
> id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L,
> 4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ",
> "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L,
> 6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c(" ",
> "1363 ", "1374 ", "1480 ", "1779 ", "1974 "
> ), class = "factor")), .Names = c("nu_notific", "tp_not",
> "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
> "id_regiona"), variable.labels = structure(c("Número da notificação",
> "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação",
> "Ano da notificação", "Estado em que foi notificado o caso",
> "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific",
> "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
> "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class =
> "data.frame")
>
> #aqui é um caso que vc quer mudar certo?
> exemplo[8,3]
> str(exemplo)
> #um fator
>
> #usando o mesmo comando que acabamos de usar vc ve que nesse caso o vaziu
> é 4 espaço
> dput(exemplo[8,3])
>
> #dai vc substitui
>
> exemplo[]<-lapply(exemplo,function(x){replace(x, x == " ", NA)})
>
> #assim vc subtitui nada de 4 espaços por NA
> exemplo[8,3]
>
> #so cuidado com as implicações de fazer isso para futuro uso dos dados
> #e não sei se ficou muito generico a solução, mas é um jeito
>
> Em 13 de abril de 2012 15:53, Sérgio Henrique almeida da silva ju <
> sergio.edfisica em gmail.com> escreveu:
>
> Oi
>>
>> Reduzi o banco e rodei o comando:
>>
>> exemplo<-dput(dados[1:10,])
>> structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L,
>> 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055",
>> "0180019", "0180280", "0180567", "0180573", "0181106", "0181303",
>> "0841583", "1634645", "1778689", "2082159", "2082161", "2087955",
>> "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L,
>> 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"),
>> id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L,
>> 2L), .Label = c(" ", "A309"), class = "factor"), dt_notific =
>> c(13470537600,
>> 13429670400, 13452307200, 13456713600, 13455417600, 13457232000,
>> 13457145600, 13455504000, 13460342400, 13459046400), nu_ano =
>> structure(c(1L,
>> 2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c(" ", "2008",
>> "2009"), class = "factor"), sg_uf_not = structure(c(27L,
>> 25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label =
>> c("Ignorado/exterior",
>> "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá",
>> "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte",
>> "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas
>> Gerais",
>> "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná",
>> "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul",
>> "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"),
>> id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L,
>> 4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ",
>> "500320 ", "520870 "), class = "factor"), id_regiona =
>> structure(c(5L,
>> 6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c(" ",
>> "1363 ", "1374 ", "1480 ", "1779 ", "1974 "
>> ), class = "factor")), .Names = c("nu_notific", "tp_not",
>> "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
>> "id_regiona"), variable.labels = structure(c("Número da notificação",
>> "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação",
>> "Ano da notificação", "Estado em que foi notificado o caso",
>> "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific",
>> "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
>> "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class =
>> "data.frame")
>>
>>
>> Em 13 de abril de 2012 16:47, Augusto Ribas <ribas.aca em gmail.com>escreveu:
>>
>> Cara.
>>> Depois que vc fez:
>>>
>>> library(foreign)
>>> dados <- read.spss("tmp.sav", use.value.labels=TRUE,
>>> max.value.labels=Inf, to.data.frame=TRUE)
>>>
>>> #faça o seguinte
>>> exemplo<-dput(dados)
>>>
>>>
>>> #se o arquivo for muito gigante faz o dput de um pedaçinho so, so
>>> garanta que no pedacinho vc mostre esses brancos que ta falando tipo:
>>>
>>> exemplo<-dput(dados[1:10,])
>>>
>>> #ai mostra so as primeiras 10 linhas
>>> # ou faz um exemplo de dados pequenininho no systat abre no R e usa o
>>> dput
>>>
>>> #A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais
>>> eficientemente.
>>>
>>>
>>> Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju <
>>> sergio.edfisica em gmail.com> escreveu:
>>>
>>> No arquivo original algumas variáveis estão em branco e eu quero
>>>> considerar isso como NA, na importação algumas variáveis automaticamente o
>>>> em branco ficam NA, porém em outras os dados continuam em branco.
>>>> Desculpe, mas não sei fazer um CMR com dados em branco.
>>>>
>>>> Abraços
>>>>
>>>>
>>>> Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani em gmail.com>escreveu:
>>>>
>>>>> No arquivo de origem qual o caracter representador de NA, é ponto, é
>>>>> espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou
>>>>> similar a este na função de leitura que você usa) o caratere
>>>>> correspondente. Se não resolver providencie um CMR.
>>>>>
>>>>> À disposição.
>>>>> Walmes.
>>>>>
>>>>>
>>>>> ==========================================================================
>>>>> Walmes Marques Zeviani
>>>>> LEG (Laboratório de Estatística e Geoinformação, 25.450418 S,
>>>>> 49.231759 W)
>>>>> Departamento de Estatística - Universidade Federal do Paraná
>>>>> fone: (+55) 41 3361 3573
>>>>> VoIP: (3361 3600) 1053 1173
>>>>> e-mail: walmes em ufpr.br
>>>>> twitter: @walmeszeviani
>>>>> homepage: http://www.leg.ufpr.br/~walmes
>>>>> linux user number: 531218
>>>>>
>>>>> ==========================================================================
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>>
>>>> --
>>>> Sérgio Henrique Almeida da Silva Junior
>>>> Doutorando em Epidemiologia em Saúde Pública
>>>> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
>>>> http://lattes.cnpq.br/1611345552843383
>>>> Tel: (21) 94429486/78101651 id: 123*20942
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>> Grato
>>> Augusto C. A. Ribas
>>>
>>> Site Pessoal: http://augustoribas.heliohost.org
>>> Lattes: http://lattes.cnpq.br/7355685961127056
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> Sérgio Henrique Almeida da Silva Junior
>> Doutorando em Epidemiologia em Saúde Pública
>> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
>> http://lattes.cnpq.br/1611345552843383
>> Tel: (21) 94429486/78101651 id: 123*20942
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> Grato
> Augusto C. A. Ribas
>
> Site Pessoal: http://augustoribas.heliohost.org
> Lattes: http://lattes.cnpq.br/7355685961127056
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
--
Sérgio Henrique Almeida da Silva Junior
Doutorando em Epidemiologia em Saúde Pública
Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
http://lattes.cnpq.br/1611345552843383
Tel: (21) 94429486/78101651 id: 123*20942
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120413/bcf2516b/attachment.html>
Mais detalhes sobre a lista de discussão R-br