[R-br] Pergunta boba

Sérgio Henrique almeida da silva ju sergio.edfisica em gmail.com
Sexta Abril 13 17:13:55 BRT 2012


Quais as implicações de fazer isso para futuro uso dos dados?

Em 13 de abril de 2012 17:05, Augusto Ribas <ribas.aca em gmail.com> escreveu:

> #abrindo seus dados como exemplo
>
> exemplo<-structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L,
>
> 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055",
> "0180019", "0180280", "0180567", "0180573", "0181106", "0181303",
> "0841583", "1634645", "1778689", "2082159", "2082161", "2087955",
> "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L,
> 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"),
>     id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L,
>     2L), .Label = c("    ", "A309"), class = "factor"), dt_notific =
> c(13470537600,
>     13429670400, 13452307200, 13456713600, 13455417600, 13457232000,
>     13457145600, 13455504000, 13460342400, 13459046400), nu_ano =
> structure(c(1L,
>     2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c("    ", "2008",
>     "2009"), class = "factor"), sg_uf_not = structure(c(27L,
>     25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label =
> c("Ignorado/exterior",
>     "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá",
>     "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte",
>     "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais",
>     "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná",
>     "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul",
>     "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"),
>     id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L,
>     4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ",
>     "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L,
>     6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c("        ",
>     "1363    ", "1374    ", "1480    ", "1779    ", "1974    "
>     ), class = "factor")), .Names = c("nu_notific", "tp_not",
> "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
> "id_regiona"), variable.labels = structure(c("Número da notificação",
> "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação",
> "Ano da notificação", "Estado em que foi notificado o caso",
> "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific",
> "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
> "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class =
> "data.frame")
>
> #aqui é um caso que vc quer mudar certo?
> exemplo[8,3]
> str(exemplo)
> #um fator
>
> #usando o mesmo comando que acabamos de usar vc ve que nesse caso o vaziu
> é 4 espaço
> dput(exemplo[8,3])
>
> #dai vc substitui
>
> exemplo[]<-lapply(exemplo,function(x){replace(x, x == "    ", NA)})
>
> #assim vc subtitui nada de 4 espaços por NA
> exemplo[8,3]
>
> #so cuidado com as implicações de fazer isso para futuro uso dos dados
> #e não sei se ficou muito generico a solução, mas é um jeito
>
> Em 13 de abril de 2012 15:53, Sérgio Henrique almeida da silva ju <
> sergio.edfisica em gmail.com> escreveu:
>
> Oi
>>
>> Reduzi o banco e rodei o comando:
>>
>> exemplo<-dput(dados[1:10,])
>> structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L,
>> 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055",
>> "0180019", "0180280", "0180567", "0180573", "0181106", "0181303",
>> "0841583", "1634645", "1778689", "2082159", "2082161", "2087955",
>> "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L,
>> 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"),
>>     id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L,
>>     2L), .Label = c("    ", "A309"), class = "factor"), dt_notific =
>> c(13470537600,
>>     13429670400, 13452307200, 13456713600, 13455417600, 13457232000,
>>     13457145600, 13455504000, 13460342400, 13459046400), nu_ano =
>> structure(c(1L,
>>     2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c("    ", "2008",
>>     "2009"), class = "factor"), sg_uf_not = structure(c(27L,
>>     25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label =
>> c("Ignorado/exterior",
>>     "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá",
>>     "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte",
>>     "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas
>> Gerais",
>>     "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná",
>>     "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul",
>>     "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"),
>>     id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L,
>>     4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ",
>>     "500320 ", "520870 "), class = "factor"), id_regiona =
>> structure(c(5L,
>>     6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c("        ",
>>     "1363    ", "1374    ", "1480    ", "1779    ", "1974    "
>>     ), class = "factor")), .Names = c("nu_notific", "tp_not",
>> "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
>> "id_regiona"), variable.labels = structure(c("Número da notificação",
>> "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação",
>> "Ano da notificação", "Estado em que foi notificado o caso",
>> "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific",
>> "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
>> "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class =
>> "data.frame")
>>
>>
>> Em 13 de abril de 2012 16:47, Augusto Ribas <ribas.aca em gmail.com>escreveu:
>>
>> Cara.
>>> Depois que vc fez:
>>>
>>> library(foreign)
>>> dados <- read.spss("tmp.sav", use.value.labels=TRUE,
>>> max.value.labels=Inf, to.data.frame=TRUE)
>>>
>>> #faça o seguinte
>>> exemplo<-dput(dados)
>>>
>>>
>>> #se o arquivo for muito gigante faz o dput de um pedaçinho so, so
>>> garanta que no pedacinho vc mostre esses brancos que ta falando tipo:
>>>
>>> exemplo<-dput(dados[1:10,])
>>>
>>> #ai mostra so as primeiras 10 linhas
>>> # ou faz um exemplo de dados pequenininho no systat abre no R e usa o
>>> dput
>>>
>>> #A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais
>>> eficientemente.
>>>
>>>
>>> Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju <
>>> sergio.edfisica em gmail.com> escreveu:
>>>
>>> No arquivo original algumas variáveis estão em branco e eu quero
>>>> considerar isso como NA, na importação algumas variáveis automaticamente o
>>>> em branco ficam NA, porém em outras os dados continuam em branco.
>>>> Desculpe, mas não sei fazer um CMR com dados em branco.
>>>>
>>>> Abraços
>>>>
>>>>
>>>> Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani em gmail.com>escreveu:
>>>>
>>>>> No arquivo de origem qual o caracter representador de NA, é ponto, é
>>>>> espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou
>>>>> similar a este na função de leitura que você usa) o caratere
>>>>> correspondente. Se não resolver providencie um CMR.
>>>>>
>>>>> À disposição.
>>>>> Walmes.
>>>>>
>>>>>
>>>>> ==========================================================================
>>>>> Walmes Marques Zeviani
>>>>> LEG (Laboratório de Estatística e Geoinformação, 25.450418 S,
>>>>> 49.231759 W)
>>>>> Departamento de Estatística - Universidade Federal do Paraná
>>>>> fone: (+55) 41 3361 3573
>>>>> VoIP: (3361 3600) 1053 1173
>>>>> e-mail: walmes em ufpr.br
>>>>> twitter: @walmeszeviani
>>>>> homepage: http://www.leg.ufpr.br/~walmes
>>>>> linux user number: 531218
>>>>>
>>>>> ==========================================================================
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>>
>>>> --
>>>> Sérgio Henrique Almeida da Silva Junior
>>>> Doutorando em Epidemiologia em Saúde Pública
>>>> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
>>>> http://lattes.cnpq.br/1611345552843383
>>>> Tel: (21) 94429486/78101651 id: 123*20942
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>> Grato
>>> Augusto C. A. Ribas
>>>
>>> Site Pessoal: http://augustoribas.heliohost.org
>>> Lattes: http://lattes.cnpq.br/7355685961127056
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> Sérgio Henrique Almeida da Silva Junior
>> Doutorando em Epidemiologia em Saúde Pública
>> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
>> http://lattes.cnpq.br/1611345552843383
>> Tel: (21) 94429486/78101651 id: 123*20942
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> Grato
> Augusto C. A. Ribas
>
> Site Pessoal: http://augustoribas.heliohost.org
> Lattes: http://lattes.cnpq.br/7355685961127056
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
Sérgio Henrique Almeida da Silva Junior
Doutorando em Epidemiologia em Saúde Pública
Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
http://lattes.cnpq.br/1611345552843383
Tel: (21) 94429486/78101651 id: 123*20942
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120413/bcf2516b/attachment.html>


Mais detalhes sobre a lista de discussão R-br