[R-br] Pergunta boba

Augusto Ribas ribas.aca em gmail.com
Sexta Abril 13 17:05:18 BRT 2012


#abrindo seus dados como exemplo

exemplo<-structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L,
5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055",
"0180019", "0180280", "0180567", "0180573", "0181106", "0181303",
"0841583", "1634645", "1778689", "2082159", "2082161", "2087955",
"9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L,
2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"),
    id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L,
    2L), .Label = c("    ", "A309"), class = "factor"), dt_notific =
c(13470537600,
    13429670400, 13452307200, 13456713600, 13455417600, 13457232000,
    13457145600, 13455504000, 13460342400, 13459046400), nu_ano =
structure(c(1L,
    2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c("    ", "2008",
    "2009"), class = "factor"), sg_uf_not = structure(c(27L,
    25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label =
c("Ignorado/exterior",
    "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá",
    "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte",
    "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais",
    "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná",
    "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul",
    "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"),
    id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L,
    4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ",
    "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L,
    6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c("        ",
    "1363    ", "1374    ", "1480    ", "1779    ", "1974    "
    ), class = "factor")), .Names = c("nu_notific", "tp_not",
"id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
"id_regiona"), variable.labels = structure(c("Número da notificação",
"", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação",
"Ano da notificação", "Estado em que foi notificado o caso",
"", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific",
"tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
"id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class =
"data.frame")

#aqui é um caso que vc quer mudar certo?
exemplo[8,3]
str(exemplo)
#um fator

#usando o mesmo comando que acabamos de usar vc ve que nesse caso o vaziu é
4 espaço
dput(exemplo[8,3])

#dai vc substitui

exemplo[]<-lapply(exemplo,function(x){replace(x, x == "    ", NA)})

#assim vc subtitui nada de 4 espaços por NA
exemplo[8,3]

#so cuidado com as implicações de fazer isso para futuro uso dos dados
#e não sei se ficou muito generico a solução, mas é um jeito

Em 13 de abril de 2012 15:53, Sérgio Henrique almeida da silva ju <
sergio.edfisica em gmail.com> escreveu:

> Oi
>
> Reduzi o banco e rodei o comando:
>
> exemplo<-dput(dados[1:10,])
> structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L,
> 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055",
> "0180019", "0180280", "0180567", "0180573", "0181106", "0181303",
> "0841583", "1634645", "1778689", "2082159", "2082161", "2087955",
> "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L,
> 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"),
>     id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L,
>     2L), .Label = c("    ", "A309"), class = "factor"), dt_notific =
> c(13470537600,
>     13429670400, 13452307200, 13456713600, 13455417600, 13457232000,
>     13457145600, 13455504000, 13460342400, 13459046400), nu_ano =
> structure(c(1L,
>     2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c("    ", "2008",
>     "2009"), class = "factor"), sg_uf_not = structure(c(27L,
>     25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label =
> c("Ignorado/exterior",
>     "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá",
>     "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte",
>     "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas
> Gerais",
>     "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná",
>     "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul",
>     "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"),
>     id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L,
>     4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ",
>     "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L,
>     6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c("        ",
>     "1363    ", "1374    ", "1480    ", "1779    ", "1974    "
>     ), class = "factor")), .Names = c("nu_notific", "tp_not",
> "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
> "id_regiona"), variable.labels = structure(c("Número da notificação",
> "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação",
> "Ano da notificação", "Estado em que foi notificado o caso",
> "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific",
> "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
> "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class =
> "data.frame")
>
>
> Em 13 de abril de 2012 16:47, Augusto Ribas <ribas.aca em gmail.com>escreveu:
>
> Cara.
>> Depois que vc fez:
>>
>> library(foreign)
>> dados <- read.spss("tmp.sav", use.value.labels=TRUE,
>> max.value.labels=Inf, to.data.frame=TRUE)
>>
>> #faça o seguinte
>> exemplo<-dput(dados)
>>
>>
>> #se o arquivo for muito gigante faz o dput de um pedaçinho so, so garanta
>> que no pedacinho vc mostre esses brancos que ta falando tipo:
>>
>> exemplo<-dput(dados[1:10,])
>>
>> #ai mostra so as primeiras 10 linhas
>> # ou faz um exemplo de dados pequenininho no systat abre no R e usa o dput
>>
>> #A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais
>> eficientemente.
>>
>>
>> Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju <
>> sergio.edfisica em gmail.com> escreveu:
>>
>> No arquivo original algumas variáveis estão em branco e eu quero
>>> considerar isso como NA, na importação algumas variáveis automaticamente o
>>> em branco ficam NA, porém em outras os dados continuam em branco.
>>> Desculpe, mas não sei fazer um CMR com dados em branco.
>>>
>>> Abraços
>>>
>>>
>>> Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani em gmail.com>escreveu:
>>>
>>>> No arquivo de origem qual o caracter representador de NA, é ponto, é
>>>> espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou
>>>> similar a este na função de leitura que você usa) o caratere
>>>> correspondente. Se não resolver providencie um CMR.
>>>>
>>>> À disposição.
>>>> Walmes.
>>>>
>>>>
>>>> ==========================================================================
>>>> Walmes Marques Zeviani
>>>> LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759
>>>> W)
>>>> Departamento de Estatística - Universidade Federal do Paraná
>>>> fone: (+55) 41 3361 3573
>>>> VoIP: (3361 3600) 1053 1173
>>>> e-mail: walmes em ufpr.br
>>>> twitter: @walmeszeviani
>>>> homepage: http://www.leg.ufpr.br/~walmes
>>>> linux user number: 531218
>>>>
>>>> ==========================================================================
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>> Sérgio Henrique Almeida da Silva Junior
>>> Doutorando em Epidemiologia em Saúde Pública
>>> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
>>> http://lattes.cnpq.br/1611345552843383
>>> Tel: (21) 94429486/78101651 id: 123*20942
>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>> Grato
>> Augusto C. A. Ribas
>>
>> Site Pessoal: http://augustoribas.heliohost.org
>> Lattes: http://lattes.cnpq.br/7355685961127056
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
> Sérgio Henrique Almeida da Silva Junior
> Doutorando em Epidemiologia em Saúde Pública
> Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
> http://lattes.cnpq.br/1611345552843383
> Tel: (21) 94429486/78101651 id: 123*20942
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
Grato
Augusto C. A. Ribas

Site Pessoal: http://augustoribas.heliohost.org
Lattes: http://lattes.cnpq.br/7355685961127056
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20120413/06e6225b/attachment.html>


Mais detalhes sobre a lista de discussão R-br