Quais as implicações de fazer isso para futuro uso dos dados?

Em 13 de abril de 2012 17:05, Augusto Ribas <ribas.aca@gmail.com> escreveu:
#abrindo seus dados como exemplo

exemplo<-structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L,

5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055",
"0180019", "0180280", "0180567", "0180573", "0181106", "0181303",
"0841583", "1634645", "1778689", "2082159", "2082161", "2087955",
"9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L,
2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"),
    id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L,
    2L), .Label = c("    ", "A309"), class = "factor"), dt_notific = c(13470537600,
    13429670400, 13452307200, 13456713600, 13455417600, 13457232000,
    13457145600, 13455504000, 13460342400, 13459046400), nu_ano = structure(c(1L,
    2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c("    ", "2008",
    "2009"), class = "factor"), sg_uf_not = structure(c(27L,
    25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label = c("Ignorado/exterior",
    "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá",
    "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte",
    "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais",
    "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná",
    "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul",
    "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"),
    id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L,
    4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ",
    "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L,
    6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c("        ",
    "1363    ", "1374    ", "1480    ", "1779    ", "1974    "
    ), class = "factor")), .Names = c("nu_notific", "tp_not",
"id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
"id_regiona"), variable.labels = structure(c("Número da notificação",
"", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação",
"Ano da notificação", "Estado em que foi notificado o caso",
"", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific",
"tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip",
"id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class = "data.frame")

#aqui é um caso que vc quer mudar certo?
exemplo[8,3]
str(exemplo)
#um fator

#usando o mesmo comando que acabamos de usar vc ve que nesse caso o vaziu é 4 espaço
dput(exemplo[8,3])

#dai vc substitui

exemplo[]<-lapply(exemplo,function(x){replace(x, x == "    ", NA)})

#assim vc subtitui nada de 4 espaços por NA
exemplo[8,3]

#so cuidado com as implicações de fazer isso para futuro uso dos dados
#e não sei se ficou muito generico a solução, mas é um jeito

Em 13 de abril de 2012 15:53, Sérgio Henrique almeida da silva ju <sergio.edfisica@gmail.com> escreveu:

Oi

Reduzi o banco e rodei o comando:

exemplo<-dput(dados[1:10,])
structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L, 
5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055", 
"0180019", "0180280", "0180567", "0180573", "0181106", "0181303", 
"0841583", "1634645", "1778689", "2082159", "2082161", "2087955", 
"9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L, 
2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"), 
    id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 
    2L), .Label = c("    ", "A309"), class = "factor"), dt_notific = c(13470537600, 
    13429670400, 13452307200, 13456713600, 13455417600, 13457232000, 
    13457145600, 13455504000, 13460342400, 13459046400), nu_ano = structure(c(1L, 
    2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c("    ", "2008", 
    "2009"), class = "factor"), sg_uf_not = structure(c(27L, 
    25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label = c("Ignorado/exterior", 
    "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá", 
    "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte", 
    "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais", 
    "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná", 
    "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul", 
    "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"), 
    id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L, 
    4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ", 
    "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L, 
    6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c("        ", 
    "1363    ", "1374    ", "1480    ", "1779    ", "1974    "
    ), class = "factor")), .Names = c("nu_notific", "tp_not", 
"id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", 
"id_regiona"), variable.labels = structure(c("Número da notificação", 
"", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação", 
"Ano da notificação", "Estado em que foi notificado o caso", 
"", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific", 
"tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", 
"id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class = "data.frame")


Em 13 de abril de 2012 16:47, Augusto Ribas <ribas.aca@gmail.com> escreveu:

Cara.
Depois que vc fez:

library(foreign)
dados <- read.spss("tmp.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)

#faça o seguinte
exemplo<-dput(dados)


#se o arquivo for muito gigante faz o dput de um pedaçinho so, so garanta que no pedacinho vc mostre esses brancos que ta falando tipo:

exemplo<-dput(dados[1:10,])

#ai mostra so as primeiras 10 linhas
# ou faz um exemplo de dados pequenininho no systat abre no R e usa o dput

#A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais eficientemente.


Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju <sergio.edfisica@gmail.com> escreveu:

No arquivo original algumas variáveis estão em branco e eu quero considerar isso como NA, na importação algumas variáveis automaticamente o em branco ficam NA, porém em outras os dados continuam em branco.
Desculpe, mas não sei fazer um CMR com dados em branco.

Abraços


Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani@gmail.com> escreveu:
No arquivo de origem qual o caracter representador de NA, é ponto, é espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou similar a este na função de leitura que você usa) o caratere correspondente. Se não resolver providencie um CMR.

À disposição.
Walmes.

==========================================================================
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: walmes@ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==========================================================================

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



--
Sérgio Henrique Almeida da Silva Junior
Doutorando em Epidemiologia em Saúde Pública
Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
http://lattes.cnpq.br/1611345552843383
Tel: (21) 94429486/78101651 id: 123*20942



_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



--
Grato
Augusto C. A. Ribas
 


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



--
Sérgio Henrique Almeida da Silva Junior
Doutorando em Epidemiologia em Saúde Pública
Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
http://lattes.cnpq.br/1611345552843383
Tel: (21) 94429486/78101651 id: 123*20942



_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



--
Grato
Augusto C. A. Ribas
 
Site Pessoal: http://augustoribas.heliohost.org
Lattes: http://lattes.cnpq.br/7355685961127056


_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.



--
Sérgio Henrique Almeida da Silva Junior
Doutorando em Epidemiologia em Saúde Pública
Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ
http://lattes.cnpq.br/1611345552843383
Tel: (21) 94429486/78101651 id: 123*20942