
No meu conjunto de dados têm muitos dados em branco e o R não reconhece como NA, como posso fazer para que ele transforme o "em branco" para NA? Abraços -- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

Tá importando com que função? De que extensão? Cadê CMR? Peça o help da função, se for das usuais deve ter um argumento na.strig=. Comece por ele. À disposição Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

Oi Walmes Estou importando do SPSS e uso a foreign. Em 13 de abril de 2012 16:19, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Tá importando com que função? De que extensão? Cadê CMR? Peça o help da função, se for das usuais deve ter um argumento na.strig=. Comece por ele.
À disposição Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

Estou usando o seguinte comando: library(foreign) dados <- read.spss("tmp.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE) Em 13 de abril de 2012 16:21, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
Oi Walmes
Estou importando do SPSS e uso a foreign.
Em 13 de abril de 2012 16:19, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
Tá importando com que função? De que extensão? Cadê CMR? Peça o help da função, se for das usuais deve ter um argumento na.strig=. Comece por ele.
À disposição Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

Então mostra pra gente como você tá fazendo caso contrário é impossível ajudar! Leia o guia de postagem? Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

No arquivo de origem qual o caracter representador de NA, é ponto, é espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou similar a este na função de leitura que você usa) o caratere correspondente. Se não resolver providencie um CMR. À disposição. Walmes. ========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================

No arquivo original algumas variáveis estão em branco e eu quero considerar isso como NA, na importação algumas variáveis automaticamente o em branco ficam NA, porém em outras os dados continuam em branco. Desculpe, mas não sei fazer um CMR com dados em branco. Abraços Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
No arquivo de origem qual o caracter representador de NA, é ponto, é espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou similar a este na função de leitura que você usa) o caratere correspondente. Se não resolver providencie um CMR.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

Cara. Depois que vc fez: library(foreign) dados <- read.spss("tmp.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE) #faça o seguinte exemplo<-dput(dados) #se o arquivo for muito gigante faz o dput de um pedaçinho so, so garanta que no pedacinho vc mostre esses brancos que ta falando tipo: exemplo<-dput(dados[1:10,]) #ai mostra so as primeiras 10 linhas # ou faz um exemplo de dados pequenininho no systat abre no R e usa o dput #A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais eficientemente. Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
No arquivo original algumas variáveis estão em branco e eu quero considerar isso como NA, na importação algumas variáveis automaticamente o em branco ficam NA, porém em outras os dados continuam em branco. Desculpe, mas não sei fazer um CMR com dados em branco.
Abraços
Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
No arquivo de origem qual o caracter representador de NA, é ponto, é espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou similar a este na função de leitura que você usa) o caratere correspondente. Se não resolver providencie um CMR.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218 ==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Alias, vc tem que posta o resultado do dput, num precisa salvar em objeto nenhum não, desculpe falei bobeira tipo assim: mdat <- matrix(c(1,2,3, 11,12,13), nrow = 2, ncol=3, byrow=TRUE, dimnames = list(c("row1", "row2"), c("C.1", "C.2", "C.3"))) dput(mdat) #posta isso aqui, so evita de posta algo gigante
dput(mdat) structure(c(1, 11, 2, 12, 3, 13), .Dim = 2:3, .Dimnames = list( c("row1", "row2"), c("C.1", "C.2", "C.3")))
Se vc digita tudo que ta ae Em 13 de abril de 2012 15:47, Augusto Ribas <ribas.aca@gmail.com> escreveu:
Cara. Depois que vc fez:
library(foreign) dados <- read.spss("tmp.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)
#faça o seguinte exemplo<-dput(dados)
#se o arquivo for muito gigante faz o dput de um pedaçinho so, so garanta que no pedacinho vc mostre esses brancos que ta falando tipo:
exemplo<-dput(dados[1:10,])
#ai mostra so as primeiras 10 linhas # ou faz um exemplo de dados pequenininho no systat abre no R e usa o dput
#A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais eficientemente.
Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
No arquivo original algumas variáveis estão em branco e eu quero
considerar isso como NA, na importação algumas variáveis automaticamente o em branco ficam NA, porém em outras os dados continuam em branco. Desculpe, mas não sei fazer um CMR com dados em branco.
Abraços
Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
No arquivo de origem qual o caracter representador de NA, é ponto, é espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou similar a este na função de leitura que você usa) o caratere correspondente. Se não resolver providencie um CMR.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218
==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Oi Reduzi o banco e rodei o comando: exemplo<-dput(dados[1:10,]) structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L, 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055", "0180019", "0180280", "0180567", "0180573", "0181106", "0181303", "0841583", "1634645", "1778689", "2082159", "2082161", "2087955", "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"), id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L), .Label = c(" ", "A309"), class = "factor"), dt_notific = c(13470537600, 13429670400, 13452307200, 13456713600, 13455417600, 13457232000, 13457145600, 13455504000, 13460342400, 13459046400), nu_ano = structure(c(1L, 2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c(" ", "2008", "2009"), class = "factor"), sg_uf_not = structure(c(27L, 25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label = c("Ignorado/exterior", "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá", "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte", "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais", "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná", "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul", "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"), id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L, 4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ", "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L, 6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c(" ", "1363 ", "1374 ", "1480 ", "1779 ", "1974 " ), class = "factor")), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona"), variable.labels = structure(c("Número da notificação", "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação", "Ano da notificação", "Estado em que foi notificado o caso", "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class = "data.frame") Em 13 de abril de 2012 16:47, Augusto Ribas <ribas.aca@gmail.com> escreveu:
Cara. Depois que vc fez:
library(foreign) dados <- read.spss("tmp.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)
#faça o seguinte exemplo<-dput(dados)
#se o arquivo for muito gigante faz o dput de um pedaçinho so, so garanta que no pedacinho vc mostre esses brancos que ta falando tipo:
exemplo<-dput(dados[1:10,])
#ai mostra so as primeiras 10 linhas # ou faz um exemplo de dados pequenininho no systat abre no R e usa o dput
#A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais eficientemente.
Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
No arquivo original algumas variáveis estão em branco e eu quero
considerar isso como NA, na importação algumas variáveis automaticamente o em branco ficam NA, porém em outras os dados continuam em branco. Desculpe, mas não sei fazer um CMR com dados em branco.
Abraços
Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
No arquivo de origem qual o caracter representador de NA, é ponto, é espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou similar a este na função de leitura que você usa) o caratere correspondente. Se não resolver providencie um CMR.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218
==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

#abrindo seus dados como exemplo exemplo<-structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L, 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055", "0180019", "0180280", "0180567", "0180573", "0181106", "0181303", "0841583", "1634645", "1778689", "2082159", "2082161", "2087955", "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"), id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L), .Label = c(" ", "A309"), class = "factor"), dt_notific = c(13470537600, 13429670400, 13452307200, 13456713600, 13455417600, 13457232000, 13457145600, 13455504000, 13460342400, 13459046400), nu_ano = structure(c(1L, 2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c(" ", "2008", "2009"), class = "factor"), sg_uf_not = structure(c(27L, 25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label = c("Ignorado/exterior", "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá", "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte", "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais", "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná", "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul", "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"), id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L, 4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ", "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L, 6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c(" ", "1363 ", "1374 ", "1480 ", "1779 ", "1974 " ), class = "factor")), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona"), variable.labels = structure(c("Número da notificação", "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação", "Ano da notificação", "Estado em que foi notificado o caso", "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class = "data.frame") #aqui é um caso que vc quer mudar certo? exemplo[8,3] str(exemplo) #um fator #usando o mesmo comando que acabamos de usar vc ve que nesse caso o vaziu é 4 espaço dput(exemplo[8,3]) #dai vc substitui exemplo[]<-lapply(exemplo,function(x){replace(x, x == " ", NA)}) #assim vc subtitui nada de 4 espaços por NA exemplo[8,3] #so cuidado com as implicações de fazer isso para futuro uso dos dados #e não sei se ficou muito generico a solução, mas é um jeito Em 13 de abril de 2012 15:53, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
Oi
Reduzi o banco e rodei o comando:
exemplo<-dput(dados[1:10,]) structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L, 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055", "0180019", "0180280", "0180567", "0180573", "0181106", "0181303", "0841583", "1634645", "1778689", "2082159", "2082161", "2087955", "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"), id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L), .Label = c(" ", "A309"), class = "factor"), dt_notific = c(13470537600, 13429670400, 13452307200, 13456713600, 13455417600, 13457232000, 13457145600, 13455504000, 13460342400, 13459046400), nu_ano = structure(c(1L, 2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c(" ", "2008", "2009"), class = "factor"), sg_uf_not = structure(c(27L, 25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label = c("Ignorado/exterior", "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá", "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte", "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais", "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná", "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul", "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"), id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L, 4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ", "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L, 6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c(" ", "1363 ", "1374 ", "1480 ", "1779 ", "1974 " ), class = "factor")), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona"), variable.labels = structure(c("Número da notificação", "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação", "Ano da notificação", "Estado em que foi notificado o caso", "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class = "data.frame")
Em 13 de abril de 2012 16:47, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Cara.
Depois que vc fez:
library(foreign) dados <- read.spss("tmp.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)
#faça o seguinte exemplo<-dput(dados)
#se o arquivo for muito gigante faz o dput de um pedaçinho so, so garanta que no pedacinho vc mostre esses brancos que ta falando tipo:
exemplo<-dput(dados[1:10,])
#ai mostra so as primeiras 10 linhas # ou faz um exemplo de dados pequenininho no systat abre no R e usa o dput
#A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais eficientemente.
Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
No arquivo original algumas variáveis estão em branco e eu quero
considerar isso como NA, na importação algumas variáveis automaticamente o em branco ficam NA, porém em outras os dados continuam em branco. Desculpe, mas não sei fazer um CMR com dados em branco.
Abraços
Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
No arquivo de origem qual o caracter representador de NA, é ponto, é espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou similar a este na função de leitura que você usa) o caratere correspondente. Se não resolver providencie um CMR.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218
==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056

Quais as implicações de fazer isso para futuro uso dos dados? Em 13 de abril de 2012 17:05, Augusto Ribas <ribas.aca@gmail.com> escreveu:
#abrindo seus dados como exemplo
exemplo<-structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L,
5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055", "0180019", "0180280", "0180567", "0180573", "0181106", "0181303", "0841583", "1634645", "1778689", "2082159", "2082161", "2087955", "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"), id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L), .Label = c(" ", "A309"), class = "factor"), dt_notific = c(13470537600, 13429670400, 13452307200, 13456713600, 13455417600, 13457232000, 13457145600, 13455504000, 13460342400, 13459046400), nu_ano = structure(c(1L, 2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c(" ", "2008", "2009"), class = "factor"), sg_uf_not = structure(c(27L, 25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label = c("Ignorado/exterior", "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá", "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte", "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais", "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná", "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul", "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"), id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L, 4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ", "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L, 6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c(" ", "1363 ", "1374 ", "1480 ", "1779 ", "1974 " ), class = "factor")), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona"), variable.labels = structure(c("Número da notificação", "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação", "Ano da notificação", "Estado em que foi notificado o caso", "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class = "data.frame")
#aqui é um caso que vc quer mudar certo? exemplo[8,3] str(exemplo) #um fator
#usando o mesmo comando que acabamos de usar vc ve que nesse caso o vaziu é 4 espaço dput(exemplo[8,3])
#dai vc substitui
exemplo[]<-lapply(exemplo,function(x){replace(x, x == " ", NA)})
#assim vc subtitui nada de 4 espaços por NA exemplo[8,3]
#so cuidado com as implicações de fazer isso para futuro uso dos dados #e não sei se ficou muito generico a solução, mas é um jeito
Em 13 de abril de 2012 15:53, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
Oi
Reduzi o banco e rodei o comando:
exemplo<-dput(dados[1:10,]) structure(list(nu_notific = structure(c(9L, 1L, 13L, 16L, 4L, 5L, 2L, 14L, 11L, 3L), .Label = c("0010777", "0014623", "0036055", "0180019", "0180280", "0180567", "0180573", "0181106", "0181303", "0841583", "1634645", "1778689", "2082159", "2082161", "2087955", "9138695"), class = "factor"), tp_not = structure(c(2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 2L, 2L), .Label = c(" ", "2"), class = "factor"), id_agravo = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L), .Label = c(" ", "A309"), class = "factor"), dt_notific = c(13470537600, 13429670400, 13452307200, 13456713600, 13455417600, 13457232000, 13457145600, 13455504000, 13460342400, 13459046400), nu_ano = structure(c(1L, 2L, 3L, 3L, 3L, 3L, 3L, 1L, 3L, 3L), .Label = c(" ", "2008", "2009"), class = "factor"), sg_uf_not = structure(c(27L, 25L, 22L, 2L, 27L, 27L, 5L, 22L, 22L, 5L), .Label = c("Ignorado/exterior", "Rondônia", "Acre", "Amazonas", "Roraima", "Pará", "Amapá", "Tocantins", "Maranhão", "Piauí", "Ceará", "Rio Grande do Norte", "Paraíba", "Pernambuco", "Alagoas", "Sergipe", "Bahia", "Minas Gerais", "Espírito Santo", "Rio de Janeiro", "São Paulo", "Paraná", "Santa Catarina", "Rio Grande do Sul", "Mato Grosso do Sul", "Mato Grosso", "Goiás", "Distrito Federal"), class = "factor"), id_municip = structure(c(6L, 5L, 3L, 1L, 6L, 6L, 2L, 3L, 4L, 2L), .Label = c("110004 ", "140010 ", "410830 ", "410880 ", "500320 ", "520870 "), class = "factor"), id_regiona = structure(c(5L, 6L, 2L, 4L, 5L, 5L, 1L, 2L, 3L, 1L), .Label = c(" ", "1363 ", "1374 ", "1480 ", "1779 ", "1974 " ), class = "factor")), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona"), variable.labels = structure(c("Número da notificação", "", "", "Definições para Ano, Mes, Semana e Trimestre da Notificação", "Ano da notificação", "Estado em que foi notificado o caso", "", "Definicoes para Regionais de Notificaçao"), .Names = c("nu_notific", "tp_not", "id_agravo", "dt_notific", "nu_ano", "sg_uf_not", "id_municip", "id_regiona")), codepage = 1252L, row.names = c(NA, 10L), class = "data.frame")
Em 13 de abril de 2012 16:47, Augusto Ribas <ribas.aca@gmail.com>escreveu:
Cara.
Depois que vc fez:
library(foreign) dados <- read.spss("tmp.sav", use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)
#faça o seguinte exemplo<-dput(dados)
#se o arquivo for muito gigante faz o dput de um pedaçinho so, so garanta que no pedacinho vc mostre esses brancos que ta falando tipo:
exemplo<-dput(dados[1:10,])
#ai mostra so as primeiras 10 linhas # ou faz um exemplo de dados pequenininho no systat abre no R e usa o dput
#A questão é, desse jeito todos poderam ver o que vc ve e te ajudar mais eficientemente.
Em 13 de abril de 2012 15:38, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
No arquivo original algumas variáveis estão em branco e eu quero
considerar isso como NA, na importação algumas variáveis automaticamente o em branco ficam NA, porém em outras os dados continuam em branco. Desculpe, mas não sei fazer um CMR com dados em branco.
Abraços
Em 13 de abril de 2012 16:26, Walmes Zeviani <walmeszeviani@gmail.com>escreveu:
No arquivo de origem qual o caracter representador de NA, é ponto, é espaço, é "missing", é asterisco? Passe para o argumento na.strig= (ou similar a este na função de leitura que você usa) o caratere correspondente. Se não resolver providencie um CMR.
À disposição. Walmes.
========================================================================== Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W) Departamento de Estatística - Universidade Federal do Paraná fone: (+55) 41 3361 3573 VoIP: (3361 3600) 1053 1173 e-mail: walmes@ufpr.br twitter: @walmeszeviani homepage: http://www.leg.ufpr.br/~walmes linux user number: 531218
==========================================================================
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas
Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942

Mas os dados ja estão no R como um Objeto? Se sim da pra usar a função replace() Se não abriu no R ainda e esta de alguma planilha ou arquivo ai depnde do arquivo eu acho. Em 13 de abril de 2012 15:08, Sérgio Henrique almeida da silva ju < sergio.edfisica@gmail.com> escreveu:
No meu conjunto de dados têm muitos dados em branco e o R não reconhece como NA, como posso fazer para que ele transforme o "em branco" para NA?
Abraços
-- Sérgio Henrique Almeida da Silva Junior Doutorando em Epidemiologia em Saúde Pública Escola Nacional de Saúde Pública Sérgio Arouca - ENSP/FIOCRUZ http://lattes.cnpq.br/1611345552843383 Tel: (21) 94429486/78101651 id: 123*20942
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Grato Augusto C. A. Ribas Site Pessoal: http://augustoribas.heliohost.org Lattes: http://lattes.cnpq.br/7355685961127056
participantes (3)
-
Augusto Ribas
-
Sérgio Henrique almeida da silva ju
-
Walmes Zeviani