[R-br] RES: mutate vs within
Leonard Mendonça de Assis
assis.leonard em gmail.com
Terça Novembro 1 22:05:32 BRST 2016
O within é como se fosse o mutate, funciona como o with, só que retorna o data.frame.
O problema é que eu tenho uma variável múltipla resposta Area (1 a 3) que foi planejada de maneira errada, eu vou analisar ela como item de TRI, não como tabela de frequência (o que os malucos coletaram).
O problema é que o “within” coloca as variáveis no data.frame na ordem que ele quer, misturando copm outras. Isso me obriga a fazer outras coisas no código.
Já om o mutate, eu tenho que quebrar em etapas extras, pois ele executa na ordem que ele quer e o que está me incomodando ´eisso, pois uma das coisas que faço é apagar a variável velha.
Queria uma solução menos gambiarra que a que mostrei
De: Manoel Galdino [mailto:mcz.fea em gmail.com]
Enviada em: terça-feira, 1 de novembro de 2016 19:14
Para: Leonard Mendonça de Assis <assis.leonard em gmail.com>; a lista Brasileira oficial de discussão do programa R. <r-br em listas.c3sl.ufpr.br>
Assunto: Re: [R-br] mutate vs within
Não sei o que é o within que você fala, e seu exemplo não é lá minimamente reproduzível. Então fica difícil ajudar.
Dito isso, talvez você deveria usar o spread (do pacote tidyr) em área. Mas é difícil ajudar mais sem saber o que você quer fazer direito e sem o exemplo reproduzível.
Abraço,
2016-11-01 18:18 GMT-02:00 Leonard Mendonça de Assis via R-br <r-br em listas.c3sl.ufpr.br <mailto:r-br em listas.c3sl.ufpr.br> >:
Boa tarde a todos
Surgiu uma dúvida conceitual aqui:
Eu tenho um data.frame que precisa unir com vários outros, além de fazer várias transformações. Estou utilizando a seguinte sequencia para fazer tudo
bhz.data <-
read_csv2(
"Belo Horizonte 20161027.csv",
col_types=colunas) %>%
filter(Filtro == 1 & Filtro.Votar==1) %>%
select(-Filtro, -Filtro.Votar) %>%
left_join(label.Sexo,by=c("Sexo"="value")) %>% select(-Sexo) %>%
left_join(label.Faixa.Idade, by=c("Faixa.Idade"="value")) %>% select(-Faixa.Idade) %>%
left_join(label.Renda, by=c("Renda"="value")) %>% select(-Renda) %>%
left_join(label.classe, by=c("Renda.Classe"="value")) %>% select(-Renda.Classe) %>%
left_join(label.Escolaridade, by=c("Escolaridade"="value")) %>% select(-Escolaridade) %>%
left_join(label.Etinia, by=c('Etinia'="value")) %>% select(-Etinia) %>%
left_join(label.Religião, by=c("Religião"="value")) %>% select(-Religião) %>%
left_join(label.Trabalha, by=c("Trabalha"="value")) %>% select(-Trabalha) %>%
mutate(Area.1 = ifelse(is.na <http://is.na> (Area.1),0,Area.1), Area.2 = ifelse(is.na <http://is.na> (Area.2),0,Area.2),
Area.3 = ifelse(is.na <http://is.na> (Area.3),0,Area.3)) %>%
mutate(area.Educação =
ifelse(Area.1 == 1,1,0) + ifelse(Area.2 == 1,1,0) + ifelse(Area.3 == 1,1,0),
area.Habitação =
ifelse(Area.1 == 2,1,0) + ifelse(Area.2 == 2,1,0) + ifelse(Area.3 == 2,1,0),
area.Limpeza =
ifelse(Area.1 == 3,1,0) + ifelse(Area.2 == 3,1,0) + ifelse(Area.3 == 3,1,0),
area.Obras.Mobilidade =
ifelse(Area.1 == 4,1,0) + ifelse(Area.2 == 4,1,0) + ifelse(Area.3 == 4,1,0),
area.Obras.Pavimentação =
ifelse(Area.1 == 5,1,0) + ifelse(Area.2 == 5,1,0) + ifelse(Area.3 == 5,1,0),
area.Saneamento =
ifelse(Area.1 == 6,1,0) + ifelse(Area.2 == 6,1,0) + ifelse(Area.3 == 6,1,0),
area.Saúde =
ifelse(Area.1 == 7,1,0) + ifelse(Area.2 == 7,1,0) + ifelse(Area.3 == 7,1,0),
area.Transpoorte =
ifelse(Area.1 == 8,1,0) + ifelse(Area.2 == 8,1,0) + ifelse(Area.3 == 8,1,0),
area.Conservação =
ifelse(Area.1 == 9,1,0) + ifelse(Area.2 == 9,1,0) + ifelse(Area.3 == 9,1,0),
area.Acessibilidade =
ifelse(Area.1 == 10,1,0) + ifelse(Area.2 == 10,1,0) + ifelse(Area.3 == 10,1,0),
area.Combate.Mosquito =
ifelse(Area.1 == 11,1,0) + ifelse(Area.2 == 11,1,0) + ifelse(Area.3 == 11,1,0),
area.MeioAmbiente =
ifelse(Area.1 == 12,1,0) + ifelse(Area.2 == 12,1,0) + ifelse(Area.3 == 12,1,0),
area.Social =
ifelse(Area.1 == 13,1,0) + ifelse(Area.2 == 13,1,0) + ifelse(Area.3 == 13,1,0),
area.Esporte.Lazer =
ifelse(Area.1 == 14,1,0) + ifelse(Area.2 == 14,1,0) + ifelse(Area.3 == 14,1,0),
area.Geração.Empregos =
ifelse(Area.1 == 15,1,0) + ifelse(Area.2 == 15,1,0) + ifelse(Area.3 == 15,1,0)) %>%
select(-Area.1, -Area.2, -Area.3)
A questão é a seguinte:
No caso da variável área, que é recodificada de 3 para 15 variáveis, quando eu substituo esta sequencia enorme de mutate por um within, as variáveis ficam em uma ordem diferente da que eu preciso. A questão é: como deixar o código mais limpo nesta situação, visto que esta alternativa funciona, mas parece ser meio gambiarra?
Leonard
_______________________________________________
R-br mailing list
R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
--
Manoel Galdino
https://sites.google.com/site/galdinomcz/
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20161101/88d8b040/attachment.html>
Mais detalhes sobre a lista de discussão R-br