Prezados,
Tendo criar mais uma coluna em data.
data$Var2 <-
ifelse(grepl("BARREIRO|CENTRO-SUL|LESTE|NORDESTE|NOROESTE|NORTE|OESTE|PAMPULHA|VENDA
NOVA|RMBH|MG|SEM INFORMACAO", data$Var1, ignore.case = TRUE),
gsub(".*(BARREIRO|CENTRO-SUL|LESTE|NORDESTE|NOROESTE|NORTE|OESTE|PAMPULHA|VENDA
NOVA|RMBH|MG|SEM INFORMACAO).*", "\\1",data$Var1), "OUTRO ESTADO")
NOROESTE acaba sendo excluído de Var2, sendo substituído por
OESTE. Não quero que isso aconteça. Penso seja por conta do
"OESTE" nele contido, já que existe outra palavra OESTE. O
restante está exatamente como eu quero. Abaixo, exemplo de como
está ficando. Desde já agradeço.
Var1 | Freq | Var2 |
SEM INFORMACAO | 0,38 | SEM INFORMACAO |
SEM INFORMACAO | 0 | SEM INFORMACAO |
BARREIRO | 9 | BARREIRO |
CENTRO-SUL | 22,18 | CENTRO-SUL |
CIDADE DE CANDEIAS/MG | 0 | MG |
CIDADE DE CORONEL FABRICIANO/MG | 0 | MG |
CIDADE DE ITABIRA/MG | 0 | MG |
CIDADE DE ITABIRITO/MG | 0,13 | MG |
GOVERNADOR VALADARES/MG | 0 | MG |
LESTE | 5,83 | LESTE |
NORDESTE | 9,25 | NORDESTE |
NOROESTE | 13,05 | OESTE |
NORTE | 8,11 | NORTE |
OESTE | 7,48 | OESTE |
PAMPULHA | 8,87 | PAMPULHA |
RMBH/BETIM | 0 | RMBH |
RMBH/BRUMADINHO | 0 | RMBH |
RMBH/CONTAGEM | 1,01 | RMBH |
RMBH/ESMERALDAS | 0 | RMBH |
SEM INFORMACAO | 0,89 | SEM INFORMACAO |
VENDA NOVA | 13,31 | VENDA NOVA |