um pequena correção para evitar repetição da coluna cidades,

a <- "Nova_Nazare_(MT)"

c <- data.frame(cidades=c(a,b))

#install.packages("plyr")

adply(c,1,function(x) data.frame(cidades=tolower(substr(x,1,nchar(x)-5)),estado=substr(x,nchar(x)-2,nchar(x)-1)))

Usando o código reproduzível do Cid, é possível fazer utilizando a função adply do pacote {plyr}

a <- "Nova_Nazare_(MT)"

c <- data.frame(cidades=c(a,b))

#install.packages("plyr")

adply(c,1,function(x) data.frame(cidade=tolower(substr(x,1,nchar(x)-5)),estado=substr(x,nchar(x)-2,nchar(x)-1)))

Olá pessoal,

Eu gostaria de retirar a UF que vem junto com os municípios dos dados do IBGE, coloca-la em uma nova coluna para os estados, e deixar todos os caracteres em minúsculo. Exemplo:

Nova_Nazare_(MT)

para

nova_nazare

Este é o script que estou utilizando:

#Calling the package group ----

library(tidyverse)

#Load data ----

setwd('...')

alldata = list.files()

#Change especial character ----

chg = function(x){

iconv(x, to = "ASCII//TRANSLIT")

}

#Put NA info ----

##We will replace all in this loop

##In the and, we will exporting all

for (i in alldata) {

df = read.csv(i, sep = ";")

df[df == "-"] <- c(NA)

df[df == "..."] <- c(NA)

df$municipalities = chg(df$municipalities)

df$municipalities = gsub("'", "", df$municipalities)

df$municipalities = gsub(" ", "_", df$municipalities)

Desde já agradeço!

Bianca

_______________________________________________

R-br@listas.c3sl.ufpr.br

https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.