Excluir parte dos caracteres e colocar caracteres em minúsculos

Olá pessoal, Eu gostaria de retirar a UF que vem junto com os municípios dos dados do IBGE, coloca-la em uma nova coluna para os estados, e deixar todos os caracteres em minúsculo. Exemplo: De Nova_Nazare_(MT) para nova_nazare Este é o script que estou utilizando: #Calling the package group ---- library(tidyverse) #Load data ---- setwd('...') alldata = list.files() #Change especial character ---- chg = function(x){ iconv(x, to = "ASCII//TRANSLIT") } #Put NA info ---- ##We will replace all in this loop ##In the and, we will exporting all for (i in alldata) { df = read.csv(i, sep = ";") df[df == "-"] <- c(NA) df[df == "..."] <- c(NA) df$municipalities = chg(df$municipalities) df$municipalities = gsub("'", "", df$municipalities) df$municipalities = gsub(" ", "_", df$municipalities) Desde já agradeço! Bianca

library(tidyverse) library(stringi) a <- "Nova_Nazare_(MT)" b <- "Ilhéus_(BA)" c <- data.frame(cidades=c(a,b)) c %>% mutate(estado = stri_sub(.$cidade,-3,-2), cidades = stri_sub(.$cidade,1,-6), cidades = tolower(cidades)) *Cid Edson Mendonça Póvoas **Cel: +55 (73) 99151-9565* *Engenheiro **Agrônomo* *Analista de dados * *Técnico em Segurança do Trabalho * *LinkedIn: **http://br.linkedin.com/in/cidedson/ <http://br.linkedin.com/in/cidedson/>* *Lattes: **http://lattes.cnpq.br/2303498368142537 <http://lattes.cnpq.br/2303498368142537>* Em qua., 18 de nov. de 2020 às 10:11, Bia Rebelatto por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Olá pessoal,
Eu gostaria de retirar a UF que vem junto com os municípios dos dados do IBGE, coloca-la em uma nova coluna para os estados, e deixar todos os caracteres em minúsculo. Exemplo:
De Nova_Nazare_(MT) para nova_nazare
Este é o script que estou utilizando:
#Calling the package group ---- library(tidyverse)
#Load data ---- setwd('...') alldata = list.files()
#Change especial character ---- chg = function(x){ iconv(x, to = "ASCII//TRANSLIT") }
#Put NA info ---- ##We will replace all in this loop ##In the and, we will exporting all for (i in alldata) { df = read.csv(i, sep = ";")
df[df == "-"] <- c(NA) df[df == "..."] <- c(NA)
df$municipalities = chg(df$municipalities) df$municipalities = gsub("'", "", df$municipalities) df$municipalities = gsub(" ", "_", df$municipalities)
Desde já agradeço!
Bianca _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Obrigada! Em qua., 18 de nov. de 2020 às 11:35, Cid Póvoas por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
library(tidyverse) library(stringi)
a <- "Nova_Nazare_(MT)" b <- "Ilhéus_(BA)" c <- data.frame(cidades=c(a,b))
c %>% mutate(estado = stri_sub(.$cidade,-3,-2), cidades = stri_sub(.$cidade,1,-6), cidades = tolower(cidades))
*Cid Edson Mendonça Póvoas **Cel: +55 (73) 99151-9565*
*Engenheiro **Agrônomo*
*Analista de dados *
*Técnico em Segurança do Trabalho *
*LinkedIn: **http://br.linkedin.com/in/cidedson/ <http://br.linkedin.com/in/cidedson/>*
*Lattes: **http://lattes.cnpq.br/2303498368142537 <http://lattes.cnpq.br/2303498368142537>*
Em qua., 18 de nov. de 2020 às 10:11, Bia Rebelatto por (R-br) < r-br@listas.c3sl.ufpr.br> escreveu:
Olá pessoal,
Eu gostaria de retirar a UF que vem junto com os municípios dos dados do IBGE, coloca-la em uma nova coluna para os estados, e deixar todos os caracteres em minúsculo. Exemplo:
De Nova_Nazare_(MT) para nova_nazare
Este é o script que estou utilizando:
#Calling the package group ---- library(tidyverse)
#Load data ---- setwd('...') alldata = list.files()
#Change especial character ---- chg = function(x){ iconv(x, to = "ASCII//TRANSLIT") }
#Put NA info ---- ##We will replace all in this loop ##In the and, we will exporting all for (i in alldata) { df = read.csv(i, sep = ";")
df[df == "-"] <- c(NA) df[df == "..."] <- c(NA)
df$municipalities = chg(df$municipalities) df$municipalities = gsub("'", "", df$municipalities) df$municipalities = gsub(" ", "_", df$municipalities)
Desde já agradeço!
Bianca _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Usando o código reproduzível do Cid, é possível fazer utilizando a função adply do pacote {plyr} a <- "Nova_Nazare_(MT)" b <- "Ilhéus_(BA)" c <- data.frame(cidades=c(a,b)) #install.packages("plyr") library(plyr) adply(c,1,function(x) data.frame(cidade=tolower(substr(x,1,nchar(x)-5)),estado=substr(x,nchar(x)-2,nchar(x)-1))) att On Nov 18 2020, at 11:10 am, Bia Rebelatto por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal,
Eu gostaria de retirar a UF que vem junto com os municípios dos dados do IBGE, coloca-la em uma nova coluna para os estados, e deixar todos os caracteres em minúsculo. Exemplo:
De Nova_Nazare_(MT) para nova_nazare
Este é o script que estou utilizando:
#Calling the package group ---- library(tidyverse)
#Load data ---- setwd('...') alldata = list.files()
#Change especial character ---- chg = function(x){ iconv(x, to = "ASCII//TRANSLIT") }
#Put NA info ---- ##We will replace all in this loop ##In the and, we will exporting all for (i in alldata) { df = read.csv(i, sep = ";")
df[df == "-"] <- c(NA) df[df == "..."] <- c(NA)
df$municipalities = chg(df$municipalities) df$municipalities = gsub("'", "", df$municipalities) df$municipalities = gsub(" ", "_", df$municipalities)
Desde já agradeço!
Bianca _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

um pequena correção para evitar repetição da coluna cidades, a <- "Nova_Nazare_(MT)" b <- "Ilhéus_(BA)" c <- data.frame (https://link.getmailspring.com/link/14D0449D-01C8-4D8E-BCCE-BDDBC27E1797@get...)) #install.packages("plyr") library(plyr) adply(c,1,function(x) data.frame(cidades=tolower(substr(x,1,nchar(x)-5)),estado=substr(x,nchar(x)-2,nchar(x)-1))) On Nov 18 2020, at 5:24 pm, Fernando Souza <nandodesouza@gmail.com> wrote:
Usando o código reproduzível do Cid, é possível fazer utilizando a função adply do pacote {plyr} a <- "Nova_Nazare_(MT)" b <- "Ilhéus_(BA)" c <- data.frame(cidades=c(a,b))
#install.packages("plyr") library(plyr)
adply(c,1,function(x) data.frame(cidade=tolower(substr(x,1,nchar(x)-5)),estado=substr(x,nchar(x)-2,nchar(x)-1)))
att On Nov 18 2020, at 11:10 am, Bia Rebelatto por (R-br) <r-br@listas.c3sl.ufpr.br> wrote:
Olá pessoal,
Eu gostaria de retirar a UF que vem junto com os municípios dos dados do IBGE, coloca-la em uma nova coluna para os estados, e deixar todos os caracteres em minúsculo. Exemplo:
De Nova_Nazare_(MT) para nova_nazare
Este é o script que estou utilizando:
#Calling the package group ---- library(tidyverse)
#Load data ---- setwd('...') alldata = list.files()
#Change especial character ---- chg = function(x){ iconv(x, to = "ASCII//TRANSLIT") }
#Put NA info ---- ##We will replace all in this loop ##In the and, we will exporting all for (i in alldata) { df = read.csv(i, sep = ";")
df[df == "-"] <- c(NA) df[df == "..."] <- c(NA)
df$municipalities = chg(df$municipalities) df$municipalities = gsub("'", "", df$municipalities) df$municipalities = gsub(" ", "_", df$municipalities)
Desde já agradeço!
Bianca _______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
participantes (3)
-
Bia Rebelatto
-
Cid Póvoas
-
Fernando Souza