[R-br] Codificar nomes
Elerson
amikobh em gmail.com
Sex Out 5 12:06:04 -03 2018
Prezados:
Muito obrigado! Com o sugerido, problema resolvido.
Elerson
Em 04/10/2018 21:21, Fernando Mayer via R-br escreveu:
> Basta lembrar que, internamente, os níveis de um fator são armazenados
> como numeros inteiros, por padrão coincidentes com a ordem alfabética,
> ou seja,
>
> as.numeric(factor(c("A", "B", "C")))
>
> Portanto basta converter o vetor de nomes para fator e converter para
> numérico:
>
> nomes <- c("Alexandre Aguiar Parreiras",
> "Alexandre Aguiar Parreiras",
> "Breno Pereira Galvão",
> "Carlos Daniel Pereira de Souza",
> "Daniel Prates Andrade",
> "Daniel Prates Andrade",
> "Elian Kanaan dos Santos",
> "Érick Daniel Sena de Jesus")
>
> nomes <- as.factor(nomes)
> nomes.id <http://nomes.id> <- as.numeric(nomes)
> data.frame(nomes, nomes.id <http://nomes.id>)
> ---
> Fernando de Pol Mayer
> Laboratório de Estatística e Geoinformação - LEG
> Departamento de Estatística - DEST
> Universidade Federal do Paraná - UFPR
> URL: http://leg.ufpr.br/~fernandomayer
> e-mail: fernando.mayer [@] {gmail.com <http://gmail.com>, ufpr.br
> <http://ufpr.br>}
>
>
> On Thu, Oct 4, 2018 at 3:07 PM Luís G. Silva e Silva via R-br
> <r-br em listas.c3sl.ufpr.br <mailto:r-br em listas.c3sl.ufpr.br>> wrote:
>
> Olá,
>
> Usando o pacote dplyr ficaria assim:
>
> library(dplyr)
> nomes <- c("Alexandre Aguiar Parreiras",
> "Alexandre Aguiar Parreiras",
> "Breno Pereira Galvão",
> "Carlos Daniel Pereira de Souza",
> "Daniel Prates Andrade",
> "Daniel Prates Andrade",
> "Elian Kanaan dos Santos",
> "Érick Daniel Sena de Jesus")
>
> df <- data.frame(nomes)
> df <- df %>%
> mutate(id = 1:n()) %>%
> group_by(nomes) %>%
> mutate(id = first(id))
> df
>
>
> Abraço
>
> On Thu, Oct 4, 2018 at 3:00 PM Amiko Bh via R-br
> <r-br em listas.c3sl.ufpr.br <mailto:r-br em listas.c3sl.ufpr.br>> wrote:
>
> Pessoal: Não consegui achar instruções a respeito.
> Quero codificar (criar id?) nomes em um enorme banco de dados.
> Há vários nomes que se repetem. Estes teriam que ter a mesma
> identificação.
>
> Exemplo:
>
> Deste banco:
>
> Nome:
> Alexandre Aguiar Parreiras
> Alexandre Aguiar Parreiras
> Breno Pereira Galvão
> Carlos Daniel Pereira de Souza
> Daniel Prates Andrade
> Daniel Prates Andrade
> Elian Kanaan dos Santos
> Érick Daniel Sena de Jesus
>
>
> Quero ter este:
>
> Nome: ID
> Alexandre Aguiar Parreiras 1
> Alexandre Aguiar Parreiras 1
> Breno Pereira Galvão 2
> Carlos Daniel Pereira de Souza 3
> Daniel Prates Andrade 4
> Daniel Prates Andrade 4
> Elian Kanaan dos Santos 5
> Érick Daniel Sena de Jesus 6
>
>
> Muito Obrigado.
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
> forneça código mínimo reproduzível.
>
> --
>
> Luís G. Silva e Silva
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
> forneça código mínimo reproduzível.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20181005/0d714928/attachment.html>
Mais detalhes sobre a lista de discussão R-br