[R-br] Codificar nomes

Fernando Mayer fernandomayer em gmail.com
Qui Out 4 21:21:44 -03 2018


Basta lembrar que, internamente, os níveis de um fator são armazenados como
numeros inteiros, por padrão coincidentes com a ordem alfabética, ou seja,

as.numeric(factor(c("A", "B", "C")))

Portanto basta converter o vetor de nomes para fator e converter para
numérico:

nomes <- c("Alexandre Aguiar Parreiras",
"Alexandre Aguiar Parreiras",
"Breno Pereira Galvão",
"Carlos Daniel Pereira de Souza",
"Daniel Prates Andrade",
"Daniel Prates Andrade",
"Elian Kanaan dos Santos",
"Érick Daniel Sena de Jesus")

nomes <- as.factor(nomes)
nomes.id <- as.numeric(nomes)
data.frame(nomes, nomes.id)

---
Fernando de Pol Mayer
Laboratório de Estatística e Geoinformação - LEG
Departamento de Estatística - DEST
Universidade Federal do Paraná - UFPR
URL: http://leg.ufpr.br/~fernandomayer
e-mail: fernando.mayer [@] {gmail.com, ufpr.br}


On Thu, Oct 4, 2018 at 3:07 PM Luís G. Silva e Silva via R-br <
r-br em listas.c3sl.ufpr.br> wrote:

> Olá,
>
> Usando o pacote dplyr ficaria assim:
>
> library(dplyr)
> nomes <- c("Alexandre Aguiar Parreiras",
> "Alexandre Aguiar Parreiras",
> "Breno Pereira Galvão",
> "Carlos Daniel Pereira de Souza",
> "Daniel Prates Andrade",
> "Daniel Prates Andrade",
> "Elian Kanaan dos Santos",
> "Érick Daniel Sena de Jesus")
>
> df <- data.frame(nomes)
> df <- df %>%
>   mutate(id = 1:n()) %>%
>   group_by(nomes) %>%
>   mutate(id = first(id))
> df
>
>
> Abraço
>
> On Thu, Oct 4, 2018 at 3:00 PM Amiko Bh via R-br <r-br em listas.c3sl.ufpr.br>
> wrote:
>
>> Pessoal: Não consegui achar instruções a respeito.
>> Quero codificar (criar id?) nomes em um enorme banco de dados.
>> Há vários nomes que se repetem. Estes teriam que ter a mesma
>> identificação.
>>
>> Exemplo:
>>
>> Deste banco:
>>
>> Nome:
>> Alexandre Aguiar Parreiras
>> Alexandre Aguiar Parreiras
>> Breno Pereira Galvão
>> Carlos Daniel Pereira de Souza
>> Daniel Prates Andrade
>> Daniel Prates Andrade
>> Elian Kanaan dos Santos
>> Érick Daniel Sena de Jesus
>> Quero ter este:
>>
>> Nome: ID
>> Alexandre Aguiar Parreiras 1
>> Alexandre Aguiar Parreiras 1
>> Breno Pereira Galvão 2
>> Carlos Daniel Pereira de Souza 3
>> Daniel Prates Andrade 4
>> Daniel Prates Andrade 4
>> Elian Kanaan dos Santos 5
>> Érick Daniel Sena de Jesus 6
>> Muito Obrigado.
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>
> --
>
> Luís G. Silva e Silva
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20181004/d7b085e0/attachment.html>


Mais detalhes sobre a lista de discussão R-br