[R-br] Codificar nomes

Elerson amikobh em gmail.com
Sex Out 5 12:06:04 -03 2018


Prezados:

Muito obrigado! Com o sugerido, problema resolvido.

Elerson

Em 04/10/2018 21:21, Fernando Mayer via R-br escreveu:
> Basta lembrar que, internamente, os níveis de um fator são armazenados 
> como numeros inteiros, por padrão coincidentes com a ordem alfabética, 
> ou seja,
>
> as.numeric(factor(c("A", "B", "C")))
>
> Portanto basta converter o vetor de nomes para fator e converter para 
> numérico:
>
> nomes <- c("Alexandre Aguiar Parreiras",
> "Alexandre Aguiar Parreiras",
> "Breno Pereira Galvão",
> "Carlos Daniel Pereira de Souza",
> "Daniel Prates Andrade",
> "Daniel Prates Andrade",
> "Elian Kanaan dos Santos",
> "Érick Daniel Sena de Jesus")
>
> nomes <- as.factor(nomes)
> nomes.id <http://nomes.id> <- as.numeric(nomes)
> data.frame(nomes, nomes.id <http://nomes.id>)
> ---
> Fernando de Pol Mayer
> Laboratório de Estatística e Geoinformação - LEG
> Departamento de Estatística - DEST
> Universidade Federal do Paraná - UFPR
> URL: http://leg.ufpr.br/~fernandomayer
> e-mail: fernando.mayer [@] {gmail.com <http://gmail.com>, ufpr.br 
> <http://ufpr.br>}
>
>
> On Thu, Oct 4, 2018 at 3:07 PM Luís G. Silva e Silva via R-br 
> <r-br em listas.c3sl.ufpr.br <mailto:r-br em listas.c3sl.ufpr.br>> wrote:
>
>     Olá,
>
>     Usando o pacote dplyr ficaria assim:
>
>     library(dplyr)
>     nomes <- c("Alexandre Aguiar Parreiras",
>     "Alexandre Aguiar Parreiras",
>     "Breno Pereira Galvão",
>     "Carlos Daniel Pereira de Souza",
>     "Daniel Prates Andrade",
>     "Daniel Prates Andrade",
>     "Elian Kanaan dos Santos",
>     "Érick Daniel Sena de Jesus")
>
>     df <- data.frame(nomes)
>     df <- df %>%
>       mutate(id = 1:n()) %>%
>       group_by(nomes) %>%
>       mutate(id = first(id))
>     df
>
>
>     Abraço
>
>     On Thu, Oct 4, 2018 at 3:00 PM Amiko Bh via R-br
>     <r-br em listas.c3sl.ufpr.br <mailto:r-br em listas.c3sl.ufpr.br>> wrote:
>
>         Pessoal: Não consegui achar instruções a respeito.
>         Quero codificar (criar id?) nomes em um enorme banco de dados.
>         Há vários nomes que se repetem. Estes teriam que ter a mesma
>         identificação.
>
>         Exemplo:
>
>         Deste banco:
>
>         Nome:
>         Alexandre Aguiar Parreiras
>         Alexandre Aguiar Parreiras
>         Breno Pereira Galvão
>         Carlos Daniel Pereira de Souza
>         Daniel Prates Andrade
>         Daniel Prates Andrade
>         Elian Kanaan dos Santos
>         Érick Daniel Sena de Jesus
>
>
>         Quero ter este:
>
>         Nome: 	ID
>         Alexandre Aguiar Parreiras 	1
>         Alexandre Aguiar Parreiras 	1
>         Breno Pereira Galvão 	2
>         Carlos Daniel Pereira de Souza 	3
>         Daniel Prates Andrade 	4
>         Daniel Prates Andrade 	4
>         Elian Kanaan dos Santos 	5
>         Érick Daniel Sena de Jesus 	6
>
>
>         Muito Obrigado.
>         _______________________________________________
>         R-br mailing list
>         R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>         https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>         Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>         forneça código mínimo reproduzível.
>
>     -- 
>
>     Luís G. Silva e Silva
>
>     _______________________________________________
>     R-br mailing list
>     R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
>     https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>     Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
>     forneça código mínimo reproduzível.
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20181005/0d714928/attachment.html>


Mais detalhes sobre a lista de discussão R-br