[R-br] Codificar nomes

Raphael Saldanha rfsaldanha em gmail.com
Qui Out 4 15:07:02 -03 2018


Uma ideia:

library(tidyverse)

seus_dados <- tibble(nome = c("Nome A", "Nome A", "Nome B", "Nome C", "Nome B", "Nome C"))

ids <- seus_dados %>%
  distinct(nome) %>%
  mutate(id = row_number())

seus_dados_com_id <- left_join(x = seus_dados,
                               y = ids,
                               by = "nome")

> Em 4 de out de 2018, à(s) 15:00, Amiko Bh via R-br <r-br em listas.c3sl.ufpr.br> escreveu:
> 
> Pessoal: Não consegui achar instruções a respeito.
> Quero codificar (criar id?) nomes em um enorme banco de dados.
> Há vários nomes que se repetem. Estes teriam que ter a mesma identificação.
> 
> Exemplo:
> 
> Deste banco:
> 
> Nome:
> Alexandre Aguiar Parreiras
> Alexandre Aguiar Parreiras
> Breno Pereira Galvão
> Carlos Daniel Pereira de Souza
> Daniel Prates Andrade
> Daniel Prates Andrade
> Elian Kanaan dos Santos
> Érick Daniel Sena de Jesus
> 
> Quero ter este:
> 
> Nome:	ID
> Alexandre Aguiar Parreiras	1
> Alexandre Aguiar Parreiras	1
> Breno Pereira Galvão	2
> Carlos Daniel Pereira de Souza	3
> Daniel Prates Andrade	4
> Daniel Prates Andrade	4
> Elian Kanaan dos Santos	5
> Érick Daniel Sena de Jesus	6
> 
> Muito Obrigado.
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20181004/db92a0da/attachment.html>


Mais detalhes sobre a lista de discussão R-br