[R-br] Frequencia de linhas duplicadas
Manoel Galdino
mcz.fea em gmail.com
Segunda Agosto 22 15:31:04 BRT 2016
Não sei se entendi, mas com a biblioteca dplyr, é bem fácil
Mas supondo que seu banco de dados se chama df, então, seria algo como
df <- data.frame(ID = c(23, 45, 34,20,10,11,23),
CODOM = c(100,100,101,100,102,102,100))
library(dplyr)
df %>%
group_by(CODOM) %>%
mutate(FREQ = n())
Se quiser pode atribuir o resultado a um novo data.frame.
Abraço,
2016-08-22 14:53 GMT-03:00 Wagner Tassinari via R-br <
r-br em listas.c3sl.ufpr.br>:
> Saudações pessoal,
>
> Tenho um banco de dados do seguinte formato:
>
> ID CODOM
> 23 100
> 45 100
> 34 101
> 20 100
> 10 102
> 11 102
> 23 100
>
> Gostaria de construir uma variável de contagem da variável CODOM, ou
> seja,no CODOM 100 existem 4 registros, no CODOM 101 apenas 1 registro e no
> CODOM 102 existem 2 registros.
>
> Saída deverá ser assim:
>
> ID CODOM FREQ
> 23 100 4
> 45 100 4
> 34 101 1
> 20 100 4
> 10 102 2
> 11 102 2
> 23 100 4
>
> Obrigado,
> -----
> Wagner S. Tassinari
> Departamento de Matemática
> Universidade Federal Rural do Rio de Janeiro.
> BR-465, Km 7 - Seropedica, RJ - Brasil
> CEP: 23890-000
> Cel: (21) 96488-5982 (WhatsApp)
> Skype: wagner.tassinari
> wtassinari em gmail.com
> ----------------------------------------------------------------------
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
--
Manoel Galdino
https://sites.google.com/site/galdinomcz/
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20160822/a8ebd053/attachment.html>
Mais detalhes sobre a lista de discussão R-br