[R-br] excluir linhas que tenham códigos repetidos

Manoel Galdino mcz.fea em gmail.com
Quarta Maio 1 12:28:15 BRT 2013


Com exemplo reproduzívei fica fácil...

banco1 <- banco1[ order(banco1$aih),] ## ordena o banco pela coluna que
vocÊ quer checar valores repetidos

exclusao <- which(duplicated(banco1$aih)==T) # cria vetor com duplicados

#porém, com duplicated, ele ainda deixa um elemento. MAs como o banco está
ordenado, os elementos que vão ficar são as linhas imediatamente anteriores
às linhas a serem excluídas
# assim, vou retirar essas linhas tbm.
aux <- exclusao - 1
exclusao1 <- unique(c(exclusao, aux))
banco2 <- banco1[-exclusao1, ]

abç
M


2013/5/1 Fátima Lima Paula <fatima.lima.paula em gmail.com>

> Pessoal, existe algum comando que exclua as linhas que apresentam códigos
> repetidos? Não seria deixar apenas um não. É excluir todas.
> Exemplo
>
> nome=c("Ricardo","Maria","Tereza","Pedro","José", "Germano","Paulo","Ana")
>
>  sobrenome=c("Cunha","Andrade","Silva","Soares","Silva","Lima","Pitanga","Amora")
> aih=c(6867,6798,8903,7865,8903,6745,6867,8903)
> ano=c(1944,1945,1923,1954,1947,1945,1946,1944)
>
> dataint=c(20121004,20120907,20120703,20120301,20120805,20121209,20120907,20120703)
> sexo=c("M","F","F","M","M","M","M","F")
> banco1=cbind(nome,sobrenome,aih,sexo,ano,dataint)
> banco1=data.frame(banco1)
> banco1
>      nome sobrenome  aih sexo  ano  dataint
> 1 Ricardo     Cunha 6867    M 1944 20121004
> 2   Maria   Andrade 6798    F 1945 20120907
> 3  Tereza     Silva 8903    F 1923 20120703
> 4   Pedro    Soares 7865    M 1954 20120301
> 5    José     Silva 8903    M 1947 20120805
> 6 Germano      Lima 6745    M 1945 20121209
> 7   Paulo   Pitanga 6867    M 1946 20120907
> 8     Ana     Amora 8903    F 1944 20120703
>
> Quero excluir as linhas que apresentam as aihs repetidas (6867 e 8903), de
> forma que o banco fique assim:
>
>      nome sobrenome  aih sexo  ano  dataint
> 1   Maria   Andrade 6798    F 1945 20120907
> 2   Pedro    Soares 7865    M 1954 20120301
> 3 Germano      Lima 6745    M 1945 20121209
>
>
> Obrigada
>
>
>
>
>
>
>
> --
> "Minha felicidade depende da qualidade dos meus pensamentos"
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 
Manoel Galdino
https://sites.google.com/site/galdinomcz/
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130501/e92aac0f/attachment.html>


Mais detalhes sobre a lista de discussão R-br