
Pessoal, existe algum comando que exclua as linhas que apresentam códigos repetidos? Não seria deixar apenas um não. É excluir todas. Exemplo nome=c("Ricardo","Maria","Tereza","Pedro","José", "Germano","Paulo","Ana") sobrenome=c("Cunha","Andrade","Silva","Soares","Silva","Lima","Pitanga","Amora") aih=c(6867,6798,8903,7865,8903,6745,6867,8903) ano=c(1944,1945,1923,1954,1947,1945,1946,1944) dataint=c(20121004,20120907,20120703,20120301,20120805,20121209,20120907,20120703) sexo=c("M","F","F","M","M","M","M","F") banco1=cbind(nome,sobrenome,aih,sexo,ano,dataint) banco1=data.frame(banco1) banco1 nome sobrenome aih sexo ano dataint 1 Ricardo Cunha 6867 M 1944 20121004 2 Maria Andrade 6798 F 1945 20120907 3 Tereza Silva 8903 F 1923 20120703 4 Pedro Soares 7865 M 1954 20120301 5 José Silva 8903 M 1947 20120805 6 Germano Lima 6745 M 1945 20121209 7 Paulo Pitanga 6867 M 1946 20120907 8 Ana Amora 8903 F 1944 20120703 Quero excluir as linhas que apresentam as aihs repetidas (6867 e 8903), de forma que o banco fique assim: nome sobrenome aih sexo ano dataint 1 Maria Andrade 6798 F 1945 20120907 2 Pedro Soares 7865 M 1954 20120301 3 Germano Lima 6745 M 1945 20121209 Obrigada -- "Minha felicidade depende da qualidade dos meus pensamentos"

Com exemplo reproduzívei fica fácil... banco1 <- banco1[ order(banco1$aih),] ## ordena o banco pela coluna que vocÊ quer checar valores repetidos exclusao <- which(duplicated(banco1$aih)==T) # cria vetor com duplicados #porém, com duplicated, ele ainda deixa um elemento. MAs como o banco está ordenado, os elementos que vão ficar são as linhas imediatamente anteriores às linhas a serem excluídas # assim, vou retirar essas linhas tbm. aux <- exclusao - 1 exclusao1 <- unique(c(exclusao, aux)) banco2 <- banco1[-exclusao1, ] abç M 2013/5/1 Fátima Lima Paula <fatima.lima.paula@gmail.com>
Pessoal, existe algum comando que exclua as linhas que apresentam códigos repetidos? Não seria deixar apenas um não. É excluir todas. Exemplo
nome=c("Ricardo","Maria","Tereza","Pedro","José", "Germano","Paulo","Ana")
sobrenome=c("Cunha","Andrade","Silva","Soares","Silva","Lima","Pitanga","Amora") aih=c(6867,6798,8903,7865,8903,6745,6867,8903) ano=c(1944,1945,1923,1954,1947,1945,1946,1944)
dataint=c(20121004,20120907,20120703,20120301,20120805,20121209,20120907,20120703) sexo=c("M","F","F","M","M","M","M","F") banco1=cbind(nome,sobrenome,aih,sexo,ano,dataint) banco1=data.frame(banco1) banco1 nome sobrenome aih sexo ano dataint 1 Ricardo Cunha 6867 M 1944 20121004 2 Maria Andrade 6798 F 1945 20120907 3 Tereza Silva 8903 F 1923 20120703 4 Pedro Soares 7865 M 1954 20120301 5 José Silva 8903 M 1947 20120805 6 Germano Lima 6745 M 1945 20121209 7 Paulo Pitanga 6867 M 1946 20120907 8 Ana Amora 8903 F 1944 20120703
Quero excluir as linhas que apresentam as aihs repetidas (6867 e 8903), de forma que o banco fique assim:
nome sobrenome aih sexo ano dataint 1 Maria Andrade 6798 F 1945 20120907 2 Pedro Soares 7865 M 1954 20120301 3 Germano Lima 6745 M 1945 20121209
Obrigada
-- "Minha felicidade depende da qualidade dos meus pensamentos"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Manoel Galdino https://sites.google.com/site/galdinomcz/

Tenho a impressão que tem algum caminho melhor, mas o comando abaixo resolve. temp <- table(banco1$aih) banco1[match(names(temp[temp==1]),banco1$aih),] __________________ Gledson Picharski Em 1 de maio de 2013 12:11, Fátima Lima Paula <fatima.lima.paula@gmail.com>escreveu:
Pessoal, existe algum comando que exclua as linhas que apresentam códigos repetidos? Não seria deixar apenas um não. É excluir todas. Exemplo
nome=c("Ricardo","Maria","Tereza","Pedro","José", "Germano","Paulo","Ana")
sobrenome=c("Cunha","Andrade","Silva","Soares","Silva","Lima","Pitanga","Amora") aih=c(6867,6798,8903,7865,8903,6745,6867,8903) ano=c(1944,1945,1923,1954,1947,1945,1946,1944)
dataint=c(20121004,20120907,20120703,20120301,20120805,20121209,20120907,20120703) sexo=c("M","F","F","M","M","M","M","F") banco1=cbind(nome,sobrenome,aih,sexo,ano,dataint) banco1=data.frame(banco1) banco1 nome sobrenome aih sexo ano dataint 1 Ricardo Cunha 6867 M 1944 20121004 2 Maria Andrade 6798 F 1945 20120907 3 Tereza Silva 8903 F 1923 20120703 4 Pedro Soares 7865 M 1954 20120301 5 José Silva 8903 M 1947 20120805 6 Germano Lima 6745 M 1945 20121209 7 Paulo Pitanga 6867 M 1946 20120907 8 Ana Amora 8903 F 1944 20120703
Quero excluir as linhas que apresentam as aihs repetidas (6867 e 8903), de forma que o banco fique assim:
nome sobrenome aih sexo ano dataint 1 Maria Andrade 6798 F 1945 20120907 2 Pedro Soares 7865 M 1954 20120301 3 Germano Lima 6745 M 1945 20121209
Obrigada
-- "Minha felicidade depende da qualidade dos meus pensamentos"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Perfeito, obrigada. Em 1 de maio de 2013 12:31, gledson picharski <gledson.picharski@gmail.com>escreveu:
Tenho a impressão que tem algum caminho melhor, mas o comando abaixo resolve.
temp <- table(banco1$aih) banco1[match(names(temp[temp==1]),banco1$aih),]
__________________ Gledson Picharski
Em 1 de maio de 2013 12:11, Fátima Lima Paula <fatima.lima.paula@gmail.com
escreveu:
Pessoal, existe algum comando que exclua as linhas que apresentam códigos repetidos? Não seria deixar apenas um não. É excluir todas. Exemplo
nome=c("Ricardo","Maria","Tereza","Pedro","José", "Germano","Paulo","Ana")
sobrenome=c("Cunha","Andrade","Silva","Soares","Silva","Lima","Pitanga","Amora") aih=c(6867,6798,8903,7865,8903,6745,6867,8903) ano=c(1944,1945,1923,1954,1947,1945,1946,1944)
dataint=c(20121004,20120907,20120703,20120301,20120805,20121209,20120907,20120703) sexo=c("M","F","F","M","M","M","M","F") banco1=cbind(nome,sobrenome,aih,sexo,ano,dataint) banco1=data.frame(banco1) banco1 nome sobrenome aih sexo ano dataint 1 Ricardo Cunha 6867 M 1944 20121004 2 Maria Andrade 6798 F 1945 20120907 3 Tereza Silva 8903 F 1923 20120703 4 Pedro Soares 7865 M 1954 20120301 5 José Silva 8903 M 1947 20120805 6 Germano Lima 6745 M 1945 20121209 7 Paulo Pitanga 6867 M 1946 20120907 8 Ana Amora 8903 F 1944 20120703
Quero excluir as linhas que apresentam as aihs repetidas (6867 e 8903), de forma que o banco fique assim:
nome sobrenome aih sexo ano dataint 1 Maria Andrade 6798 F 1945 20120907 2 Pedro Soares 7865 M 1954 20120301 3 Germano Lima 6745 M 1945 20121209
Obrigada
-- "Minha felicidade depende da qualidade dos meus pensamentos"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- "Minha felicidade depende da qualidade dos meus pensamentos"

subset(banco1, !aih %in% c(6867, 8903)) Em 1 de maio de 2013 13:22, Fátima Lima Paula <fatima.lima.paula@gmail.com> escreveu:
Perfeito, obrigada.
Em 1 de maio de 2013 12:31, gledson picharski <gledson.picharski@gmail.com> escreveu:
Tenho a impressão que tem algum caminho melhor, mas o comando abaixo resolve.
temp <- table(banco1$aih) banco1[match(names(temp[temp==1]),banco1$aih),]
__________________ Gledson Picharski
Em 1 de maio de 2013 12:11, Fátima Lima Paula <fatima.lima.paula@gmail.com> escreveu:
Pessoal, existe algum comando que exclua as linhas que apresentam códigos repetidos? Não seria deixar apenas um não. É excluir todas. Exemplo
nome=c("Ricardo","Maria","Tereza","Pedro","José", "Germano","Paulo","Ana")
sobrenome=c("Cunha","Andrade","Silva","Soares","Silva","Lima","Pitanga","Amora") aih=c(6867,6798,8903,7865,8903,6745,6867,8903) ano=c(1944,1945,1923,1954,1947,1945,1946,1944)
dataint=c(20121004,20120907,20120703,20120301,20120805,20121209,20120907,20120703) sexo=c("M","F","F","M","M","M","M","F") banco1=cbind(nome,sobrenome,aih,sexo,ano,dataint) banco1=data.frame(banco1) banco1 nome sobrenome aih sexo ano dataint 1 Ricardo Cunha 6867 M 1944 20121004 2 Maria Andrade 6798 F 1945 20120907 3 Tereza Silva 8903 F 1923 20120703 4 Pedro Soares 7865 M 1954 20120301 5 José Silva 8903 M 1947 20120805 6 Germano Lima 6745 M 1945 20121209 7 Paulo Pitanga 6867 M 1946 20120907 8 Ana Amora 8903 F 1944 20120703
Quero excluir as linhas que apresentam as aihs repetidas (6867 e 8903), de forma que o banco fique assim:
nome sobrenome aih sexo ano dataint 1 Maria Andrade 6798 F 1945 20120907 2 Pedro Soares 7865 M 1954 20120301 3 Germano Lima 6745 M 1945 20121209
Obrigada
-- "Minha felicidade depende da qualidade dos meus pensamentos"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- "Minha felicidade depende da qualidade dos meus pensamentos"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

Pegando carona na solução do Benilton, subset(banco1, !aih %in% banco1$aih[duplicated(banco1$aih)]) Em 1 de maio de 2013 13:47, Benilton Carvalho <beniltoncarvalho@gmail.com>escreveu:
subset(banco1, !aih %in% c(6867, 8903))
Em 1 de maio de 2013 13:22, Fátima Lima Paula <fatima.lima.paula@gmail.com> escreveu:
Perfeito, obrigada.
Em 1 de maio de 2013 12:31, gledson picharski < gledson.picharski@gmail.com> escreveu:
Tenho a impressão que tem algum caminho melhor, mas o comando abaixo resolve.
temp <- table(banco1$aih) banco1[match(names(temp[temp==1]),banco1$aih),]
__________________ Gledson Picharski
Em 1 de maio de 2013 12:11, Fátima Lima Paula <fatima.lima.paula@gmail.com> escreveu:
Pessoal, existe algum comando que exclua as linhas que apresentam
códigos
repetidos? Não seria deixar apenas um não. É excluir todas. Exemplo
nome=c("Ricardo","Maria","Tereza","Pedro","José", "Germano","Paulo","Ana")
sobrenome=c("Cunha","Andrade","Silva","Soares","Silva","Lima","Pitanga","Amora")
aih=c(6867,6798,8903,7865,8903,6745,6867,8903) ano=c(1944,1945,1923,1954,1947,1945,1946,1944)
dataint=c(20121004,20120907,20120703,20120301,20120805,20121209,20120907,20120703)
sexo=c("M","F","F","M","M","M","M","F") banco1=cbind(nome,sobrenome,aih,sexo,ano,dataint) banco1=data.frame(banco1) banco1 nome sobrenome aih sexo ano dataint 1 Ricardo Cunha 6867 M 1944 20121004 2 Maria Andrade 6798 F 1945 20120907 3 Tereza Silva 8903 F 1923 20120703 4 Pedro Soares 7865 M 1954 20120301 5 José Silva 8903 M 1947 20120805 6 Germano Lima 6745 M 1945 20121209 7 Paulo Pitanga 6867 M 1946 20120907 8 Ana Amora 8903 F 1944 20120703
Quero excluir as linhas que apresentam as aihs repetidas (6867 e 8903), de forma que o banco fique assim:
nome sobrenome aih sexo ano dataint 1 Maria Andrade 6798 F 1945 20120907 2 Pedro Soares 7865 M 1954 20120301 3 Germano Lima 6745 M 1945 20121209
Obrigada
-- "Minha felicidade depende da qualidade dos meus pensamentos"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- "Minha felicidade depende da qualidade dos meus pensamentos"
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
-- Marcos F. Silva http://sites.google.com/site/marcosfs2006
participantes (5)
-
Benilton Carvalho
-
Fátima Lima Paula
-
gledson picharski
-
Manoel Galdino
-
Marcos Silva