[R-br] Unique com menos variáveis
Fátima Lima Paula
fatima.lima.paula em gmail.com
Quarta Março 27 19:04:36 BRT 2013
Prezados, tenho um banco de dados com muitas variáveis e com linhas
idênticas em relação a algumas variáveis.
Quero retirar as linhas idênticas, mas para que isso fique melhor é
necessário fazer o unique apenas com algumas variáveis.
Quando faço isso são eliminadas mais linhas.
Mas, por outro lado o unique me retorna um banco com menos variáveis.
Como posso fazer para ficar com o banco com todas as colunas e sem as
linhas idênticas.
Exemplo:
nome=c("A","B","C","D","E","F","F","A","C","K","L","M")
idade=c("1","2","3","4","5","6","6","1","3","11","12","13")
cor=c("azul","preto","verde","branco","amarelo","cinza","cinza", "marrom",
"amarelo","bege","azul","azul")
material=c("lápis","ignorado","caneta","papel","borracha","lápis","lápis",
"lápis","ignorado","caneta","apontador","pilha")
banco1=cbind(nome,idade,cor,material) # banco que tenho
dim(banco1)
banco2=cbind(nome,idade) # banco para fazer o unique
dim(banco2)
b1unique=unique(banco1) # se faço o unique com o banco todo retornam 11
linhas e 4 colunas
dim(b1unique)
b2unique=unique(banco2) # fazendo o unique com o banco com as 2 variáveis
retornam 9 linhas e 2 colunas
dim(b2unique)
Para fazer o unique, de forma a eliminar o maior número de repetidas, quero
utilizar apenas as variáveis nome e idade.
O b1unique (com todas as variáveis) retorna 11 linhas e o b2unique retorna
9. Quero o banco com as nove linhas, mas com todas as colunas do banco1.
Verifiquei que existe um argumento incomparables no unique, mas vi que não
é aplicável para bancos grandes.
Alguém poderia me ajudar, por favor?
Obrigada
Fátima
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130327/4db8a3e9/attachment.html>
Mais detalhes sobre a lista de discussão R-br