[R-br] Unique com menos variáveis

Fátima Lima Paula fatima.lima.paula em gmail.com
Quarta Março 27 20:47:34 BRT 2013


Pois é, mas quando faço isso no banco grande, não dá certo.
Eu não entendi o comando.
No banco 1 você faz !duplicate nas linhas e mantém as colunas. Mas quando
ele faz o duplicate, leva em consideração todas as variáveis?

Em 27 de março de 2013 20:36, Luciano F. Sgarbi
<luciano.f.sgarbi em gmail.com>escreveu:

> Oi Fátima,
> Mas vc não quer que seu resultado seja um conjunto com 9 linhas e 4
> colunas?
> Att.
>
>
> Em 27 de março de 2013 20:27, Fátima Lima Paula <
> fatima.lima.paula em gmail.com> escreveu:
>
> Não deu certo não.
>>
>> Em 27 de março de 2013 19:30, Luciano F. Sgarbi <
>> luciano.f.sgarbi em gmail.com> escreveu:
>>
>> Seria isso?
>>>
>>> banco1[!duplicated(banco2),]
>>>
>>> att.
>>> Luciano
>>>
>>>
>>> Em 27 de março de 2013 19:04, Fátima Lima Paula <
>>> fatima.lima.paula em gmail.com> escreveu:
>>>
>>>> Prezados, tenho um banco de dados com muitas variáveis e com linhas
>>>> idênticas em relação a algumas variáveis.
>>>> Quero retirar as linhas idênticas, mas para que isso fique melhor é
>>>> necessário fazer o unique apenas com algumas variáveis.
>>>> Quando faço isso são eliminadas mais linhas.
>>>> Mas, por outro lado o unique me retorna um banco com menos variáveis.
>>>> Como posso fazer para ficar com o banco com todas as colunas e sem as
>>>> linhas idênticas.
>>>> Exemplo:
>>>>
>>>> nome=c("A","B","C","D","E","F","F","A","C","K","L","M")
>>>> idade=c("1","2","3","4","5","6","6","1","3","11","12","13")
>>>> cor=c("azul","preto","verde","branco","amarelo","cinza","cinza",
>>>> "marrom", "amarelo","bege","azul","azul")
>>>> material=c("lápis","ignorado","caneta","papel","borracha","lápis","lápis",
>>>> "lápis","ignorado","caneta","apontador","pilha")
>>>> banco1=cbind(nome,idade,cor,material) # banco que tenho
>>>> dim(banco1)
>>>> banco2=cbind(nome,idade) # banco para fazer o unique
>>>> dim(banco2)
>>>> b1unique=unique(banco1) # se faço o unique com o banco todo retornam 11
>>>> linhas e 4 colunas
>>>> dim(b1unique)
>>>> b2unique=unique(banco2) # fazendo o unique com o banco com as 2
>>>> variáveis retornam 9 linhas e 2 colunas
>>>> dim(b2unique)
>>>>
>>>>
>>>> Para fazer o unique, de forma a eliminar o maior número de repetidas,
>>>> quero utilizar apenas as variáveis nome e idade.
>>>> O b1unique (com todas as variáveis) retorna 11 linhas e o b2unique
>>>> retorna 9. Quero o banco com as nove linhas, mas com todas as colunas do
>>>> banco1.
>>>> Verifiquei que existe um argumento incomparables no unique, mas vi que
>>>> não é aplicável para bancos grandes.
>>>> Alguém poderia me ajudar, por favor?
>>>> Obrigada
>>>> Fátima
>>>>
>>>>
>>>>
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>>
>>> *Luciano F. Sgarbi*
>>>
>>> Mestrando em Ecologia e Evolução
>>> Laboratório de Ecologia de Insetos (sl. 222)
>>> Departamento de Ecologia
>>> Instituto de Ciências Biológicas - ICB 1
>>> Universidade Federal de Goiás, campus II
>>> Goiânia-GO
>>> 74001-970
>>> Brazil
>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
>
> *Luciano F. Sgarbi*
>
> Mestrando em Ecologia e Evolução
> Laboratório de Ecologia de Insetos (sl. 222)
> Departamento de Ecologia
> Instituto de Ciências Biológicas - ICB 1
> Universidade Federal de Goiás, campus II
> Goiânia-GO
> 74001-970
> Brazil
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130327/ed25eecf/attachment.html>


Mais detalhes sobre a lista de discussão R-br