[R-br] Unique com menos variáveis

Luciano F. Sgarbi luciano.f.sgarbi em gmail.com
Quarta Março 27 21:04:59 BRT 2013


veja se assim fica mais claro

banco1[,c("nome","idade")]#você quer selecionar pelas variáveis nome e
idade do banco1
duplicated(banco1[,c("nome","idade")])#Este comando te retorna quais são as
linhas duplicadas, certo?
!duplicated(banco1[,c("nome","idade")])# o"!" significa diferente. Portanto
você pega as linhas não duplicadas (unicas).
banco1[!duplicated(banco1[,c("nome","idade")]),]#assim ele vai selecionar
todas as linhas  = TRUE

Entendeu?


Em 27 de março de 2013 20:47, Fátima Lima Paula <fatima.lima.paula em gmail.com
> escreveu:

> Pois é, mas quando faço isso no banco grande, não dá certo.
> Eu não entendi o comando.
> No banco 1 você faz !duplicate nas linhas e mantém as colunas. Mas quando
> ele faz o duplicate, leva em consideração todas as variáveis?
>
> Em 27 de março de 2013 20:36, Luciano F. Sgarbi <
> luciano.f.sgarbi em gmail.com> escreveu:
>
> Oi Fátima,
>> Mas vc não quer que seu resultado seja um conjunto com 9 linhas e 4
>> colunas?
>> Att.
>>
>>
>> Em 27 de março de 2013 20:27, Fátima Lima Paula <
>> fatima.lima.paula em gmail.com> escreveu:
>>
>> Não deu certo não.
>>>
>>> Em 27 de março de 2013 19:30, Luciano F. Sgarbi <
>>> luciano.f.sgarbi em gmail.com> escreveu:
>>>
>>> Seria isso?
>>>>
>>>> banco1[!duplicated(banco2),]
>>>>
>>>> att.
>>>> Luciano
>>>>
>>>>
>>>> Em 27 de março de 2013 19:04, Fátima Lima Paula <
>>>> fatima.lima.paula em gmail.com> escreveu:
>>>>
>>>>> Prezados, tenho um banco de dados com muitas variáveis e com linhas
>>>>> idênticas em relação a algumas variáveis.
>>>>> Quero retirar as linhas idênticas, mas para que isso fique melhor é
>>>>> necessário fazer o unique apenas com algumas variáveis.
>>>>> Quando faço isso são eliminadas mais linhas.
>>>>> Mas, por outro lado o unique me retorna um banco com menos variáveis.
>>>>> Como posso fazer para ficar com o banco com todas as colunas e sem as
>>>>> linhas idênticas.
>>>>> Exemplo:
>>>>>
>>>>> nome=c("A","B","C","D","E","F","F","A","C","K","L","M")
>>>>> idade=c("1","2","3","4","5","6","6","1","3","11","12","13")
>>>>> cor=c("azul","preto","verde","branco","amarelo","cinza","cinza",
>>>>> "marrom", "amarelo","bege","azul","azul")
>>>>> material=c("lápis","ignorado","caneta","papel","borracha","lápis","lápis",
>>>>> "lápis","ignorado","caneta","apontador","pilha")
>>>>> banco1=cbind(nome,idade,cor,material) # banco que tenho
>>>>> dim(banco1)
>>>>> banco2=cbind(nome,idade) # banco para fazer o unique
>>>>> dim(banco2)
>>>>> b1unique=unique(banco1) # se faço o unique com o banco todo retornam
>>>>> 11 linhas e 4 colunas
>>>>> dim(b1unique)
>>>>> b2unique=unique(banco2) # fazendo o unique com o banco com as 2
>>>>> variáveis retornam 9 linhas e 2 colunas
>>>>> dim(b2unique)
>>>>>
>>>>>
>>>>> Para fazer o unique, de forma a eliminar o maior número de repetidas,
>>>>> quero utilizar apenas as variáveis nome e idade.
>>>>> O b1unique (com todas as variáveis) retorna 11 linhas e o b2unique
>>>>> retorna 9. Quero o banco com as nove linhas, mas com todas as colunas do
>>>>> banco1.
>>>>> Verifiquei que existe um argumento incomparables no unique, mas vi que
>>>>> não é aplicável para bancos grandes.
>>>>> Alguém poderia me ajudar, por favor?
>>>>> Obrigada
>>>>> Fátima
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>>
>>>> --
>>>>
>>>> *Luciano F. Sgarbi*
>>>>
>>>> Mestrando em Ecologia e Evolução
>>>> Laboratório de Ecologia de Insetos (sl. 222)
>>>> Departamento de Ecologia
>>>> Instituto de Ciências Biológicas - ICB 1
>>>> Universidade Federal de Goiás, campus II
>>>> Goiânia-GO
>>>> 74001-970
>>>> Brazil
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>>
>> --
>>
>> *Luciano F. Sgarbi*
>>
>> Mestrando em Ecologia e Evolução
>> Laboratório de Ecologia de Insetos (sl. 222)
>> Departamento de Ecologia
>> Instituto de Ciências Biológicas - ICB 1
>> Universidade Federal de Goiás, campus II
>> Goiânia-GO
>> 74001-970
>> Brazil
>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>



-- 

*Luciano F. Sgarbi*

Mestrando em Ecologia e Evolução
Laboratório de Ecologia de Insetos (sl. 222)
Departamento de Ecologia
Instituto de Ciências Biológicas - ICB 1
Universidade Federal de Goiás, campus II
Goiânia-GO
74001-970
Brazil
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130327/faadfcc4/attachment.html>


Mais detalhes sobre a lista de discussão R-br