[R-br] Unique com menos variáveis
Fátima Lima Paula
fatima.lima.paula em gmail.com
Quinta Março 28 07:41:23 BRT 2013
Obrigada, Luciano.
Não havia dado certo porque a ordem das variáveis em cada banco estava
diferente e eu não usei o nome delas e sim a posição.
Valeu.
Fátima
Em 27 de março de 2013 21:04, Luciano F. Sgarbi
<luciano.f.sgarbi em gmail.com>escreveu:
> veja se assim fica mais claro
>
> banco1[,c("nome","idade")]#você quer selecionar pelas variáveis nome e
> idade do banco1
> duplicated(banco1[,c("nome","idade")])#Este comando te retorna quais são
> as linhas duplicadas, certo?
> !duplicated(banco1[,c("nome","idade")])# o"!" significa diferente.
> Portanto você pega as linhas não duplicadas (unicas).
> banco1[!duplicated(banco1[,c("nome","idade")]),]#assim ele vai selecionar
> todas as linhas = TRUE
>
> Entendeu?
>
>
> Em 27 de março de 2013 20:47, Fátima Lima Paula <
> fatima.lima.paula em gmail.com> escreveu:
>
> Pois é, mas quando faço isso no banco grande, não dá certo.
>> Eu não entendi o comando.
>> No banco 1 você faz !duplicate nas linhas e mantém as colunas. Mas quando
>> ele faz o duplicate, leva em consideração todas as variáveis?
>>
>> Em 27 de março de 2013 20:36, Luciano F. Sgarbi <
>> luciano.f.sgarbi em gmail.com> escreveu:
>>
>> Oi Fátima,
>>> Mas vc não quer que seu resultado seja um conjunto com 9 linhas e 4
>>> colunas?
>>> Att.
>>>
>>>
>>> Em 27 de março de 2013 20:27, Fátima Lima Paula <
>>> fatima.lima.paula em gmail.com> escreveu:
>>>
>>> Não deu certo não.
>>>>
>>>> Em 27 de março de 2013 19:30, Luciano F. Sgarbi <
>>>> luciano.f.sgarbi em gmail.com> escreveu:
>>>>
>>>> Seria isso?
>>>>>
>>>>> banco1[!duplicated(banco2),]
>>>>>
>>>>> att.
>>>>> Luciano
>>>>>
>>>>>
>>>>> Em 27 de março de 2013 19:04, Fátima Lima Paula <
>>>>> fatima.lima.paula em gmail.com> escreveu:
>>>>>
>>>>>> Prezados, tenho um banco de dados com muitas variáveis e com linhas
>>>>>> idênticas em relação a algumas variáveis.
>>>>>> Quero retirar as linhas idênticas, mas para que isso fique melhor é
>>>>>> necessário fazer o unique apenas com algumas variáveis.
>>>>>> Quando faço isso são eliminadas mais linhas.
>>>>>> Mas, por outro lado o unique me retorna um banco com menos variáveis.
>>>>>> Como posso fazer para ficar com o banco com todas as colunas e sem as
>>>>>> linhas idênticas.
>>>>>> Exemplo:
>>>>>>
>>>>>> nome=c("A","B","C","D","E","F","F","A","C","K","L","M")
>>>>>> idade=c("1","2","3","4","5","6","6","1","3","11","12","13")
>>>>>> cor=c("azul","preto","verde","branco","amarelo","cinza","cinza",
>>>>>> "marrom", "amarelo","bege","azul","azul")
>>>>>> material=c("lápis","ignorado","caneta","papel","borracha","lápis","lápis",
>>>>>> "lápis","ignorado","caneta","apontador","pilha")
>>>>>> banco1=cbind(nome,idade,cor,material) # banco que tenho
>>>>>> dim(banco1)
>>>>>> banco2=cbind(nome,idade) # banco para fazer o unique
>>>>>> dim(banco2)
>>>>>> b1unique=unique(banco1) # se faço o unique com o banco todo retornam
>>>>>> 11 linhas e 4 colunas
>>>>>> dim(b1unique)
>>>>>> b2unique=unique(banco2) # fazendo o unique com o banco com as 2
>>>>>> variáveis retornam 9 linhas e 2 colunas
>>>>>> dim(b2unique)
>>>>>>
>>>>>>
>>>>>> Para fazer o unique, de forma a eliminar o maior número de repetidas,
>>>>>> quero utilizar apenas as variáveis nome e idade.
>>>>>> O b1unique (com todas as variáveis) retorna 11 linhas e o b2unique
>>>>>> retorna 9. Quero o banco com as nove linhas, mas com todas as colunas do
>>>>>> banco1.
>>>>>> Verifiquei que existe um argumento incomparables no unique, mas vi
>>>>>> que não é aplicável para bancos grandes.
>>>>>> Alguém poderia me ajudar, por favor?
>>>>>> Obrigada
>>>>>> Fátima
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> R-br mailing list
>>>>>> R-br em listas.c3sl.ufpr.br
>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>>> código mínimo reproduzível.
>>>>>>
>>>>>
>>>>>
>>>>>
>>>>> --
>>>>>
>>>>> *Luciano F. Sgarbi*
>>>>>
>>>>> Mestrando em Ecologia e Evolução
>>>>> Laboratório de Ecologia de Insetos (sl. 222)
>>>>> Departamento de Ecologia
>>>>> Instituto de Ciências Biológicas - ICB 1
>>>>> Universidade Federal de Goiás, campus II
>>>>> Goiânia-GO
>>>>> 74001-970
>>>>> Brazil
>>>>>
>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> R-br mailing list
>>>>> R-br em listas.c3sl.ufpr.br
>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>>> código mínimo reproduzível.
>>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> R-br mailing list
>>>> R-br em listas.c3sl.ufpr.br
>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>>> código mínimo reproduzível.
>>>>
>>>
>>>
>>>
>>> --
>>>
>>> *Luciano F. Sgarbi*
>>>
>>> Mestrando em Ecologia e Evolução
>>> Laboratório de Ecologia de Insetos (sl. 222)
>>> Departamento de Ecologia
>>> Instituto de Ciências Biológicas - ICB 1
>>> Universidade Federal de Goiás, campus II
>>> Goiânia-GO
>>> 74001-970
>>> Brazil
>>>
>>>
>>>
>>> _______________________________________________
>>> R-br mailing list
>>> R-br em listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
>
>
> --
>
> *Luciano F. Sgarbi*
>
> Mestrando em Ecologia e Evolução
> Laboratório de Ecologia de Insetos (sl. 222)
> Departamento de Ecologia
> Instituto de Ciências Biológicas - ICB 1
> Universidade Federal de Goiás, campus II
> Goiânia-GO
> 74001-970
> Brazil
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20130328/cf861490/attachment.html>
Mais detalhes sobre a lista de discussão R-br