[R-br] Comparar informações de colunas e linhas

Benilton Carvalho beniltoncarvalho em gmail.com
Quinta Julho 28 14:07:47 BRT 2011


I) Ja dei a solucao no email anterior:

XX[['dup']] = duplicated(XX[['A']]) | duplicated(XX[['A']], fromLast=TRUE)

II) Tambem no email anterior:

YY[['dup']] = duplicated(YY) | duplicated(YY, fromLast=TRUE)

III)

merge(YY, aggregate(rep(1, nrow(YY)), by=YY, sum)


(muuuuuito mais facil qdo exemplos que podemos executar sao dados)

b

2011/7/28 Roney Fraga Souza <roneyfraga em gmail.com>:
> Caros,
>
> Reescrevendo o problema da mensagem anterior, procurei ser mais preciso nos exemplos. Segue as dúvidas:
> Objetivo I:
> Considerando XX,
> XX <- data.frame("A"=c(8,11,14,11,11,8))
> XX
>    A
> 1  8
> 2 11
> 3 14
> 4 11
> 5 11
> 6  8
> quero criar uma nova variável em XX,  que retorne 1 quando um determinado valor em XX$A já foi repetido ou 0 se é a primeira vez que ele aparece. Nesse caso teria que ficar
> XX
>    A           nova_variavel1
> 1  8            1
> 2 11    1
> 3 14    0
> 4 11    1
> 5 11    1
> 6  8            1
>
> A pergunta é, como criar essa variável (nova_variavel1)?
>
> Objetivo II:
> Considerando YY,
> YY <- data.frame("A"=c(8,11,14,11,11,8), "B"=c(14,16,33,14,16,14))
> YY
>    A   B
> 1  8  14
> 2 11 16
> 3 14  33
> 4 11 14
> 5 11 16
> 6  8  14
> quero criar agora uma nova variável que apresente valor 1 se existem valores repetidos em YY$A e YY$B simultaneamente, exemplo, na linha 1 de YY os valores (8 e 14)  se repetem na linha 6, logo a nova variável terá valor 1 em ambas a linhas citadas, caso contrário assumirá valor 0. O resultado seria
> YY
>    A   B       nova_variavel2
> 1  8  14        1
> 2 11 16 1
> 3 14  33        0
> 4 11 14 0
> 5 11 16 1
> 6  8  14        1
>
> Como criar a variável (nova_variavel2)?
>
> Objetivo III:
> Considerando YY, quero criar uma nova variável que conte quantas vezes os valores de determinadas linhas se repetem. Como os valores das linhas 2 e 5 de YY$A e YY$B são iguais, então nas linhas 2 e 5 da nova variável aparecera o número 2, caso os valores aparecessem em 4 linhas distintas o valor da nova variável seria 4 nas linhas citadas. O resultado do exemplo YY seria
> YY
>    A  B        nova_variavel3
> 1  8  14        2
> 2 11 16 2
> 3 14 33 1
> 4 11 14 1
> 5 11 16 2
> 6  8  14        2
>
> Por fim, a última questão é, como criar a variável (nova_variavel3)?
>
>
> Atenciosamente
> Roney
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>



-- 
Successful people ask better questions, and as a result, they get
better answers. (Tony Robbins)


Mais detalhes sobre a lista de discussão R-br