[R-br] Duplicated conjunto
Edson Lira
edinhoestat em yahoo.com.br
Quarta Maio 14 11:56:59 BRT 2014
Valeu Eder! Vou testar e depois respondo relatando o resultado.
[ ]'s.
Edson Lira
Estatístico
Manaus-Amazonas
Em Quarta-feira, 14 de Maio de 2014 8:16, Éder Comunello <comunello.eder em gmail.com> escreveu:
Senhores, bom dia!
Apenas supondo...
### <code r>
t1[!duplicated(t1$tecnico),]
### deverá retornar só a primeira linha (nas demais tecnico="Cavalcante" é duplicado!)
t1[!duplicated(t1),] ### utiliza todos os campos (colunas) e retorna só linhas distintas!!!
t1[!duplicated(cbind(t1$data_de_realizacao,t1$tx_tipo_exame,t1$tecnico)),]
t1[!duplicated(t1[,3:5]),] ### mesmo que forma anterior
### as três formas deverão retornarão as linhas 1 e 10, mas a primeira forma não é consistente.
### É comum a 'repetição' intencional do exame (por recomendação médica, p.ex.), de modo que poderão haver registros do mesmo tipo de exame em datas diferentes (e por vezes realizado pelo mesmo técnico). A segunda e terceira forma são 'chaveadas' pelos campos de interesse.
</code>
Agora é necessário aplicar o código pra ver se procede. Espero que ajude,
Éder Comunello <comunello.eder em gmail.com>
Dourados, MS - [22 16.5'S, 54 49'W]
Em 13 de maio de 2014 16:25, Edson Lira <edinhoestat em yahoo.com.br> escreveu:
Caros amigos, tenho um banco de exames com a estrutura abaixo
>
>
> id data_de_coleta data_de_realizacao tx_tipo_exame tecnico
>1 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>2 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>3 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>4 161538 2013-01-01 00:31:00
2013-01-01 08:20:01.406 Albumina Cavalcante
>5 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>6 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>7 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>8 161538 2013-01-01
00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>9 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>10 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>11 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>12 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>13 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina
Total e Frações Cavalcante
>14 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>15 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>16 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>17 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>18 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>19 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>20 161538
2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>21 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>22 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>23 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>24 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>25 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>26 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações
Cavalcante
>27 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>28 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>29 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>30 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>31 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>32 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>33 161538 2013-01-01 00:31:00
2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>
>
>t1<- ger[order(ger$tecnico,ger$data_de_realizacao, decreasing=TRUE) ,]
>
>
>gern<- t1[!duplicated(t1$tecnico),]
>
>Estou querendo, manter os exames (somente um de cada) eliminando os repetidos e os respectivos técnicos.
>
>Com a rotina acima não estou conseguindo.
>
>Gostaria de obeter o resultado abaixo:
> id data_de_coleta data_de_realizacao tx_tipo_exame tecnico
>1 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.406 Albumina Cavalcante
>10 161538 2013-01-01 00:31:00 2013-01-01 08:20:01.859 Bilirrubina Total e Frações Cavalcante
>
>Exemplifiquei com dois tipos de exames, pode ser que tenha 3 ou 4 exames.Só gostaria de eliminar os repetidos.
>
>[ ]'s.
>
>Edson Lira
>Estatístico
>Manaus-Amazonas
>_______________________________________________
>R-br mailing list
>R-br em listas.c3sl.ufpr.br
>https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140514/10b63988/attachment-0001.html>
Mais detalhes sobre a lista de discussão R-br