[R-br] tidyverse e vroom: Leitura de informações alvo em um arquivo *txt e também computo de informação ausente

Cid Póvoas cidedson em gmail.com
Ter Set 29 15:21:54 -03 2020


Parece q ainda tinha um erro no método de seleção do  str_detect, agora ta
100%


library(vroom)
> library(tidyverse)
> #Download dos dados
> myfile <-
>   vroom("
> https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt",
> delim = "\t", skip = 5)
> myfile <- myfile %>% rename(dados = `folder input=imgval/ and
> output=backup/`)
>
> myfile <- myfile %>% filter(str_detect(dados, "lca:|sample")) %>%
> as.data.frame() %>% filter(!str_detect(dados, "Predict"))
> myfile2 <- myfile %>%
>   separate(dados, c("Start", "sample"), sep = "/") %>%
>   select("sample") %>% mutate_all(parse_number)
>
>
> myfile2[is.na(myfile2)] <- 1
> myfile3 <- myfile2 %>% mutate(lca = ifelse(sample == "1", "1", "0"),
>                               lca = lead(lca, default = "0")) %>%
> filter(!sample == "1") %>% mutate(sample = paste0("sample_",sample))
> myfile3 %>% filter(sample == "sample_5769" | sample =="sample_21884" |
> sample == "sample_20371" | sample == "sample_19295")



*Cid Edson Mendonça Póvoas **Cel: +55 (73) 99151-9565*

*Engenheiro **Agrônomo*

*Analista de dados *

*Técnico em Segurança do Trabalho *

*LinkedIn: **http://br.linkedin.com/in/cidedson/
<http://br.linkedin.com/in/cidedson/>*

*Lattes: **http://lattes.cnpq.br/2303498368142537
<http://lattes.cnpq.br/2303498368142537>*




Em ter., 29 de set. de 2020 às 15:04, Cid Póvoas <cidedson em gmail.com>
escreveu:

> Desconsidera o outro, tinha um erro
>
> library(vroom)
> library(tidyverse)
>
> #Download dos dados
> myfile <-
>   vroom("
> https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt",
> delim = "\t", skip = 5)
>
> myfile <- myfile %>% rename(dados = `folder input=imgval/ and
> output=backup/`)
>
>
> myfile <- myfile %>% filter(str_detect(dados, c("lca:","sample"))) %>%
> as.data.frame()
>
> myfile2 <- myfile %>%
>   separate(dados, c("Start", "sample"), sep = "/") %>%
>   select("sample") %>% mutate_all(parse_number)
>
>
> myfile2[is.na(myfile2)] <- 1
>
> myfile3 <- myfile2 %>% mutate(lca = ifelse(sample == "1", "1", "0"),
>                               lca = lead(lca, default = "0")) %>%
> filter(!sample == "1") %>% mutate(sample = paste0("sample_",sample))
>
> myfile3 %>% filter(sample == "sample_5769" | sample =="sample_21884")
>
>
> tail(myfile3)
> View(myfile)
>
>
> *Cid Edson Mendonça Póvoas **Cel: +55 (73) 99151-9565*
>
> *Engenheiro **Agrônomo*
>
> *Analista de dados *
>
> *Técnico em Segurança do Trabalho *
>
> *LinkedIn: **http://br.linkedin.com/in/cidedson/
> <http://br.linkedin.com/in/cidedson/>*
>
> *Lattes: **http://lattes.cnpq.br/2303498368142537
> <http://lattes.cnpq.br/2303498368142537>*
>
>
>
>
> Em ter., 29 de set. de 2020 às 10:57, ASANTOS por (R-br) <
> r-br em listas.c3sl.ufpr.br> escreveu:
>
>> Prezados membros,
>>
>> Surgiu um novo problema para a extração de informações em um arquivo
>> *txt quando eu tenho que computar também quando eu não tenho determinada
>> informação (lca) e preciso considerar isso no meu data.frame final.
>>
>> Em meu exemplo:
>>
>> #Pacotes
>> library(vroom)
>> library(tidyverse)
>>
>> #Download dos dados
>> myfile <-
>> vroom("
>> https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt
>> ")
>>
>> As informações alvo são:
>>
>> 1) No caso quando ocorreu o evento lca o padrão das linhas é:
>>
>> imgval/sample_21915.jpg: Predicted in 7337.147000 milli-seconds.
>> lca: 65.648048%    left_x:    0    top_y:   18    width:   13 height:   27
>> lca: 45.191948%    left_x:   71    top_y:   31    width:    7 height:   12
>> End
>>
>> Então meu data.frame precisa receber a informação:
>>
>> image             lca
>> sample_21915.jpg  1
>> sample_21915.jpg  1
>>
>> 2) Quando não ocorrer o evento lca, o padrão das linhas será diferente:
>>
>> Start processing imgval/sample_3908.jpg
>> imgval/sample_3908.jpg: Predicted in 7282.433000 milli-seconds.
>> End
>>
>> E nesse caso o meu data.frame precisa receber a seguinte informação:
>> image             lca
>> sample_3908.jpg   0
>>
>> Gostaria de saber ideias de como filtrar essa informação e especialmente
>> do que fazer para gerar os zeros, se o meu data.frame final que preciso,
>> após a análise da informação de 100 imagens deve ser:
>>
>> image        lca
>> sample_14715 1
>> sample_3101 0
>> sample_5769 0
>> sample_21884 1
>> sample_4163 0
>> sample_20368 0
>> sample_20371 0
>> sample_3370 0
>> sample_4434 0
>> sample_20888 1
>> sample_19295 1
>> sample_22196 0
>> ...
>> sample_20314.jpg 0
>>
>> Antecipadamente agradeço,
>>
>> Alexandre
>>
>> --
>> Alexandre dos Santos
>> Geotechnologies and Spatial Statistics applied to Forest Entomology
>> Instituto Federal de Mato Grosso (IFMT) - Campus Caceres
>> Caixa Postal 244 (PO Box)
>> Avenida dos Ramires, s/n - Vila Real
>> Caceres - MT - CEP 78201-380 (ZIP code)
>> Phone: (+55) 65 99686-6970 / (+55) 65 3221-2674
>> Lattes CV: http://lattes.cnpq.br/1360403201088680
>> OrcID: orcid.org/0000-0001-8232-6722
>> ResearchGate: www.researchgate.net/profile/Alexandre_Santos10
>> Publons: https://publons.com/researcher/3085587/alexandre-dos-santos/
>> --
>>
>> _______________________________________________
>> R-br mailing list
>> R-br em listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200929/c1f06dcf/attachment.html>


Mais detalhes sobre a lista de discussão R-br