[R-br] tidyverse e vroom: Leitura de informações alvo em um arquivo *txt e também computo de informação ausente

Cid Póvoas cidedson em gmail.com
Ter Set 29 14:41:17 -03 2020


library(vroom)
library(tidyverse)

#Download dos dados
myfile <-
  vroom("
https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt",
delim = "\t", skip = 5)

myfile <- myfile %>% rename(dados = `folder input=imgval/ and
output=backup/`)


myfile <- myfile %>% filter(str_detect(dados, c("Start","sample","lca:")))
%>% as.data.frame() %>% filter(!str_detect(dados, c("Predicted")))


dim(myfile)


myfile2 <- myfile %>%
  separate(dados, c("Start", "sample"), sep = "/") %>%
  select("sample")


myfile2[is.na(myfile2)] <- 1



myfile3 <- myfile2 %>% mutate(lca = ifelse(sample == "1", "1", "0"),
                   lca = lead(lca, default = "0")) %>% filter(!sample ==
"1")



*Cid Edson Mendonça Póvoas **Cel: +55 (73) 99151-9565*

*Engenheiro **Agrônomo*

*Analista de dados *

*Técnico em Segurança do Trabalho *

*LinkedIn: **http://br.linkedin.com/in/cidedson/
<http://br.linkedin.com/in/cidedson/>*

*Lattes: **http://lattes.cnpq.br/2303498368142537
<http://lattes.cnpq.br/2303498368142537>*




Em ter., 29 de set. de 2020 às 10:57, ASANTOS por (R-br) <
r-br em listas.c3sl.ufpr.br> escreveu:

> Prezados membros,
>
> Surgiu um novo problema para a extração de informações em um arquivo
> *txt quando eu tenho que computar também quando eu não tenho determinada
> informação (lca) e preciso considerar isso no meu data.frame final.
>
> Em meu exemplo:
>
> #Pacotes
> library(vroom)
> library(tidyverse)
>
> #Download dos dados
> myfile <-
> vroom("
> https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt
> ")
>
> As informações alvo são:
>
> 1) No caso quando ocorreu o evento lca o padrão das linhas é:
>
> imgval/sample_21915.jpg: Predicted in 7337.147000 milli-seconds.
> lca: 65.648048%    left_x:    0    top_y:   18    width:   13 height:   27
> lca: 45.191948%    left_x:   71    top_y:   31    width:    7 height:   12
> End
>
> Então meu data.frame precisa receber a informação:
>
> image             lca
> sample_21915.jpg  1
> sample_21915.jpg  1
>
> 2) Quando não ocorrer o evento lca, o padrão das linhas será diferente:
>
> Start processing imgval/sample_3908.jpg
> imgval/sample_3908.jpg: Predicted in 7282.433000 milli-seconds.
> End
>
> E nesse caso o meu data.frame precisa receber a seguinte informação:
> image             lca
> sample_3908.jpg   0
>
> Gostaria de saber ideias de como filtrar essa informação e especialmente
> do que fazer para gerar os zeros, se o meu data.frame final que preciso,
> após a análise da informação de 100 imagens deve ser:
>
> image        lca
> sample_14715 1
> sample_3101 0
> sample_5769 0
> sample_21884 1
> sample_4163 0
> sample_20368 0
> sample_20371 0
> sample_3370 0
> sample_4434 0
> sample_20888 1
> sample_19295 1
> sample_22196 0
> ...
> sample_20314.jpg 0
>
> Antecipadamente agradeço,
>
> Alexandre
>
> --
> Alexandre dos Santos
> Geotechnologies and Spatial Statistics applied to Forest Entomology
> Instituto Federal de Mato Grosso (IFMT) - Campus Caceres
> Caixa Postal 244 (PO Box)
> Avenida dos Ramires, s/n - Vila Real
> Caceres - MT - CEP 78201-380 (ZIP code)
> Phone: (+55) 65 99686-6970 / (+55) 65 3221-2674
> Lattes CV: http://lattes.cnpq.br/1360403201088680
> OrcID: orcid.org/0000-0001-8232-6722
> ResearchGate: www.researchgate.net/profile/Alexandre_Santos10
> Publons: https://publons.com/researcher/3085587/alexandre-dos-santos/
> --
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200929/39e9983c/attachment.html>


Mais detalhes sobre a lista de discussão R-br