Desconsidera o outro, tinha um erro

library(vroom)
library(tidyverse)

#Download dos dados
myfile <-
  vroom("https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt", delim = "\t", skip = 5)

myfile <- myfile %>% rename(dados = `folder input=imgval/ and output=backup/`)


myfile <- myfile %>% filter(str_detect(dados, c("lca:","sample"))) %>% as.data.frame()

myfile2 <- myfile %>%
  separate(dados, c("Start", "sample"), sep = "/") %>%
  select("sample") %>% mutate_all(parse_number)


myfile2[is.na(myfile2)] <- 1

myfile3 <- myfile2 %>% mutate(lca = ifelse(sample == "1", "1", "0"),
                              lca = lead(lca, default = "0")) %>% filter(!sample == "1") %>% mutate(sample = paste0("sample_",sample))

myfile3 %>% filter(sample == "sample_5769" | sample =="sample_21884")


tail(myfile3)
View(myfile)

Cid Edson Mendonça Póvoas
Cel: +55 (73) 99151-9565

Engenheiro Agrônomo

Analista de dados 

Técnico em Segurança do Trabalho 

LinkedIn: http://br.linkedin.com/in/cidedson/

Lattes: http://lattes.cnpq.br/2303498368142537




Em ter., 29 de set. de 2020 às 10:57, ASANTOS por (R-br) <r-br@listas.c3sl.ufpr.br> escreveu:
Prezados membros,

Surgiu um novo problema para a extração de informações em um arquivo
*txt quando eu tenho que computar também quando eu não tenho determinada
informação (lca) e preciso considerar isso no meu data.frame final.

Em meu exemplo:

#Pacotes
library(vroom)
library(tidyverse)

#Download dos dados
myfile <-
vroom("https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt")

As informações alvo são:

1) No caso quando ocorreu o evento lca o padrão das linhas é:

imgval/sample_21915.jpg: Predicted in 7337.147000 milli-seconds.
lca: 65.648048%    left_x:    0    top_y:   18    width:   13 height:   27
lca: 45.191948%    left_x:   71    top_y:   31    width:    7 height:   12
End

Então meu data.frame precisa receber a informação:

image             lca
sample_21915.jpg  1
sample_21915.jpg  1

2) Quando não ocorrer o evento lca, o padrão das linhas será diferente:

Start processing imgval/sample_3908.jpg
imgval/sample_3908.jpg: Predicted in 7282.433000 milli-seconds.
End

E nesse caso o meu data.frame precisa receber a seguinte informação:
image             lca
sample_3908.jpg   0

Gostaria de saber ideias de como filtrar essa informação e especialmente
do que fazer para gerar os zeros, se o meu data.frame final que preciso,
após a análise da informação de 100 imagens deve ser:

image        lca
sample_14715 1
sample_3101 0
sample_5769 0
sample_21884 1
sample_4163 0
sample_20368 0
sample_20371 0
sample_3370 0
sample_4434 0
sample_20888 1
sample_19295 1
sample_22196 0
...
sample_20314.jpg 0

Antecipadamente agradeço,

Alexandre

--
Alexandre dos Santos
Geotechnologies and Spatial Statistics applied to Forest Entomology
Instituto Federal de Mato Grosso (IFMT) - Campus Caceres
Caixa Postal 244 (PO Box)
Avenida dos Ramires, s/n - Vila Real
Caceres - MT - CEP 78201-380 (ZIP code)
Phone: (+55) 65 99686-6970 / (+55) 65 3221-2674
Lattes CV: http://lattes.cnpq.br/1360403201088680
OrcID: orcid.org/0000-0001-8232-6722
ResearchGate: www.researchgate.net/profile/Alexandre_Santos10
Publons: https://publons.com/researcher/3085587/alexandre-dos-santos/
--

_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.