[R-br] Conversão de alguns elementos de texto em variáveis de um data frame com o pacote tidyverse

ASANTOS alexandre.santos em cas.ifmt.edu.br
Qui Nov 12 10:44:25 -02 2020


Bom dia Membros,

Eu gostaria de realizar a manipulação de um *txt para uso de algumas 
informações como variáveis em um data frame a ser criado. Em meu exemplo:

#Pacote
library(tidyverse)

# Leitura do arquivo
myfile<-read_lines("https://raw.githubusercontent.com/Leprechault/trash/main/result_imgall_f_test.txt")

# Visualização parcial da informação contida no *txt
# [1] "Start processing imgall/sample_59178.jpg"
# [2] "imgall/sample_59178.jpg: Predicted in 7337.640000 milli-seconds."
# [3] "End"
# [4] "Start processing imgall/sample_34773.jpg"
# [5] "imgall/sample_34773.jpg: Predicted in 7376.639000 milli-seconds."
# [6] "End"
# [7] "Start processing imgall/sample_24908.jpg"
# [8] "imgall/sample_24908.jpg: Predicted in 7412.858000 milli-seconds."
# [9] "End"
#[10] "Start processing imgall/sample_18922.jpg"
#[11] "imgall/sample_18922.jpg: Predicted in 7424.998000 milli-seconds."
#[12] "End"
#[13] "Start processing imgall/sample_31653.jpg"
#[14] "imgall/sample_31653.jpg: Predicted in 7311.578000 milli-seconds."
#[15] "lca: 90.681282%\tleft_x:   18\ttop_y:   33\twidth: 18\theight:   30"
#[16] "End"
#[17] "Start processing imgall/sample_17341.jpg"
#[18] "imgall/sample_17341.jpg: Predicted in 7418.365000 milli-seconds."
#[19] "End"
#[20] "Start processing imgall/sample_11440.jpg"
#[21] "imgall/sample_11440.jpg: Predicted in 7365.160000 milli-seconds."
#[22] "lca: 66.567978%\tleft_x:   54\ttop_y:   34\twidth: 18\theight:   23"
#[23] "lca: 33.219677%\tleft_x:   74\ttop_y:   15\twidth: 23\theight:   22"
#[24] "End"


#Como output final eu gostaria de ter o seguinte dataframe:

#[1] left top width height obj_id        lca
#[2] 54   34  18    23     sample_11440  66.567978
#[3] 74   15  23    22     sample_11440  33.219677
#[4]  1   38  19    28     sample_40452  66.658073

#Estou tentando algo com o pacote tidyverse, mas sem sucesso e com muita 
dificuldade em isolar o que esta após "imgall/"  e recuperar o que está 
contido após "\t" :

names_col <- c("left", "top", "width", "height", "obj_id","lca")

mydf <- myfile %>%
   str_subset("lca$") %>%
   enframe(name = NULL) %>%
   separate(col = value, into = names_col, sep = "[\t]")
mydf
# A tibble: 0 x 6
# ... with 6 variables: left <dbl>, top <dbl>, width <dbl>, height 
<dbl>, obj_id <dbl>, lca <dbl


#Dicas e/ou sugestões. Obrigado!

-- 
Alexandre dos Santos
Geotechnologies and Spatial Statistics applied to Forest Entomology
Instituto Federal de Mato Grosso (IFMT) - Campus Caceres
Caixa Postal 244 (PO Box)
Avenida dos Ramires, s/n - Vila Real
Caceres - MT - CEP 78201-380 (ZIP code)
Phone: (+55) 65 99686-6970 / (+55) 65 3221-2674
Lattes CV: http://lattes.cnpq.br/1360403201088680
OrcID: orcid.org/0000-0001-8232-6722
ResearchGate: www.researchgate.net/profile/Alexandre_Santos10
Publons: https://publons.com/researcher/3085587/alexandre-dos-santos/
--



Mais detalhes sobre a lista de discussão R-br