[R-br] Conversão de alguns elementos de texto em variáveis de um data frame com o pacote tidyverse
ASANTOS
alexandre.santos em cas.ifmt.edu.br
Qui Nov 12 10:44:25 -02 2020
Bom dia Membros,
Eu gostaria de realizar a manipulação de um *txt para uso de algumas
informações como variáveis em um data frame a ser criado. Em meu exemplo:
#Pacote
library(tidyverse)
# Leitura do arquivo
myfile<-read_lines("https://raw.githubusercontent.com/Leprechault/trash/main/result_imgall_f_test.txt")
# Visualização parcial da informação contida no *txt
# [1] "Start processing imgall/sample_59178.jpg"
# [2] "imgall/sample_59178.jpg: Predicted in 7337.640000 milli-seconds."
# [3] "End"
# [4] "Start processing imgall/sample_34773.jpg"
# [5] "imgall/sample_34773.jpg: Predicted in 7376.639000 milli-seconds."
# [6] "End"
# [7] "Start processing imgall/sample_24908.jpg"
# [8] "imgall/sample_24908.jpg: Predicted in 7412.858000 milli-seconds."
# [9] "End"
#[10] "Start processing imgall/sample_18922.jpg"
#[11] "imgall/sample_18922.jpg: Predicted in 7424.998000 milli-seconds."
#[12] "End"
#[13] "Start processing imgall/sample_31653.jpg"
#[14] "imgall/sample_31653.jpg: Predicted in 7311.578000 milli-seconds."
#[15] "lca: 90.681282%\tleft_x: 18\ttop_y: 33\twidth: 18\theight: 30"
#[16] "End"
#[17] "Start processing imgall/sample_17341.jpg"
#[18] "imgall/sample_17341.jpg: Predicted in 7418.365000 milli-seconds."
#[19] "End"
#[20] "Start processing imgall/sample_11440.jpg"
#[21] "imgall/sample_11440.jpg: Predicted in 7365.160000 milli-seconds."
#[22] "lca: 66.567978%\tleft_x: 54\ttop_y: 34\twidth: 18\theight: 23"
#[23] "lca: 33.219677%\tleft_x: 74\ttop_y: 15\twidth: 23\theight: 22"
#[24] "End"
#Como output final eu gostaria de ter o seguinte dataframe:
#[1] left top width height obj_id lca
#[2] 54 34 18 23 sample_11440 66.567978
#[3] 74 15 23 22 sample_11440 33.219677
#[4] 1 38 19 28 sample_40452 66.658073
#Estou tentando algo com o pacote tidyverse, mas sem sucesso e com muita
dificuldade em isolar o que esta após "imgall/" e recuperar o que está
contido após "\t" :
names_col <- c("left", "top", "width", "height", "obj_id","lca")
mydf <- myfile %>%
str_subset("lca$") %>%
enframe(name = NULL) %>%
separate(col = value, into = names_col, sep = "[\t]")
mydf
# A tibble: 0 x 6
# ... with 6 variables: left <dbl>, top <dbl>, width <dbl>, height
<dbl>, obj_id <dbl>, lca <dbl
#Dicas e/ou sugestões. Obrigado!
--
Alexandre dos Santos
Geotechnologies and Spatial Statistics applied to Forest Entomology
Instituto Federal de Mato Grosso (IFMT) - Campus Caceres
Caixa Postal 244 (PO Box)
Avenida dos Ramires, s/n - Vila Real
Caceres - MT - CEP 78201-380 (ZIP code)
Phone: (+55) 65 99686-6970 / (+55) 65 3221-2674
Lattes CV: http://lattes.cnpq.br/1360403201088680
OrcID: orcid.org/0000-0001-8232-6722
ResearchGate: www.researchgate.net/profile/Alexandre_Santos10
Publons: https://publons.com/researcher/3085587/alexandre-dos-santos/
--
Mais detalhes sobre a lista de discussão R-br