[R-br] tidyverse e vroom: Leitura de informações alvo em um arquivo *txt e também computo de informação ausente

ASANTOS alexandre.santos em cas.ifmt.edu.br
Ter Set 29 16:18:00 -03 2020


Muito obrigado pela ajuda Cid, mas ainda tem alguma informação que está 
sendo perdida, pois:

myfile <-
vroom("https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt", 
delim = "\t", skip = 5)

myfile <- myfile %>% rename(dados = `folder input=imgval/ and 
output=backup/`)


myfile <- myfile %>% filter(str_detect(dados, 
c("Start","sample","lca:"))) %>% as.data.frame() %>% 
filter(!str_detect(dados, c("Predicted")))


dim(myfile)
[1] 73  1

Eu sei por contagem direta no arquvo result_imgval.txt  que tem 52 lca 
no output do result_imgval.txt do myfile só aparecem 18.

Seguindo o seu caminho, se eu tento selecionar todos os lca, faço:

myfile <-
vroom("https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt", 
delim = "\t", skip = 5)

myfile <- myfile %>% rename(dados = `folder input=imgval/ and 
output=backup/`)
myfile <- myfile %>% filter(str_detect(dados, c("lca:"))) %>% 
as.data.frame()

dim(myfile)
#[1] 73  1

Mais então eu perco a informação dos arquivos *jpg e todo arranjo que 
modifico nos filtros não consigo recuperar a informação. Eu sei que tudo 
estará OK, quando no final:

unique(myfile3$sample)
#[1] 100


-- 
Alexandre dos Santos
Geotechnologies and Spatial Statistics applied to Forest Entomology
Instituto Federal de Mato Grosso (IFMT) - Campus Caceres
Caixa Postal 244 (PO Box)
Avenida dos Ramires, s/n - Vila Real
Caceres - MT - CEP 78201-380 (ZIP code)
Phone: (+55) 65 99686-6970 / (+55) 65 3221-2674
Lattes CV: http://lattes.cnpq.br/1360403201088680
OrcID: orcid.org/0000-0001-8232-6722
ResearchGate: www.researchgate.net/profile/Alexandre_Santos10
Publons: https://publons.com/researcher/3085587/alexandre-dos-santos/
--

Em 29/09/2020 13:41, Cid Póvoas escreveu:
> #Download dos dados
> myfile <-
>   
> vroom("https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt 
> <https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt>", 
> delim = "\t", skip = 5)
>
> myfile <- myfile %>% rename(dados = `folder input=imgval/ and 
> output=backup/`)
>
>
> myfile <- myfile %>% filter(str_detect(dados, 
> c("Start","sample","lca:"))) %>% as.data.frame() %>% 
> filter(!str_detect(dados, c("Predicted")))
>
>
> dim(myfile)
>
>
> myfile2 <- myfile %>%
>   separate(dados, c("Start", "sample"), sep = "/") %>%
>   select("sample")
>
>
> myfile2[is.na <http://is.na>(myfile2)] <- 1
>
>
>
> myfile3 <- myfile2 %>% mutate(lca = ifelse(sample == "1", "1", "0"),
>                    lca = lead(lca, default = "0")) %>% filter(!sample 
> == "1") 
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200929/a23dc5a3/attachment.html>


Mais detalhes sobre a lista de discussão R-br