[R-br] tidyverse e vroom: Leitura de informações alvo em um arquivo *txt e também computo de informação ausente
ASANTOS
alexandre.santos em cas.ifmt.edu.br
Ter Set 29 16:18:00 -03 2020
Muito obrigado pela ajuda Cid, mas ainda tem alguma informação que está
sendo perdida, pois:
myfile <-
vroom("https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt",
delim = "\t", skip = 5)
myfile <- myfile %>% rename(dados = `folder input=imgval/ and
output=backup/`)
myfile <- myfile %>% filter(str_detect(dados,
c("Start","sample","lca:"))) %>% as.data.frame() %>%
filter(!str_detect(dados, c("Predicted")))
dim(myfile)
[1] 73 1
Eu sei por contagem direta no arquvo result_imgval.txt que tem 52 lca
no output do result_imgval.txt do myfile só aparecem 18.
Seguindo o seu caminho, se eu tento selecionar todos os lca, faço:
myfile <-
vroom("https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt",
delim = "\t", skip = 5)
myfile <- myfile %>% rename(dados = `folder input=imgval/ and
output=backup/`)
myfile <- myfile %>% filter(str_detect(dados, c("lca:"))) %>%
as.data.frame()
dim(myfile)
#[1] 73 1
Mais então eu perco a informação dos arquivos *jpg e todo arranjo que
modifico nos filtros não consigo recuperar a informação. Eu sei que tudo
estará OK, quando no final:
unique(myfile3$sample)
#[1] 100
--
Alexandre dos Santos
Geotechnologies and Spatial Statistics applied to Forest Entomology
Instituto Federal de Mato Grosso (IFMT) - Campus Caceres
Caixa Postal 244 (PO Box)
Avenida dos Ramires, s/n - Vila Real
Caceres - MT - CEP 78201-380 (ZIP code)
Phone: (+55) 65 99686-6970 / (+55) 65 3221-2674
Lattes CV: http://lattes.cnpq.br/1360403201088680
OrcID: orcid.org/0000-0001-8232-6722
ResearchGate: www.researchgate.net/profile/Alexandre_Santos10
Publons: https://publons.com/researcher/3085587/alexandre-dos-santos/
--
Em 29/09/2020 13:41, Cid Póvoas escreveu:
> #Download dos dados
> myfile <-
>
> vroom("https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt
> <https://raw.githubusercontent.com/Leprechault/yolov3ants/master/result_imgval.txt>",
> delim = "\t", skip = 5)
>
> myfile <- myfile %>% rename(dados = `folder input=imgval/ and
> output=backup/`)
>
>
> myfile <- myfile %>% filter(str_detect(dados,
> c("Start","sample","lca:"))) %>% as.data.frame() %>%
> filter(!str_detect(dados, c("Predicted")))
>
>
> dim(myfile)
>
>
> myfile2 <- myfile %>%
> separate(dados, c("Start", "sample"), sep = "/") %>%
> select("sample")
>
>
> myfile2[is.na <http://is.na>(myfile2)] <- 1
>
>
>
> myfile3 <- myfile2 %>% mutate(lca = ifelse(sample == "1", "1", "0"),
> lca = lead(lca, default = "0")) %>% filter(!sample
> == "1")
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20200929/a23dc5a3/attachment.html>
Mais detalhes sobre a lista de discussão R-br