[R-br] Selecionar e copiar conteúdo de página usando apenas o terminal linux
Éder Comunello
comunello.eder em gmail.com
Sexta Maio 2 10:49:46 BRT 2014
Senhores, bom dia!
Melhorei o código anterior e agora já está capturando os dados em um objeto
do tipo lista.
Falta passar de lista pra data.frame... Ainda não fiz porque os elementos
da lista estão com tamanhos diferentes e tenho que pensar numa estratégia.
Se tiverem interesse e puderem finalizar, fiquem à vontade.
### <code r>
setwd("C:/LAB/RBAS/dataMining")
sapply(c("RCurl", "XML", "RJSONIO"), require, character.only=T)
html.ori <- getURL("http://www.whoscored.com/Teams/1232")
html.lin <- readLines(tcon <- textConnection(html.ori)); close(tcon)
# pagetree <- htmlTreeParse(html.lin, error=function(...){},
useInternalNodes = TRUE)
sel <- grep("DataStore.prime\\(\\'stage-player-stat\\'", html.lin)
data <- html.lin[sel]
djson <- gsub("^.*DataStore.*\\[(.*)\\]);", "\\[\\1\\]", data)
res <- fromJSON(djson)
res
### <code>
Éder Comunello <c <comunello.eder em gmail.com>omunello.eder em gmail.com>
Dourados, MS - [22 16.5'S, 54 49'W]
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20140502/17a3f272/attachment.html>
Mais detalhes sobre a lista de discussão R-br