[R-br] Usar R p/ importar informações da web

Teodoro Calvo teocalvo2 em gmail.com
Quinta Outubro 3 13:40:51 BRT 2013


Muito Obrigado !

Att Téo Calvo.

Em 02-10-2013 20:54, Alisson Lucrecio escreveu:
> Caro Teodoro,
> Boa noite.
>
> Veja esse link 
> http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html
>
> Exite outras maneiras, mas você precisa saber python, assim segue 
> outro exemplos.
>
> from ghost import Ghost
> from bs4 import BeautifulSoup as bs
> import re
> import time
> import regex
> from bs4 import BeautifulSoup
> import time
> ghost = Ghost()
>
> def load_account():
> ghost.open("http://www.inmet.gov.br/projetos/rede/pesquisa/inicio.php")
> ghost.fill("form", {"mCod":"alissonluc em yahoo.com.br", 
> "mSenha":"bv1k0wgj"})
> ghost.set_field_value("input.botao", " Acessar ")
> ghost.click("input.botao", expect_loading=True)
>
> load_account()
>
> ghost.open("http://www.inmet.gov.br/projetos/rede/pesquisa/form_mapas_c_horario.php")
>
> ghost.fill("form", {"mRelDtInicio":"01/07/2012",
> "mRelDtFim":"01/08/2012",
> "mRelEstado":"MG",
> "mRelRegiao":"4",
> "mOpcaoAtrib1":"0",
> "mOpcaoAtrib2":"0",
> "mOpcaoAtrib5":"0",
> "mOpcaoAtrib6":"0",
> "mOpcaoAtrib8":"0",
> "mOpcaoAtrib9":"0",
> "mOpcaoAtrib12":"0"})
>
> ghost.evaluate("document.frmCad.submit()", expect_loading=True)
>
> ghost.capture_to("/Users/Alisson/Desktop/lixo.png")
>
> soup = BeautifulSoup(ghost.content)
>
> urls = 
> regex.findall(r"http://www.inmet.gov.br/projetos/rede/pesquisa/gera_serie_txt.php?[^ 
> ]*", ghost.content)
>
> tables = {}
> errors = []
> for url in urls:
>     print url
>     try:
> ghost.open(url)
>         soup = BeautifulSoup(ghost.content)
>     except:
> errors.append([url])
>         next
>     try:
>         cidade = regex.findall(r"Esta.*?o\s*?:\s([A-Z|\s]*-\s[A-Z]*)", 
> soup.pre.get_text())[0]
>         table = regex.findall(r"(Estacao;Data;Hora((.|\n)*))", 
> soup.pre.get_text())[0][0]
> tables[cidade] = table
> time.sleep(2)
>     except IndexError:
> errors.append([soup.pre])
>         next
>
>
> for cidade, tabela in tables.iteritems():
>     f = open("/Users/Alisson/Desktop/" + cidade + ".txt", "w")
>     f.write(table)
>     f.close()
>
> Abracos
> Alisson Lucrécio da Costa
> ------------------------------------------------------------------------
> *From:* Teodoro Calvo <teocalvo2 em gmail.com>
> *To:* r-br em listas.c3sl.ufpr.br
> *Sent:* Wednesday, October 2, 2013 8:43 PM
> *Subject:* [R-br] Usar R p/ importar informações da web
>
> Olá, boa noite.
>
> Como posso extrair uma parte de um texto de determinado site, utilizando
> o R ?
> É possível ? Existe algum material ?
>
> Obrigado desde já.
>
> Att Téo Calvo.
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br <mailto:R-br em listas.c3sl.ufpr.br>
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça 
> código mínimo reproduzível.
>
>
>
>
> _______________________________________________
> R-br mailing list
> R-br em listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://listas.inf.ufpr.br/pipermail/r-br/attachments/20131003/af1e367f/attachment.html>


Mais detalhes sobre a lista de discussão R-br