
Muito Obrigado ! Att Téo Calvo. Em 02-10-2013 20:54, Alisson Lucrecio escreveu:
Caro Teodoro, Boa noite.
Veja esse link http://r-br.2285057.n4.nabble.com/R-br-r-baixando-dados-inmet-td4660459.html
Exite outras maneiras, mas você precisa saber python, assim segue outro exemplos.
from ghost import Ghost from bs4 import BeautifulSoup as bs import re import time import regex from bs4 import BeautifulSoup import time ghost = Ghost()
def load_account(): ghost.open("http://www.inmet.gov.br/projetos/rede/pesquisa/inicio.php") ghost.fill("form", {"mCod":"alissonluc@yahoo.com.br", "mSenha":"bv1k0wgj"}) ghost.set_field_value("input.botao", " Acessar ") ghost.click("input.botao", expect_loading=True)
load_account()
ghost.open("http://www.inmet.gov.br/projetos/rede/pesquisa/form_mapas_c_horario.php")
ghost.fill("form", {"mRelDtInicio":"01/07/2012", "mRelDtFim":"01/08/2012", "mRelEstado":"MG", "mRelRegiao":"4", "mOpcaoAtrib1":"0", "mOpcaoAtrib2":"0", "mOpcaoAtrib5":"0", "mOpcaoAtrib6":"0", "mOpcaoAtrib8":"0", "mOpcaoAtrib9":"0", "mOpcaoAtrib12":"0"})
ghost.evaluate("document.frmCad.submit()", expect_loading=True)
ghost.capture_to("/Users/Alisson/Desktop/lixo.png")
soup = BeautifulSoup(ghost.content)
urls = regex.findall(r"http://www.inmet.gov.br/projetos/rede/pesquisa/gera_serie_txt.php?[^ ]*", ghost.content)
tables = {} errors = [] for url in urls: print url try: ghost.open(url) soup = BeautifulSoup(ghost.content) except: errors.append([url]) next try: cidade = regex.findall(r"Esta.*?o\s*?:\s([A-Z|\s]*-\s[A-Z]*)", soup.pre.get_text())[0] table = regex.findall(r"(Estacao;Data;Hora((.|\n)*))", soup.pre.get_text())[0][0] tables[cidade] = table time.sleep(2) except IndexError: errors.append([soup.pre]) next
for cidade, tabela in tables.iteritems(): f = open("/Users/Alisson/Desktop/" + cidade + ".txt", "w") f.write(table) f.close()
Abracos Alisson Lucrécio da Costa ------------------------------------------------------------------------ *From:* Teodoro Calvo <teocalvo2@gmail.com> *To:* r-br@listas.c3sl.ufpr.br *Sent:* Wednesday, October 2, 2013 8:43 PM *Subject:* [R-br] Usar R p/ importar informações da web
Olá, boa noite.
Como posso extrair uma parte de um texto de determinado site, utilizando o R ? É possível ? Existe algum material ?
Obrigado desde já.
Att Téo Calvo.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br <mailto:R-br@listas.c3sl.ufpr.br> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.