Paulo, <div><br></div><div>É possível no Win, pois é uma tecnologia desenvolvida pela Microsoft [1] (COM).</div><div>Com isto é possível você ter uma interface entre aplicativos, criando uma instância por exemplo do Internet Explorer, Excel, entre vários outros.</div>
<div><br></div><div>[1] <a href="http://en.wikipedia.org/wiki/Component_Object_Model">http://en.wikipedia.org/wiki/Component_Object_Model</a></div><div><br></div><div>Abs<br><br><div class="gmail_quote">2012/8/31 Paulo Nogueira <span dir="ltr"><<a href="mailto:paulons@gmail.com" target="_blank">paulons@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Henrique, não conhecia essa possibilidade via Internet explorer.<div>Bacana, vou testar.</div><div><br></div><div>Em tempo, o que seria "uma instância" e porque só é possível no Windows/Explorer? Alguma questão relacionada à segurança da informação ou coisa do gênero? Apenas curiosidade mesmo.</div>
<div><br></div><div>Abraços,</div><div>Paulo Nogueira Starzynski</div><div><br><div class="gmail_quote">Em 30 de agosto de 2012 23:36, Henrique Dallazuanna <span dir="ltr"><<a href="mailto:wwwhsd@gmail.com" target="_blank">wwwhsd@gmail.com</a>></span> escreveu:<div>
<div class="h5"><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>Paulo, </div><div> </div><div>Esse é um comportamento das páginas que utilizam carregamento dinâmico (Ajax, jQuery, etc..).</div>
<div> </div><div>Uma solução que utilizo neste casos é usar uma instância do Internet Explorer (logo funciona apenas no Windows):</div>
<div> </div><div># Carregando Pacotes<br>library(RDCOMClient)<br>library(XML)</div><div> </div><div># Criando Instancia<br>ieApp <- COMCreate("InternetExplorer.Application")</div><div> </div><div># Acessando a página<br>
ieApp$Navigate("<a href="http://www.skyscanner.com.br/passagens-aereas/saoa/slz/121002/130409/tarifas-aereas-de-sao-paulo-destino-sao-luis-em-outubro-2012-e-abril-2013.html" target="_blank">http://www.skyscanner.com.br/passagens-aereas/saoa/slz/121002/130409/tarifas-aereas-de-sao-paulo-destino-sao-luis-em-outubro-2012-e-abril-2013.html</a>")</div>
<div> </div><div># Código da Página<br>srcHTML <- htmlTreeParse(ieApp$Document()$Body()$OuterHTML(), asText = TRUE, useInternalNodes = TRUE)</div><div> </div><div># Partidas e Chegadas<br>cbind(unlist(xpathApply(srcHTML, "//span[@class='sta sta-dep' and @mode='flight']", xmlValue)),<br>
unlist(xpathApply(srcHTML, "//span[@class='sta sta-arr' and @mode='flight']", xmlValue)))<br><br></div><div class="gmail_quote">2012/8/28 Paulo Nogueira <span dir="ltr"><<a href="mailto:paulons@gmail.com" target="_blank">paulons@gmail.com</a>></span><br>
<blockquote style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid" class="gmail_quote"><div><div>Pessoal, não sei se a lista se presta a esclarecer dúvidas como essa<br>
minha, mas pelo menos estou usando R para resolver os problemas. rs<br>
<br>
Ultimamente tenho trabalhado bastante com determinadas buscas na web<br>
para coletar dados e estruturá-los. Porém, como meus conceitos de web<br>
se restringem ao conhecimento de usuário, e não de desenvolvedor,<br>
acabo tendo alguns problemas.<br>
Vou exemplificar uma das minhas dificuldades com um problema prático:<br>
<br>
Utilizar readlines() e os pacores RCurl, XML, etc, para tratar o<br>
código fonte é algo que já faço até que bem. Mas problemas surgem<br>
quando o conteúdo que eu preciso extrair de informação não vem no<br>
código fonte?<br>
Vejam esse exemplo:<br>
<a href="http://www.skyscanner.com.br/passagens-aereas/saoa/slz/121002/130409/tarifas-aereas-de-sao-paulo-destino-sao-luis-em-outubro-2012-e-abril-2013.html" target="_blank">http://www.skyscanner.com.br/passagens-aereas/saoa/slz/121002/130409/tarifas-aereas-de-sao-paulo-destino-sao-luis-em-outubro-2012-e-abril-2013.html</a><br>
<br>
Após carregar toda a busca, o site SkyScanner exibe os preços<br>
encontrados para o trecho São Paulo - São Luis.<br>
[1] No navegador Firefox ou Chrome, ao clicar em "Exibir Código<br>
Fonte", não aparecem as informações do vôos, apenas o código que<br>
estrutura a página.<br>
[2] Ao clicar em "Inspecionar Elemento" eu consigo analisar o código<br>
fonte do meu interesse.<br>
[3] Ao utilizar readlines passando o a url acima o R importa o código<br>
fonte [1] e não o [2], com as informações de interesse.<br>
<br>
Imagino que isso tenha a ver com as funções de javascript e coisas desse tipo...<br>
Alguém sabe contornar essa situação com o R? Se não, o que devo<br>
estudar para agilizar a busca dessa solução? Estou meio perdido nessa<br>
parte e agradeço ajudas de qualquer tipo. rs<br>
<br>
Peço desculpas se por acaso isso for muito off-topic.<br>
Abraços,<br>
Paulo Nogueira<br></div></div><div>
_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br>
</div></blockquote></div><span><font color="#888888"><br><br clear="all"><br>-- <br>Henrique Dallazuanna<br>Curitiba-Paraná-Brasil<br>25° 25' 40" S 49° 16' 22" O<br>
</font></span><br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br" target="_blank">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div></div></div><br></div>
<br>_______________________________________________<br>
R-br mailing list<br>
<a href="mailto:R-br@listas.c3sl.ufpr.br">R-br@listas.c3sl.ufpr.br</a><br>
<a href="https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br" target="_blank">https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br</a><br>
Leia o guia de postagem (<a href="http://www.leg.ufpr.br/r-br-guia" target="_blank">http://www.leg.ufpr.br/r-br-guia</a>) e forneça código mínimo reproduzível.<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>
Henrique Dallazuanna<br>Curitiba-Paraná-Brasil<br>25° 25' 40" S 49° 16' 22" O<br>
</div>