Saudações a todos!<br><br>Preciso aprender como tratar HTML no R para identificar alguns padrões na estrutura do código, extrair e guardar determinadas informações.<br>Alguém costuma fazer algo do tipo e poderia informar os pacotes mais indicados para esse trabalho?<br>
<br>Terei de acessar cerca de 300 páginas semanalmente, e extrais alguns parâmetros.<br>O HTML abaixo é um trecho do código que terei de lidar, e preciso extrair as informações destacadas.<br><br>Alguém pode me sugerir o início do caminho das pedras, como algum pacote e/ou funções específicas?<br>
<br><div id="individual-completo"> <br> <div class="title-box"><br> <img src="<a href="http://address.jpg" target="_blank">http://address.jpg</a>" gestor="foto" class="foto" /><br>
<div><br> <div class="colright"><br> <span><span style="background-color: rgb(255, 255, 0);">Participações: 22</span></span><br> <a href="<a href="http://players" target="_blank">http://players</a>" class="visite">Saiba Mais</a><br>
</div><br> <h2><span style="background-color: rgb(255, 255, 0);">NomeElemento</span></h2><br> <p class="tflag"><img src="<a href="http://team" target="_blank">http://team</a>" /> <a href="/refteam"><span style="background-color: rgb(255, 255, 0);">NomeGrupo</span></a></p><br>
<p><span style="background-color: rgb(255, 255, 0);">NomeFunção</span></p><br> </div><br> </div><br> <div class="content-box"><br> <h2>Desempenho completo</h2><br>
<table cellspacing="0" cellpadding="0"><br> <tbody><br><br> <tr><br> <th><span style="background-color: rgb(255, 255, 0);">Parâmetro1</span></th><br>
<td><span gestor="param1"><span style="background-color: rgb(255, 255, 0);">2</span></span></td><br> </tr><br> <tr class="divisor"><br> <td colspan="2"> </td><br>
</tr><br> <br> <tr><br> <th><span style="background-color: rgb(255, 255, 0);">Parâmetro2</span></th><br> <td><span gestor="param2"><span style="background-color: rgb(255, 255, 0);">63</span></span></td><br>
</tr><br><br> <tr class="odd"><br> <th><span style="background-color: rgb(255, 255, 0);">Parâmetro3</span></th><br> <td><span gestor="param3"><span style="background-color: rgb(255, 255, 0);">87</span></span></td><br>
</tr><br> <tr class="divisor"><br> <td colspan="2"> </td><br> </tr><br> <tr class="destaque"><br><br> </tbody><br>
</table><br> </div><br></div><br><br>Obrigado<br>