<div dir="ltr"><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Você pode pegar dados do ipeadata (<a href="http://www.ipeadata.gov.br/">http://www.ipeadata.gov.br/</a>) que são socioeconômicos. Outras fontes de dados são de esportes como a maratona de Paris (<a href="http://www.20kmparis.com/web/resultats_precedents.asp">http://www.20kmparis.com/web/resultats_precedents.asp</a>) e triathlon (<a href="http://www.ipitos.com/accueil/">http://www.ipitos.com/accueil/</a>). As de esportes são interessantes para explorar manuseio de datas (tempo de prova), agrupamento em classe de idade dos atetlas, relações entre tempo de prova, idade, sexo. As de triathlon são interessantes para fazer visualizações multivariadas (nadar, correr, pedalar) e condicionais (à idade, ao sexo) com, por exemplo, a lattice. Além disso, você pode pegar dados para fazer mapas do site do ibge. Eu prefiro fazer análise com esses dados maiores (n>10000) porque acredito que reflitam mais a realidade dos conjuntos de dados do hoje em dia (grande dimensão).<br>
<br>À disposição.<br>Walmes.<br></div></div>