[R-br] Gráfico nada fácil

Roney Fraga Souza roneyfraga em gmail.com
Quarta Maio 14 18:24:06 BRT 2014


Caros,

Tenho intuito de reproduzir esse gráfico:
https://dl.dropboxusercontent.com/u/61883020/shibata.fig7.pdf

Basicamente o que temos é a contribuição dos elementos de um grupo para a formação de outro grupo no ano t+1. Os círculos são formados por grupos de artigos científicos, quanto maior o número de artigos em um grupo, maior o círculo. As setas indicam quantos artigos passaram a constar no ano t+1 no grupo seguinte. 

Vou tentar ser mais claro com um exemplo. Fiz uma busca e baixei todos os artigos científicos sobre R entre os anos de 1996 e 2004, criei uma rede de citação com esses artigos, classificando-os por ano, artigos de 1996, artigos de 1996+1997, artigos de 1996+1997+1998, até chegar nos artigos de 1994 até 2004. Em seguida apliquei um método de clusterização para cada ano, de 1996 a 2004. No ano de 1996 existe dois grupo, para o primeiro grupo, vi que 28% de seus artigos foram parar em um determinado grupo no ano de 1997, e 58% de seus artigos foram parar em outro grupo também no ano de 1997. O outro grupo do ano de 1996 teve 84% de seus artigos em um único grupo no ano de 1997.

Qualquer sugestão sobre por onde devo começar a estudar para fazer um gráfico como esse é bem vinda.

Com ajuda de Éder Columello organizei os dados com as informações necessárias para fazer esse gráfico, segue link:
https://dl.dropboxusercontent.com/u/61883020/fig7.RData

> head(df)
    label qtde tm1.grupo tm1.ano t.grupo t.ano tm1.total.grupo tm1.total.ano t.total.grupo t.total.ano
135   1-1    2         1    1994       1  1995              45           186            45         262
136   1-2   16         1    1994       2  1995              45           186            44         262
137   1-3    2         1    1994       3  1995              45           186            41         262
138   1-4    2         1    1994       4  1995              45           186            16         262
139   1-6    1         1    1994       6  1995              45           186            48         262
140   1-9    2         1    1994       9  1995              45           186             2         262

As variáveis que começam com ‘tm1’ indicam que pertencem ao ano t-1, já ao variáveis que começam com ’t’, pertencem ao presente ano.

O sentido é (primeira linha):
2 artigos (qtde) que faziam parte do grupo 1 (tm1.grupo) no ano 1994 (tm1.ano) passaram a fazer parte do grupo 1 (t.grupo) no ano de 1995 (t.ano). Ainda na primeira linha, o grupo 1 do ano de 1994 tinha 45 artigos (tm1.total.grupo), enquanto todo o ano de 1994 tinha 186 artigos. Já em 1995 o grupo 1 tinha também 45 artigos, e o total de artigos para esse ano era de 262.

Att
Roney


Mais detalhes sobre a lista de discussão R-br