[R-br] Redes de cocitação
Jakson Alves de Aquino
jalvesaq em gmail.com
Sábado Fevereiro 23 17:06:22 BRT 2013
2013/2/22 Roney Fraga <roneyfraga em gmail.com>:
> Pretendo fazer uma rede de citação e co-citação, a mesma terá mais
> de 150000 nós ou (vértices, indivíduos, etc.). Estou buscando as
> informações no Web of Science. Para exemplificar fiz uma busca de 50
> artigos, e exportei para o seguinte endereço:
> https://docs.google.com/document/d/14w8lQgAwZsmwZ-xGbV5vy4Z3lzvIkFa6Bj44GHiapSw/edit
> minha dificuldade é deixar esses dados da seguinte forma,
> https://docs.google.com/spreadsheet/ccc?key=0AnxuqxFeBpZodG9waVNPYmdNV0V5ZWQ4TjNPM19CWnc
> uma matriz quadrada relacionando todos os atores. Atualmente utilizo
> o software VantagePoint para importar esses dados e criar uma matriz
> de adjacência. Considerando as várias dificuldades de uso do
> VantagePoint, preço, velocidade de processamento, acesso, etc, busco
> uma alternativa para importar os dados do web of science e criar uma
> matriz de adjacência pelo R, ou outro software acessível.
> primeira pergunta: existe alguma função do R para importar esses
> dados (exportados do web of science) e criar uma matriz de
> adjacência?
> segunda pergunta: é possível criar uma rede entre 150 e 250 mil nós
> usando o R?
> terceira pergunta: qual pacote (igraph, sna, statnet) lida melhor
> com redes grandes?
O igraph parece ser a melhor opção para redes muito grandes. E não é
necessário criar uma matriz. Uma lista de adjacência resolve. Exemplo:
library(igraph)
lista <- rbind(c("Autor1", "Autor2"),
c("Autor1", "Autor3"),
c("Autor1", "Autor4"),
c("Autor2", "Autor3"),
c("Autor2", "Autor4"),
c("Autor2", "Autor5"),
c("Autor3", "Autor1"),
c("Autor3", "Autor2"),
c("Autor3", "Autor4"),
c("Autor4", "Autor1"),
c("Autor4", "Autor2"),
c("Autor4", "Autor3"))
g <- graph.edgelist(lista)
plot(g)
--
Jakson Alves de Aquino
Universidade Federal do Ceará
Departamento de Ciências Sociais
www.lepem.ufc.br/aquino.php
Mais detalhes sobre a lista de discussão R-br