Dessa discussão no Facebook da Manuela surgiu a idéia de fazer um post de introdução sobre o Gephi. Espero que o resultado seja útil a quem tiver interesse.
Gephi: “Um photoshop de gráfos”
“Gephi é uma plataforma interativa de visualização e exploração de todos os tipos de redes e sistemas complexos, grafos dinâmicos e hierárquicos.”
É um software escrito em Java e roda tanto no Windows, Linux e Mac. Você pode fazer o download do Gephi 0.8 beta aqui.
As principais características do Gephi: Visualização em tempo real, Layout, Métricas, Análise de redes dinâmicas, Criação de cartografias, Clusterização e gráfos hierárquicos, Filtros dinâmicos, Centrado no usuário, Modular e Possui um centro de plugins.
Um pequeno tutorial
Este post pretende ser apenas uma referência inicial para quem está querendo explorar essa poderosa ferramenta de análise de redes.
O que é um grafo?
“Um grafo G é definido como sendo um par ordenado (V,E), onde V é um conjunto e E uma relação binária sobre V. Os elementos de V são denominados de vértices ou pontos ou nós, e os pares ordenados de E são denominados de arestas ou linhas ou arcos do grafo.”
“Um grafo pode ser dirigido ou não dirigido. Um grafo é dito dirigido se suas arestas possuem orientação.”
RABUSKE, Márcia. Introdução à teoria dos grafos. Florianópolis: UFSC, 1992.
No Gephi, nós são nodes e arestas são edges.
Gephi na prática
O primeiro passo é criar um novo projeto. Cumprido esse passo, o Gephi te mostra 3 telas principais: Visão Geral (Overview), Laboratório de Dados (Data Laboratory) e Visualização (Preview). Você pode acessar uma descrição detalhada de toda a Interface Gráfica do Usuário (GUI) aqui. Recomendo sempre começar seu projeto pelo Laboratório de dados:
Laboratório de Dados
Esta área é composta por duas tabelas (Nós (Nodes) e Arestas (Edges)), sendo a de arestas relacional.
Inicie configurando todos os campos de atributos que irão descrever os seus itens de pesquisa. Esses atributos são importantes para gerar estatísticas posteriormente, por isso é fundamental cuidado nesse momento. O Gephi permite o uso de todos os principais formatos de dados para a descrição do campo, mas se não souber o que usar, use “string” para caracteres e “integer” para números. Para criar um gráfo dinâmico, crie uma coluna tipo “integer” (por exemplo, ano), preencha alguns valores, clique em “mesclar colunas”, selecione a coluna criada e como estratégia de mesclagem, escolha “Criar intervalo de tempo”. Será criado uma coluna “TimeInterval” permitindo você utilizar filtros temporais da aba “Visão Geral”. Importante lembrar que a cada cálculo rodado, os resultados são adicionados como campos na tabela.
A aba Arestas já vem praticamente configurada, e é preenchida relacionando os registros adicionados na tabela Nós através de seus IDs. Existem dois campos desta tabela que merecem atenção: Label e Weight. O Label é o nome dado ao relacionamento, que podem dar atributos semânticos para sua rede. E o Weight (Peso) é o valor dado ao relaciomento, esse valor será utilizado nos cálculos no Overview e na representação visual do Gráfo.
Visão Geral
Consulte o GUI Description
Farei um post só para tentar deixar mais claro os cálculos das estatísticas.
Visualização
Consulte o GUI Description
Finalizando
Tem alguma dúvida? Consulte se alguém já postou no fórum, se não, não deixe de postar. Lembrando também uma frase comum em fórums de discussão internacionais: “Google is your friend”.
Coleta de dados
Algumas maneiras de coletar dados:
Twitter: Use o NodeXL.
Facebook: Use o Netvizz.
HTTP ou Rede de links: O Gephi tem um plugin: HTTP Graph. Ou uma melhor e mais trabalhosa opção, usar o NaviCrawler, que é um complemento que só funciona no firefox 3.6 (procure por uma versão portable).
Importando dados do excel
Leia esse tópico do forum: Creating the right Excel file
Deixe uma resposta para Análise e visualização de redes: o Gephi | Humanidades DigitaisCancelar resposta