Social Network Analysis - Corso di Laurea in Ingegneria Informatica

Download Report

Transcript Social Network Analysis - Corso di Laurea in Ingegneria Informatica

Scuola Politecnica e delle Scienze di Base
Corso di Laurea in Ingegneria Informatica
Elaborato finale in Basi di dati
Social Network Analysis
Anno Accademico 2015/2016
Candidato:
Giuseppe Corbisiero
matr. N46/1579
Introduzione
Oggigiorno siamo completamente assorbiti da questa nuova realtà sociale che
ci circonda. I Social Network sono entrati nel nostro quotidiano e ci
permettono di essere costantemente aggiornati con il mondo e con persone che
si trovano a migliaia di km.
Ma tutto ciò cosa va a creare?
Un flusso di dati enorme che viaggia attraverso la rete, i Big Data.
L’analisi delle reti sociali, ovvero la mappatura e la misurazione delle reti
sociali, può essere condotta con un formalismo matematico usando la teoria
dei grafi. In generale, il corpus teorico ed i modelli usati per lo studio delle reti
sociali sono compresi nella cosiddetta Social Network Analysis.
In uno specifico consiste in un insieme di tecniche finalizzate a misurare le
relazioni sociali che scaturiscono da legami di diversa natura (in caso di
aziende: commerciali con altre aziende e clienti, legami istituzionali …).
Il valore aggiunto della SNA rispetto all’approccio standard delle scienze
sociali i si basa sull’importante assunzione che il comportamento di un attore
influenza quello degli altri.
Per la SNA sensato e significativo è considerare anche le interazioni tra i
membri di un determinato gruppo di appartenenza quali variabili responsabili
di un preciso comportamento e processo decisionale.
Il compito dell’analista delle reti sociali è quello di realizzare modelli in grado
di descrivere la struttura relazionale di un gruppo e di osservare l’impatto di
tale struttura sul “funzionamento” del gruppo e la sua influenza sui singoli
attori.
Sono moltissime le aziende che avvertono l’esigenza di analizzare e
comprendere questo nuovo tipo di dati, per trarne informazioni utili sulle
abitudini e i comportamenti dei loro potenziali clienti e fare “marketing
digitale”; il giornalismo basato sui dati ne fa uso per verificare notizie, cercare
nuovi casi da approfondire, raccontare storie significative basate su dati
concreti, in grado di coinvolgere intellettualmente ed emozionalmente il
pubblico.
Il presente elaborato si propone di mostrare una vista sulla SNA generale, per
comprendere in grandi linee la natura della sua esistenza.
In seguito si introdurrà alle principali metriche e concetti che sono alle base
degli studi e dell’analisi.
E solo successivamente entreremo nel campo applicativo, sperimenteremo
un’analisi di una rete sociale tramite un software operativo.
Infine daremo uno sguardo agli scenari realizzati, per trarre delle conclusioni,
possibili migliorie e sviluppi per il futuro.
Capitolo 1: Concetti fondamentali
1.1 I Social Network
Oggi circa tre miliardi di persone si connettono ogni giorno a Internet.
La maggior parte di queste lo fa per utilizzare i “Social Network”: per lavoro,
per tenersi in contatto con gli amici o per divertimento.
Negli ultimi anni, la tendenza degli utenti ad utilizzare queste “piattaforme di
comunicazione” e la diffusione sul mercato degli innumerevoli “dispositivi
mobile”, hanno fatto diventare i social network gli indiscussi padroni della
comunicazione mediatica sul web.
Possiamo dire quindi che i Social Network sono networks adatti sia agli utenti
comuni che ai professionisti.
Gli utenti comuni possono condividere le informazioni, curare le proprie
relazioni interpersonali e crearne di nuove: all’inizio solo virtuali, ma alcune
di esse poi, in seguito ad approcci sempre più confidenziali, possono anche
diventare reali.
I professionisti possono pubblicizzare la propria attività e nel caso delle
aziende, anche impostare delle vere e proprie campagne di marketing.
Dal punto di vista informatico, i social network rappresentano “la sintesi
dell’evoluzione tecnologica sulla rete Internet”.
La condivisione dei contenuti multimediali, oggi, avviene sui social network.
Esistono diversi tipi di social network (professionali, d’intrattenimento, di
categorie specifiche: animali, sport, musica ecc.).
I principali social network sono: Facebook, MySpace, Instagram, Twitter,
Google+, LinkedIn, Pinterest, Meetup, YouTube, Spotify.
1.2 Caratteristiche comuni dei Social Network
La maggior parte dei social network presentano delle caratteristiche comuni
che si possono identificare in tre principali elementi:
1. la creazione di un profilo personale;
2. la creazione di una lista di amici;
3. l’esplorazione della propria rete e di quella degli amici.
Ultimata la fase di registrazione (in cui ci vengono richiesti l’indicazione di un
indirizzo di posta elettronica (e-mail) e di una password (parola chiave), si
passa alla creazione e alla gestione di un profilo personale dell’utente:
attraverso una serie di domande che vengono poste al nuovo iscritto (sulla città
di nascita, sul luogo in cui abitiamo, sulla scuola che frequentiamo o abbiamo
frequentato, sul datore di lavoro, sugli interessi personali, hobby e altro), si
delinea la pagina web del profilo personale dell’utente.
Questa pagina contiene le informazioni generali sull’utente, che possono
essere supportate da immagini o foto, da video e da una breve auto-descrizione
che commenta più dettagliatamente il nostro carattere personale o l’attività che
svolgiamo.
L’utente in questo modo ha la possibilità di scegliere quali informazioni
personali rendere pubbliche, per farsi conoscere dagli altri utenti (che non lo
conoscono) e quali rendere private, per condividere i contenuti solo con gli
amici.
Successivamente si passa alla creazione di una lista di amici che si costruisce
soggettivamente, indicando direttamente il nome delle persone che si vogliono
includere nell’ elenco delle nostre amicizie.
La lista degli amici viene ampliata con l’aiuto di programmi informatici del
social network che, in riferimento alle risposte che abbiamo dato nella fase di
compilazione del profilo utente, ci suggeriscono amici conosciuti nella vita
reale e “potenziali nuove amicizie”, selezionando tra gli utenti iscritti, le
persone che hanno caratteristiche corrispondenti alle nostre indicazioni.
Altra caratteristica dei social network è la possibilità di esplorare i profili degli
amici che fanno parte del nostro elenco di amicizie e quelli che fanno parte
delle amicizie dei nostri amici (anche se non hanno stretto amicizia
direttamente con noi); si possono visitare le pagine personali degli utenti
(amici), osservare le attività preferite, i gusti musicali ecc. e naturalmente
interagire direttamente anche con persone che non conosciamo direttamente,
ma che possono essere “amici dei nostri amici” o persone che non conosciamo
a fatto.
1.3 Social Network Analysis
L'analisi delle reti sociali, a volte detta anche teoria della rete sociale, è una
moderna metodologia di analisi delle relazioni sociali sviluppatasi a partire dai
contributi di Jacob Levi Moreno, il fondatore della sociometria, scienza che
analizza le relazioni interpersonali.
La SNA (dall'inglese Social Network Analysis) trova ora applicazione in
diverse scienze sociali, come la sociologia, l'antropologia, la psicologia e
l'economia, così come nel management, ed è stata utilmente impiegata nello
studio di diversi fenomeni, come il commercio internazionale, la diffusione
dell'informazione, lo studio delle istituzioni e il funzionamento delle
organizzazioni.
Nella teoria delle reti sociali la società è vista e studiata come rete di relazioni,
più o meno estese e strutturate. Il presupposto fondante è che ogni individuo (o
attore) si relaziona con gli altri e questa sua interazione plasma e modifica il
comportamento di entrambi. Lo scopo principale dell'analisi di network è
appunto quello di individuare e analizzare tali legami (ties) tra gli individui
(nodes).
Diverse classi di misure sono disponibili in letteratura, rivolte fra l'altro
all'esame delle proprietà di rete nel loro complesso (coesione, centralità, ...),
alla ricerca di sotto-reti specifiche (gruppi, egonet) ed alla ricerca di
somiglianze fra reti (equivalenza strutturale, automorfica e regolare).
Nel suo sviluppo la SNA ha fatto ampio uso di temi, concetti e strumenti di
una branca della matematica nota come teoria dei grafi.
Capitolo 2: Concetti base di Teoria dei Grafi e Social
Network Analysis
Iniziamo con alcune definizioni:
 RETI PRIMARIE (INFORMALI): Le reti sociali primarie (o reti
informali) sono quelle unità di vita sociale che raggruppano delle
persone, le quali si conoscono e sono unite le une alle altre da legami di
parentela, di amicizia, di vicinato o di lavoro.
 RETI SECONDARIE (FORMALI): Le reti secondarie formali sono
costituite dalle istituzioni sociali, che hanno una esistenza ufficiale.
Sono strutturate in modo preciso, svolgono funzioni specifiche o
forniscono sevizi particolari.
 RETE TOTALE: Le ricerche sulla rete totale, hanno lo scopo di
descrivere, come osservatori esterni, le relazioni che legano tutti i
membri di un sistema sociale. Questi studi cercano di tracciare una
mappa delle relazioni (matrice delle adiacenze) che legano i membri di
un sistema sociale.
2.1 Il concetto di grafo
Nella sua definizione più ampia un grafo G = {N,L} è un reticolo non
orientato dato dagli insiemi finiti:
N = {n1, n2, ni, nn} nodi del grafo
L = {l1, l2, lj, lm} legami del grafo
Quindi il grafo G = {ni, lj} i cui insiemi sono N = n1, n2, n3, n4, n5, n6 e
L = l1, l2, l3, l4, l5, l6, l7, l8, l9,l10.
Figura 1.1 = rappresentazione grafica di un grafo G = {ni, lj}
I singoli legami sono definiti dall’insieme della coppia di nodi che li uniscono.
Quindi il legame l1 è definito dall’insieme n1, n2. Il posizionamento dei nodi
nello spazio di rappresentazione del grafo è puramente casuale e non altera le
proprietà del grafo così come la lunghezza della linea che collega due nodi. In
simili grafi il numero totale di legame che potenzialmente si possono avere è
pari a “n(n-1)/2” in quanto, data la reciprocità, il legame che collega due nodi
è considerato come se fosse un solo legame.
Dato un grafo si introducono le seguenti definizioni:
 nodo adiacente: il nodo ni è adiacente al nodo nj se esiste un legame
lm = {ni, nj}.
 Vicinato (intorno) di un nodo: il vicinato di un nodo è l’insieme dei
nodi adiacenti ad esso.
 Grado di un nodo: il grado di un nodo è pari al numero di nodi
appartenenti al vicinato.
 Sottografo: un sottografo è costituito da un sottoinsieme di nodi
appartenenti all’insieme dei nodi del grafo e dai relativi legami.
Un grafo G si dice orientato se dato l’insieme N dei nodi, l’insieme dei legami
L è formato da coppie ordinate di nodi. In un grafo orientato i legami tra i nodi
sono orientati quindi una coppia di nodi ni, nj presenta due potenziali legami
lk= ni, nj e lm= nj, ni .
Figura 1.2= rappresentazione grafica di un grafo orientato
Come si evince dalla figura 1.2, i legami che uniscono i nodi non sono
bidirezionali (o reciproci). Considerando il nodo n2 ed il nodo n4 si nota che vi
sono due legami l5 ed il legame mentre per gli altri nodi vi è solo un legame.
In grafi orientati il numero totale di legame che potenzialmente si possono
avere è pari a “n(n-1)”.
2.1.1 Sociomatrice
Le informazioni contenute in un grafo G possono essere espresse in una
varietà di forme matriciali. Due tra queste sono particolarmente
significative e in uso tra gli studiosi di NA (Wasserman e Faust, 1994):
1) SOCIOMATRICE di un grafo (per relazioni non orientate) =
Adjacency Matrix.
Matrice di dimensione gxg (g righe e g colonne). Per ogni nodo del grafo è
presente una riga e una colonna. Le righe e le colonne identificano i nodi
del grafo o gli attori della rete, posti nel medesimo ordine.
Il corpo centrale della matrice è rappresentato da i valori xij che danno
indicazione sull’adiacenza o meno dei nodi:
xij = 1: c’è una linea tra i e j e quindi i due nodi sono adiacenti;
xij = 0: non c’è una linea tra i e j e quindi i due nodi non sono adiacenti.
2) SOCIOMATRICE di un grafo orientato (per relazioni orientate) =
Adjacency Matrix (X).
Attenzione: la matrice può non essere simmetrica.
Xij = 1 se l’arco <ni, nj> è contemplato nell’insieme delle linee L: l’attore i
“sceglie” per l’attore/nodo j;
xji = 0 se l’arco <ni, nj> non è contemplato nell’insieme delle linee L: l’attore i
non “sceglie” per l’attore/nodo j.
3) Sociomatrice
e Incidence Matrix
Matrice delle INCIDENZE = Incidence matrix (I(G)).
Matrice di dimensione gxL (g righe e L colonne): registra quali linee sono
“incidenti” su quali nodi. I nodi ni intestano le righe e le linee lj intestano le
colonne.
Iij = 1: se il nodo ni è punto di arrivo della linea lj (se la linea è incidente sul
nodo).
Iij = 0: se il nodo ni non è punto di arrivo della linea lj (se la linea non è
incidente sul nodo).
La matrice I è binaria. Non è necessariamente quadrata.
La sociomatrice e la matrice di incidenza contengono tutte le informazioni
che riguardano un grafo. L’insieme dei nodi e dei grafi è completamente
descritto dalle due matrici.
2.1.2 Elementi matematici
La diade: analizza solo la relazione tra due attori ed è caratterizzata da due
proprietà:
- presenza della relazione;
- reciprocità della relazione.
La triade: analizza le relazioni tra tre attori ed è il più piccolo network che
viene utilizzato negli studi sociali.
Il grado di un nodo: indica il numero di nodi adiacenti al nodo considerato,
il suo valore varia da 0 a (n-1).
N indica la dimensione del grafo ossia il numero di attori. Un grado pari a 0
significa che il nodo non è adiacente a nessun altro nodo e quindi non ha
legami e si definisce isolato.
Un grado parti a (n-1) significa che il nodo è adiacente a tutti gli altri nodi del
grafo.
2.1.3 Le Misure Strutturali
Le misure strutturali offrono informazioni relative alle proprietà di un nodo
all’interno del reticolo e alle proprietà della struttura del reticolo nel suo
insieme. Una prima semplice misura riguarda la dimensione della rete, che è
data da N, ossia dal numero dei nodi. La rete di dimensioni minori in assoluto
è la diade, ossia quella costituita da due nodi.
Possiamo fare una distinzione tra i nodi che compongono la rete e i nodi
connessi, NC, ossia la totalità dei nodi incidenti ad almeno un punto. Se tale
valore è minore del numero dei nodi significa che sono presenti dei nodi
isolati. E’ possibile ricavare un indice di inclusività, rapportando la
totalità dei nodi connessi alla totalità dei nodi che compongono la rete:
Al crescere del numero dei nodi lo studio delle proprietà strutturali si
arricchisce di concetti e variabili.
Un’altra misura importante densità, data dalla proporzione tra i legami
effettivamente presenti e quelli possibili. Infatti, la densità di una rete al tempo
t rappresenta il rapporto tra le relazioni esistenti al tempo t e le relazioni
potenzialmente sviluppabili al medesimo tempo:
D= lt / [nt x (nt-1) / 2 ]
Dove l rappresenta il numero dei legami al tempo t e n il numero dei nodi.
Questo rapporto è compreso tra 0 e 1, ossia rete vuota e rete completa.
Per valori prossimi a 0 interpretiamo la rete debolmente connessa, mentre per
valori prossimi a 1 interpretiamo la rete come fortemente connessa.
Tale formula calcola la densità per un grafo non orientato mentre per un grado
orientato i legami potenziali sono pari a [nt x (nt-1)] quindi la densità risulta
essere pari a:
D= lt /(nt x (nt-1)
La densità è una misura che permette di valutare la connettività che tiene
conto del grado di accentramento, della molteplicità e della diffusione dei
legami. Una rete presenta alti livelli di connettività nella misura in cui le
relazioni sono diffuse tra tutti gli attori senza esclusioni.
Maggiore è la densità di una rete e maggiore sarà la connettività di una rete.
Un'altra misura che può essere indicativa del grado di connettività della rete si
richiama alla distanza geodetica tra i nodi. La distanza geodetica è pari al
sentiero che collega un nodoi ad un nodoj. Quanto minore è la media
delle distanze geodetiche tra i nodi, tanto maggiore sarà la connettività della
rete.
Diversamente, in un grafo orientato vanno considerate tutte le linee, in quanto
una linea orientata da A a B non necessariamente comporterà una linea
reciproca da B a A.
L’indice di densità varia tra 0, in caso di grafo vuoto, e 1, in caso di grafo
completo.
Nel caso di un grafo semplice non orientato il grado è dato dal numero di linee
di connessione del nodo considerato. Nel caso di un grafo orientato avremo
una misura di entrata, indegree, che indica quanti nodi si connettono a quello
osservato, e una misura di uscita, outdegree, cioè a quanti nodi si connette il
vertice considerato.
Quindi la somma totale dei gradi di tutti i nodi:
E’ possibile calcolare un il grado medio dei nodi:
così come la varianza del grado:
che sarà tanto più alta quanto più varierà il grado di ciascun nodo. In altre
parole indica se i nodi del grafo hanno un vicinato più o meno uguale.
Ulteriori misure strutturali sono l’eccentricità ed il diametro di una rete.
L’eccentricità di un nodo esprime la distanza più lunga tra quel nodo e
qualsiasi altro. Il diametro di un reticolo è l’eccentricità più lunga, misurabile
per un qualsiasi nodo del grafo stesso.
Un ulteriore misura da considerare è la clique. La clique viene definita come il
massimo sottografo completo. Dato un grafo G connesso o disconnesso (ossia
ci sono dei nodi isolati), posso individuare in esso uno o più sottografi GC,
chiamati clique, se la densità interna è uguale ad 1, cioè se tutte le coppie di
nodi in NC sono tra di loro direttamente collegate da una linea.
2.1.4 Misure strutturali di centralità
Passiamo ora ad un altro concetto che può aiutarci a descrivere la rete come
più o meno accentrata o gerarchizzata, a partire dagli indici di centralità
descritti nel paragrafo relativo alle misure dei nodi.
Un valido indice di centralizzazione del reticolo deve rilevare la variazione tra
gli indici di centralità dei nodi che lo compongono. Si può dire che, mentre
l’indice di densità di un reticolo presenta un valore medio della distribuzione
dei legami tra i nodi, un qualsiasi indice di centralizzazione dovrebbe rilevare
il grado di dispersione intorno al valore medio.
La centralizzazione descrive come la rete dipende da uno dei suoi vertici. Si
calcola adattando l’indice generale di centralità e la centralità di ogni nodo. Al
numeratore si calcola la sommatoria delle differenze tra il più alto grado
valutato nella rete e quello di ciascun nodo. Al denominatore si
calcola la somma massima possibile:
Un concetto altrettanto importante, legato alla posizione strutturale ricoperta
nel reticolo complessivo, è sicuramente quello di centralità del nodo. L'idea
della centralità degli individui e delle organizzazioni all'interno dei loro
network sociali fu una delle prime ad essere perseguite e studiate.
La centralità individua e definisce il posizionamento di un attore nel proprio
Ambiente rilevante in termini puramente relazionali, ovvero relativamente a
tutti gli altri attori sociali con cui allaccia rapporti di scambio.
L'idea di centralità è fondamentalmente intuitiva e si basa sul fatto che, a
partire da un insieme di attori sociali (organizzazione, individui) e dato un
insieme di relazioni fra di loro (finanziarie, di affetto etc.), è quasi sempre
possibile dare agli attori un ordinamento gerarchico in base alla loro posizione
nella struttura relazionale concreta che è possibile osservare.
Un punto è localmente centrale se ha un gran numero di connessioni con gli
altri punti del suo ambiente circostante, basta quindi osservarne il grado,
mentre è globalmente centrale se ha una posizione di importanza strategica
nella struttura complessiva della rete.
Il concetto di centralità può essere visto secondo differenti punti di vista, a
seconda degli aspetti che si ritengono più importanti. L’indice più semplice
parte dall’ipotesi che la centralità di un attore dipenda dalla numerosità dei
legami che intrattiene con altri soggetti. Ad una prima analisi, la centralità può
essere rappresentata dal numero di attori con i quali l'attore osservato detiene
dei legami: chi all'interno di un insieme di relazioni detiene un maggior
numero di relazioni è il più centrale. Questa misura rappresenta il livello di
coinvolgimento (involvment) di un attore nella rete di relazioni.
In questo caso il concetto analitico di riferimento è il grado. La formula
Standardizzata della centralità locale è:
dove al numeratore troviamo il numero massimo di legami del nodo
considerato.
I limiti di questa misura emergono in quei casi in cui non è tanto il numero di
relazioni che si hanno, quanto la posizione di interscambio con gli altri nodi,
quando cioè siamo interessati al potere e all’influenza di quel nodo, che può
ricoprire un ruolo strategicamente più centrale.
Una misura di centralità che cerca di superare questi limiti è la centralità
basata sulle distanze con tutti gli altri nodi. Intuitivamente, questo indice
focalizza la propria attenzione su quanto vicino un attore è agli altri.
Un attore è quindi tanto più centrale quanto più è nella posizione di interagire
velocemente (avendo meno intermediari) con altri attori. Un attore centrale in
questo senso risulta allora molto efficace nel divulgare informazioni, proprio
perché è quello che maggiormente nel gruppo ha contatti diretti, o indiretti ma
brevi, con tutti gli altri. Questa misura, a differenza dei gradi, non si concentra
solo sui legami diretti, ma prende in considerazione anche i percorsi indiretti
tra i nodi. Quanto minore è la somma delle distanze, tanto più centrale è
l’attore, in quanto vicino a un gran numero di altri punti. Tale somma è data
dal tot di riga (o di colonna) della matrice delle distanze. Poiché tale indice
dipende dall’ampiezza del reticolo, bisogna introdurre un fattore di
standardizzazione:
Dove CC sta per l’indice di centralità basato sulla distanza (closeness) e (N-1)
è il fattore di standardizzazione che moltiplica invece di dividere la
sommatoria delle distanze allo scopo di invertirne il valore2.
Questo indice varia da 0 a 1. Mentre il valore 1 indica che il nodo è centrale e
si trova ad una distanza minima da tutti gli altri nodi, il valore 0 indica i nodi
periferici (per lo 0 assoluto i nodi isolati).
Capitolo 3: Analyzing Facebook Networks
with Gephi.
Gephi è uno strumento per esplorare e comprendere i grafici. Come nel caso di
Photoshop (ma per i grafici), l'utente interagisce con la rappresentazione,
manipola le strutture, forme e colori per rivelare le proprietà nascoste.
Gephi è un software open source per l'analisi e la visualizzazione delle reti
sociali, scritto in Java e basato sulla piattaforma NetBeans, inizialmente
sviluppato dagli studenti di 'The University of Technology of Compiègne in
Francia. Gephi è stato usato in una serie di progetti di ricerca in ambito
universitario, giornalistico e in vari altri campi, per esempio per visualizzare le
connessioni globali ai contenuti del 'New York Times o per esaminare la rete
di traffico su Twitter in occasioni di disordini sociali, ma anche per altre
tematiche solitamente oggetto di analisi di rete.
Noi andremo ad usufruire di questo software per creare una rete e analizzare
ed individuare i concetti sopra esposti. Per farlo useremo Netvizz, un’app
Facebook che consente di creare un file .gdf delle proprie amicizie e dei
gruppi di cui si fa parte. E’ costruito come una tabella di un database o un file
(CSV). Esso supporta gli attributi per entrambi, nodi ed edge.
Un file standard è diviso in due sezioni, uno per i nodi e uno per i bordi.
Ogni sezione ha una riga di intestazione, che fondamentalmente è il titolo
della colonna. Ogni elemento è su una linea e i valori sono separati da un
punto. Il formato GDF è quindi molto facile da leggere e può essere facilmente
convertito da CSV. Nel nostro caso analizzeremo una pagina facebook di cui
sono membro, il “Kot & Jeux”, un gruppo dell’Université de Namur del
Belgio.
3.1 Netvizz
Come prima azione si deve effettuare l’accesso alla piattaforma di Facebook,
e cercare nella barra di ricerca “Netvizz”. Daremo alle stessa dei permessi per
poter accedere alla nostra rete di amicizie.
Conseguentemente vi è la scelta di quale rete si vuole
analizzare e creare il nostro file .gfd. Sono presenti 6 opzioni:
 Group Data – crea una rete e tabelle con le attività
dell’utente sui propri gruppi;
 Page Data – crea una rete e tabelle con le attività
dell’utente sulle pagine;
 Page like Network – crea una rete di pagine collegate
attraverso i like;
 Page Timeline images – crea un elenco di tutte le
immagini dall'album "Timeline di foto";
 Search – interfaccia per la funzione di ricerca di
Facebook;
 Link Stats – fornisce statistiche per link condivisi su
Facebook;
Si è scelto “Page Data”, per estrarre i dati dei post della pagina. Inserito l’id
della pagina, vi è la scelta del data scope, in questo esperimento gli ultimi 50
post. Ed infine i data to get, che abbiamo scelto tutti i dati, tutta la rete e i
commenti.
Si mostrerà a video questa pagina:
Che come si può notare ha catturato tutti gli ultimi 50 post e compresso le
informazioni in un archivio zip scaricabile, che useremo in Gephi.
Tornando al nostro software, per primo si crea un nuovo progetto:
Ci sarà mostrata questa pagina con tutti i dati che il Gephi sta per acquisire:
Clicchiamo “OK” e apparirà il nostro primo grafo.
1. Sul pannello si sinistra, abbiamo la possibilità di scegliere un Layout,
prendiamo in considerazione il “Force Atlas”, con tutte le sue
proprietà.
Lo scopo della proprietà di layout è quello di farvi controllare l'algoritmo per
creare una rappresentazione leggibile. Forza Atlas rende i nodi collegati,
attratti l'uno dall'altro e spinge i nodi non connessi a parte, per creare gruppi
di connessioni.
2. Impostare la Repulsion Strength a 10 000 per espandere il grafico:
 Fare clic su Invio per convalidare il valore.
 Fare clic su Stop quando sembra che si siano formati gruppi diversi.
Repulsion Strength: Come fortemente ogni coppia di nodi collegati attratti
reciprocamente.
Il nostro risultato è:
Visibilmente abbiamo dei gruppi diversi, alcuni collegati, ed altri isolati.
3. Ranking (degree)
• Modulo Ranking consente di configurare il
colore e le dimensioni del nodo.
• Scegliere la scheda classifica nel modulo
in alto a sinistra e scegliere il grado dal
menu.
• Fare clic su Applica
Ricorda: gradi = numero di connessioni.
4. Ranking (colore)
• Cerchiamo di configurare i colori.
• Passare il mouse sopra la barra della sfumatura e fare doppio click
su ogni triangolo.
• Provare a utilizzare un colore luminoso per il più alto grado così
è facile vedere chi è il più collegato.
• Fare clic su Applica
5. Statistics
• Fare clic sulla scheda statistiche nel modulo in alto a destra.
• Fare clic su average path length e click run.
• Selezionare diretto e fare clic su OK.
• Al termine viene visualizzata la metrica dei risultati, una relazione come
questa (betweenness, vicinanza e eccentricità):
6. Ranking (Betweenness)
• Rientra in ranking nel modulo in alto a sinistra e scegli il parametro rango
dal menu a discesa: "Betweenness centralità".
7. Ranking (dimensione)
• Fare clic sull'icona delle dimensioni.
• Impostare la dimensione minima a 10 e la dimensione massima a 50. Giocare
con questi numeri a seconda delle dimensioni del Rete.
8. My Network (betweenness e dimensione)
• Colore: Dimensioni
Grado: Betweenness centralità metrica
9. Layout (betweenness)
• Per mantenere i grandi nodi in sovrapposizione di quelli più piccoli,
tornare al pannello di layout.
• Selezionare l'opzione "Regola per dimensioni" ed eseguire di nuovo
l’algoritmo per un attimo. Così i moduli saranno sparsi di conseguenza.
10. Le etichette
• etichette dei nodi di visualizzazione.
• Impostare le dimensioni dell'etichetta proporzionale con dimensioni nodo.
• Utilizzare il cursore per regolare la dimensione complessiva. È inoltre
possibile modificare lo stile del carattere cliccando accanto al cursore.
11. My Labels:
12. Community Detection
• Torna al pannello di statistiche e fare clic su Esegui "modularità".
Controllare "casuale" e fare clic su OK.
13. Partizione
• L'algoritmo di rilevamento della comunità ha creato un "Class Modularità"
per ogni nodo, che useremo per colorare le comunità.
• Individuare il modulo di partizione sul pannello di sinistra e cliccare sul
pulsante di aggiornamento per popolare la lista.
• Scegliere "classe modularità" dal menu. È possibile fare clic su "randomize
colors".
• Fare clic su Applica per colorare.
My Partition:
14.
Filters
• Andare ai filtri nel modulo in alto a destra e aprire la
cartella "topologia".
Trascinare il "degree range" filtro ai" Query "e
rilasciarlo.
• Fare clic sul "degree range" per attivare il filtro. Essa
mostra un dispositivo
di scorrimento e il grafico che rappresenta i dati, e il
grado di distribuzione.
Spostare il cursore verso il suo limite inferiore a 2 e premere filtro. I nodi con
un grado inferiore a 2 sono ora nascosti.
Result:
15. Anteprima
• In alto a sinistra clicckare sulla scheda di anteprima.
• Sotto il pannello nodo scegliere " show labels" e fare clic su Aggiorna in
il fondo. Clicca sul lista preset e provare diverse configurazioni.
My preview: