ΔΙΚΤΥΑ – Networks

Download Report

Transcript ΔΙΚΤΥΑ – Networks

ΔΙΚΤΥΑ - Networks Η τρέχουσα πραγματικότητα

ΓΕΝΙΚΑ • • • • • Δίκτυα στα οποία ζούμε (social life) Δίκτυα πληροφοριών (web – news) Δίκτυα οικονομικά – τεχνολογικά Δίκτυα κρατών – Οργανισμών Δίκτυα τρομοκρατικά (!)

Όψεις (1) • Αντικείμενα συνδεδεμένα μεταξύ τους

Emails in HP Όψεις (2)

Όψεις (3)

Αρχικές παρατηρήσεις • • • • Δυσκολία επεξήγησης Υπάρχουν αραιές και πυκνές περιοχές Υπάρχουν αντικείμενα «κεντρικά» και περιφερειακά Υπάρχουν αντικείμενα που συνδέουν απομακρυσμένες περιοχές ή όχι (παρατηρήσεις σχετικές με τη δομή του δικτύου)

Επιπλέον… στρατηγική • Συμπεριφορά?

– Πώς συμπεριφέρεται κάθε αντικείμενο?

– Πώς η συμπεριφορά επηρεάζει τις αποφάσεις των άλλων?

– Πώς η συμπεριφορά των άλλων επηρεάζει τις δικές μας αποφάσεις?

– Οι αλλαγές πρέπει να προγραμματίζονται όχι σε ένα στατικό περιβάλλον αλλά σε δυναμικό (η εισαγωγή ενός νέου προϊόντος ή υπηρεσίας έχει πάντα επίπτωση σε όλο το δίκτυο το οποίο θα αντιδράσει…)

Υπάρχει ή όχι δίκτυο?

• Κάποιες φορές, ακόμα κι αν το δίκτυο δεν είναι εμφανές ή δεν μπορούμε να το καταγράψουμε, η συμπεριφορά του συνόλου δείχνει ότι υπάρχει εσωτερική δομή (συλλογικότητα)

Μελέτη δικτύων • • • • • • • • Κοινωνιολογία Computer science Μαθηματικά Επιχειρησιακή Έρευνα Οικονομία Επιδημιολογία Χρήμα – διακίνηση ……… (!)

Πώς καταγράφονται τα δίκτυα • • • • • Από απλή παρατήρηση (κοινωνιολογία) Από μελέτες ιστορικών πηγών Από τρέχοντα δεδομένα Από το Διαδίκτυο Με τη βοήθεια μοντέλων δημιουργίας δικτύων

Network dynamics • Γιατί συμπεριφέρεται έτσι ένας πληθυσμός?

– Λόγω κοινωνικής συμφωνίας – τηρουμένων κοινωνικών κανόνων?

– Λόγω φαινομένων επηρεασμού από τους άλλους?

– Λόγω μίμησης (φυσικής ροπής) – Λόγω της υπόθεσης ότι υπάρχει περισσότερος πλούτος εκεί που παν οι άλλοι – Λόγω προστιθέμενης αξίας μετά από την κατάκτηση ενός μεγέθους?

Network dynamics - structure • Global – local – Η συμπεριφορά κάποιες φορές αλλάζει σε τοπικό επίπεδο – Φαινόμενα «καταρράκτη» • Η δομή επηρεάζει τη διάδοση • Η ύπαρξη communities μπορεί να σταματήσει την πρόοδο • Η συνεχιζόμενη αύξηση θα οδηγήσει σε πλήρη επιρρόή

φυματίωση Epidemics

Αντίθετη περίπτωση Σεξουαλικές σχέσεις σε Λύκειο

• • • GRAPHS – NETWORKS (Γράφοι – Δίκτυα) Κόμβοι (κορυφές – nodes) και γραμμές (ακμές - edges – links) Συμμετρία – ασυμμετρία (directed – undirected) Relationship – Σχέση.

Δρόμοι, μονοπάτια, κύκλοι (walks – paths – cycles)

Connectivity • Component – συνεκτική συνιστώσα – Όλοι οι κόμβοι συνδέονται – Δεν μπορεί να βελτιωθεί

Giant component • • • • • • Είμαστε όλοι συνδεδεμένοι με όλους?

Υπάρχουν απομακρυσμένα «τροπικά νησιά»?

Υπάρχει άνθρωπος που είναι απόλυτα απομονωμένος?

Συχνά υπάρχει ΜΟΝΟ ΜΙΑ γιγάντια συνεκτική συνιστώσα Σπάνια υπάρχουν περισσότερες (πχ πριν την ανακάλυψη της Αμερικής Συχνά υπάρχει ο χρόνος ως σημαντικός παράγοντας

ΑΠΟΣΤΑΣΗ (μήκος μονοπατιού) – breath – first search

Φαινόμενα Small world • Πείραμα Milgram

Instant messenger Erdos number (4-5) Bacon number (2.9) Six degrees or six Worlds

Network Datasets • • • • • • • • Collaboration graphs Who-talks-to-whom graph Information graphs Who-transacts-to-whom Technological linking Biological linking Natural world ………….

Strong and weak ties (Granovetter) • • Εύρεση εργασίας – Ρωτώ το στενό κύκλο?

– Ρωτάω μακρινούς γνωστούς?

– Πηγαίνω σε υπηρεσία?

Triadic closure (τριαδική κλειστότητα)

Λόγοι ύπαρξης της τριαδικής κλειστότητας • • • Ευκαιρία (opportunity) (πιθανότερες συναντήσεις) Εμπιστοσύνη (καλύτερα με αυτόν τον οποίο εμπιστεύεται ο φίλος μου) Κίνητρο (ο κεντρικός κόμβος χαλαρώνει την ένταση του ανταγωνισμού)

Γέφυρες και τοπικές γέφυρες

Κάθε τοπική γέφυρα είναι weak

FACEBOOK

• • • • • • • • • GEPHI https://gephi.github.io/ Start Gephi Δημιουργία απλού γράφου Center on graph, enlarge Edit node (? Tools) Dining table partners Force atlas 2 Reset colors, reset size (right click) Show node labels, size

Δομές Δεδομένων • • • Edges partition (choice) apply Data laboratory Preview

Node metrics

Degree distribution

Components

Gephi (dining table…) • • • • • Ranking nodes indegree size (spline) Compute average degree (statistics δεξιά) Data laboratory – nodes sort Statistics connected components..

Partition nodes strongly connected

Καθολική πυκνότητα • Το πλήθος των ακμών που υπάρχουν προς το πλήθος των ακμών που θα μπορούσαν να υπάρχουν • • • 𝑑 = 𝐿 𝑁(𝑁−1) 2 2𝐿 = 𝑁(𝑁−1) Διαφορετικό για directed graphs Gephi compute

Clustering coefficient (ego density – local density) • • • Η πιθανότητα δύο φίλοι μας να είναι και μεταξύ τους φίλοι Η αναλογία των ζευγαριών των φίλων μας που είναι φίλοι μεταξύ τους.

Το πλήθος των ακμών ανάμεσα στους φίλους μας προς το μέγιστο πλήθος των πιθανών ακμών • • • • CC(A) = 1/6 (εικόνα α) CC(A) = ½ (εικόνα β) CC ε [0, 1] Gephi compute

Centrality • http://moviegalaxies.com/

X

indegree

Y Y X Y

outdegree

X X Y

betweenness closeness To Χ έχει σημαντικότερη θέση από το Y

παράδειγμα • • • • Import.net

Εύρεση μεγαλύτερων εισαγωγέων Εύρεση μεγαλύτερων εξαγωγέων Degree – indegree - outdegree

Αριθμοί normalization divide degree by the max. possible, i.e. (N-1)

real-world examples example financial trading networks high in-centralization: one node buying from many others low in-centralization: buying is more evenly distributed

Τι δεν είναι καλό με το degree centrality?

Με ποιούς τρόπους η κεντρικότητα βαθμού δεν τα καταφέρνει καλά στα ακόλουθα?

Η μεσιτεία και ο περιορισμός

betweenness: μεσιτεία?

• Πόσα ζεύγη κόμβων πρέπει να περάσουν από εσένα για να φτάσουν με συντομότερο τρόπο ο ένας στον άλλον?

X Y

Παράδειγμα (γιατί?)

Κι άλλο παράδειγμα A B C D E    A lies between no two other vertices B lies between A and 3 other vertices: C, D, and E C lies between 4 pairs of vertices (A,D),(A,E),(B,D),(B,E)  note that there are no alternate paths for these pairs to take, so C gets full credit

Quiz:  Find a node that has high betweenness but low degree

Quiz Q:  Find a node that has low betweenness but high degree

closeness • Εάν δεν είναι τόσο σημαντικό να έχω άμεσους φίλους?

• Η να βρίσκομαι ανάμεσα σε άλλους?

• Πάντως θέλω να είναι στο «κέντρο των εξελίξεων», όχι μακριά από όλους…

Closeness… To Μέσο συντομότερο μονοπάτι μεταξύ ενός και όλων των άλλων

X Y Y X X Y X Y

Partitioning • • • Components Κλίκες Άλλα (cores – k-cores – clans, …)

Κλίκες – υπογραφήματα (overlap)

Communities • • • • Μία ομάδα κόμβων ανήκουν στην ίδια κοινότητα αν έχουν περισσότερους δεσμούς μεταξύ τους παρά με τους υπόλοιπους… Εύρεση μέσω συνεχόμενης αφαίρεσης ακμών με μεγάλη betweenness centrality.

Παράδειγμα στο Gephi (strike), και με netvizz (facebook) Παράδειγμα στο Nodexl με emails

• Spanning tree Kάλυψη Initialize: Vnew = {x}, where x is an arbitrary node (starting point) from V, Enew = {} Repeat until Vnew = V: Choose an edge (u, v) with minimal weight such that u is in Vnew and v is not (if there are multiple edges with the same weight, any of them may be picked) Add v to Vnew, and (u, v) to Enew Output: Vnew and Enew describe a minimal spanning tree

Χρηματοοικονομικά?

• • • • • • Πίνακας cross corellation Πίνακας γειτνίασης Δημιουργία γράφου με φιλτράρισμα… Τι σημαίνει ένα asset graph?

MST asset graph?

Planar maximally filtered graph?