power point

Transcript power point

Introducción a la Sociomática
El Estudio de los Sistemas Adaptables Complejos en el
Entorno Socioeconómico.
Dr. Gonzalo Castañeda
Capítulo 8
Modelos Computacionales de Redes
8.0 Introducción
• Los modelos computacionales de redes permiten describir una
topología más flexible que la de CA y ABM móviles
• En una red los agentes son nodos y los lazos son conexiones
entre agentes (se combinan vínculos cercanos con lazos física
y socialmente distantes)
• La topología de la red ayuda a describir una gran gama de
configuraciones de los elementos-relacionales (sistemas
jerárquicos, cluster fragmentados, grupos cohesionados)
• Redes en el mundo real: neuronas conectadas por axones;
computadoras entrelazadas por líneas telefónicas; moléculas
del cuerpo vinculadas por reacciones químicas; paginas de
internet que se ligan entre sí; especies de un ecosistema,
miembros de una comunidad con lazos sociales; empleados de
una empresa conectados por un organigrama
• Las redes ayudan a describir la topología de una gobernanza
social, y la dinámica con que ésta cambia (i.e. la retícula del
entorno no es inmutable)
Ejemplos de redes:
• (a) Consejeros en australia
• (c) Sistema judicial EU
(b) Comercio de productos
(e) Blogs en singapur
• (e) Proteinas de la levadura
• (f) Relaciones sexuales entre
adolescentes
8.1.- Las redes y la teoría de gráficas
• En 1736 Leonhard Euler estableció las bases
matemáticas de la teoría de gráficas (redes)
• Los puentes de Könisberg: ¿es posible caminar por
c/u de estos siete puentes sin tener que cruzar alguno
de ellos más de una vez?
• Euler visualizó a los puentes como lazos (o ligas) y a
los pedazos de tierra como nodos ( o vértices)
• Solución: El punto de partida y de llegada tiene que ubicarse
en nodos con un número non de lazos; una travesía que
cruza todos los puentes una vez debe tener sólo dos de
estos nodos.
• En este caso todos los nodos son nones → no hay solución;
en 1875 se construyó un octavo puente entre B y C
• Primeros avances se dieron en gráficas ordenadas, hasta
los 50’s que aparecieron las redes aleatorias de Erdos y
Rényi
• Debido a que las redes son representaciones matemáticas
de fenómenos muy diversos, se eligió la formación aleatoria
de lazos como una primera aproximación
• ¿Cómo establecer la red carretera de un país muy pobre
con 50 pueblos?
• Conectar a todos los pueblos entre sí requiere 1225
caminos (50 x 49/2), solución no factible con recursos
fiscales escasos
• Solución de Erdös y Rényi: Si se forma un camino
entre dos pueblos al azar y este proceso se repite
varias veces con el tiempo se forma un ‘componente
gigante’.
• Entre mayor sea el número de nodos menor es el
porcentaje de lazos aleatorios para formar una red
conectada
• Una red con 300 nodos puede tener 50,000 lazos
pero sólo se requieren el 2% de lazos; con 1,000
nodos sólo se requiere el 1%
• La conectividad de la red es importante para
entender diversos fenómenos: propagación de
enfermedades, flujo de información, impacto ante
fallas (e.g. red eléctrica)
• Las redes naturales y sociales no están formadas
por conexiones aleatorias (¿?)
*Parábola de los botones
• S. Kauffman: Se toman al azar dos botones para amarrarlos,
se repite el proceso varias veces con otras parejas pero
permitiendo que un botón previamente elegido sea hilvanado
de nueva cuenta
• Cuando se rebasa el umbral de un lazo por nodo se da un
cambio súbito, pasando de clusters pequeños a un cluster
gigante.
• (a) Formación de clusters
(b) Fase de transición
* El Componente Gigante
• Netlogo: Model Library → Sample Models → Networks →
Giant Component
• Se inicializa la corrida con un cierto número de nodos,
conforme avanza se conectan parejas tomando nodos al azar
• Antes de cruzar el umbral (un lazo en promedio por nodo)
existen pequeños clusters (pantalla a), después aparece
súbitamente el componente gigante (pantalla b).
• Pantalla (a)
Pantalla (b)
8.2 El Fenómeno de Sincronización
• El analizar la formación de redes a través de
mecanismos aleatorios es limitativo para entender la
auto-organización de agentes que se desenvuelven
en un entorno de interacción local
• Ejemplos de sincronización: células que marcan el
latido del corazón, neuronas que disparan impulsos
en el cerebro, individuos que aplauden en
conciertos, chasquido de los grillos, menstruación
colectiva, planetas que orbitan, brillo de las
luciérnagas
• Sincronización es un orden emergente de carácter
temporal en el que eventos similares pasan al
mismo tiempo y de manera persistente
• No hay sincronización cuando vuelan palomas o
cuando individuos tocan el claxón, o cuando
coincide el andar de personas
• Osciladores acoplados: entidades que se ciclan
de manera automática repitiendo una y otra vez
determinada acción en un intervalo de tiempo
relativamente regular
• Para que haya acoplamiento se requiere
comunicación o mecanismos físicos o químicos
con los cuales dos o más osciladores se influyen
entre sí para actuar a una misma frecuencia
• Ejemplos: luces, fuerza de gravedad, corriente
eléctrica
• Osciladores acoplados vivos (células, animales,
individuos) o inanimados (planetas, electrones,
péndulos, fotones)
* La relevancia de la interacción
local en la sincronización
• Los aplausos al final de un concierto empiezan
siendo arrítmicos para luego realizarse en armonía
• Un grupo empieza a aplaudir con ritmo, y éste
contagia a individuos que están en una vecindad.
• En conciertos la sincronía se combina con
aplausos caóticos; el ritmo reduce la frecuencia de
los aplausos y la sonoridad → sincronización se da
a costa de la intensidad
• La coordinación o sincronización suele ser
consecuencia de acciones locales que, por alguna
razón, contagian a otros y así se generalizan en la
población
• Este es el caso de movimientos sociales, en donde
las acciones de unos cuantos puede terminar en el
desmoronamiento del status quo
*Modelos de sincronización sin
interacción local
• Mirollo y Strogatz (1990) demostraron
matemáticamente que la sincronización es posible
para un conjunto de n osciladores idénticos que se
encuentran conectados entre si
• Conjunto de osciladores cuyo voltaje aumenta
siguiendo la trayectoria de una curva cóncava; al
llegar a un umbral se dispara un impulso de energía
que se redistribuye en la red
• Los que estaban cerca del umbral también se disparan con
el impulso recibido, pero los que iniciaban en su ciclo se
alejan con el impulso (no es evidente la sincronización
pero se van formando cluster de osciladores)
• Limitante del modelo: debido a la diversidad genética los
osciladores no son idénticos; no hay interacción local,
todos los nodos tienen la misma importancia
• Diversidad: ¿Cómo sincronizar a un grupo de corredores
muy compacto, algunos muy lentos y otros muy rápidos?
• Los corredores de jogging se gritan para regular sus
tiempos (conectividad)
• La posibilidad de sincronización se incrementa entre más
acentuada sea la homogeneidad de las frecuencias
observadas.
• Matemáticamente resulta muy difícil incorporar elementos
de heterogeneidad e interacción local, necesidad de acudir
a un modelo de cómputo
*Heterogeneidad entre los osciladores
y sincronización
* Ejemplos de sincronización con
interacción local
• (a) En el mundo biológico: luciérnagas que centellean para
atraer una pareja y aparearse
• En un principio cada quién va con su propio timing pero con
el tiempo va surgiendo la armonía
• Común en el sureste-asiático y África
• (b) En el mundo social: la ola mexicana, en donde grupos de
individuos se levantan momentáneamente de la tribuna y
alzan la mano dando la apariencia de una ola gigante que se
desplaza en el sentido de las manecillas del reloj a lo largo de
la tribuna
• Aunque se inició en el fut americano de E.U. se generalizó al
mundo en el mundial de 1986
• La probabilidad de que la ola se propague depende del
número de individuos que la inicia y el umbral que requiere
un individuo para ser activado y levantarse de su asiento.
* El centelleo rítmico de las luciérnagas
• En Netlogo: Model Library → Sample Models → Biology →
Fireflies
• Agentes con un reloj virtual que indica a cada insecto
centellear al inicio de su ciclo, cuando éste llega a su valor
máximo el reloj se reposiciona en cero.
• Ciclos de c/luciérnaga son idénticos, la diferencia esta en la
definición aleatoria de su reloj a lo largo del ciclo
• Cuando se llega a un determinado número de brillos en la
vecindad (flashes-to-reset), el observador elige estrategia:
• (a) avanzada: la luciérnaga centellea inmediatamente y se
reposiciona en cero
• (b) retrasada: se fija el reloj el número de periodos que dura
el centelleo (flash-length) por lo que el ciclo se vincula con el
último agente que lo influyó
• No siempre se da la sincronización, y ésta no
necesariamente se obtiene para toda la población
• (1) estrategia avanzada (flashes-to-reset
= 1, flash.lenght = 1) → no hay
sincronización
• (2) estrategia retrasada (flashes-to-reset
= 1, flash.lenght = 1) → sincronización
total en 950 periodos
• (3) estrategia avanzada (flashes-to-reset
= 2, flash.lenght = 1) → solo llegan a
sincronizarse unas 910 luciérnagas de un
total de 1500.
La Ola mexicana
• Después de analizar 14 videos de olas en un estadio con
50,000 aficionados, Farkas y sus colegas encontraron que por
lo general la ola se logra impulsar con 12 individuos
• La ola se mueve a razón de 12 metros (o 20 asientos) por
segundo y tiene una amplitud de entre 6 y 12 m. (15 asientos
en promedio).
• Para mayores detalles sobre la mecánica de formación de olas
ver http://angel.elte.hu/wave/index.cgi?m=models
8.3 Las redes de mundo pequeño
• ¡¡El mundo es pequeño!! Es siempre una causa de
asombro
• Sara una humilde habitante de Cholula se encuentra
a tres pasos del presidente de Eslovenia
• Stanley Milgrom realizó el primer estudio formal de
este tipo: dos individuos tomados al azar de cualquier
parte del mundo se encuentran a seis grados de
separación
• El asombro se debe a que la gente interactúa en la
cotidianidad con un núcleo reducido de personas, sin
estar conscientes que nuestros conocidos y los de los
amigos pueden pertenecer a clusters muy diferentes
* El experimento de Milgram (1967)
• Antecedentes: el cuento ‘cadenas ‘ (1929) del escritor húngaro Karinthy
• Se seleccionaron 296 personas de Boston y Omaha Nebraska, a quienes se
les encomendó llegar una carta a un corredor de bolsa de Boston (sólo 217
iniciaron el experimento)
• La carta no debía ser enviada directamente sino a una persona que fuera
conocida personalmente y que pudiera estar mas ‘cerca’ del objetivo
• En promedio la carta llegó en 5.5 pasos, aunque 64 no llegaron a su destino
final
• Deficiencias estadísticas: (a) 100 de Boston fueron reclutadas a través de
un anuncio de periódico; (b) 100 de Nebraska a través de una lista de
inversionistas; (c) 96 restantes de Nebraska al azar de una lista de
direcciones postales (de éstas sólo 18 llegaron a su destino)
• (d) En otro estudio entre individuos de Wichita, Kansas y la esposas de un
estudiante del Harvard Divinity School, llegaron sólo 3 de 60
• (e) Los dos puntos del extremo de la cadena deberían haber sido elegidos
aleatoriamente
• (f) No se puede saber si las cartas llegaron por la ruta más corta
• (g) Al desconocer la conectividad de la red no se sabe si existen individuos
aislados (al ubicarse en islas la longitud calculada sería infinita)
• En 2003 se reprodujo el ejercicio con e-mail, Se iniciaron 24,163 cadenas
con gentes de 66 paises, los objetivos eran 18 personas de 13 paises.
Llegaron a término 384. Longitud media de 4, pero con ajuste de entre 5-7
* En una topología de redes aleatorias
• Existen mundos pequeños en las redes aleatorias de Erdös y
Rényi
• Si Juan tiene 50 conocidos, y éstos a su vez otros 50; en dos
pasos se tienen 2500 personas, en tres pasos 125,000 (50 x
2500)…en seis a 15,625 millones (506); cifra muy por encima
de los 6 mil millones de habitantes
• ¿Un individuo de Tlacotalpan Ver. tiene la misma
probabilidad de estar cerca de un vecino del pueblo que de
un esquimal de la zona ártica?
• En una gráfica aleatoria los lazos entre nodos no respetan la
proximidad física o cercanía social de los agentes (los amigos
de Juan son amigos entre si)
• Si A tiene lazos fuertes con B y C, posiblemente existan lazos
similares entre B y C (triadas)
• Formación de redes tiene un alto componente histórico:
estado actual de los vínculos sociales depende de la
configuración de periodos previos
• Un planteamiento extremo sería caracterizar a las redes
sociales mediante gráficas ordenadas
• Este es el caso de un CA unidimensional sin fronteras (anillo)
con 24 nodos y tres vecinos en cada lado.
• Existe un alto grado de aglutinamiento ya que cada nodo
comparte 2/3 partes de los vecinos, pero no es un mundo
pequeño puesto que se requieren 4 pasos para ir de un lado
a otro del anillo
• Para un mundo pequeño más real se requiere un balance
entre una estructura ordenada y la existencia de trayectorias
cortas
* Los lazos débiles de una red social
• Watts y Stogatz (1998) crearon sus redes de mundo
pequeño partiendo de una red ordenada y
desconectando ciertos nodos para establecer
tendidos aleatorios
• ¿Cómo se interpretan estos tendidos aleatorios en
términos sociológicos?
• Mark Granovetter (1973) define la diferencia entre
lazos fuertes (vínculos entre personas que
interactúan cotidianamente) y lazos débiles
(conexiones entre individuos sin relación estrecha)
• Los lazos débiles permiten que un movimiento social
se propague o que personas encuentren empleo;
estos puentes sociales hacen que la información
fluya y no sea redundante (networking)
Los lazos débiles o puentes
sociales de una red
• Los lazos débiles y fuertes se combinan para formar una red social
• Los fuertes se suelen presentar en triángulos, cuando uno de ellos se rompe
la conectividad queda inalterada
• En cambio cuando los lazos débiles se rompen (líneas punteadas), se
fracturan los puentes sociales, las distancias se hacen más largas y se
fragmenta la sociedad
• Los lazos débiles pueden ser interpretados como los puentes aleatorios que
conectan a los distintos clusters
• En la realidad estos puentes no se establecen de manera fortuita, los
antecedentes sociales importan
* El modelo beta de Watts y Strogatz
• Se parte de un anillo en el que todos los nodos
tienen el mismo número de lazos
• El objetivo es monitorear el grado de aglutinamiento
y separación conforme se desconectan lazos y se
hacen tendidos aleatorios
• ¿Existe un punto intermedio en el que coexisten el
mundo pequeño y la estructura de clusters?
• Beta: probabilidad de que c/lazo sea desconectado y
reposicionado aleatoriamente en otro nodo → b = 1
(red aleatoria), b = 0 (red ordenada)
• Para valores cercanos a 0, la creación de puentes
sociales tiene un impacto marginal en el grado de
aglutinamiento pero se producen reducciones
importantes en el grado de separación
* Topología del modelo beta
• “Longitud promedio de la trayectoria” (L): número
mínimo de lazos entre dos nodos, repitiendo el
cálculo para todas las parejas posibles de nodos y
obteniendo el promedio
• “Aglutinamiento” (C): probabilidad de que dos nodos
conectados a un tercero estén vinculados entre sí.
* Redes de mundos pequeños
• Cuando se incrementa el valor de beta, el impacto sobre C es
limitado (i.e. los puentes aleatorios no reducen en mucho los
conocidos en común).
• La creación de atajos sociales sí tiene un gran impacto en L, no
sólo porque el nodo que mantiene el lazo desconectado
establece un puente sino también porque dicho puente
beneficia a los vecinos que lo rodean
* Simulación de un mundo pequeño
en una red igualitaria
• NetLogo : Model Library → Sample Models →
Networks → Small World
• Red en un anillo con radio 2, el observador
elige el número de nodos.
• Con 100 nodos, beta = 0.16 → L pasa de 12.7
a 4.4, mientras que C pasa de 4.5 a 2.6
* Evidencia empírica de mundos pequeños
• ¿Existe evidencia que soporte los valores de L y C de una red de mundo
pequeño?
• Comunidad de actores (Internet Movie Database: http://www.imdb.com),
existe un cluster gigante de 225,000 actores (datos 1898-2000), los actores
vinculados en pocos pasos
• Comunidad científica. Paul Erdös escribió 1500 artículos con 507 coautores. Número de Erdös = pasos que separan a los autores del
matemático húngaro (Samuelson es un Erdös 5)
• ¿Son estas propiedades de carácter universal?
• Evidencia con una red tecnológica (red eléctrica del occidente de E.U.) y
otra de carácter biológico (302 neuronas del gusano C elegans)
• Existe evidencia de un mundo pequeño: L similares a las de una red
aleatoria equivalente y C que reflejan estructura de cluster
Red de colaboración de Erdos
* El Oráculo de Bacon
• Kevin Bacon tiene una
separación de 2.96
pasos(http://www.imdb.com
/name/nm0000102/)
• Existen otros 1000 actores
con un número menor a
pesar de haber tenido una
carrera prolífica (60
películas, más de 1900
vínculos directos)
• Número de Bacon de
Salma Hayek es de 2 ya
que participó en Four
Rooms (1995) con Marisa
Tomei quién a su vez actuó
en Loverboy (2005) con
Kevin Bacon.
* Evidencia empírica reciente
• Trabajos con redes who-talks-to-whom
• Leskovec y Horvitz utilizaron datos de
conversación en Messanger con 240 millones
de cuentas
• Resultado: casi todas incluidas en componente
gigante
• Con muestra de 1000 calcularon longitud de
trayectoria mínima: media (6.6), mediana (7)
• Precaución: no necesariamente coincide con
red de amistades
* Grados de separación en red
del Messanger
* Búsqueda de primer-aliento
(breadth-first search)
• Método para calcular longitud de trayectoria más corta en una
red con miles o cientos de miles de nodos
• (i) Determinar a todos los amigos del nodo x que están a una
distancia de 1.
• (ii) Encontrar a todos los amigos que están a una distancia de
1 de los amigos de x, pero sin incluir a los amigos con los que
x tiene vínculos directos, y declarar que éstos están a una
distancia de 2.
• (iii) Determinar a todos los amigos de los nodos que están a
una distancia de 2 de x, pero sin incluir a aquellos que tienen
vínculos directos con x o que están a una distancia de 1 de x,
y declarar que éstos están a una distancia de 3 y así
sucesivamente.
• Organización de los nodos en función de las
etapas de separación
8.4. El problema de la búsqueda
• No es lo mismo identificar la existencia de trayectorias
cortas que encontrarlas
• En el experimento de Milgram c/individuo recibe una
carta, en la red de W & S se hace una búsqueda de
amplio espectro y luego se calcula la trayectoria
mínima
• El tendido aleatorio de W & S no toma en cuenta la
distancia social entre individuos. Existen barreras
geográficas, religiosas, de status, profesionales
• Las cartas dirigidas al corredor de bolsa de Boston
seguían por lo general criterios geográficos o de
ocupación
• En cada etapa los individuos identifican cual es la
mejor trayectoria sin preocuparse de lo que los demás
destinatarios intermedios hagan con su envío
* Búsqueda descentralizada
• Kleingber plantea un modelo en el que los tendidos
aleatorios se hacen sobre una retícula
• Sin embargo, los lazos débiles son menos factibles
conforme mayor es la distancia
• Uno de c/k nodos elegidos al azar presenta un tendido
aleatorio
• Prob de conectar v con w: d(v, w) –q
• Si exponente de aglutinamiento (q > 0) probabilidad
del lazo se reduce en función de la distancia
• Para redes grandes q=2 produce búsqueda eficiente
• Con regla cuadrática-inversa los tiempos de
búsqueda son reducidos a pesar de sólo conocer a
vecinos
• Con q pequeña
• Con q grande
• Intuitivamente, la regla cuadrática inversa permite
lazos aleatorios distribuidos uniformemente en las
distintas escalas de resolución de la red
• Con tendidos aleatorios en distintas escalas dos
nodos elegidos al azar pueden ser encontrados en
pocos pasos
• En anillo entre circunferencia d y 2d existen ~ d2
nodos
• Probabilidad de conectar a un nodo ~ d-2
• Probabilidad de que al menos un nodo conectado ~ d2
. d-2 = 1
• Probabilidad acumulada es independiente de d
• Distancia a la que se encuentra un anillo no incide en
la probabilidad de que exista lazo débil
* La búsqueda descentralizada en
Netlogo
• Modelo elaborado por Bakshy y Adamic
• Red en una retícula bidimensional en forma de torus
• Lazos con 4 vecinos y tendido aleatorio de acuerdo a
la regla:Prob [lazo (v, w)] ~ 1/d(v,w)-r,
• Se elige al azar un nodo-salida y nodo-objetivo
• (i) En c/paso se verifica si el nodo alcanzado es el
objetivo
• (ii) Tomar lazo no utilizado con el tendido de mejor
posicionamiento
• (iii) Si todos visitados, tomar el mejor
• Notar que r = 0 no es el valor óptimo, ¿Cuál es?
• Red virtual:
• Resultados
• r = 7.3 → tiempo de búsqueda promedio = 25.37
• r = 1 → tiempo = 12.56 pasos
* Evidencia empírica de regla
cuadrática-inversa
• En redes reales nodos no están igualmente
distribuidos en el espacio geográfico
• Ejemplo: subscriptores de LiveJournal
• Alternativa: ‘redes de amistad basadas en
rango’
• Probabilidad de lazo débil ~ R(v,w)-1
• Rango = número de nodos que están más
cerca de v de lo que esta w
• Liben-Nowell probaron que con regla de rangoinversa se logra búsqueda eficiente
• Con red uniforme se tiene que R(v, w) = d2 por
lo que regla de rango es una generalización
• Con 500,000 usuarios de sitio Livejournal se
encontró que la probabilidad de que dos nodos
conectados con un rango r ~ r-1
• Coeficiente de la ley de potencia para frecuencia de
parejas de nodos con rango r entre -1.15 y -1.12
• Si se divide entre Costa Oeste y Este se encuentra
mejor aproximación (-1.05)
8.5. Las redes jerárquicas
• W & S mostraron que los puentes sociales tienen un papel
crítico en la arquitectura de la red
• Pero la información que se distribuye no se genera de manera
simétrica
• Conectores: agentes cuyos vínculos con diversos grupos
sociales les permiten propagar modas, tendencia, difundir
gustos, innovaciones, prácticas empresariales
• Las redes aleatorias de E & R, W & S son de tipo igualitario
(igual número de lazos -grado- por nodo) → no es posible
describir conectores
• Si la web fuera una red aleatoria igualitaria la probabilidad de
una página a la que se ligan 500 páginas sería de sólo 10-99.
• Entonces ¿por qué existen amazon, google, yahoo?
• Estudio de Barabási con la página de la Universidad de Notre
Dame: 82% eran ligadas por tres o menos, 42 páginas tenían
más de 1,000 ligas
*
Redes jerárquicas versus redes igualitarias
• (a) jerárquica centralizada
• (c) igualitaria aleatoria (W&S)
(b) jerárquica descentralizada
(d) igualitaria distribuida
• Estructura jerárquica descentralizada (hubs): rutas
aéreas en los E.U. Un número reducido de
aeropuertos tienen una cantidad enorme de
llegadas y salidas (Atlanta, Dallas, Chicaho, N.Y.),
demás aeropuertos con pocos vuelos
• Otros hubs: artistas de cine (los conectores
participan en películas de diversos géneros),
ecosistemas, moléculas vinculadas entre sí
• Además del grado de separación y el
aglutinamiento, la jerarquía es una tercera
propiedad
• Puede haber mundos pequeños en redes
igualitarias pero también en jerárquicas
• Si el promedio es de seis pasos de separación, los
conectores tienen dos o tres
• W & S sobreestimaron la importancia del modelo
beta en la descripción de la realidad
* La topología y el crecimiento de
las redes
• En una red igualitaria la distribución asociada tiene
forma de campana; existe una escala o
comportamiento típico
• En una red jerárquica la distribución asociada es la ley
de la potencia; se habla de una escala-libre
• Ley de la potencia en: paginas web, actores de
Hollywood, red eléctrica, comunidad científica,
circuitos de un chip de computadora
• Necesidad de explicar la dinámica de crecimiento de
una red: auto-organización.
• En W & S la red es estática, en la red de Barabási la
topología de la red está asociada a su crecimiento
• La topología jerárquica: su crecimiento a partir del
criterio de vínculos preferenciales
• La antigüedad hace que nodos más viejos tengan
más posibilidades de ser conectados
• Nodos con más lazos tienen mayores posibilidades
de recibir conexiones de nuevos nodos
• Para que exista una topología de hubs se requiere
que la red crezca y que los vínculos se establezcan
por popularidad
• La red de actores y la de páginas web empezaron
con pocos nodos, los cuales se han ido añadiendo
poco a poco
* La popularidad de los nodos y la
ley de la potencia
• (i) Las páginas se crean en un cierto orden, enumeradas de
acuerdo a su periodo de aparición en la Web 1, 2,……,N.
• (ii) Cuando se crea la j-ésima página se produce una liga con
una página establecida previamente de acuerdo con:
• (ii.a) Con probabilidad p la j-ésima página elige a la i-ésima
pagina, de entre las existentes, a partir de una distribución
uniforme y establece una liga con ella.
• (ii.b) Con probabilidad 1 – p la j-ésima página elige a la iésima página, de entre las existentes, a partir de una
distribución uniforme y establece una liga con la página a la
que se vincula la página número i.
• (iii) El proceso se repite N número de veces suponiendo cada
vez que la nueva página crea una sola liga con las páginas
existentes.
• Notar proceso de popularidad: en i-esima página en
(ii.b) la liga se establece con la página con la que ésta
se vincula.
• (ii.b´) Con probabilidad 1 – p la j-ésima página elige a
una página l con una probabilidad que es proporcional
al número de páginas que se vinculan con l, creando
así una nueva liga con l.
• Páginas que mantienen k lazos entrantes se
distribuyen aproximadamente con una ley de la
potencia 1/kc,
• Evidencia: frecuencia de páginas con k
vínculos es proporcional a 1/k2; números
telefónicos 1/k2; libros vendidos 1/k3; artículos
citados 1/k3.
*Redes con vínculos preferenciales
• NetLogo : Model Library → Sample Models → Networks → Preferential
Attachment
• La corrida se inicializa con dos nodos conectados, a los cuales se les
incorpora uno más en c/periodo
• La probabilidad de conexión se establece en función de los lazos que parten
de cada nodo
• Interfase con gráfica (grado versus número de nodos) en escala normal y
logarítmica
• La línea recta se observa para un cierto rango de los grados (distribuciones
de escala-libre para valores no acotados)
• Por lo tanto este rango se amplia cuando aumenta el tamaño de la red
• En la interfase nodos de tamaño diferente identifican su grado
*Algunas variantes de redes jerárquicas
• (a) En otros modelos los nodos de la red se pueden retirar ya
sea por antigüedad o por pérdida de popularidad
• No en todos los casos las conexiones se describen a través de
una distribución de escala-libre
• (b) La vinculación preferencial se modifica cuando se describe
un entorno de competencia
• ¿Cómo explicar el éxito del Google y otros nodos de aparición
tardía?
• Con competencia la antigüedad puede dejar de ser importante,
nodos atraen conexiones (nuevas y previas) por sus
capacidades (i.e. consumidores que prefieren un nuevo
producto)
• Agregar función de adaptación: habilidad para hacer amigos,
calidad de la compañía, potencial para atraer clientes,
versatilidad de un actor y, en general, capacidad de un nodo
para incrementar su grado
• Cuando la capacidad de adaptación de un nodo es
“abrumadora” (el ganador-se-lleva-todo) da lugar a una
topología en forma de estrella (e.g. Windows con el 86%)
*La popularidad y sus consecuencias
en la industria del entretenimiento
• Popularidad de libros, albums y películas es frágil
• Despeje inicial por sencuencia de accidentes, luego entra el
efecto de vínculos preferenciales
• Si la historia se repitiera ¿que pasaria con Harry Potter y el
Código da Vince?
• Libros mejores pasan inadvertidos para grandes audiencias
• Experimento de Salganik et al: Crearon sitio de 48 canciones
desconocidas, se podían oir y ver número de descargas antes
de bajarlas
• Internautas no sabían que había 8 sitios (repetir la historia)
• Resultado: participación de mercado muy diferente
• Noveno sitio sin contador de descarga: distribución más
simétrica → resultado de ‘dinero-llama-dinero’
• Dificultad para predecir blockbusters
• ¿Qué conviene encontrar ‘best-sellers’ o
vender pocos volúmenes de muchos títulos?
• Venta de nicho se ha hecho posible por
Internet, no hay necesidad de contar con red
de almacenes: Amazon, Netflix, I-tunes
• Fenómeno de colas largas (Long Tails) de
Chris Anderson
• Ventajas competitivas del e-commerce
• Requerimientos: amplia cobertura, bajos
costos de inventarios y de distribución
El caso de Amazon (2000 y 2008)
• Fenómeno de las colas largas = recíproco de la ley
de la potencia
• Factor subyacente en ambos casos es el proceso de
popularidad.
• CL = cantidad de copias que vende un título que se
ubica en el j-esimo sitio de popularidad, LP = número
de títulos que pueden vender al menos k copias
• Cola Larga
Ley de la Potencia
8.6 La afiliación como criterio de
distancia social
• ¿Cómo incorporar al análisis la densidad o cohesión sin tener
que suponer como sustrato la rejilla de un autómata celular?
• H. White: los contextos (asociación gremial, actividad
deportiva, grupo social) en los que se desenvuelven los
individuos son criticas para explicar la naturaleza de sus
redes
• Cuando dos personas no tienen afiliaciones comunes resulta
poco probable que tengan vínculos entre si.
• Estructura social (identidad) → redes sociales; la gente se
conoce por lo que hacen
• Cuando se parte de la estructura social (afiliaciones) se
pueden construir redes bimodales (o bipartitas)
• Existen dos tipos de distribución de grados: número de
grupos a los que pertenece cada actor (afiliación de actores)
y número de actores que pertenecen a cada grupo (afiliación
de grupos)
* Redes de afiliación bipartita
* Un modelo de redes de afiliación
• Ejemplo de una red de afiliación: consejeros de empresas (un
conjunto de nodos para las empresas y otro para los
consejeros)
• En el modelo se establece un emparejamiento aleatorio entre
los dos tipos de nodos → redes uni-modales de afiliación
presentan cliques traslapados y trayectorias cortas
• Además de formarse redes de mundo pequeño se logra
precisar adecuadamente la distribución de grado
* La intensidad de las afiliaciones
• Depuración del concepto de identidad social en base a su
intensidad ¿qué tan distantes se encuentran sus afiliaciones?
• (a) En el caso del contexto social en una sola dimensión:
Número de pasos que se tiene que subir en una jerarquía para
encontrar la bifurcación común
• (b) Multiplicidad de dominios: permite navegar y transmitir
información de manera más eficiente.
• Se pueden encontrar nodos definidos aleatoriamente en una
red cuando los actores utilizan relativamente pocas
dimensiones. Una sola implica aislamiento, muchas equivale al
caso de tendidos aleatorios
* Co-evolución entre redes sociales y
de afiliación
• A la par de redes de afiliación hay redes sociales
• No son estáticas ya que hay Mecánica co-evolutiva:
• Selección: pertenecen a un mismo grupo y forman lazo de
amistad (cierre focal)
• Influencia social: A se involucra a un grupo ya que su amigo B
ya era integrante (cierre de membresía)
• Cierre triádico tradicional: amigos de uno tienden a ser amigos
• Evidencia empírica: Christakis y Fowler sobre
obesidad con 12,000 en 32 años
• Resultado: obesidad es un asunto de redes:
separación en dos clusteres
• (i) Homofilia por variables diferentes al peso
• (ii) Selección que hizo posible su amistad
• (iii) Influencia social: imitación que hizo que
cambiaran prácticas alimenticias
• Aunque se ve como un problema de salud
pública, parte de solución está en contagio
social.
8.7 El contagio a través de
redes sociales
• Redes producto de decisiones y redes condicionan decisiones
• Redes: propagación de adicciones, emociones, normas
sociales, pánicos financieros, relaciones cliente-proveedor,
matrimonios
• Emociones y enfermedades transmitidas por factores
psicosomáticos
• Christakis y Fowler: relevancia de las influencia de 3er grado
(hiperdiadas)
• Contrauitivo: la esposa de un colega del trabajo de mi hermano
incide en mi comportamiento a pesar de no conocerla
personalmente
• Imitación: cambios de conducta y de normas
• Normas de obesidad más allá de mis conocidos directos
* Contagio social vs biológico
• Ideas y enfermedades a través de redes sociales,
pero…
• Contagio social involucra una toma de decisión
• Contagio de enfermedades mecanismo aleatorio
• En sociales cuando es díficl conocer factor causal
subyacente
• Emociones: ansiedad, risa, dolor, parálisis e histeria
(enfermedades psicogénicas masivas (EPM)
• Emociones son menos deliberativa, instintivas
• Capacidad de leer e imitar emociones ofreció
capacidad evolutiva
* Un modelo tradicional de emociones
• Modelo epidemiológico tradicional, agentes con
tres estados: susceptible (S), infectado (I),
resistente (R)
• Poblaciones mezcladas: individuos tienen la
misma probabilidad de ser contagiados por
unidad de tiempo
• Realidad: individuos en contacto con pequeña
fracción de la población no elegida
aleatoriamente
• Variables S(t), X(t), R(t) que describen valores
esperados: promedio si el proceso se repitiera
varias veces
• Probabilidad de que una persona cualesquiera
entre en contacto con una susceptible: S/n.
• Si b = promedio de personas con las que un
individuo tiene contacto, por unidad de tiempo
• Persona infectada tiene contactos con bS/n
• Promedio de nuevas infecciones viene dada
por bSX/n.
• En segunda etapa; personas infectadas se
‘recuperan’ a una tasa constante g.
• Recuperacion rápida más facible (exponencial)
vs duran enfermos un periodo (normal),
segundo escenario más real pero no se
considera
• Dinámica epidemiológica
• Solución
ds
  b sx
dt
dx
 b sx  gx
dt
dr
 gx
dt
t
1
g

r
0
du
 bu / g
1  u  s0 e
* SIR: difusión de enfermedades
• En estado estacionario: r = 1 – e-br/g
• Para b  g: transición epidémica
• Régimen epidémico: enfermedad se propaga cuando g < b
* Epidemias a través de redes
• Probabilidad de que dos personas al azar
entren en contacto << probabilidad de que una
persona entre en contacto con colega o amigo.
• Nodo infectado v puede contagiar a un nodo
susceptible w sólo si existe un lazo que los
vincula directamente.
• Red direccional tendría sentido cuando se trata
de una relación asimétrica.
• Por ejemplo: virus se transmite de un agente
que tiene una mayor capacidad para generar
anti-cuerpos a uno que tiene menor capacidad.
* Algoritmo de contagio (Easley
y Kleinberg)
• (i) Inicialmente un número determinado de nodos I
están infectados y el resto de la población se
encuentra en el estado S;
• (ii) Cada nodo v que entra en el estado I se mantiene
infectado por un número fijo de periodos (t1);
• (iii) A lo largo de estos t1 periodos el nodo v tiene la
probabilidad de pasar la enfermedad a alguno de sus
vecinos que sea susceptible;
• (iv) Después de los t1 periodos el nodo v se vuelve
resistente y, por ende, no puede contagiar
enfermedades ni ser contagiado a partir de ese
momento.
* Transmisión de enfremedades
a través de una red
* Propagación de un virus a
través de red
• Library → Sample Models → Networks → Virus on a Network.
• Tres estados: S, I, R
• Un nodo infectado (rojo) contagia a uno susceptible (verde) con
el que está vinculado en función de una probabilidad.
• La infección de un nodo no es detectada inmediatamente
• Un nodo infectado es detectado con una cierta probabilidad
• A partir de otra probabilidad se establece si dicho nodo se
vuelve resistente a contagios futuros.
• Resultado: infecciones se propagan pero crecimiento de nodos
resistentes hace que los nodos infectados desaparezcan
• Robusto a modificaciones en parámetros a menos que
probabilidad de que un nodo se haga resistente sea nula.
• Condiciones iniciales
• Monitor de estatus de la red
*Difusión de recursos a partir de red
direccional
• Library → Sample Models → Networks → Diffusion on
a Directed Network
• Sembrado inicial: nodos reciben misma cantidad del
recurso
• Se diferencian por la cantidad de lazos que entran y
salen
• Observador especifica número de nodos y porcentaje
promedio de conexiones
• Estado estacionario: mayoría de nodos se encuentran
sin recurso alguno y unos cuantos acaparan casi todo
• Distribución más asimétrica conforme la probabilidad
de que un nodo tenga un vínculo es cercana a 1/2
• Red en estado estacionario
• Con retrazado-aleatorio

power point

Transcript power point

Directory