复杂网络研究 ——现状与前瞻

Download Report

Transcript 复杂网络研究 ——现状与前瞻

复杂网络
樊瑛
北京师范大学管理学院系统科学系
2011.07.18
Simple
Complex System
Complicated
Complex systems
Complex Systems
Complex systems are all around us:



economies
nature: ant, bee, bird colonies
little robots
相互作用与复杂性
晶格
扩散
全局相互作用
平均场
Internet
?
Complex Networks

complex networks are the backbone of
complex systems



every complex system is a network of
interaction among numerous smaller elements
understanding a complex system = break down
into parts + reassemble
network anatomy is important to
characterize because structure affects
function (and vice-versa)
为什么研究复杂网络?
• 复杂系统不能够用分析的方法去研究,
必须考虑个体之间的关联和作用;
• 理解复杂系统的行为应该从理解系统相互
作用网络的拓扑结构开始;
• 网络拓扑结构的信息是构建系统模型、研
究系统性质和功能的基础。
为什么研究复杂网络?
复杂网络是研究复杂系统的一种角
度和方法,它关注系统中个体相互关联
的作用的拓扑结构,是理解复杂系统性
质和功能的基础。
复杂网络研究所关心的问题


如何建立复杂网络?网络研究中的反问题
如何定量刻画复杂网络?


网络是如何发展成现在这种结构的?


网络结构的描述及其性质
网络演化模型
网络特定结构的后果是什么?正问题


网络结构的鲁棒性
网络上的动力学行为和过程
复杂网络是对复杂系统的一种抽象
Complex systems
Made of
many non-identical elements
connected by diverse interactions.
NETWORK
复杂网络
同质性?(个体、相互作用)
复杂网络的数学描述



网络G=(V, E),由点集V(G)和边集E(G)组成
的一个图,可分为无向、有向和加权网络
令ei∈ E(G),每条边ei有V(G)中的一对点(u,v)与
之对应;
如果任意(u,v)与(v,u)对应同一条边,则称为无向
网络,否则为有向网络;
如果任意∣ei ∣ =1,则称为无权网络,否则为加权
网络。
连接矩阵及拉普拉斯矩阵
技术网络
WWW
因特网
电力网
社会网络
科学引文网
朋友关系网
演员网
科学家合著网
交通运输网络
城市公共交通网
航空网
道路交通网
生态、生物网络
生态网络
蛋白质相互作用网络
神经网络
基因网络
新陈代谢网络
不同领域的复杂网络






社会网:演员合作网,朋友网,姻亲关系网,
科研合作网,Email网,短信网…
生物网:食物链网,神经网,新陈代谢网,蛋
白质网,基因网络…
信息网络:WWW,专利使用,论文引用,…
技术网络:电力网,Internet,电话线路网,
交通运输网:航线网,铁路网,公路网,自然
河流网
经济系统:投入产出网,国际贸易,…
网络研究的历史

1736,欧拉:哥尼斯堡七桥

1950,Erdos, Renyi: 随机图论

1998,Strogatz; 1999,Barabasi: 小世界
和无标度网络
复杂网络的兴起

计算机技术的发展:


普适性的发现:



使我们拥有各种网络的数据库,并有可能对大规模的网络进
行实证研究
许多实际网络具有相同的定性性质
且已有的理论不能描述和解释
理论研究的发展


小世界网络 (Small World Network), 无标度网络 (Scale-free
Network)
统计物理学的研究手段
复杂网络研究所关心的问题

网络的拓扑结构——静态几何量及其统计性质



网络的演化性质和机制模型



度、聚集系数、最短路径、介数、权、相关性
网络上的聚类分析
时间演化性质,偏好性的检验
Small World Network ,Scale Free Network-BA 模型
网络的结构与功能


网络的容错与抗攻击能力
网络上的动力学性质
对网络结构的描述

几何量及其分布
度(Degree):朋友的个数
集聚系数(群系数)(Clustering coefficient):
朋友的朋友还是不是朋友的情况
最短路径(Shortest path):
两个顶点之间边数最少的路径
介数(Betweenness):
经过我的最短路径的条数
一个简单的例子
K●=5
C●=0
K●=5
C●=1
复杂网络的统计分析

度及其分布(Degree)

集聚系数及其分布(Clustering Coefficient)

统计性质的描述方法:


Zipf Plot(顺序、出现频次)
频数统计
复杂网络的结构

四种结构模型:

规则网络

随机网络

小世界网络

无标度网络
规则网络
(a) 完全连接; (b) 最近邻居连接; (c) 星形连接
规则网络
...
(d) Lattice
...
(z) Layers
基本网络模型

随机图论 - Erdös and Rényi (1960)



ER 随机图模型统治四十余年…… 直到今天 ……
当今大量可获取的数据+高级计算工具,促使人们重新考
虑随机图模型及其方法
近年来的重大发现:
 小世界效应 (Watts and Strogatz, Nature, 1998)
 Scale-Free 特征 (Barabási and Albert, Science, 1999)
ER 随机图模型
特征:



连通性:
Poisson 分布
齐次特征:
每个节点大约有相同的
连接数
节点数不增加
小世界网络
特征:
(Similar to ER Random Graphs)
齐次性:
每个节点有大约相同
的连接数
 节点不增加

Small World Network
C(p) : 平均聚集系数
L(p) : 平均最短路径
小世界性质的测度
度分布

分布函数f(k):


网络中度值为k的顶点占总点数的比例
随机网络的度分布——Poisson分布
P(k )  e  pN
10000个顶点
p=0.0015
k
( pN ) k

k

 e  k 
k!
k!
度分布

幂律分布——Power Law
P(k )  k
ln P(k )   ln k

=-3
World Wide Web
Nodes: WWW documents
Links: URL links
800 million documents (S.
Lawrence, 1999)
P(k=500) ~ 10-6
NWWW ~ 109
 N(k=500) ~ 103
INTERNET BACKBONE
Nodes: computers, routers
Links: physical lines
(Faloutsos,et.al 1999)
ACTOR CONNECTIVITIES
Nodes: actors
Links: cast jointly
N = 212,250 actors
k = 28.78
P(k) ~k-
=2.3
SCIENCE
CITATION INDEX
Nodes: papers
Links: citations
SCIENCE
COAUTHORSHIP
Nodes: scientist (authors)
Links: write paper together
1736 PRL papers (1988)
(Newman, 2000, H. Jeong et al 2001)
Metabolic network
Archaea
Bacteria
Eukaryotes
Organisms from all three domains of life are scale-free networks!
H. Jeong, B. Tombor, R. Albert, Z.N. Oltvai, and A.L. Barabasi, Nature, 407 651 (2000)
Scale Free 网络的基本特征
Power Law Degree Distribution(幂律度分布)
P(k )  k
ln P(k )   ln k

P(k )  (k )


 k
1、自相似结构
2、两极分化,高度弥散


  P(k )
Most real world networks have the same
internal structure:
Scale-free networks


其形成机制是什么?
结构与功能?
BA偏好连接模型
——PREFERENTIAL ATTACHMENT
(1) The number of nodes (N) is NOT fixed.
Networks continuously expand by
the addition of new nodes Examples:
WWW : addition of new documents
Citation : publication of new papers
(2) The attachment is NOT uniform.
A node is linked with higher probability to a node that
already has a large number of links.
Examples :
WWW : new documents link to well known sites
(CNN, YAHOO, NewYork Times, etc)
Citation : well cited papers are more likely to be cited again
(1) GROWTH :
At every timestep we add a new node with m edges
(connected to the nodes already present in the system).
(2) PREFERENTIAL ATTACHMENT :
The probability Π that a new node will be connected to
node i depends on the connectivity ki of that node
ki
 ( ki ) 
 jk j
P(k) ~k-3
A.-L.Barabási, R. Albert, Science 286, 509 (1999)
Scale-Free 网络
特征:
 连通性:
幂指数分布(幂律分
布)
 非齐次性:
很少的节点有很多连
接,很多节点只有很
少的连接
 节点数增加
(Hawoong Jeong)
复杂网络中顶点度的匹配关系
Assortative Mixing by Degree

如果网络中度值高的顶点倾向于与其他高度值的顶点相
互连接,则称网络具有同向匹配性质;


例如:社会网络
如果网络中度值高的顶点倾向于与度值低的顶点相互连
接,则称网络具有反向匹配性质;

例如:大部分生物、技术网络
同向匹配
无标度网络
反向匹配
无标度网络
小世界实验

Milgram小世界实验
上世纪60年代哈佛大学社会心里学家Stanley Milgram
社会调查后推断出: 世界上任意两个人平均距离是6.

Milgram实验: 信件传递.


Kevin Bacon游戏




Kevin Bacon美国著名演员
任意一个演员与Bacon一起演过电影则其Bacon数为1.
平均Bacon数为2.944.
周星驰的Bacon数是3.

1967年,哈佛大学的社会心理学家米尔格兰姆(Stanley
Milgram)就设计了一个连锁信件实验。他将一套连锁
信件随机发送给居住在内布拉斯加州奥马哈的160个人,
信中放了一个波士顿股票经纪人的名字,信中要求每
个收信人将这套信寄给自己认为是比较接近那个股票
经纪人的朋友。朋友收信后照此办理。最终,大部分
信在经过五、六个步骤后都抵达了该股票经纪人。六
度空间的概念由此而来。
复杂网络中的社团结构
(Community Structures)
社团内部连接紧密,社团之间连接相对稀疏
Palla et al. Nature 435, 9 (2005)
Palla et al. Nature 435, 9 (2005)
Physics collaboration network
Santa Fe研究所的科学家合作网
经济物理学科学家合作网
Rhesus猴子网
Rhesus monkey network(WEO)
A
male
female
B
C
ER
EZ
CN
KD
076
CY
KE
022
R006
EC
EK
AC
DL
004
065
066
(b)
D
网络模体---Network Motifs
模体——在网络中密度明显较高的子图(基
本结构单元)
网络的结构与功能
网络上的动力学行为和过程
 动力系统:自旋、振子或混沌的同步、可激发
系统…
 传播过程:信息传播与拥堵、网络搜寻、运输
过程、疾病传播、谣言的传播、舆论形成…
 博弈与其他社会行为:囚徒困境、少数者博
弈…
 其他过程:电力网的级联失效等…
复杂网络上的疾病传播
传染病动力学:
SIS 模型
di (t )
  i (t ) s (t )   i (t )
dt
ds (t )
   i (t ) s (t )
dt
i (t )  s (t )  1
SIR模型

有效扩散速率:  

di (t )
  i (t ) s (t )   i (t )
dt
ds (t )
   i (t ) s (t )
dt
dr (t )
  i (t )
dt
i (t )  s (t )  r (t )  1
相互作用结构上的疾病传播
 完全混合
网络结构的影响
规则网格
复杂网络
网络上的动力学—疾病传播
Reachability in Colorado Springs
(Sexual contact only)
 Epidemic Dynamics in
•High-risk actors over 4 years
•695 people represented
•Longest path is 17 steps
Complex
Networks
•Average
distance is about 5 steps
•Average person is within 3 steps
of 75 other people
•137 people connected through 2
independent paths, core of 30
people connected through 4
independent paths
(Node size = log of degree)
Drug sharing network
SIS model on Networks
网络上的疾病传播
 小世界网上的SIS 模型

有效扩散速率  
And Let =1

利用平均场理论计算被感染顶点密度随时间的变化:
稳态解:
传播阈值:
小世界网上的SIS 模型
 计算机数值模拟
N=103_---- N=3* 106, <k>=6, 10 个不同的网络, 100
个不同的初始分布
BA无标度网络上的SIS 模型
利用平均场理论计算被感染顶点密度随时间的变化:
SW
BA
稳态解:
BA无标度网度分布
P(k )  2m2 / k 3
传播阈值为0!
社会网络发端于对群体行为的研究

在1932年的秋天,
在纽约州北部的哈
德森女子学校出现
了流行逃跑。在仅
2周的时间里,14
个女孩子逃走
Dynamic Spread of Happiness in a
Large Social Network
Fig 1 . Happiness clusters in the
Framingham social network. Graphs
show largest component of friends,
spouses, and siblings at exam 6
(centred on year 1996, showing 1181
individuals) and exam 7 (year 2000,
showing 1020 individuals). Each node
represents one person (circles are
female, squares are male). Lines
between nodes indicate relationship
(black for siblings, red for friends and
spouses). Node colour denotes mean
happiness of ego and all directly
connected (distance 1) alters, with
blue shades indicating least happy and
yellow shades indicating most happy
(shades of green are intermediate)
Catastrophic cascade of failures
in interdependent networks

NATURE, Vol 464, 15 April 2010
 power network and an Internet network
Italy on 28 September 2003
复杂网络研究已经波及到众多科
学领域,确实可以称之为形成了
研究热潮。
但还没有做到与其他学科领域的有机结合。
发挥复杂网络研究的意义和价值应该
注意以下几点:



具备所研究的系统的相关知识;
存在一个确实需要网络基础的科学问题,而复
杂网络有助于你解决它。
清楚了解系统相互作用的拓扑结构仅仅是万里
长征走完了第一步,它不可能魔术般地解决系
统的根本问题。
同时应该注意复杂网络研究中所可能
出现的问题
在实证研究中,样本太少或取样的偏差
会导致对网络结构的错误认识。
把系统的某些特性仅仅归结为网络结
构的作用往往是片面的。
例如,对Intenet的容错性
和鲁棒性的研究
102
高度值的中枢节点
核心
低度值的网状核心
101
identical
power-law
degrees
度分布相同的网络的
细致结构未必相同
100
10
10
10
10
我们接下来该做什么?




发现和刻画实际系统的网络结构
模拟网络的演化
探讨结构与功能之间的相互关系
利用网络结构控制和优化系统功能
从网络结构的层面理解社会、经济、
生命、生态等复杂系统的性质。
谢谢大家!