세계 영화배우 네트워크 분석

Download Report

Transcript 세계 영화배우 네트워크 분석

세계 영화배우 네트워크 분석
영화배우 네트워크의 특징과 부익부 빈익
빈 현상에 대한 연구
Network theory(1)
Link
Node
 Node
어떠한 대상을 가리
키는 객체
 Link
Node와 node사이
의 연결선
 Degree
어떠한 node가 가
지는 link의 개수
Network theory(2)
 Average degree
모든 node에 대한 degree의 평균
 Characteristic path length
임의의 두 node 사이를 잇는 최단거리의 평균
 Diameter
모든 node의 짝들을 잇는 최단거리를 구했을 때
그 중 가장 큰 값
Network theory(3)
c
b
a
 Clustering
b와 c가 공통의 node a에
연결되어 있는 경우, b와
c가 연결되어 있을 가능성
 Clustering coefficient
Clustering의 정도를 정량
화 한 값.
Network theory(4)
a
 Clustering coefficient
어떤 node의 degree가
n일 때, 그 node가 갖
는 삼각형 모양(triad)의
개수를 이론적으로 가
능한 삼각형 개수의 최
대값인 n(n–1)/2로 나
눈값
Weighted network
 Weight
Link에 주어지는 가중값
 Strength
한 node에서 가중값들
의 합.
Scale-free network
 Node의 link수의 분포가 멱함수 분포
P(k)~k- 를 따르는 network를 Scale-free
network라고 한다.
 항공망 network, 논문 공저자 network, 인
터넷, www 등이 이에 해당한다.
Poisson distribution
Exponential Network
Power-law distribution
Scale-free Network
부익부 빈익빈으로 성장하는 network
 전산물리 homework set #5의 2번 문제를
참고한다.
 Barabasi-Albert Model
Network는 성장하며, 새로 태어난 node는
기존 node들 중에서 link 수에 비례하는 확
률로 선택하여 연결함.
영화배우 network
 Network의 특성
 부익부 빈익빈 현상
영화배우 network
 영화배우 network의 average degree,
clustering coefficient 등 기본적인 속성들
에 대해 알아본다
 영화배우 network의 weight, 공백기,
weight(t) – d(weight(t))의 분포로 부익부
빈익빈 현상을 관찰한다.
영화배우 network의 구성(1)
 http://www.imdb.com
영화배우 – 영화(년도)의 방식으로 DB가
형성되어 있음.
 C언어를 이용하여 영화, 영화배우, 년도를
읽어 들여 integer로 변환
영화배우 network의 구성(2)




















…
4123595
4123596
4123597
4123598
4123599
4123600
4123601
4123602
4123603
4123604
4123605
4123606
4123607
4123608
4123609
4123610
4123611
4123612
…
Penny, Val
I Love Christmas (2001) (TV) [Herself] <50>
On the Game (1973) [2nd Prostitute] <29>
Schalken the Painter (1979) (TV) [Lesbia] <7>
Sex Thief, The (1973) [Stripper] <22>
What's Up Nurse! (1977) [Nudist] <42>
Peno, Lola (I)
De tripas coraz처n (1985)
Matador (1986) [Alumna 1쨘] <14>
Peno, Lola (II)
Dancer Upstairs, The (2002) [Nurse] <42>
Grimm (2003) [Woman on balcony] <9>
No somos nadie (2002) [Hermana Mar챠a Dolores] <17>
Penot, Carole
Au nom de tous les miens (1983) [Nicole Gray] <39>
Penotti, Bernadette Kiss of Death (1995/I) [Molested Dancer] <29>
No Way Home (1996) [Ronnie] <7>
Regarding Henry (1991) [Lawyer] <35>
영화배우 network의 구성(3)


















…
70223
70224
70225
70226
70227
70228
70229
70230
70231
70232
70233
70234
70235
70236
70237
70238
…
Datorie si sacrificiu (1926)
D챠a tras d챠a (1951)
Datsche, Die (2002)
Datsugoku (1950)
Datsugoku Hiroshima satsujinsh청 (1974)
Datta (1951)
Datta (1976)
Dattak (2001)
Datterich (1976) (TV)
Datterich, Der (1963) (TV)
Dattuputhran (1970)
Datum, Das (1998)
"Dat ziet ge van hier" (1953)
Daud (1997)
Daughter (1994)
Daughter (2002)
영화배우 network의 구성(4)






















..
564181
564182
564183
564184
564185
564186
564187
564188
564189
564190
564191
564192
564193
564194
564195
564196
564197
564198
564199
564200
..
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Bailey,
Jennifer
Jennifer Rebecca
Jessie
Jo
Jordan
Josephine
Judy (II)
Juli
Julie
June
Kai
Karen
Katharine
Kathleen
Kathleen M.
Kay
Kiara
Kim (I)
Kim (III)
Kimberly
영화배우 network의 구성(5)






















..
909
909
909
909
909
909
909
909
909
909
909
909
909
909
909
909
909
909
909
909
..
1947
1947
1947
1948
1948
1948
1953
1953
1954
1954
1955
1955
1956
1956
1957
1957
1957
1964
1965
1973
308332
500
94551
202651
289956
82773
143402
272072
205305
279488
122006
139337
265733
276575
238585
282000
29886
61180
190273
180779
영화배우 network의 특성
 Average degree
k = 61
 Characteristic path length
l = 3.65
 Clustering coefficient
C = 0.79
 D. Watts and S. Strogatz, Collective dynamics
of small world networks 에서 인용
영화배우 network의 부익부 빈익빈 현상
 S – dt/ds그래프가 선형 증가 하는 모습을
나타냈다.
이로서 부익부 빈익빈 현상이 뚜렷하게 나
타났음을 알 수 있다.