Hálózatba kapcsolt adatbázisok * Hálózatelmélet

Download Report

Transcript Hálózatba kapcsolt adatbázisok * Hálózatelmélet

Szinkronizáció és terjedés önszerveződő hálózatokban

High Speed Networks Laboratory 1 / 38

Terjedés önszerveződő adatbázisokban

1.

• • Bevezető és áttekintés Az előző rész tartalmából… • Forgalommonitorozás játékelmélettel Milyen terjedési folyamatokat vizsgálunk?

2.

• Önszerveződő adatbázis mérete Meddig nő egy adatbázis?

3.

Szinkronizáció adatbázisokban 1.

2.

Vírusterjedés Kaszkádok kialakulása 4.

OHV 2 / 38

Múlt órai áttekintés: játékelmélet alapok

• • • Optimális stratégia keresése Legjobbválasz-leképezés, Nash-egyensúly beállása Braess-paradoxon 3 / 38

Múlt órai áttekintés: egyensúly vs optimum

• • • • Optimálsi átviteli idő ≠ egyensúlyi átviteli idő Braess-paradoxon: upgrade nem Legjobbválasz-leképezések feltétlenül javít az átviteli időn → Nash egyensúly Az optimumnak legfeljebb kétszerese 4 / 38

A mai óra tartalmából:

• Hálózatok növekedése • Egy magára hagyott hálózat meddig nő?

• Szinkronizáció • • • Terjedési jelenségek a hálózatban Hogyan terjednek a vírusok?

Hogyan alakulnak ki a kaszkádok?

5 / 38

Stabilitás önszerveződő adatbázisokban

1.

• • Bevezető és áttekintés Az előző rész tartalmából… • Forgalommonitorozás játékelmélettel Milyen terjedési folyamatokat vizsgálunk?

2.

• Önszerveződő adatbázis mérete Meddig nő egy adatbázis?

3.

Szinkronizáció adatbázisokban 1.

2.

Vírusterjedés Kaszkádok kialakulása 4.

OHV 6 / 38

Egy önszerveződő adatbázis mérete

• • Meddig nő egy önszerveződő adatbázis?

Wi-Fi a K épületben vs. a Q-ban • Populációk növekedése – Verhulst modell • Erre a jelenségre is használható 7 / 38

Lineáris növekedési modell

• • Legegyszerűbb: • •

r N(t)

= az adatbázis mérete = növekedési ráta

t

időpontban d𝑁 • = 𝑟 𝑁(𝑡) d𝑡 A növekedés üteme időben állandó r • • t Exponenciális növekedés • • 𝑁 𝑡 = 𝑁 0 𝑒𝑟 𝑡 A hálózat felrobban Nem mehet a végtelenségig 8 / 38

Módosítás

• • Vegyük be a túlnépesedést = túl sokan vannak Korlátos erőforrások = a szerver csak bizonyos számú számítógépet tud kiszolgálni • • • • • A növekedési ráta nem időben állandó Kis

N

-re

r

még konstans Egyre jobban csökken

K

= carrying capacity = teherbírás Ha

N

>

K

, akkor hagyják el a hálózatot, mint ahányan jönnek negatív: többen A növekedési ráta változása az adatbázisban levő számítógépek számának függvényében.

9 / 38

A növekedési modell

• • Kezelhető verzió: vesszük az egy egységre eső növekedést: Ez

N

-ben lineárisan csökken • Kapjuk: logisztikus növekedési modell • Kérdés: N(t) = ?

• • Meg lehet oldani analitikusan És grafikusan 10 / 38

• • • •

A növekedés mértéke

-t függvényében • • • • • • • • a növekedés gyorsasága K/2-ig nő, utána csökken K után negatív =0, és oldjuk meg N-re 11 / 38

Mit jelent mindez?

• • • • • Mit jelent mindez?

Először gyorsan nő, aztán egyre lassabban A teherbírást ha túllépi, csökkeni fog • Többen hagyják el a hálózatot, mint ahányan jönnek 0 fixpont, de instabil: kicsit megváltozik, akkor K-ba konvergál K fixpont, stabil: perturbáció hatására oda visszatalál 12 / 38

Még jobban lefordítva

• • • • • • Ez a modell nem mindenható, de az alapvető jelenségeket jól mutatja Az történik, amit intuitívan várunk Elkezd nőni, beáll a teherbírás körüli értékre Ha magára hagyjuk, akkor e körül ingadozik Előrször gyorsabban nő, majd lassabban Ha túllépi a teherbírást, akkor csökken 13 / 38

Stabilitás önszerveződő adatbázisokban

1.

• • Bevezető és áttekintés Az előző rész tartalmából… • Forgalommonitorozás játékelmélettel Milyen terjedési folyamatokat vizsgálunk?

2.

• Önszerveződő adatbázis mérete Meddig nő egy adatbázis?

3.

Szinkronizáció adatbázisokban 1.

2.

Vírusterjedés Kaszkádok kialakulása 4.

OHV 14 / 38

Szinkronizáció

• Szinkronizáció = közös állapotba kerülés • ≠ ritmikusság • • Közös tudás elterjedése Közös állapotba kerülés 15 / 38

Szinkronizáció két esetben

1.

Vírusterjedés • • Modellek Vírusok skálafüggetlen hálózatban 2.

• Kaszkádok kialakulása Újítás elterjedése 16 / 38

Vírusok terjedése önszerveződő adatbázisban

• • • • • Vírus • utasításhalmaz ami elsősorban önmaga sokszorosításáról szól Mennyire fertőző Mennyi ideig tartja a gazdát fertőző állapotban Nagyon hasonlít az embert támadó vírusokra • HIV, Ebola, Influenza Számítógép vírusok • • • • • • Internet előtt (floppy-n) Az Internet elterjedésével nulla energiával Broadcast keresés (mindegy kit) Exponenciális növekedés Ma már inkább észrevétlenség, adatszerzés, kapacitás ILOVEYOU vírus 17 / 38

Vírusterjedés: SIR modell

• • • • Vírusterjedés vizsgálata SIR modell Természetesen tudni kell, hogy ki kivel érintkezik S(t),I(t),R(t): fertőződésre hajlamosak, fertőzőek, gyógyultak száma t-kor • • β = S → I contact rate ν = I → R recovery rate Lassú, robbanás, lecsengés 18 / 38

Vírusterjedés véletlen gráfmodellben

• • • Legkönnyebb vizsgálni: véletlen gráf • Nem életszerű, de jó kiindulópont Reprodukciós arány = egy fertőzött egyed egy egészséges populációban hány újat fertőz meg az élettartama alatt

R

0  

S

 Véletlen gráf esetén a reprodukciós arány teljesen meghatározza a lefolyást • • R 0 < 1 : hosszú távon kihal a vírus R 0 > 1: hosszú távon mindenki megfertőződik 1

R

0  1 Reprodukciós arány 19 / 38

Vírusterjedés kisvilág modellben

• Rács esetén csak az igazán durva betegség teljed el • • A shortcutokon keresztül gyorsan terjed a vírus Új közösségeket megfertőzve • • • A kisvilágságot figyelmen kívül hagyva, az emberek nem érzik a veszélyt Viszont van esély fellépni a kezdeti szakaszban • • Modularitás mesterséges növelése Reprodukciós arány csökkentése, immunizálás Egy védekezési stratégia: a shortcutok elvágása • Tűcsere program 1   1   0 1 Fertőzőképesség 0 1 Véletlen élek aránya 20 / 38

Vírusterjedés skálafüggetlen hálózatban

• Ez áll a legközelebb a valós önszerveződő hálózatokhoz • Virus bulletin • • A legtöbb számítógép vírus hosszan képes rejtőzködni a hálózatban Hogy lehetséges ez? (SIR modellben nem lehet) • Skálafüggetlen modell • • Eltűnik a küszöb Kegyetlen védekezési stratégia: • • Hubok immunizálása De hogy találjuk meg őket?

21 / 38

Vírusok elleni védekezés

• • Hubokat immunizáljuk Véletlen alany véletlen ismerősét immunizáljuk • Számítógép vírusok • • • Microsoft minden kompatibilis mindennel „When you are dealing with rootkits and some advanced

spyware programs, the only solution is to rebuild from scratch. In some cases, there really is no way to recover

without nuking the systems from orbit" Mike Danseglio, program manager in the Security Solutions group at Microsoft 2006 "Detection is difficult, and remediation is often impossible," Danseglio declared. "If it doesnt crash your system or cause your system to freeze, how do you know its there? 22 / 38

Véletlen immunizálás vs hubok védelme

• Ha véletlenszeűen immunizáljuk a csomópontokat: • • • Kiválasztunk 5 csomópontot Ezeket + a szomszédaikat immunizáljuk 24 csomópontot érünk el 23 / 38

Véletlen immunizálás vs hubok védelme

• Hubokat • immunizáljuk 1 lépésben ≈ 60 csomópontot érünk el • A hatékony megoldás a hubok védelme • A hubok felvet azonosítása némi problémát… • De ez egy kérdés másik 24 / 38

Stabilitás önszerveződő adatbázisokban

1.

• • Bevezető és áttekintés Az előző rész tartalmából… • Forgalommonitorozás játékelmélettel Milyen terjedési folyamatokat vizsgálunk?

2.

• Önszerveződő adatbázis mérete Meddig nő egy adatbázis?

3.

Szinkronizáció adatbázisokban 1.

2.

Vírusterjedés Kaszkádok kialakulása 4.

OHV 25 / 38

• • • • • •

Érvényes-e a virusterjedés minden terjedési folyamatra? I

Hirtelen változások a társadalolban?

Gladwell: "Ideas and products and messages and behaviors spread like viruses do.„ A terjesztés 3 főszereplője: • • • Kapcsolattőkések ...

akik mindenkit ismernek...

A nagy szakértők

...akik mindenről tudnak...

A nagydumások ...aki kibeszéli a gyereket a hasaból...

A jelenség vonzóereje High Speed Networks Laboratory Független külső körülmények • • • természeti jelenségek véletlen együttállások bámészkodó effektus Reklámozás ez alapján?

26 / 38

• • • • • •

Érvényes-e a virusterjedés minden terjedési folyamatra? II

Az ismertség magyarázható? Az pénzpiaci lufik magyarázhatók? Egy találmány elterjedése magyarázható?

Mi az ami a stabil rendszereket végül romba dönti?

Kaszkádok Externáliák • Nem ismerünk minden körülményt • • • Próbálunk megfelelő információt szerezni És a lehetőségekhez képes racionálisan döntünk Ez többnyire stabil hálózatot eredményez, de néha minden megváltozik High Speed Networks Laboratory Helyi valuta elterjedése • Balatoni Korona Sztrájk kirobbanása,divat, pletyka keringés 27 / 38

Externáliák Asch kísérlet

• • • • Információs externália • • • Zh másolás Telefon választás Boldogulást segíti a komplex világban • Sokszor igen jól működik Kényszerítő externália • • Hasonló az előzőhöz de itt igazából nem változik meg a véleményünk Banda bűnözés Piaci externália • • A dolog értéke nem csak magától a dologtól függ Koordinációs externália • • Törődni kell a jövővel És remélni, hogy a tettünk hat a többiekre 28 / 38

Küszöb modellek

• • • • • Mikor roppansz össze?

A relatív számra vagyunk érzékenyek Mintaméret azért számít Ezért ha kevesebb véleményt ismerünk nagyobb a súlyuk • Hány véleményt kérsz ki egy döntés előtt?

Reklámkampányok • ismerősökön keresztül Vírus vs.

kaszkád High Speed Networks Laboratory Küszöbérték 29 / 38

Kaszkád kialakulásának feltételei

• Kaszkád modell: • • Gráf+küszöbök a csomópontokhoz A dolog megjelenik a hálózatban • • • kiválasztunk pár csomópontot Korán reagálók rezonálnak Többiek stabilak maradnak (hubok is általában) Küszöbérték High Speed Networks Laboratory 30 / 38

Kaszkád kialakulásának feltétele

• • • Korán reagálók csoportja áthatja a gráfot (nagy összefüggő részgráf) Ha az innováció eltalálja ezt a csoportot kialakul a kaszkád Általában is: • az új eszméket kezdetben csak egy kis csoport képviseli • aztán ez begyújthatja a kaszkádot 1 Globális kaszkád 0.1

Nincs gobális kaszkád 0.25

Átlagos küszöbérték • • Ezért egy innováció sikere függ: • • a küszöbértéktől de legalább ennyire a hálózattól is Éppen ezért sokszor a véletlen hozza meg a sikert • rengeteg író, de csak kevés híres • csatatér High Speed Networks Laboratory 31 / 38

Esettanulmány: Egyetemi hálózat fejlődése

• • • Egyetemi hálózat dinamizmusának vizsgálata A változás iránya és a hálózat jellemzőinek összefüggése Globális és lokális tulajdonságok stabilitása • • • Hálózat csomópontok száma: 43553 • Hallgatók • Tanárok Vizsgálati szempontok: • E-mail csere • • Közös ismerősök Közös érdeklődés (látogatott közös órák) Időtartam: • • 1 oktatási év Többnyire 60 napos időablak 32 / 38

Új kapcsolat kialakulásának valószínűsége

High Speed Networks Laboratory • • d ij – Legrövidebb távolság i és j csomópontok között p new – kapcsolat kialakulásának valószínűsége 33 / 38

Rövidzár valószínűsége közös ismerőssel rendelkezők között

High Speed Networks Laboratory • • • Strong indirect – Kapcsolat erősség e-mail-ek alapján M, F – Male, Female Obstruction – A közös ismerős más jellegű csoportba tartozik 34 / 38

Globális tulajdonságok kialakulásának változása

High Speed Networks Laboratory • • 30, 60 és 90 napos átlagolás fokszám, legnagyobb komponens aránya, közepes legrövidebb út, klaszterezési együttható 35 / 38

Lokális tulajdonságok változása

High Speed Networks Laboratory • • Logaritmikus fokszámeloszlás a 61. és 270. napon (A, B) Eloszlások közötti különbség (D), az egyének szerepének változása (ζ) 36 / 38

Összefoglalás

1.

2.

3.

1.

2.

Önszerveződő adatbázisok kialakulása Struktúra Keresés Forgalom modellezése 1.

Szinkronizáció Növekedés 2.

3.

Vírusterjedés Kaszkádok 37 / 38