Justyna Signerska Grafy losowe jako modele sieci 1
G lówne metody konstruowania sieci: klasyczny graf losowy G n,p (Erdős, Rényi - 1960) graf losowy z ustalonym rozk ladem stopni wierzcho lków ( 1972)- tzw. model konfiguracyjny sieć ma lych światów (Small-world networks, Watts i Strogatz - 1998) sieć Barabasi-Albert (1999) 2
G n,p : średni stopień wierzcho lka n(n 1)p z = = (n 1)p np (1) n (ostatnie przybliżenie w laściwe dla dostatecznie dużych n) 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 1 0.5 0 0.5 1 3
G n,p a rzeczywiste sieci Niech p k oznacza prawdopodobieństwo, że losowo wybrany wierzcho lek ma stopień k 1. klasyczny graf losowy posiada dwumianowy rozk lad stopni wierzcho lków ( ) n 1 p k = p k (1 p) n 1 k, (2) k który w granicy n kz przechodzi w rozk lad Poissona: p k = zk e z (3) k! (wiȩkszość sieci rzeczywistych posiada rozk lad potȩgowy) 2. niski wspó lczynnik grupowania C z n (4) - wiȩkszość rzeczywistych sieci ma wysoki wspó lczynnik C (zjawisko the friend of my friend is also my friend) 4
5
W jaki sposób uogólnić klasyczny model grafu losowego, aby lepiej modelowa l sieci rzeczywiste? - graf posiadaj acy specyficzny rozk lad stopni wierzcho lków p k (lub ustalony ci ag stopni wierzcho lków {k i }, i = 1, 2,..., n zbiegaj acy do p k dla n ). 6
Dla tak zdefiniowanego modelu: z = k = k kp k, (5) z 2 = k 2 k, (6) gdzie z 2 - średnia liczba s asiadów drugiego rzȩdu dla losowo wybranego wierzcho lka Ogólnie: z m = k2 k z m 1 = k ( z2 z 1 ) m 1 z 1 (7) 7
Przejścia fazowe Przejście fazowe to taka zmiana uk ladu, której towarzyszy nag la zmiana parametrów uk ladu, np. zmiana stanu skupienia uk ladu lub jego sk ladowych, perkolacja. Wyróżniamy dwa parametry: parametr kontroli -np. p w modelu G(n, p) parametr porz adku -np. S-liczba wierzcho lków grafu G(n, p) w tzw. giant connected component w stosunku do n Podstawow a zasad a, która konstytuuje dziedzinȩ fizyki zajmuj ac a siȩ teori a przejść fazowych jako samodzielny obszar badawczy, jest fakt, że zupe lnie różne substancje przejawiaj a w ramach zjawisk towarzysz acych przejściom fazowym takie samo zachowanie, co jest treści a hipotezy uniwersalności opisu przejść fazowych. Przejście fazowe w grafie losowym polega na pojawieniu siȩ tzw. giant connected component. 8
Perkolacja W matematyce teoria perkolacji opisuje zachowanie siȩ po l aczonych grup wierzcho lków w grafie losowym. Znajduje ona także szersze zastosowanie, np. w chemii czy inżynierii materia lowej. 0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50 nz = 458 9
0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50 nz = 1509
W klasycznym grafie losowym G n,p obserwujemy przejście fazowe, gdy z = 1. W grafie z danym rozk ladem stopni wierzcho lków, gdy z 1 = z 2 lub równoważnie, gdy: k 2 2 k = 0 (Molloy, Reed 1995) k=0 k(k 2)p k = 0 (8) Powyżej przejścia fazowego możemy rozważać średni a odleg lość miȩdzy dwoma wierzcho lkami grafu - l: l = log(n/z 1) log(z 2 /z 1 ) + 1 (9) Zauważmy, że nawet w bardzo dużych sieciach l jest dosyć ma le-zjawisko to znane jest jako small-world effect 10
Wspó lczynnik grupowania dla uogólnionego grafu losowego: C = k ik j nz = z n [ k 2 ] 2 k = z k 2 n [ ] 2 c 2 v + z 1 z (10) 11
Funkcje generuj ace rozk lady prawdopodobieństwa a) p k -prawdopodobieństwo, że losowo wybrany wierzcho lek ma stopień k: G 0 (x) = p k = 1 k! k=0 [ d k ] G 0 dx k x=0 p k x k, (11) (12) b) q k -prawdopodobieństwo, że losowo wybrana krawȩdz kończy siȩ wierzcho lkiem stopnia k + 1: k=0 G 1 (x) = q k x k (k + 1)p k+1 x k = = j jp j = k=0 k=0 (k)p k x k 1 j jp j = G 0 (x) z (13) 12
W lasności funkcji generuj acych: 1) jeżeli rozk lad, który generuje funkcja jest poprawnie znormalizowany, to: G 0 (1) = k p k = 1 (14) 2) wartość oczekiwan a możemy obliczyć jako: G 0 (1) = k kp k = k (15) 3) ogólnie, n-ty moment rozk ladu obliczamy jako: k n = [ ( k n p k = x d ) n G 0 (x)] dx k x=1 (16) 4) jeśli funkcja generuje rozk lad prawdopodobieństwa dla pewnej w lasnośći k danego obiektu (np. stopień wierzcho lka w grafie), to rozk lad tej w lasnośći dla n niezależnych obiektów jest generowany przez [G 0 (x)] n 13
Rozmiary sk ladowych spójnośći grafu A. Poniżej przejścia fazowego Każda skończona sk ladowa grafu nie ma cykli - ma strukturȩ drzewa (C 0 dla n ). Wybierzmy losow a krawȩdź. Rozważmy zbiór wierzcho lków, które s a osi agalne z jednego końca tej krawȩdzi - klaster. Niech H 1 (x) generuje rozk lad liczby wierzcho lków w takim klasterze (jego rozmiar): H 1 (x) = x k=0 q k [H 1 (x)] k = xg 1 (H 1 (x)) (17) 14
Funkcja generuj aca rozk lad liczby wierzcho lków w sk ladowej spójnośći, do której należy losowo wybrany wierzcho lek: H 0 (x) = x k=0 p k [H 1 (x)] k = xg 0 (H 1 (x)). Średni rozmiar sk ladowej spójnośći: (18) s = H 0 (1) = [ G 0 (H 1 (x)) + xg 0 (H 1(x))H 1 (x)] x=1 lub równoważnie: = 1 + G 0 (1)H 1 (1) (19) s = 1 + z2 1 z 1 z 2 (20) Przejście fazowe obserwujemy, gdy z 1 = z 2 lub G 1 (1) = 1. 15
B. Powyżej przejścia fazowego -wiȩkszość sieci badanych doświadczalnie znajduje siȩ w tym stanie, ma tzw. giant connected component (GCC). GCC nia ma struktury drzewa dla n. H 0 (x), H 1 (x) - funkcje generuj ace dla rozk ladu wielkości sk ladowych spójności z wy l aczeniem GCC P s -rozk lad prawdopodobieństwa dla rozmiarów sk ladowych spójnośći (poza GCC): H 0 (1) = s P s, H 0 (1) = liczba wierzcho lków grafu poza GCC w stosunku do n. Rozmiar GCC, S, musi być rozwi azaniem uk ladu: S = 1 G 0 (v), v = G 1 (v), (21) gdzie v H 1 (1). 16
Średni rozmiar sk ladowej spójności grafu: s = 1 + zv 2 [1 S][1 G 1 (v)] (22) 17
Teoria perkolacji a odporność sieci na uszkodzenia Proces perkolacji w sieci polega ogólnie na losowym podziale wierzcho lków lub krawȩdzi na dwa zbiory: czynne i nieczynne (working and not working). Model perkolacji zosta l po raz pierwszy zaproponowany w latach 50-tych; motywacj a by la chȩć lepszego zrozumienia zjawiska rozprzestrzeniania siȩ chorób zakaźnych. Wyróżniamy dwa rodzaje perkolacji: site percolation i bond percolation: 18
Miar a odporności sieci na losowe usuwanie wierzcho lków może być zmiana (lub brak zmiany) liczby wierzcho lków, które znajduj a siȩ w najwiȩkszej sk ladowej grafu (GCC). Proces losowego wy l aczania wierzcho lków można rozpatrywać jako site percolation. Wierzcho lki, które pozostaj a w sieci czynne (mog a komunikować siȩ ze sob a) tworz a giant connected component w odpowiadaj acym modelu perkolacji. 19
Rozważmy model grafu losowego, gdzie p k to rozk lad prawdopodobieństwa stopni wierzcho lków. Za lóżmy, że q to czȩść wierzcho lków grafu, które s a czynne (wierzcho lki te losujemy jednostajnie z ca lego grafu). Wtedy p ( ) k k = k q k (1 q) k k (23) k=k p k jest prawdopodobieństwem, że losowo wybrany wierzcho lek czynny jest po laczony z k innymi czynnymi wierzcho lkami. Ponieważ wy l aczanie wierzcho lków jest losowe i niezależne, to podzbiór wierzcho lków czynnych tworzy inny model konfiguracyjny, gdzie p k jest rozk ladem stopni wierzcho lków. 20
Ciekawe wyniki zosta ly pokazane dla sieci z rozk ladem potȩgowym p k k α (α ustalone). Dla α 3 wartość krytyczna q c, kiedy dochodzi do przejścia fazowego i tworzy siȩ GCC, jest niedodatnia, co oznacza, że sieć zawsze perkoluje. Pokazano ogólnie, że g c 0 dla sieci o rozk ladzie p k, gdzie k 2 dla n. 21
Prawdopodobieństwo, że dany wierzcho lek jest czynny może zależeć od jego stopnia k. Wtedy zamiast sta lej q mamy q k - prawdopodobieństwo, że wierzcho lek stopnia k jest czynny. Funkcje generuj ace: k F 0 (x) = p k q k x k kp, F 1 (x) = k q k x k 1 k=0 k kp k (24) Rozk lad prawdopodobieństwa rozmiarów sk ladowych grafu, tworzonych przez wierzcho lki czynne, do których należy losowo wybrany wierzcho lek, jest generowany poprzez funkcjȩ H 0 (x): gdzie: H 0 (x) = 1 F 0 (1) + xf 0 (H 1 (x)), (25) H 1 (x) = 1 F 1 (1) + xf 1 (H 1 (x)) (26) Średni rozmiar sk ladowej grafu (tworzonej przez wierzcho lki czynne): s = F 0 (1) + F 0 (1)F 1(1) 1 F 1 (1) (27) GCC formuje siȩ, gdy F 1 (1) = 1. 22
W niektórych sieciach, np. sieciach przesy laj acych energiȩ elektryczn a, zjawisko, gdy nagle jedna krawȩdź lub wierzcho lek przestaje dzia lać, może w rezultacie zaburzyć funkcjonowanie ca lej sieci. Sieci opisane rozk ladem potȩgowym s a szczególnie wrażliwe na usuwanie wierzcho lów o wysokim stopniu. 23
Epidemiologia Standardowe matematyczne podejście do problemu rozprzestrzeniania siȩ choroby zakaźnej w populacji opiera siȩ na za lożeniu, że każda para osób ma równe szanse kontaktu ze sob a (tzw. fully mixed approximation). Za lożenie to jest nierealistyczne. Realistyczne modele używaj a struktury sieci. Najprostszym z nich jest model SIR (Reed, Frost 1920): S - susceptible I - infective R - recovered Proces rozprzestrzeniania siȩ choroby w sieci reprezentuj acej populacjȩ może być utożsamiany z bond percolation dla tej samej sieci. 24
Niech β oznacza prawdopodobieśtwo, że osoba zainfekowana zarazi swojego s asiada (z grupy S) w ustalonej jednostce czasu. Wielkości β s a wylosowane z rozk ladu P i (β). Niech γ oznacza prawdopodobieństwo, że losowo wybrana osoba zainfekowana wyzdrowieje (w jednostce czasu), gdzie P r (γ) jest rozk ladem odpowiadaj acym tej wielkości. Uzyskany model okazuje siȩ być równoważny z jednostajnym bond percolation: T = 1 P i(β)p r (γ)e β/γ dβdγ, (28) 0 gdzie T to prawdopodobieństwo, że losowo wybrana krawȩdź jest czynna (nast api zarażenie). 25
Model perkolacji dostarcza nam wielu informacji na temat rozprzestrzeniania siȩ choroby, g lównie jej rozmiarów: rozk lad rozmiarów sk ladowych grafu utworzonych przez funkcjonuj ace krawȩdzie to rozk lad rozmiarów ognisk choroby zapocz atkowanych przez pojedyncz a zainfekowan a osobȩ, a przejście fazowe to tzw. próg epidemiologiczny -stan, powyżej którego możliwy jest wybuch epidemii-jej zasiȩg to liczba wierzcho lków w GCC. Niestety model ten nie pozwala wnioskować o ewolucji ognisk choroby w czasie. 26
Interesuj ace wnioski zosta ly sformu lowane dla sieci z rozk ladem potȩgowym p k k α : jeśli tylko α 3, to próg epidemiologiczny 0. Wiȩkszoś ć realistycznych sieci realizuje to za lożenie, tak wiȩc choroby bȩd a siȩ zawsze na nich rozprzestrzenia ly, nie zależnie od rozk ladu β (po raz pierwszy pokazano to dla wirusów komputerowych - Pastor-Satorras i Vespignani) 27
Po l aczenie zjawiska odporności sieci na losowe usuwanie wierzcho lków z problemem rozprzestrzeniania siȩ na niej choroby uzyskujemy, gdy rozważamy szczepienie losowo wybranych osób z populacji przeciwko danej chorobie - to z kolei możemy modelować jako site percolation. Jeżeli proces site percolation jest dodatnio skorelowany ze stopniem wierzcho lka, to otrzymujemy efektywn a strategiȩ przeciwdzia lania rozprzestrzenianiu siȩ choroby. 28
Bibliografia: 1. M. Newman: Random graphs as model of networks. 2. S.Dorogovtsev, J.Mendes, A.Samukhin: Modern architecture of random graphs: correlations. Constructions and 3. M. Newman: The structure and function of complex networks. 4. S.Janson, D.Knuth, T. Luczak, B.Pittel The Birth of the Giant Component. 5. M. Newman, S.Strogatz, D. Watts: Random graphs with arbitrary degree distributions and their applications. 29