Justyna Signerska. Grafy losowe jako modele sieci

Podobne dokumenty
STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Szymon G l ab. Struktury losowe II Graf losowy. Instytut Matematyki, Politechnika Lódzka

Grafy Alberta-Barabasiego

Modelowanie sieci złożonych

Dyskretne modele populacji

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA. Spis pojȩċ teoretycznych

Geometria odwzorowań inżynierskich. 1. Perspektywa odbić w zwierciad lach p laskich 06F

Geometria odwzorowań inżynierskich rzut środkowy 06A

SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ. Ewa Madalińska. na podstawie prac:

Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.

Geometria odwzorowań inżynierskich Zadania 01

Wyk lad 9 Podpierścienie, elementy odwracalne, dzielniki zera

Elementy logiki i teorii mnogości Wyk lad 1: Rachunek zdań

Foliacje symetralnymi w zespolonej przestrzeni hiperbolicznej

z n n=1 S n nazywamy sum a szeregu. Szereg, który nie jest zbieżny, nazywamy rozbieżnym. n=1

Statystyka w analizie i planowaniu eksperymentu

POCHODNA KIERUNKOWA. DEFINICJA Jeśli istnieje granica lim. to granica ta nazywa siȩ pochodn a kierunkow a funkcji f(m) w kierunku osi l i oznaczamy

Statystyka w analizie i planowaniu eksperymentu

Dyskretne modele populacji

Sterowalność liniowych uk ladów sterowania

Geometria odwzorowań inżynierskich perspektywa wnȩtrza 06C

Sieci bezskalowe. Filip Piękniewski

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Statystyka w analizie i planowaniu eksperymentu

Równania różniczkowe cz astkowe rzȩdu pierwszego

Analiza zrekonstruowanych śladów w danych pp 13 TeV

Po wprowadzeniu zmiennych uzupe lniaj acych otrzymamy równoważny mu problem w postaci kanonicznej:

Procesy Stochastyczne - Zestaw 1

ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 3 Tablice trwania życia 2

Wyk lad 3 Wielomiany i u lamki proste

Analiza dla informatyków 2 DANI LI2 Pawe l Domański szkicowe notatki do wyk ladu

Niech X bȩdzie dowolnym zbiorem. Dobry porz adek to relacja P X X (bȩdziemy pisać x y zamiast x, y P ) o w lasnościach:

EGZAMIN MAGISTERSKI, 18 września 2013 Biomatematyka

Grafy stochastyczne i sieci złożone

Wyk lad 6 Podprzestrzenie przestrzeni liniowych

Oddzia lywania miedzycz. jony molekularne lub atomy. edzy A i B:

Wersja testu D 14 września 2011 r. 1. Czy prawda jest, że a) x Z y Z y 2 = 2 ; b) x Z y Z x 2 = 1 ; c) x Z y Z x 2 = 2 ; d) x Z y Z y 2 = 1?

176 Wstȩp do statystyki matematycznej = 0, 346. uczelni zdaje wszystkie egzaminy w pierwszym terminie.

PROBABILISTYKA - test numery zestawów 1,3,5,7,9,...,41

Warsztaty metod fizyki teoretycznej

POISSONOWSKA APROKSYMACJA W SYSTEMACH NIEZAWODNOŚCIOWYCH

Biostatystyka, # 3 /Weterynaria I/

Zagadnienie Dualne Zadania Programowania Liniowego. Seminarium Szkoleniowe Edyta Mrówka

13 Zastosowania Lematu Szemerédiego

Analiza dla informatyków 1 DANI LI1 Pawe l Domański szkicowe notatki do wyk ladu

CHEMIA KWANTOWA MONIKA MUSIA L METODA HÜCKLA. Ćwiczenia. mm

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Sterowanie optymalne dla uk ladów nieliniowych. Zasada maksimum Pontriagina.

Cia la i wielomiany Javier de Lucas

P (x, y) + Q(x, y)y = 0. g lym w obszrze G R n+1. Funkcje. zania uk ladu (1) o wykresie przebiegaja

WYK LAD 5: GEOMETRIA ANALITYCZNA W R 3, PROSTA I P LASZCZYZNA W PRZESTRZENI R 3

T O P O L O G I A WPPT I, sem. letni WYK LAD 8. Wroc law, 21 kwietnia D E F I N I C J E Niech (X, d) oznacza przestrzeń metryczn a.

Rozdzia l 6. Wstȩp do statystyki matematycznej. 6.1 Cecha populacji generalnej

KOMBINATORYKA 1 WYK LAD 9 Zasada szufladkowa i jej uogólnienia

Wyk lad 7 Baza i wymiar przestrzeni liniowej

MATEMATYKA W SZKOLE HELIANTUS LICZBY NATURALNE I CA LKOWITE

Elementy analizy funkcjonalnej PRZESTRZENIE LINIOWE

y 1 y 2 = f 2 (t, y 1, y 2,..., y n )... y n = f n (t, y 1, y 2,..., y n ) f 1 (t, y 1, y 2,..., y n ) y = f(t, y),, f(t, y) =

PODSTAWOWE W LASNOŚCI W ZBIORZE LICZB RZECZYWISTYCH

Liczby naturalne i ca lkowite

Statystyka w analizie i planowaniu eksperymentu

Niesimpleksowe metody rozwia zywania zadań PL. Seminarium Szkoleniowe Edyta Mrówka

FUNKCJE LICZBOWE. x 1

3.1 Wprowadzenie teoretyczne i przyk lady

Wyk lad 12. (ii) najstarszy wspó lczynnik wielomianu f jest elementem odwracalnym w P. Dowód. Niech st(f) = n i niech a bedzie

Prawdopodobieństwo i statystyka

Statystyka w analizie i planowaniu eksperymentu

po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x)

Pierwsze kolokwium z Matematyki I 4. listopada 2013 r. J. de Lucas

Uproszczony dowod twierdzenia Fredricksona-Maiorany

Wyk lad 14 Cia la i ich w lasności

MATEMATYKA DYSKRETNA - wyk lad 1 dr inż Krzysztof Bryś. Wprowadzenie

Wykładnicze grafy przypadkowe: teoria i przykłady zastosowań do analizy rzeczywistych sieci złożonych

u nk = n c nn u n 0 wyznacza siȩ empirycznie (elementy przejść) lub próbuje oszacować w obliczeniach typu ab initio Rachunek zaburzeń Löwdina

Rozdzia l 10. Najważniejsze normalne logiki modalne

A. Kasperski, M. Kulej, BO -Wyk lad 5, Optymalizacja sieciowa 1

4. Decyzje dotycza ce przyznawania świadczeń pomocy materialnej. doktorantów

Funkcje wielu zmiennych

WPPT 2r., sem. letni KOLOKWIUM 1 Wroc law, 19 kwietnia 2011

Symulacje geometrycznych sieci neuronowych w środowisku rozproszonym

{E n ( k 0 ) + h2 2m (k2 k 2 0 )}δ nn + h m ( k k 0 ) p nn. c nn = E n ( k)c nn (1) gdzie ( r)d 3 r

w = w i ξ i. (1) i=1 w 1 w 2 :

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka w analizie i planowaniu eksperymentu

Wersja testu A 15 lutego 2011 r. jest, że a) x R y R y 2 > Czy prawda. b) y R x R y 2 > 1 c) x R y R y 2 > 1 d) x R y R y 2 > 1.

Statystyka w analizie i planowaniu eksperymentu

Wyk lad 8 macierzy i twierdzenie Kroneckera-Capellego

Testowanie hipotez statystycznych

Geometria odwzorowań inżynierskich Wyk lad 03B

Niezmienniki i pó lniezmienniki w zadaniach

TEORIA GRAFÓW. MATERIA LY VI. semestr letni 2013/2014. Jerzy Jaworski. Typeset by AMS-TEX

Test numer xxx EGZAMIN PISEMNY Z MATEMATYKI DLA KANDYDATÓW NA KIERUNEK MATEMATYKA 5 LIPCA 2001 ROKU. Czas trwania egzaminu: 180 min.

Równoleg le sortowanie przez scalanie

Teoria miary WPPT IIr. semestr zimowy 2009 Wyk lady 6 i 7. Mierzalność w sensie Carathéodory ego Miara Lebesgue a na prostej

Geometria odwzorowań inżynierskich cienie w rzucie środkowym 06D

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Indeks odwzorowania zmiennej zespolonej wzgl. krzywej zamknietej

Transkrypt:

Justyna Signerska Grafy losowe jako modele sieci 1

G lówne metody konstruowania sieci: klasyczny graf losowy G n,p (Erdős, Rényi - 1960) graf losowy z ustalonym rozk ladem stopni wierzcho lków ( 1972)- tzw. model konfiguracyjny sieć ma lych światów (Small-world networks, Watts i Strogatz - 1998) sieć Barabasi-Albert (1999) 2

G n,p : średni stopień wierzcho lka n(n 1)p z = = (n 1)p np (1) n (ostatnie przybliżenie w laściwe dla dostatecznie dużych n) 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 1 0.5 0 0.5 1 3

G n,p a rzeczywiste sieci Niech p k oznacza prawdopodobieństwo, że losowo wybrany wierzcho lek ma stopień k 1. klasyczny graf losowy posiada dwumianowy rozk lad stopni wierzcho lków ( ) n 1 p k = p k (1 p) n 1 k, (2) k który w granicy n kz przechodzi w rozk lad Poissona: p k = zk e z (3) k! (wiȩkszość sieci rzeczywistych posiada rozk lad potȩgowy) 2. niski wspó lczynnik grupowania C z n (4) - wiȩkszość rzeczywistych sieci ma wysoki wspó lczynnik C (zjawisko the friend of my friend is also my friend) 4

5

W jaki sposób uogólnić klasyczny model grafu losowego, aby lepiej modelowa l sieci rzeczywiste? - graf posiadaj acy specyficzny rozk lad stopni wierzcho lków p k (lub ustalony ci ag stopni wierzcho lków {k i }, i = 1, 2,..., n zbiegaj acy do p k dla n ). 6

Dla tak zdefiniowanego modelu: z = k = k kp k, (5) z 2 = k 2 k, (6) gdzie z 2 - średnia liczba s asiadów drugiego rzȩdu dla losowo wybranego wierzcho lka Ogólnie: z m = k2 k z m 1 = k ( z2 z 1 ) m 1 z 1 (7) 7

Przejścia fazowe Przejście fazowe to taka zmiana uk ladu, której towarzyszy nag la zmiana parametrów uk ladu, np. zmiana stanu skupienia uk ladu lub jego sk ladowych, perkolacja. Wyróżniamy dwa parametry: parametr kontroli -np. p w modelu G(n, p) parametr porz adku -np. S-liczba wierzcho lków grafu G(n, p) w tzw. giant connected component w stosunku do n Podstawow a zasad a, która konstytuuje dziedzinȩ fizyki zajmuj ac a siȩ teori a przejść fazowych jako samodzielny obszar badawczy, jest fakt, że zupe lnie różne substancje przejawiaj a w ramach zjawisk towarzysz acych przejściom fazowym takie samo zachowanie, co jest treści a hipotezy uniwersalności opisu przejść fazowych. Przejście fazowe w grafie losowym polega na pojawieniu siȩ tzw. giant connected component. 8

Perkolacja W matematyce teoria perkolacji opisuje zachowanie siȩ po l aczonych grup wierzcho lków w grafie losowym. Znajduje ona także szersze zastosowanie, np. w chemii czy inżynierii materia lowej. 0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50 nz = 458 9

0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50 nz = 1509

W klasycznym grafie losowym G n,p obserwujemy przejście fazowe, gdy z = 1. W grafie z danym rozk ladem stopni wierzcho lków, gdy z 1 = z 2 lub równoważnie, gdy: k 2 2 k = 0 (Molloy, Reed 1995) k=0 k(k 2)p k = 0 (8) Powyżej przejścia fazowego możemy rozważać średni a odleg lość miȩdzy dwoma wierzcho lkami grafu - l: l = log(n/z 1) log(z 2 /z 1 ) + 1 (9) Zauważmy, że nawet w bardzo dużych sieciach l jest dosyć ma le-zjawisko to znane jest jako small-world effect 10

Wspó lczynnik grupowania dla uogólnionego grafu losowego: C = k ik j nz = z n [ k 2 ] 2 k = z k 2 n [ ] 2 c 2 v + z 1 z (10) 11

Funkcje generuj ace rozk lady prawdopodobieństwa a) p k -prawdopodobieństwo, że losowo wybrany wierzcho lek ma stopień k: G 0 (x) = p k = 1 k! k=0 [ d k ] G 0 dx k x=0 p k x k, (11) (12) b) q k -prawdopodobieństwo, że losowo wybrana krawȩdz kończy siȩ wierzcho lkiem stopnia k + 1: k=0 G 1 (x) = q k x k (k + 1)p k+1 x k = = j jp j = k=0 k=0 (k)p k x k 1 j jp j = G 0 (x) z (13) 12

W lasności funkcji generuj acych: 1) jeżeli rozk lad, który generuje funkcja jest poprawnie znormalizowany, to: G 0 (1) = k p k = 1 (14) 2) wartość oczekiwan a możemy obliczyć jako: G 0 (1) = k kp k = k (15) 3) ogólnie, n-ty moment rozk ladu obliczamy jako: k n = [ ( k n p k = x d ) n G 0 (x)] dx k x=1 (16) 4) jeśli funkcja generuje rozk lad prawdopodobieństwa dla pewnej w lasnośći k danego obiektu (np. stopień wierzcho lka w grafie), to rozk lad tej w lasnośći dla n niezależnych obiektów jest generowany przez [G 0 (x)] n 13

Rozmiary sk ladowych spójnośći grafu A. Poniżej przejścia fazowego Każda skończona sk ladowa grafu nie ma cykli - ma strukturȩ drzewa (C 0 dla n ). Wybierzmy losow a krawȩdź. Rozważmy zbiór wierzcho lków, które s a osi agalne z jednego końca tej krawȩdzi - klaster. Niech H 1 (x) generuje rozk lad liczby wierzcho lków w takim klasterze (jego rozmiar): H 1 (x) = x k=0 q k [H 1 (x)] k = xg 1 (H 1 (x)) (17) 14

Funkcja generuj aca rozk lad liczby wierzcho lków w sk ladowej spójnośći, do której należy losowo wybrany wierzcho lek: H 0 (x) = x k=0 p k [H 1 (x)] k = xg 0 (H 1 (x)). Średni rozmiar sk ladowej spójnośći: (18) s = H 0 (1) = [ G 0 (H 1 (x)) + xg 0 (H 1(x))H 1 (x)] x=1 lub równoważnie: = 1 + G 0 (1)H 1 (1) (19) s = 1 + z2 1 z 1 z 2 (20) Przejście fazowe obserwujemy, gdy z 1 = z 2 lub G 1 (1) = 1. 15

B. Powyżej przejścia fazowego -wiȩkszość sieci badanych doświadczalnie znajduje siȩ w tym stanie, ma tzw. giant connected component (GCC). GCC nia ma struktury drzewa dla n. H 0 (x), H 1 (x) - funkcje generuj ace dla rozk ladu wielkości sk ladowych spójności z wy l aczeniem GCC P s -rozk lad prawdopodobieństwa dla rozmiarów sk ladowych spójnośći (poza GCC): H 0 (1) = s P s, H 0 (1) = liczba wierzcho lków grafu poza GCC w stosunku do n. Rozmiar GCC, S, musi być rozwi azaniem uk ladu: S = 1 G 0 (v), v = G 1 (v), (21) gdzie v H 1 (1). 16

Średni rozmiar sk ladowej spójności grafu: s = 1 + zv 2 [1 S][1 G 1 (v)] (22) 17

Teoria perkolacji a odporność sieci na uszkodzenia Proces perkolacji w sieci polega ogólnie na losowym podziale wierzcho lków lub krawȩdzi na dwa zbiory: czynne i nieczynne (working and not working). Model perkolacji zosta l po raz pierwszy zaproponowany w latach 50-tych; motywacj a by la chȩć lepszego zrozumienia zjawiska rozprzestrzeniania siȩ chorób zakaźnych. Wyróżniamy dwa rodzaje perkolacji: site percolation i bond percolation: 18

Miar a odporności sieci na losowe usuwanie wierzcho lków może być zmiana (lub brak zmiany) liczby wierzcho lków, które znajduj a siȩ w najwiȩkszej sk ladowej grafu (GCC). Proces losowego wy l aczania wierzcho lków można rozpatrywać jako site percolation. Wierzcho lki, które pozostaj a w sieci czynne (mog a komunikować siȩ ze sob a) tworz a giant connected component w odpowiadaj acym modelu perkolacji. 19

Rozważmy model grafu losowego, gdzie p k to rozk lad prawdopodobieństwa stopni wierzcho lków. Za lóżmy, że q to czȩść wierzcho lków grafu, które s a czynne (wierzcho lki te losujemy jednostajnie z ca lego grafu). Wtedy p ( ) k k = k q k (1 q) k k (23) k=k p k jest prawdopodobieństwem, że losowo wybrany wierzcho lek czynny jest po laczony z k innymi czynnymi wierzcho lkami. Ponieważ wy l aczanie wierzcho lków jest losowe i niezależne, to podzbiór wierzcho lków czynnych tworzy inny model konfiguracyjny, gdzie p k jest rozk ladem stopni wierzcho lków. 20

Ciekawe wyniki zosta ly pokazane dla sieci z rozk ladem potȩgowym p k k α (α ustalone). Dla α 3 wartość krytyczna q c, kiedy dochodzi do przejścia fazowego i tworzy siȩ GCC, jest niedodatnia, co oznacza, że sieć zawsze perkoluje. Pokazano ogólnie, że g c 0 dla sieci o rozk ladzie p k, gdzie k 2 dla n. 21

Prawdopodobieństwo, że dany wierzcho lek jest czynny może zależeć od jego stopnia k. Wtedy zamiast sta lej q mamy q k - prawdopodobieństwo, że wierzcho lek stopnia k jest czynny. Funkcje generuj ace: k F 0 (x) = p k q k x k kp, F 1 (x) = k q k x k 1 k=0 k kp k (24) Rozk lad prawdopodobieństwa rozmiarów sk ladowych grafu, tworzonych przez wierzcho lki czynne, do których należy losowo wybrany wierzcho lek, jest generowany poprzez funkcjȩ H 0 (x): gdzie: H 0 (x) = 1 F 0 (1) + xf 0 (H 1 (x)), (25) H 1 (x) = 1 F 1 (1) + xf 1 (H 1 (x)) (26) Średni rozmiar sk ladowej grafu (tworzonej przez wierzcho lki czynne): s = F 0 (1) + F 0 (1)F 1(1) 1 F 1 (1) (27) GCC formuje siȩ, gdy F 1 (1) = 1. 22

W niektórych sieciach, np. sieciach przesy laj acych energiȩ elektryczn a, zjawisko, gdy nagle jedna krawȩdź lub wierzcho lek przestaje dzia lać, może w rezultacie zaburzyć funkcjonowanie ca lej sieci. Sieci opisane rozk ladem potȩgowym s a szczególnie wrażliwe na usuwanie wierzcho lów o wysokim stopniu. 23

Epidemiologia Standardowe matematyczne podejście do problemu rozprzestrzeniania siȩ choroby zakaźnej w populacji opiera siȩ na za lożeniu, że każda para osób ma równe szanse kontaktu ze sob a (tzw. fully mixed approximation). Za lożenie to jest nierealistyczne. Realistyczne modele używaj a struktury sieci. Najprostszym z nich jest model SIR (Reed, Frost 1920): S - susceptible I - infective R - recovered Proces rozprzestrzeniania siȩ choroby w sieci reprezentuj acej populacjȩ może być utożsamiany z bond percolation dla tej samej sieci. 24

Niech β oznacza prawdopodobieśtwo, że osoba zainfekowana zarazi swojego s asiada (z grupy S) w ustalonej jednostce czasu. Wielkości β s a wylosowane z rozk ladu P i (β). Niech γ oznacza prawdopodobieństwo, że losowo wybrana osoba zainfekowana wyzdrowieje (w jednostce czasu), gdzie P r (γ) jest rozk ladem odpowiadaj acym tej wielkości. Uzyskany model okazuje siȩ być równoważny z jednostajnym bond percolation: T = 1 P i(β)p r (γ)e β/γ dβdγ, (28) 0 gdzie T to prawdopodobieństwo, że losowo wybrana krawȩdź jest czynna (nast api zarażenie). 25

Model perkolacji dostarcza nam wielu informacji na temat rozprzestrzeniania siȩ choroby, g lównie jej rozmiarów: rozk lad rozmiarów sk ladowych grafu utworzonych przez funkcjonuj ace krawȩdzie to rozk lad rozmiarów ognisk choroby zapocz atkowanych przez pojedyncz a zainfekowan a osobȩ, a przejście fazowe to tzw. próg epidemiologiczny -stan, powyżej którego możliwy jest wybuch epidemii-jej zasiȩg to liczba wierzcho lków w GCC. Niestety model ten nie pozwala wnioskować o ewolucji ognisk choroby w czasie. 26

Interesuj ace wnioski zosta ly sformu lowane dla sieci z rozk ladem potȩgowym p k k α : jeśli tylko α 3, to próg epidemiologiczny 0. Wiȩkszoś ć realistycznych sieci realizuje to za lożenie, tak wiȩc choroby bȩd a siȩ zawsze na nich rozprzestrzenia ly, nie zależnie od rozk ladu β (po raz pierwszy pokazano to dla wirusów komputerowych - Pastor-Satorras i Vespignani) 27

Po l aczenie zjawiska odporności sieci na losowe usuwanie wierzcho lków z problemem rozprzestrzeniania siȩ na niej choroby uzyskujemy, gdy rozważamy szczepienie losowo wybranych osób z populacji przeciwko danej chorobie - to z kolei możemy modelować jako site percolation. Jeżeli proces site percolation jest dodatnio skorelowany ze stopniem wierzcho lka, to otrzymujemy efektywn a strategiȩ przeciwdzia lania rozprzestrzenianiu siȩ choroby. 28

Bibliografia: 1. M. Newman: Random graphs as model of networks. 2. S.Dorogovtsev, J.Mendes, A.Samukhin: Modern architecture of random graphs: correlations. Constructions and 3. M. Newman: The structure and function of complex networks. 4. S.Janson, D.Knuth, T. Luczak, B.Pittel The Birth of the Giant Component. 5. M. Newman, S.Strogatz, D. Watts: Random graphs with arbitrary degree distributions and their applications. 29