Warsztaty metod fizyki teoretycznej Zestaw 6 Układy złożone- sieci w otaczającym nas świecie Marcin Zagórski, Jan Kaczmarczyk 17.04.2012 1 Wprowadzenie W otaczającym nas świecie odnajdujemy wiele struktur, które w naturalny sposób można opisać z użyciem pojęcia grafu(sieci): sieć WWW, Internet, cytowania prac naukowych, transport, metabolizm, sieć kontaktów seksualnych... Zauważmy, że opis takiego systemu będzie znacząco różny od przykładowo regularnej struktury kryształu. Niemniej, jeśli analizowany układ potraktujemy jako zbiór bardzo wielu obiektów(wierzchołki grafu) połączonych prostymi relacjami(krawędzie grafu; np. linki między stronami WWW, połączenia między serwerami, referencje w publikacjach itp.) to z pomocą przychodzą nam metofy fizyki statystycznej[1]. 2 Sformułowanieproblemu Każdy z powyższych systemów w dużym uproszczeniu można przedstawić jako zbiór identycznych wierzchołków połączonych krawędziami. Jednak dopiero zdefiniowanie praw rządzących ewolucją takiego układu(przyłączanie nowych wierzchołków, przepinanie krawędzi) pozwala nam analizować jego dynamikę i statystyczne własności. W tym zestawie skupimy się na modelu BA zaproponowanym przez Barabási i Albert[2], który wywołał lawinowy wysyp publikacji o podobnej tematyce. Spróbujemy zobaczyć jak zastosowanie prostych praw do pojedynczych elementów układu powoduje jego samoorganizację. Równocześnie obliczymy rozkład krotności oraz średnią odległość będące istotnymi charakterystykami sieci w otaczającym nas świecie. Zad.1.Zebranedane.Coznichwynika? W pracy[3] autorzy zebrali informacje o topologii fragmentu sieci WWW liczącego w przybliżeniu 325 tys. dokumentów HTML oraz 1469 tys. linków między nimi. Zamieszczone wykresy pokazują rozkład krotności P(k) dla tych danych, czyli jakie jest prawdopodobieństwo zaobserwowania strony posiadającej k wychodzących(rys. 1a)/ wchodzących(rys. 1b) linków. Na rys. 1 przerywane linie odpowiadają dopasowaniom analitycznym. Zastanów się: a) jakie jest zachowanie dopasowanej funkcji dla ogona rozkładu P(k)(powiedzmy dla k > 50)? 1
Rysunek 1: Histogram(a) liczby linków wychodzących(znajdujących się w dokumencie HTML) oraz (b) liczby linków prowadzących do danego dokumentu HTML. Rysunek zaczerpnięto z pracy[3]. b) znając jakościowy charakter zaniku oceń na podstawie wykresu jego ilościowy charakter. Zad. 2. Czy umiemy modelować/zrozumieć tego typu zależność? W fizyce oraz w innych naukach, kiedy analizujemy dany problem, często kluczowe jest wybranie jego istotnych cech, a pominięcie takich, które tylko zaciemniają obraz zagadnienia lub utrudniają rachunki. Niebezpieczne bywa również zbytnie uproszczenie modelu, gdyż wtedy możemy nie uzyskać właściwego wyniku końcowego. Okazuje się, że powyższe jakościowe zachowanie można otrzymać rozpatrując model grafu z przypadkowo(ale wg pewnej reguły) przyłączanymi wierzchołkami.czymaszpomysłodczego(jakiegoparametrugrafu)mogłabyzależećtareguła 1? Zad. 3. Równania wzrostu. Model BA Rozpatrzmynastępującymodelsieci.Zaczynającodjednegowierzchołkakonstruujemygraf 2 przez pojedyncze przyłączanie nowych wierzchołków. Przy czym każdy nowy wierzchołek przyłączamy do dokładnie jednego z wierzchołków istniejących już w grafie z prawdopodobieństwem p k k.głównąwielkościąjakąchcemyobliczyćjest n k (N),czyliliczbawierzchołkówokrotności k w chwili gdy graf ma rozmiar N(posiada N wszystkich wierzchołków). Wtymcelurozwiążemyrównaniemówiącejakn k zmieniasiępodołączeniunowegowierzchołka: n k (N +1) = n k (N)+ξ(k,N), (1) 1 Wskazówka.Regułatanosinazwę preferencyjnegoprzyłączania. 2 Zakładamy,żegrafjestnieskierowanywodróżnieniuodzad.1gdzierozważanygrafbyłskierowany. 2
gdzie ξ(k,n)jestzmiennąlosowąprzyjmującąwartości-1,0,1.znającpostać ξmoglibyśmysymulowaćrozkład n k (N),jednaknasinteresowaćbędzieśredniawartość 3 n k (N).Z(1)mamy: By rozwiązać powyższe równanie: n k (N +1) = n k (N) + ξ(k,n), (2) a)znajdźstałąnormalizacyjnądlaprawdopodobieństwa p k kdlagrafuorozmiarzen.jaki jest jej związek z liczbą wszystkich krawędzi L w grafie? b) wydedukuj postać ξ(k, N), c)korzystającz(a)i(b)rozwiąż(2)wgranicytermodynamicznejtzn.dla N podstaw n k (N) = NP(k)iznajdźwyrażeniena P(k). Choć wynik otrzymaliśmy w granicy N zmierzającego do, to bez większych odstępstw można go stosować dla odpowiednio dużych skończonych wartości N. Dyskusja rozwiązania: a)jakiejestasymptotycznezachowanie P(k)dladużych kijakpogodzićtozn <? b) oblicz średnią krotność k. Czy można było przewidzieć ten wynik? c)jakzachowujesię k 2 zewzrostem N? d)przykładowodla N = 10 6 oblicz n 1 (N) oraz n 100 (N).Jakiepłynąztegownioskidla topologii badanej sieci? Zad. 4. Efekt małego świata W latach 60-tych ubiegłego wieku S. Milgram przeprowadził eksperyment mający na celu zbadanie jaka jest średnia odległość w sieci skonstruowanej z wzajemnych znajomych spośród osób zamieszkujących w Stanach Zjednoczonych. Stwierdził on, że odległość ta wynosi około 6 osób. Przyjmując,żebadanasiećmarozmiar N = 3 10 8,zastanówsięjakiegorzędubędzieśrednia odległość l dla: a) sieci regularnej kwadratowej w d wymiarach? b) grafu przypadkowego, np. takiego jak opisany w zad. 3? Czy na podstawie znajomości rozwiązań(a) i(b) można określić, z którą siecią- regularną czy przypadkową- miał do czynienia Milgram? 3 Liczonapozespolestatystycznymwszystkichgrafówmogącychpowstaćwprocesiewzrostu.Dla N średnia taka jest dobrze określona[5]. 3
Zad. 5. Graf zupełnie przypadkowy Początki teorii grafów przypadkowych wiążą się z klasyczną konstrukcję zaproponowaną przez Erdösa i Rényi ego prawie pół wieku temu[6]. W modelu tym liczba wierzchołków N i krawędzi L( jest ustalona a krawędzie są rozmieszczone zupełnie losowo, tzn. jednorodnie spośród wszystkich N ) 2 = N(N 1)/2możliwościpołączeniawierzchołków(krawędzieniemogąsiępokrywać). Bezpośrednio związany z modelem ER jest tzw. model binomialny, w którym zaczynamy konstruować graf z N pustych wierzchołków a następnie każdą parę wierzchołków łączymy z prawdopodobieństwem p. Oblicz: a)rozkład P(L)liczbykrawędzi LdlagrafuoustalonymN, b) rozkład krotności P(k), a następnie znajdź rozkład, w który przechodzi P(k) w granicy dużych N przy ustalonej średniej krotności k. Jaką wartość mają pierwszy(średnia) i drugi moment (wariancja) tego rozkładu? Zad.6.ModelBAdladowolnego m Konstrukcja grafu przypadkowego rozważana w zad. 3 była szczególnym przypadkiem modelu BA. W ogólnym modelu występuje jeszcze jeden parametr m mówiący ile krawędzi ma nowo przyłączanywierzchołek 4.Postępującanalogiczniejakwzad.3znajdźrozkład P(k)dladowolnego m 1.Wtymceluzałóż,żegrafpoczątkowyskładasięzmpołączonychzesobąwierzchołków. Dodatkowo przyjmij, że każda z nowo przyłączanych do grafu krawędzi jest przyłączana niezależnie tzn. wykonaj obliczenia tak jakby zdarzenie, że dwa wierzchołki mogą być połączone więcej niż jednąkrawędziąbyłomożliwe 5.Możemytakzrobić,ponieważinteresujenascodziejesiędla N a przyczynki od takich zdarzeń są pomijalne w tej granicy. Czy coś zmieni się gdy przeprowadzisz dyskusję rozwiązania analogiczną do tej w zad. 3? Literatura [1] R. Albert, A.-L. Barabási, Statistical mechanics of complex networks, Rev. Mod. Phys. 74 47 (2002). Liczba cytowań: 1351. [2] R. Albert, A.-L. Barabási, Emergence of scaling in random networks, Science 286 509(1999). [3] A.-L. Barabási, R. Albert, H. Jeong, Scale-free characteristics of random networks: The topology oftheworldwideweb,physicaa28169-77(2000). [4] P. L. Krapivsky, S. Redner, Organization of growing random networks, Phys. Rev. E 63 66123 (2001). [5] S. N. Dorogovtsev, J. F. F. Mendes, A. N. Samukhin, Structure of growing networks: exact solution of the Barabasi-Albert s model, Phys. Rev. Lett. 85 4633(2000). [6]P.Erdös,A.Rényi,Publ.MathDebrecen6290(1959);Publ.Math.InstHung.Acad.Sci517 (1960). 4 Wzad.3mieliśmy m = 1. 5 Wrozpatrywanymmodelutakasytuacjajestzabroniona. 4
3 Rozwiązania Zad. 1. a)zachowaniejestpotęgowetzn. P(k)malejejak k γ, b)wartośćγdlarys.1wynosiodpowiednio2.45(lewy)oraz2.1(prawy).odczytującγzwykresu, oczywiście wystarczy mniejsza dokładność:-) Zad.2 Reguła preferencyjnego przyłączania mówi, że im więcej dany wierzchołek ma sąsiadów(im większą ma krotność) tym większe jest prawdopodobieństwo przyłączenia do niego kolejnych wierzchołków. W najprostszym przypadku prawdopodobieństwo to jest proporcjonalne do krotności k wierzchołka. Zad.3 a) Ponieważ suma krotności wszystkich wierzchołków wynosi 2L, prawdopodobieństwo przyłączeniajednejkrawędzidodanegowierzchołkawynosip k = k/2l.zachodziteżzwiązekl = N. b) Postać wartości oczekiwanej ze zmiennej ξ może być wydedukowana z procesu wzrostu. Dla ustalenia uwagi, zastanówmy się o ile zmieni się sumaryczna krotność wszystkich wierzchołków o krotności k. W wyniku dodania nowego wierzchołka do sieci każdy z nich może pozyskać nową krawędź z prawdopodobieństwem k/2l. Ponieważ do grafu przyłączamy jedną krawędź, to n k (N) zmalejeo n k (N) k/2l,gdyżkrotnośćwierzchołkapoprzyłączeniukrawędzi wzrastao1.wobectegojeślipopatrzymynawierzchołkiokrotności k 1tokrawędziedo nichprzyłączonespowodująwzrost n k (N) odpowiednioo n k 1 (N) (k 1)/2L.Ostatni przyczynekdo ξpochodziodwkładuodnowegowierzchołkaokrotności k = 1iwynosi δ k,1. Zatemcałkowiterównanienawzrost n k (N) przyjmieformę: n k (N +1) = n k (N) +δ k,1 + k 1 2L n k 1(N) k 2L n k(n). (3) c)równanietojestdokładnedladowolnegonipozwalaznaleźćrozwiązaniena n k (N) nietylko w granicy termodynamicznej. Natomiast jeśli pominąć poprawki związane ze skończonym rozmiaremukładu,możemypodstawić n k (N) = NP(k).Dodatkowo,liczbakrawędziw grafiewynosi L = N.Następniekorzystajączfaktu,że P(k)dążydostanustacjonarnegow granicy termodynamicznej[4], dostajemy: P(k) = δ k,1 + k 1 P(k 1) k P(k)+O(1/N). (4) 2 2 W granicy N człon O(1/N) może być zaniedbany i powyższe równanie przyjmuje postać: (k +2)P(k) = (k 1)P(k 1)+2δ k,1, (5) 5
skąd otrzymujemy P(1) = 2 3, P(k) = k 1 P(k 1), k > 1, k +2 (6b) (6a) zkonstrukcji P(0) = 0.Iterującrównanie(6b)otrzymujemyostateczniedla k 1: Dyskusja rozwiązania: P(k) = 4 k(k +1)(k +2), (7) a) P(k) k γ gdzie γ = 3.Dla N < związektenjestprawdziwytylkodlapewnychwartości k: 1 k < k c < N,gdzie k c jestwartościąobcięcia,którejniebędzimytudyskutować, b) k = 2, c) k 2 N k 2 k 3 lnn, d)dla N = 10 6 mamy n 1 (N) 6.7 10 5 natomiast n 100 (N) 4.Wbadanejsieciobserwujemy bardzo wiele wierzchołków o niskiej krotności oraz bardzo niewiele o wysokiej krotności (tzw. centra). Zad.4 a)korzystamyzezwiązku l N 1/d,dlasiecikwadratowej(d = 2)iN 10 8 mamy l 10 4, b) liczbę wierzchołków grafu przypadkowego w odległości l od dowolnego wierzchołka można oszacowaćjako k l,stąddlaśrednicygrafu k l = N,czyli l lnn. Zależność obserwowana przez Milgrama miała taką postać jak w(b). Zad.5 a) Rozkład liczby krawędzi ( ) N(N 1)/2 P(L) = p L (1 p) N(N 1)/2 L. (8) L b) Rozkład krotności ( ) N 1 P(k) = p k (1 p) N 1 k (9) k dladużychniprzyustalonym k = Np = µprzechodziwrozkładpoissona P(k) = e µµk k!. (10) 6
Zad.6 Rozwiązanie przebiega analogicznie do rozwiązania Zad. 3, przy czym równanie wzrostu ma postać: m(k 1) n k (N +1) = n k (N) +δ k,m + n k 1 (N) mk 2L 2L n k(n). (11) Dla N otrzymujemy gdzie Θ(x) = 1dla x 0oraz Θ(x) = 0dla x < 0. P(k) = 2m(m+1) Θ(k m), (12) k(k +1)(k +2) 7