Warsztaty metod fizyki teoretycznej

Podobne dokumenty
Modelowanie sieci złożonych

Grafy Alberta-Barabasiego

1. Potęgi. Logarytmy. Funkcja wykładnicza

I. Potęgi. Logarytmy. Funkcja wykładnicza.

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Tomasz Tobiasz PLAN WYNIKOWY (zakres podstawowy)

WYMAGANIA EDUKACYJNE Z MATEMATYKI 2016/2017 (zakres podstawowy) klasa 3abc

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Geometria analityczna

Przejście fazowe w sieciach złożonych w modelu Axelroda

Przedmiot statystyki. Graficzne przedstawienie danych.

Wykładnicze grafy przypadkowe: teoria i przykłady zastosowań do analizy rzeczywistych sieci złożonych

Model odpowiedzi i schemat oceniania do arkusza I

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Spacery losowe generowanie realizacji procesu losowego

W sieci małego świata od DNA po facebooka. Dr hab. Katarzyna Sznajd-Weron, prof. PWr.

Ruch jednostajnie zmienny prostoliniowy

Logarytmy. Funkcje logarytmiczna i wykładnicza. Równania i nierówności wykładnicze i logarytmiczne.

Rozwiązywanie równań nieliniowych

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Analiza składowych głównych. Wprowadzenie

Metody radzenia sobie z brakującymi obserwacjami

Źródło: Komitet Główny Olimpiady Fizycznej A. Wysmołek; Fizyka w Szkole nr 1, Andrzej Wysmołek Komitet Główny Olimpiady Fizycznej, IFD UW.

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

WYMAGANIA EDUKACYJNE NIEZBĘDNE DO OTRZYMANIA PRZEZ UCZNIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH Z MATEMATYKI

166 Wstęp do statystyki matematycznej

Własności i charakterystyki czwórników

Sieci bezskalowe. Filip Piękniewski

Sieci złożone. Modelarnia 2014/2015 Katarzyna Sznajd-Weron

O 2 O 1. Temat: Wyznaczenie przyspieszenia ziemskiego za pomocą wahadła rewersyjnego

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

PDF created with FinePrint pdffactory Pro trial version

Procesy stochastyczne WYKŁAD 2-3. Łańcuchy Markowa. Łańcuchy Markowa to procesy "bez pamięci" w których czas i stany są zbiorami dyskretnymi.

Weryfikacja hipotez statystycznych

DRGANIA SWOBODNE UKŁADU O DWÓCH STOPNIACH SWOBODY. Rys Model układu

Grafy stochastyczne i sieci złożone

POISSONOWSKA APROKSYMACJA W SYSTEMACH NIEZAWODNOŚCIOWYCH

Rozkład Gaussa i test χ2

Biostatystyka, # 3 /Weterynaria I/

Kolokwium ze statystyki matematycznej

Modelowanie komputerowe

Obszary strukturalne i funkcyjne mózgu

WYMAGANIE EDUKACYJNE Z MATEMATYKI W KLASIE II GIMNAZJUM. dopuszczającą dostateczną dobrą bardzo dobrą celującą

Ważne rozkłady i twierdzenia

EGZAMIN MAGISTERSKI, 18 września 2013 Biomatematyka

WYMAGANIA EDUKACYJNE Z MATEMATYKI W KLASIE II W PUBLICZNYM GIMNAZJUM NR 2 W ZESPOLE SZKÓŁ W RUDKACH

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Przykładowe zadania z teorii liczb

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Kryteria oceniania z matematyki dla klasy III LO poziom podstawowy, na podstawie programu nauczania DKOS /08

Procesy stochastyczne WYKŁAD 2-3. Łańcuchy Markowa. Łańcuchy Markowa to procesy "bez pamięci" w których czas i stany są zbiorami dyskretnymi.

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

1.Funkcja logarytmiczna

Wstęp do Rachunku Prawdopodobieństwa, IIr. WMS

Modelowanie niezawodności prostych struktur sprzętowych

Kryteria oceniania z matematyki Klasa III poziom podstawowy

TERMODYNAMIKA I FIZYKA STATYSTYCZNA

Regresja linearyzowalna

FUNKCJA KWADRATOWA. Zad 1 Przedstaw funkcję kwadratową w postaci ogólnej. Postać ogólna funkcji kwadratowej to: y = ax + bx + c;(

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

5 Błąd średniokwadratowy i obciążenie

Voter model on Sierpiński fractals Model głosujący na fraktalach Sierpińskiego

Znaleźć wzór ogólny i zbadać istnienie granicy ciągu określonego rekurencyjnie:

Zad. 1 Zad. 2 Zad. 3 Zad. 4 Zad. 5 SUMA

WYMAGANIA Z WIEDZY I UMIEJĘTNOŚCI NA POSZCZEGÓLNE STOPNIE SZKOLNE DLA KLASY CZWARTEJ H. zakres rozszerzony. Wiadomości i umiejętności

Kryteria oceniania z matematyki Klasa III poziom rozszerzony

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

Sposoby opisu i modelowania zakłóceń kanałowych

Fizyka statystyczna, elementy termodynamiki nierównowagowej Cele, zakres zagadnień

Rozkład normalny, niepewność standardowa typu A

6.4 Podstawowe metody statystyczne

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

LABORATORIUM Z FIZYKI

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t.

Z Wikipedii, wolnej encyklopedii.

Egzamin ustny z matematyki semestr II Zakres wymaganych wiadomości i umiejętności

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

Wymagania na poszczególne oceny szkolne z. matematyki. dla uczniów klasy IIIa i IIIb. Gimnazjum im. Jana Pawła II w Mętowie. w roku szkolnym 2015/2016

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Działanie algorytmu oparte jest na minimalizacji funkcji celu jako suma funkcji kosztu ( ) oraz funkcji heurystycznej ( ).

STATYSTYKA MAŁYCH OBSZARÓW II.ESTYMATOR HORVITZA-THOMPSONA, ESTYMATOR KALIBROWANY

Zachowania odbiorców. Grupa taryfowa G

Programowanie celowe #1

1 Automaty niedeterministyczne

Badanie transformatora

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

MODELE SIECIOWE 1. Drzewo rozpinające 2. Najkrótsza droga 3. Zagadnienie maksymalnego przepływu źródłem ujściem

Wykład 2. Przykład zastosowania teorii prawdopodobieństwa: procesy stochastyczne (Markova)

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów

Propensity Score Matching

M10. Własności funkcji liniowej

Prognoza terminu sadzenia rozsady sałaty w uprawach szklarniowych. Janusz Górczyński, Jolanta Kobryń, Wojciech Zieliński

Zakładamy, że są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej i wariancji.

Praca dyplomowa inżynierska

Systemy uczące się Lab 4

MODELE LINIOWE. Dr Wioleta Drobik

Obliczanie długości łuku krzywych. Autorzy: Witold Majdak

Transkrypt:

Warsztaty metod fizyki teoretycznej Zestaw 6 Układy złożone- sieci w otaczającym nas świecie Marcin Zagórski, Jan Kaczmarczyk 17.04.2012 1 Wprowadzenie W otaczającym nas świecie odnajdujemy wiele struktur, które w naturalny sposób można opisać z użyciem pojęcia grafu(sieci): sieć WWW, Internet, cytowania prac naukowych, transport, metabolizm, sieć kontaktów seksualnych... Zauważmy, że opis takiego systemu będzie znacząco różny od przykładowo regularnej struktury kryształu. Niemniej, jeśli analizowany układ potraktujemy jako zbiór bardzo wielu obiektów(wierzchołki grafu) połączonych prostymi relacjami(krawędzie grafu; np. linki między stronami WWW, połączenia między serwerami, referencje w publikacjach itp.) to z pomocą przychodzą nam metofy fizyki statystycznej[1]. 2 Sformułowanieproblemu Każdy z powyższych systemów w dużym uproszczeniu można przedstawić jako zbiór identycznych wierzchołków połączonych krawędziami. Jednak dopiero zdefiniowanie praw rządzących ewolucją takiego układu(przyłączanie nowych wierzchołków, przepinanie krawędzi) pozwala nam analizować jego dynamikę i statystyczne własności. W tym zestawie skupimy się na modelu BA zaproponowanym przez Barabási i Albert[2], który wywołał lawinowy wysyp publikacji o podobnej tematyce. Spróbujemy zobaczyć jak zastosowanie prostych praw do pojedynczych elementów układu powoduje jego samoorganizację. Równocześnie obliczymy rozkład krotności oraz średnią odległość będące istotnymi charakterystykami sieci w otaczającym nas świecie. Zad.1.Zebranedane.Coznichwynika? W pracy[3] autorzy zebrali informacje o topologii fragmentu sieci WWW liczącego w przybliżeniu 325 tys. dokumentów HTML oraz 1469 tys. linków między nimi. Zamieszczone wykresy pokazują rozkład krotności P(k) dla tych danych, czyli jakie jest prawdopodobieństwo zaobserwowania strony posiadającej k wychodzących(rys. 1a)/ wchodzących(rys. 1b) linków. Na rys. 1 przerywane linie odpowiadają dopasowaniom analitycznym. Zastanów się: a) jakie jest zachowanie dopasowanej funkcji dla ogona rozkładu P(k)(powiedzmy dla k > 50)? 1

Rysunek 1: Histogram(a) liczby linków wychodzących(znajdujących się w dokumencie HTML) oraz (b) liczby linków prowadzących do danego dokumentu HTML. Rysunek zaczerpnięto z pracy[3]. b) znając jakościowy charakter zaniku oceń na podstawie wykresu jego ilościowy charakter. Zad. 2. Czy umiemy modelować/zrozumieć tego typu zależność? W fizyce oraz w innych naukach, kiedy analizujemy dany problem, często kluczowe jest wybranie jego istotnych cech, a pominięcie takich, które tylko zaciemniają obraz zagadnienia lub utrudniają rachunki. Niebezpieczne bywa również zbytnie uproszczenie modelu, gdyż wtedy możemy nie uzyskać właściwego wyniku końcowego. Okazuje się, że powyższe jakościowe zachowanie można otrzymać rozpatrując model grafu z przypadkowo(ale wg pewnej reguły) przyłączanymi wierzchołkami.czymaszpomysłodczego(jakiegoparametrugrafu)mogłabyzależećtareguła 1? Zad. 3. Równania wzrostu. Model BA Rozpatrzmynastępującymodelsieci.Zaczynającodjednegowierzchołkakonstruujemygraf 2 przez pojedyncze przyłączanie nowych wierzchołków. Przy czym każdy nowy wierzchołek przyłączamy do dokładnie jednego z wierzchołków istniejących już w grafie z prawdopodobieństwem p k k.głównąwielkościąjakąchcemyobliczyćjest n k (N),czyliliczbawierzchołkówokrotności k w chwili gdy graf ma rozmiar N(posiada N wszystkich wierzchołków). Wtymcelurozwiążemyrównaniemówiącejakn k zmieniasiępodołączeniunowegowierzchołka: n k (N +1) = n k (N)+ξ(k,N), (1) 1 Wskazówka.Regułatanosinazwę preferencyjnegoprzyłączania. 2 Zakładamy,żegrafjestnieskierowanywodróżnieniuodzad.1gdzierozważanygrafbyłskierowany. 2

gdzie ξ(k,n)jestzmiennąlosowąprzyjmującąwartości-1,0,1.znającpostać ξmoglibyśmysymulowaćrozkład n k (N),jednaknasinteresowaćbędzieśredniawartość 3 n k (N).Z(1)mamy: By rozwiązać powyższe równanie: n k (N +1) = n k (N) + ξ(k,n), (2) a)znajdźstałąnormalizacyjnądlaprawdopodobieństwa p k kdlagrafuorozmiarzen.jaki jest jej związek z liczbą wszystkich krawędzi L w grafie? b) wydedukuj postać ξ(k, N), c)korzystającz(a)i(b)rozwiąż(2)wgranicytermodynamicznejtzn.dla N podstaw n k (N) = NP(k)iznajdźwyrażeniena P(k). Choć wynik otrzymaliśmy w granicy N zmierzającego do, to bez większych odstępstw można go stosować dla odpowiednio dużych skończonych wartości N. Dyskusja rozwiązania: a)jakiejestasymptotycznezachowanie P(k)dladużych kijakpogodzićtozn <? b) oblicz średnią krotność k. Czy można było przewidzieć ten wynik? c)jakzachowujesię k 2 zewzrostem N? d)przykładowodla N = 10 6 oblicz n 1 (N) oraz n 100 (N).Jakiepłynąztegownioskidla topologii badanej sieci? Zad. 4. Efekt małego świata W latach 60-tych ubiegłego wieku S. Milgram przeprowadził eksperyment mający na celu zbadanie jaka jest średnia odległość w sieci skonstruowanej z wzajemnych znajomych spośród osób zamieszkujących w Stanach Zjednoczonych. Stwierdził on, że odległość ta wynosi około 6 osób. Przyjmując,żebadanasiećmarozmiar N = 3 10 8,zastanówsięjakiegorzędubędzieśrednia odległość l dla: a) sieci regularnej kwadratowej w d wymiarach? b) grafu przypadkowego, np. takiego jak opisany w zad. 3? Czy na podstawie znajomości rozwiązań(a) i(b) można określić, z którą siecią- regularną czy przypadkową- miał do czynienia Milgram? 3 Liczonapozespolestatystycznymwszystkichgrafówmogącychpowstaćwprocesiewzrostu.Dla N średnia taka jest dobrze określona[5]. 3

Zad. 5. Graf zupełnie przypadkowy Początki teorii grafów przypadkowych wiążą się z klasyczną konstrukcję zaproponowaną przez Erdösa i Rényi ego prawie pół wieku temu[6]. W modelu tym liczba wierzchołków N i krawędzi L( jest ustalona a krawędzie są rozmieszczone zupełnie losowo, tzn. jednorodnie spośród wszystkich N ) 2 = N(N 1)/2możliwościpołączeniawierzchołków(krawędzieniemogąsiępokrywać). Bezpośrednio związany z modelem ER jest tzw. model binomialny, w którym zaczynamy konstruować graf z N pustych wierzchołków a następnie każdą parę wierzchołków łączymy z prawdopodobieństwem p. Oblicz: a)rozkład P(L)liczbykrawędzi LdlagrafuoustalonymN, b) rozkład krotności P(k), a następnie znajdź rozkład, w który przechodzi P(k) w granicy dużych N przy ustalonej średniej krotności k. Jaką wartość mają pierwszy(średnia) i drugi moment (wariancja) tego rozkładu? Zad.6.ModelBAdladowolnego m Konstrukcja grafu przypadkowego rozważana w zad. 3 była szczególnym przypadkiem modelu BA. W ogólnym modelu występuje jeszcze jeden parametr m mówiący ile krawędzi ma nowo przyłączanywierzchołek 4.Postępującanalogiczniejakwzad.3znajdźrozkład P(k)dladowolnego m 1.Wtymceluzałóż,żegrafpoczątkowyskładasięzmpołączonychzesobąwierzchołków. Dodatkowo przyjmij, że każda z nowo przyłączanych do grafu krawędzi jest przyłączana niezależnie tzn. wykonaj obliczenia tak jakby zdarzenie, że dwa wierzchołki mogą być połączone więcej niż jednąkrawędziąbyłomożliwe 5.Możemytakzrobić,ponieważinteresujenascodziejesiędla N a przyczynki od takich zdarzeń są pomijalne w tej granicy. Czy coś zmieni się gdy przeprowadzisz dyskusję rozwiązania analogiczną do tej w zad. 3? Literatura [1] R. Albert, A.-L. Barabási, Statistical mechanics of complex networks, Rev. Mod. Phys. 74 47 (2002). Liczba cytowań: 1351. [2] R. Albert, A.-L. Barabási, Emergence of scaling in random networks, Science 286 509(1999). [3] A.-L. Barabási, R. Albert, H. Jeong, Scale-free characteristics of random networks: The topology oftheworldwideweb,physicaa28169-77(2000). [4] P. L. Krapivsky, S. Redner, Organization of growing random networks, Phys. Rev. E 63 66123 (2001). [5] S. N. Dorogovtsev, J. F. F. Mendes, A. N. Samukhin, Structure of growing networks: exact solution of the Barabasi-Albert s model, Phys. Rev. Lett. 85 4633(2000). [6]P.Erdös,A.Rényi,Publ.MathDebrecen6290(1959);Publ.Math.InstHung.Acad.Sci517 (1960). 4 Wzad.3mieliśmy m = 1. 5 Wrozpatrywanymmodelutakasytuacjajestzabroniona. 4

3 Rozwiązania Zad. 1. a)zachowaniejestpotęgowetzn. P(k)malejejak k γ, b)wartośćγdlarys.1wynosiodpowiednio2.45(lewy)oraz2.1(prawy).odczytującγzwykresu, oczywiście wystarczy mniejsza dokładność:-) Zad.2 Reguła preferencyjnego przyłączania mówi, że im więcej dany wierzchołek ma sąsiadów(im większą ma krotność) tym większe jest prawdopodobieństwo przyłączenia do niego kolejnych wierzchołków. W najprostszym przypadku prawdopodobieństwo to jest proporcjonalne do krotności k wierzchołka. Zad.3 a) Ponieważ suma krotności wszystkich wierzchołków wynosi 2L, prawdopodobieństwo przyłączeniajednejkrawędzidodanegowierzchołkawynosip k = k/2l.zachodziteżzwiązekl = N. b) Postać wartości oczekiwanej ze zmiennej ξ może być wydedukowana z procesu wzrostu. Dla ustalenia uwagi, zastanówmy się o ile zmieni się sumaryczna krotność wszystkich wierzchołków o krotności k. W wyniku dodania nowego wierzchołka do sieci każdy z nich może pozyskać nową krawędź z prawdopodobieństwem k/2l. Ponieważ do grafu przyłączamy jedną krawędź, to n k (N) zmalejeo n k (N) k/2l,gdyżkrotnośćwierzchołkapoprzyłączeniukrawędzi wzrastao1.wobectegojeślipopatrzymynawierzchołkiokrotności k 1tokrawędziedo nichprzyłączonespowodująwzrost n k (N) odpowiednioo n k 1 (N) (k 1)/2L.Ostatni przyczynekdo ξpochodziodwkładuodnowegowierzchołkaokrotności k = 1iwynosi δ k,1. Zatemcałkowiterównanienawzrost n k (N) przyjmieformę: n k (N +1) = n k (N) +δ k,1 + k 1 2L n k 1(N) k 2L n k(n). (3) c)równanietojestdokładnedladowolnegonipozwalaznaleźćrozwiązaniena n k (N) nietylko w granicy termodynamicznej. Natomiast jeśli pominąć poprawki związane ze skończonym rozmiaremukładu,możemypodstawić n k (N) = NP(k).Dodatkowo,liczbakrawędziw grafiewynosi L = N.Następniekorzystajączfaktu,że P(k)dążydostanustacjonarnegow granicy termodynamicznej[4], dostajemy: P(k) = δ k,1 + k 1 P(k 1) k P(k)+O(1/N). (4) 2 2 W granicy N człon O(1/N) może być zaniedbany i powyższe równanie przyjmuje postać: (k +2)P(k) = (k 1)P(k 1)+2δ k,1, (5) 5

skąd otrzymujemy P(1) = 2 3, P(k) = k 1 P(k 1), k > 1, k +2 (6b) (6a) zkonstrukcji P(0) = 0.Iterującrównanie(6b)otrzymujemyostateczniedla k 1: Dyskusja rozwiązania: P(k) = 4 k(k +1)(k +2), (7) a) P(k) k γ gdzie γ = 3.Dla N < związektenjestprawdziwytylkodlapewnychwartości k: 1 k < k c < N,gdzie k c jestwartościąobcięcia,którejniebędzimytudyskutować, b) k = 2, c) k 2 N k 2 k 3 lnn, d)dla N = 10 6 mamy n 1 (N) 6.7 10 5 natomiast n 100 (N) 4.Wbadanejsieciobserwujemy bardzo wiele wierzchołków o niskiej krotności oraz bardzo niewiele o wysokiej krotności (tzw. centra). Zad.4 a)korzystamyzezwiązku l N 1/d,dlasiecikwadratowej(d = 2)iN 10 8 mamy l 10 4, b) liczbę wierzchołków grafu przypadkowego w odległości l od dowolnego wierzchołka można oszacowaćjako k l,stąddlaśrednicygrafu k l = N,czyli l lnn. Zależność obserwowana przez Milgrama miała taką postać jak w(b). Zad.5 a) Rozkład liczby krawędzi ( ) N(N 1)/2 P(L) = p L (1 p) N(N 1)/2 L. (8) L b) Rozkład krotności ( ) N 1 P(k) = p k (1 p) N 1 k (9) k dladużychniprzyustalonym k = Np = µprzechodziwrozkładpoissona P(k) = e µµk k!. (10) 6

Zad.6 Rozwiązanie przebiega analogicznie do rozwiązania Zad. 3, przy czym równanie wzrostu ma postać: m(k 1) n k (N +1) = n k (N) +δ k,m + n k 1 (N) mk 2L 2L n k(n). (11) Dla N otrzymujemy gdzie Θ(x) = 1dla x 0oraz Θ(x) = 0dla x < 0. P(k) = 2m(m+1) Θ(k m), (12) k(k +1)(k +2) 7