Imiona dzieci, prawo Zipfa i mapa Stanów Zjednoczonych



Podobne dokumenty
Imiona dzieci symulacje i fakty

Korelacje krzyżowe kryzysów finansowych w ujęciu korelacji potęgowych. Analiza ewolucji sieci na progu liniowości.

Recenzja: dr hab. prof. Uniwersytetu Warszawskiego Tomasz Grzegorz Grosse. Redaktor prowadząca: Anna Raciborska. Redakcja: Dorota Kassjanowicz

Równowaga Heidera symulacje mitozy społecznej

Wykładnicze grafy przypadkowe: teoria i przykłady zastosowań do analizy rzeczywistych sieci złożonych

Bezpłatny Internet dla mieszkańców Radomia zagrożonych wykluczeniem cyfrowym

Zaświadczenie. Nr 41/CB/2012. Niniejszym zaświadczam, iŝ Pan/Pani

Przejścia fazowe w uogólnionym modelu modelu q-wyborcy na grafie zupełnym

STATYSTYKA MATEMATYCZNA

NAUKOMETRY CZNY. WARSZTAT Pozapublikacyjna aktywność pracowników naukowych. Studium przypadku. Wiesława Osińska. Katowice 20 maja 2016

Institute of Mother and Child L Institut de la Mère et de l Enfant Warszawa, 10 marca 2015 roku

Zastosowanie rozmytych map kognitywnych do badania scenariuszy rozwoju jednostek naukowo-dydaktycznych

1. Mechanizm alokacji kwot

RAPORT Z POMIARÓW PORÓWNAWCZYCH STĘŻENIA RADONU Rn-222 W WODZIE

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Prawo Zipfa zjawiska (I)

Work Extrinsic and Inrinsic Motivation Scale

Analiza ekonomiczna w instytucjach publicznych analiza organizacji i projektów

Wstęp do sieci neuronowych, wykład 8 Uczenie nienadzorowane.

METODY STATYSTYCZNE W BIOLOGII

Modelowanie interakcji helis transmembranowych


STATYSTYKA MATEMATYCZNA

Hierarchiczna analiza skupień

I nforma c j e ogólne. Podstawy socjologia

PROJEKTOWANIE MATERIAŁOWE I KOMPUTEROWA NAUKA O MATERIAŁACH. forma studiów: studia stacjonarne. Liczba godzin/tydzień: 2W e, 2Ćw.

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

STATYSTYKA MATEMATYCZNA

Badania relaksacyjne b surowicy krwi II

EGZAMIN MAGISTERSKI, Biomatematyka

Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS

Michał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska

Regresja logistyczna (LOGISTIC)

2009 ABMC Breeder Referral List

REIfoam 240. Certificato EI240 secondo EN , rapporto di classificazione n. NP-02393/P/2009/ML ITB Building Research Institute

PQScut Podręcznik Użytkownika. Dla wersji (1.6.4)

Człowiek wobec problemów istnienia

ZGŁOSZENIE WSPÓLNEGO POLSKO -. PROJEKTU NA LATA: APPLICATION FOR A JOINT POLISH -... PROJECT FOR THE YEARS:.

Wykład z Technologii Informacyjnych. Piotr Mika

Termodynamika i właściwości fizyczne stopów - zastosowanie w przemyśle

Wybrane wyniki w zakresie umiejętności matematycznych

Fizyka na usługach inżynierii finansowej 1

Modelowanie sieci złożonych

Bładzenie przypadkowe i lokalizacja

A.Z. Górski, S. Drożdż, J. Kwapień, P. Oświęcimka. Zakład Teorii Systemów Złożonych, Instytut Fizyki Jądrowej PAN, Kraków

Metody rozwiązania równania Schrödingera

Raport z realizacji projektu Przyszłość pieniądza kryptowaluty, waluty lokalne, gospodarka bezgotówkowa

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Konkurencyjność Polski w procesie pogłębiania integracji europejskiej i budowy gospodarki opartej na wiedzy

teori to samo ci spo ecznej tradycyjna vs. nowoczesna rola kobiety w spo ecze stwie seksizm tradycyjny vs. nowoczesny seksizm ambiwalentny

Badanie słabych przemian fazowych pierwszego rodzaju w eksperymencie komputerowym dla trójwymiarowego modelu Ashkina-Tellera

KRZYSZTOF JAJUGA Uniwersytet Ekonomiczny we Wrocławiu INNOWACJE FINANSOWE SZANSA CZY ZAGROŻENIE?

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Badania genetyczne nad populacją jelenia w północno-wschodniej Polsce

Rola superkomputerów i modelowania numerycznego we współczesnej fzyce. Gabriel Wlazłowski

System Korekty Tekstu Polskiego

Badanie uporządkowania magnetycznego w ultracienkich warstwach kobaltu w pobliżu reorientacji spinowej.

Jak z ABM zrobić model analityczny? (Metoda pola średniego) Katarzyna Sznajd-Weron Physics of Complex System

PCA Zakres akredytacji Nr AB 023 ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 023 wydany przez POLSKIE CENTRUM AKREDYTACJI Warszawa, ul. Sz

Wstęp do sieci neuronowych, wykład 12 Wykorzystanie sieci rekurencyjnych w optymalizacji grafowej

Ekonofizyka 2 (Metody fizyki w ekonomii 2)

Kierunek: Matematyka Poziom studiów: Studia II stopnia Forma i tryb studiów: Stacjonarne

WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI

Metody Ilościowe w Socjologii

Nierówności macierzowe

Kierunek: Matematyka Poziom studiów: Studia II stopnia Forma i tryb studiów: Stacjonarne

Kierunek: Matematyka Poziom studiów: Studia II stopnia Forma i tryb studiów: Stacjonarne

PLAN STUDIÓW NA KIERUNKU STUDIÓW WYŻSZYCH: EUROPEISTYKA

Metody numeryczne Wykład 4

F u l l H D, I P S D, I P F u l l H D, I P 5 M P,

Home Software Hardware Benchmarks Services Store Support Forums About Us

OBLICZANIE POCHODNYCH FUNKCJI.

Karta przedmiotu STOSUNKI MIĘDZYNARODOWE

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

FIZYKA. Wstęp cz.2. Dr inż. Zbigniew Szklarski. Katedra Elektroniki, paw. C-1, pok

Wstęp do sieci neuronowych, wykład 07 Uczenie nienadzorowane cd.

u l. W i d o k 8 t e l

LABORATORIUM PRZEMYSŁOWYCH SYSTEMÓW STEROWANIA

Wykład 15. Metody nieparametryczne. Elementy analizy wielowymiarowej Weryfikacja założenia o normalności rozkładu populacji

Wysokowydajne falowodowe źródło skorelowanych par fotonów

STATYSTYKA MATEMATYCZNA

Kierunek: Matematyka Poziom studiów: Studia II stopnia Forma i tryb studiów: Stacjonarne

Kolegium Dziekanów i Dyrektorów

~13 miliardów ton węgla

STATYSTYKA MATEMATYCZNA

Hierarchical Cont-Bouchaud model

Matematyczne Podstawy Informatyki

TEORETYCZNE PODSTAWY INFORMATYKI

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych

Uniwersalizm versus partykularyzm

Podstawy fizyki sezon 2 7. Układy elektryczne RLC

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2017/2018

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Obliczenia inspirowane Naturą

Wydział Geograficzno Biologiczny

Testowanie hipotez statystycznych.

Warunki poprawy pozycji innowacyjnej kraju Globalizacja działalności badawczej i rozwojowej: próba oceny miejsca Polski

Dodatek 3. Wielowymiarowe modele GARCH model DCC-GARCH

Transkrypt:

Imiona dzieci, prawo Zipfa i mapa Stanów Zjednoczonych Mateusz Pomorski 1, Małgorzata J. Krawczyk 1, Jarosław Kwapień 2, Krzysztof Kułakowski 1, Marcel Ausloos 3 1 Wydział Fizyki i Informatyki Stosowanej, AGH, al. Mickiewicza 30, 30-059 Kraków 2 Instytut Fizyki Jądrowej PAN, ul. Radzikowskiego 152, 31-342 Kraków 3 GRAPES, rue de la Belle Jardiniere, B-4031 Liège 1

plan Motywacja + literatura Dane z USA i graf korelacji Klastry stanów Regiony USA Prawo Zipfa Dane z Belgii Podsumowania 2

Motywacja Darwinism is too big a theory to be confined to the narrow context of the gene. Richard Dawkins According to Baudrillard ( ) consumers continuously (re-)construct their identities, in part, through the consumption of symbols, images, and signs. Laurie A. Meamber 3

4/26

W ponowoczesnym społeczeństwie wiedzy to konsumpcja bowiem, w tym konsumpcja symboli, a nie produkcja, decyduje o rozwoju miast. Marta Klekotko 5

Literatura G. Simmel, Fashion, International Quarterly 10 (1904) 130 moda jako naśladownictwo elit w sferze symboli statusu R. Pedone, R. Conte, The Simmel effect: imitation and avoidance in social hierarchies, LNAI 1979 (2000) 149 algorytm symulacji w modelu Simmla Wentian Li, Analyses of baby name popularity distribution in US for the last 131 years, Complexity 18 (2012) 44 dopasowanie prawa Zipfa do imion M. J. Krawczyk, A. Dydejczyk, K. Kułakowski, The Simmel effect and babies names, Physica A 395 (2014) 384 symulacja dynamiki symboli wg Simmla P. Barucca, J. Rocchi, E. Marinari, G. Parisi, F. Ricci-Tersenghi, Cross-correlations of American baby names, PNAS 112 (2015) 7943 - dynamika korelacji między stanami 6

Histogram częstości imion Aadhya Aaditya 2011 P ( f ) f Sophia Jacob 1880 1949 7/26

interpretacja w tekście 2 - wartość typowa; 3/2 dla rzadszych słów w tekstach wieloautorskich > 2 - wiele tematów, chaotyczne wypowiedzi; także zbyt małe próbki tekstu ; może też oznaczać lekką schizofrenię < 2 - małe dzieci (1.6), teksty bojowe (1.7); także cięższa schizofrenia [R. Ferrer i Cancho, Eur. Phys. J. B 44 (2005) 249] 8

Fragmentacja S(t) St () N Ni () t i 1 Nt () 2 9/17

10 dane z USA i graf korelacji i,j imię n(i,t,a) a,b stan t =1910,,2011 Korelacje ij między trochę innymi zmiennymi: Barucca et al, 2015: ta praca: n( i, t, a) x( i, t, a) n( j, t, a) j x( i, t, a) y( i, t, a) x( i, t, b) i, j =1, 19492 i, j =1, 100 b

klastry stanów - obliczenia Elementy macierzowe sieci stanów USA Ewolucja macierzy * gdzie dw dt ab G( x) ( x) (1 x) ab ac cb c a jest parametrem maksymalizującym modularność Q ** : w ab G( w ) ( w w ) 1 2 ab 1 kk a b Q wab ( a, b) m ab m k a w c ac m k * M. J. Krawczyk, PRE 77 (2008) 065701 ** M. E. J. Newman, M. Girvan, PRE 69 (2004) 026113 a a ** 11

test metody [Krawczyk M.J., PRE 77 (2008) 065701(R); Comp. Phys. Comm. 181 (2010) 1702] 12

Q(t) 13

klastry stanów - wyniki 14

Klastry stanów - wyniki 9 12 16 11 - wszystkie 9 stanów Northeast są przypisane do wspólnego klastra; - 18 stanów Midwest +West należą do wspólnego klastra. Jednak status Arizony, Kalifornii, Missouri, Nowego Meksyku i Nevady zmienia się w czasie, więc ich przynależność pozostaje otwarta; - 13 stanów South należą do wspólnego klastra. Jednak status Teksasu zmienia się w czasie. Poza tym Delaware i Maryland przypisano do NorthEast. 15

16

S. Arbesman, The Atlantic CityLab, April 26, 2012 www.citylab.com/politics/2012/04/invisible-borders-define-american-culture/1839/ 17

www.prismnet.com/~dierdorf/ww-27.html Prawo Zipfa P ( R) R 1 1 [R. Ferrer-i-Cancho, Eur. Phys. J. B 44 (2005) 249] 18

Uzasadnienie związku i m(n) = N P(n) ilość imion o populacji n m ( n) n n ( R) R Pozycja R w rankingu = ilość imion o większej m R( n) m( n') dn' n n Porównując, mamy 1 ale 1 1 1/ R n [R. Ferrer-i-Cancho, R. V. Sole, Journal of Quantitative Linguistics 8, 165 (2001)] 19

Co oznacza? J. Baixeries et al., PLOS One 8/3 (March 2013) e53227. 20

Dane z Belgii wykładnik 21

Dopasowanie danych do prawa Zipfa dla stanu Texas 1920-1990 home.agh.edu.pl/~gos/zipf/ 22

Ewolucja w klastrach stanów USA South West + Midwest Northeast 23

R. Molloy et al, Journal of Economic Perspectives 25 (2011) 173. 24

podsumowanie 1. Korelacje między imionami nadawanymi w stanach USA odzwierciedlają administracyjną i kulturową strukturę regionalną kraju. 2. Kolejność wartości wykładnika w prawie Zipfa w otrzymanych klastrach stanów w latach 1920-1980 pozostaje niezmieniona: (South) > (Northeast) > (West+Midwest). Interpretacja wykładnika jest niejasna. 25

podsumowanie 1. Korelacje między imionami nadawanymi w stanach USA odzwierciedlają administracyjną i kulturową strukturę regionalną kraju. 2. Kolejność wartości wykładnika w prawie Zipfa w otrzymanych klastrach stanów w latach 1920-1980 pozostaje niezmieniona: (South) > (Northeast) > (West+Midwest). podziękowanie Pani Prof. Dorocie Praszałowicz za dyskusję Panu Andrzejowi Mleczko za zgodę na użycie plakatu 26 Państwu za uwagę