Imiona dzieci symulacje i fakty

Podobne dokumenty
Imiona dzieci, prawo Zipfa i mapa Stanów Zjednoczonych

Modelowanie sieci złożonych

Równowaga Heidera symulacje mitozy społecznej

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Przejścia fazowe w uogólnionym modelu modelu q-wyborcy na grafie zupełnym

Analiza ekonomiczna w instytucjach publicznych analiza organizacji i projektów

Korelacje krzyżowe kryzysów finansowych w ujęciu korelacji potęgowych. Analiza ewolucji sieci na progu liniowości.

Centralność w sieciach społecznych. Radosław Michalski Social Network Group - kwiecień 2009

Komisja Krajobrazu Kulturowego Polskiego Towarzystwa Geograficznego. Cultural Landscape Commission of Polish Geographical Society.

Syntetyczne miary reprodukcji ludności

Work Extrinsic and Inrinsic Motivation Scale

ABOUT NEW EASTERN EUROPE BESTmQUARTERLYmJOURNAL

STATYSTYKA MATEMATYCZNA

Porównywanie populacji

Wybory samorządowe 2014 w poszukiwaniu anomalii statystycznych

Kolokwium ze statystyki matematycznej

Weryfikacja hipotez statystycznych

Metody rozwiązania równania Schrödingera

STATYSTYKA MATEMATYCZNA

author: Andrzej Dudek

Akademia Młodego Ekonomisty

Klimat w Polsce w 21. wieku

STATYSTYKA MATEMATYCZNA

EGZAMIN MATURALNY 2012 JĘZYK ANGIELSKI

Kwestionariusza kodów moralnych

Algorytm k-średnich. Źródło: LaroseD.T., Okrywanie wiedzy w danych.wprowadzenie do eksploracji danych, PWN, Warszawa 2005.

EGZAMIN MATURALNY 2012 JĘZYK ANGIELSKI

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku

FORD ST _ST_Range_V2_ MY.indd FC1-FC3 27/06/ :24:01

Wykorzystanie pojęć sprawności, skuteczności, efektywności i produktywności w administracji publicznej

STATYSTYKA MATEMATYCZNA

Spektroskopia jader neutrononadmiarowych od kuchni. Krzysztof Miernik

Metacognitive Awarness Inventory. Kwestionariusz metapoznania The Metacognitive Questionnaire

Wykładnicze grafy przypadkowe: teoria i przykłady zastosowań do analizy rzeczywistych sieci złożonych

mobbing makiawelizm kultura organizacji

Algorytmiczna teoria grafów Przepływy w sieciach.

Praca w instytucjach UE. Agnieszka Zakrzewska ambasador EU Careers KUL, 24 kwietnia 2014

TECHNOLOGIE INFORMACYJNE

EGZAMIN MATURALNY 2011 JĘZYK ANGIELSKI

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Jak z ABM zrobić model analityczny? (Metoda pola średniego) Katarzyna Sznajd-Weron Physics of Complex System

Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering

METODY STATYSTYCZNE W BIOLOGII

Nazwisko Imię (drugi autor) Afiliacja TYTUŁ PRACY 2. dyscyplina naukowa. 1 autor korespondencyjny 2 praca powstała ze środków na badania

Podstawowe fakty. Model Solowa szybkie przypomnienie

Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci

Wykład 2. Transformacje (przekształcenia) danych

Wykład 2. Standaryzacja: Przykład: wpływ stałej addytywnej: odejmujemy 20. Liniowa transformacja zmiennych. Liniowa transformacja zmiennych, cd.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Ogólnopolski Próbny Egzamin Ósmoklasisty z OPERONEM. Język angielski Kartoteka testu. Wymagania szczegółowe Uczeń: Poprawna odpowiedź 1.1.

MAKROEKONOMIA 2. Wykład 4-5. Dynamiczny model DAD/DAS, część 3. Dagmara Mycielska Joanna Siwińska - Gorzelak

Stany Zjednoczone Ameryki Północnej

Marzena Świgoń. Xth National Forum for Scientific and Technical Information Zakopane, September 22th-25th, 2009

MAKROEKONOMIA 2. Wykład 4-5. Dynamiczny model DAD/DAS, część 3. Dagmara Mycielska Joanna Siwińska - Gorzelak

Zastosowanie rozmytych map kognitywnych do badania scenariuszy rozwoju jednostek naukowo-dydaktycznych

Drapieżnictwo II. (John Stuart Mill 1874, tłum. własne)

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Chiralność w fizyce jądrowej. na przykładzie Cs

Hierarchiczna analiza skupień

Wykład 10. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Badanie uporządkowania magnetycznego w ultracienkich warstwach kobaltu w pobliżu reorientacji spinowej.

PhD Programme in Sociology

A.Z. Górski, S. Drożdż, J. Kwapień, P. Oświęcimka. Zakład Teorii Systemów Złożonych, Instytut Fizyki Jądrowej PAN, Kraków

Admission to the first and only in the swietokrzyskie province Bilingual High School and European high School for the school year 2019/2020

oceny moralne dylematy moralne teoria podstaw moralno ci diadyczna teoria moralno ci potocznej

Psychologia społeczna Michał Bilewicz Podstawowe czasopisma w psychologii społecznej Journal of Personality and Social Psychology Personality and

Analiza Sieci Społecznych Pajek

Mikro- i makro-ewolucja sieci społecznych

Prawa potęgowe w grafach przepływu informacji dla geometrycznych sieci neuronowych

Grafy Alberta-Barabasiego

Modelowanie motywów łańcuchami Markowa wyższego rzędu

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Wstęp do sieci neuronowych, wykład 8 Uczenie nienadzorowane.

Zwiększenie finansowania i potrzeby w ochronie zdrowia perspektywa PTK. Piotr Hoffman Prezes PTK

Akademia Morska w Szczecinie. Wydział Mechaniczny

Wykład 5. Metoda eliminacji Gaussa

Wyk lad 7: Drzewa decyzyjne dla dużych zbiorów danych

Odpowiedzi do zadań zamieszczonych w arkuszu egzaminu ósmoklasisty z języka angielskiego 17 KWIETNIA 2019 opracowane przez ekspertów Nowej Ery

SciFinder Podstawy wyszukiwania

Druga strona lustra o wspólnej drodze telewizji i internetu. Edyta Czarnota / Zymetria Michał Szczepankiewicz / Nielsen Audience Measurement

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA MATEMATYCZNA

Prof. Peter Nijkamp (Tinbergen Institute, Jheronimus Academy of Data Science, 's-hertogenbosch, The Netherlands )

Ewa Bandura. Nauczyciel jako mediator Kulturowy (seria: Język a komunikacja 13)

Obszary strukturalne i funkcyjne mózgu

STATYSTYKA MATEMATYCZNA

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

teori to samo ci spo ecznej tradycyjna vs. nowoczesna rola kobiety w spo ecze stwie seksizm tradycyjny vs. nowoczesny seksizm ambiwalentny

Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science

Przedsiębiorczość jutra, PARP, Warszawa, dr hab. Przemysław Zbierowski

Wykład z Technologii Informacyjnych. Piotr Mika

Liczby pierwsze Mersenne a i Fermata. Liczby pierwsze Mersenne a i Fermata

Sieci komputerowe. Wykład 8: Wyszukiwarki internetowe. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski

WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW

ANNALES UNIVERSITATIS MARIAE CURIE-SKŁODOWSKA LUBLIN POLONIA VOL. XXIV, 2 SECTIO K Reviews. Reports. Recenzje. Sprawozdania

Dydaktyka matematyki III-IV etap edukacyjny (wykłady) Wykład nr 6: Nauczanie algorytmów w szkole Semestr zimowy 2018/2019

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Data Mining Wykład 5. Indukcja drzew decyzyjnych - Indeks Gini & Zysk informacyjny. Indeks Gini. Indeks Gini - Przykład

Spacery losowe generowanie realizacji procesu losowego

Transkrypt:

Imiona dzieci symulacje i fakty Krzysztof Kułakowski Antoni Dydejczyk Piotr Gronek Małgorzata Krawczyk Piotr Kulczycki Krzysztof Misztal Mateusz Pomorski oraz Jarosław Kwapień Marcel Ausloos

plan Motywacja Źródło danych: USA Moda jako proces efekt Simmla Moda na mapie struktura sieci korelacji Prawo Zipfa dla imion Prezydenci i inni wskaźnik popularności Interpretacje

Motywacja kult jednostki Totmes III (Horus), 1481-1425 BC Boski August, 63 BC 14 AD Car Symeon I, 864-927 Przez dwa lata cały świat oddawał niemal boską cześć zwycięzcy spod Marny. Jego bagaże dosłownie uginały się pod ciężarem pudełek, paczek i listów, które przesyłali mu nieznani ludzie w gorączkowych dowodach podziwu. Myślę, że poza generałem Joffre żaden dowódca czasu wojny nie miał okazji doznać porównywalnej chwały. [W. Lippmann, Public Opinion, 1921] Joseph Joffre, 1852-1931

Kult jednostki jak zanika? w jakich warunkach?

Motywacja cd: lista pomysłów na życie

Źródło danych Belgia: ilość osób o danym imieniu w Brukseli, Flandrii i Walonii, w rozbiciu na grupy wiekowe : <18, 18-65, >65 ]http://statbel.fgov.be/fr/statistiques/chiffres/population/noms/ USA: ilość dzieci którym nadano dane imię w każdym stanie (bez Alaski i Hawajów) w latach 1910-2010; bez rozbicia na stany od 1880: www.ssa.gov Przykład: Charlie

Dane: rozkład częstości imion Aadhya Aaditya 2011 Sophia Jacob 1880 1949 7/17

Dane: ilość imion N(t), fragmentacja S(t) S N i 1 Ni( t) N( t) 2 N(t) 8/17

Georg Simmel, Fashion, International Quarterly 10 (1904) 130 Efekt Simmla... agenci są skłonni nie tylko do naśladowania, ale także, aby odróżniać się od innych. (Simmel) opisał modę jako efekt łącznego działania obu postaw. (...) Gdy grupy społeczne są sortowane według rangi, aktorzy naśladują symbole statusu określające wyższe poziomy hierarchii i porzucają symbole wyznaczające niższe poziomy. Na skutek tej dynamiki symbole wysokiego statusu szybko rozprzestrzeniają się w populacji, przebiegając w dół od wyższych do niższych poziomów w hierarchii społecznej. Jednak, gdy tylko się rozprzestrzenią, symbole te zostają porzucone i zastąpione nowymi. [Roberto Pedone and Rosaria Conte, Soc. Sci. Comp. Rev. 2001] 9/17

Sekwencje naśladowania w sieci bezskalowej 10/17

Dlaczego sieci bezskalowe? -Niektóre sieci społeczne są bezskalowe [Newman, SIAM 2003; Fu ea, Phys A 2008] -Stopień wierzchołka jest wygodnym miernikiem statusu The degree of an actor is important; thus, a centrality measure for an individual actor should be the degree of the node. [Wasserman & Faust, Social Network Analysis 1994, p. 178] [Ball & Newman, arxiv:1205.6822 sieci przyjaźni 90 000 studentów] 11/17

Algorytm 4 3 3 1 2 4 3 3 2 3 3 4 3 0 1 3 1 2 1 2

q=5 q=10 Gdy ilość q opcji wzrasta, poszczególne symbole zaczynają wymierać. q=15 q=20 q=25 q=30 13

Dane i wyniki numeryczne: kształt Debra P. Barucca, J. Rocchi, E. Marinari, G. Parisi, F. Ricci-Tersenghi, Cross correlations of American baby names, PNAS 112 (2015) 7943; (max między 1940 i 1982) 14/17

Wyniki numeryczne Rozkład czasów trwania imienia q = 30 q = 1000 15/17

Dane 20 najpopularniejszych imion W(1935) > 2000 W(1935) < 2000 16/17

Dane: czy czas trwania imienia maleje? T2-T1 W W max W max /2 T1 T2 t + : max 60-100 10 3 : 50-60 10 3 : 25-50 10 3 T1 17/17

podsumowanie 1/4 Teoria Simmla: - kształt ilości imienników w czasie - czas trwania mody maleje z ilością imion (dane nie wykluczają takiej prawidłowości) teraz będzie: moda na mapie

n(i,t,a) dane : graf korelacji i,j imię a,b stan t =1910,,2011 Korelacje ij między trochę innymi zmiennymi: Barucca et al, 2015: ta praca: x( i, t, a) n( i, t, a) n( j, t, a) y( i, t, a) x( i, t, a) x( i, t, b) j b i, j =1, 19492 dziewcząt i, j =1, 100

klastry stanów - obliczenia Elementy macierzowe sieci stanów USA Ewolucja macierzy * gdzie dw dt ab G( x) ( x) (1 x) a jest parametrem maksymalizującym modularność Q ** : w ab G( w ) ( w w ) ab ac cb c 1 2 ab 1 kk a b Q wab ( a, b) m m k a c w ab ac * M. J. Krawczyk, PRE 77 (2008) 065701 ** M. E. J. Newman, M. Girvan, PRE 69 (2004) 026113 m a k a ** 20

test metody [Krawczyk M.J., PRE 77 (2008) 065701(R); Comp. Phys. Comm. 181 (2010) 1702] 21

Q(t) 22

klastry stanów - wyniki 23

Klastry stanów - wyniki 9 12 16 11 - wszystkie 9 stanów Northeast są przypisane do wspólnego klastra; - 18 stanów Midwest +West należą do wspólnego klastra. Jednak status Arizony, Kalifornii, Missouri, Nowego Meksyku i Nevady zmienia się w czasie, więc ich przynależność pozostaje otwarta; - 13 stanów South należą do wspólnego klastra. Jednak status Teksasu zmienia się w czasie. Poza tym Delaware i Maryland przypisano do NorthEast. 24

25

S. Arbesman, The Atlantic CityLab, April 26, 2012 www.citylab.com/politics/2012/04/invisible-borders-define-american-culture/1839/ 26

podsumowanie 2/4 Moda na mapie: Analiza częstości imion w poszczególnych stanach w przybliżeniu odtwarza regiony administracyjne USA teraz będzie: prawo Zipfa

Jeszcze raz: rozkład częstości imion 2011 P ( f ) f Mała wartość : dużo imion występujących często, stosunkowo mało imion egzotycznych. Tu: w XX wieku 1.7 < < 1.9, w XXI wieku 2.0.

interpretacja w tekstach 2 - wartość typowa; 3/2 dla rzadszych słów w tekstach wieloautorskich > 2 - wiele tematów, chaotyczne wypowiedzi; także zbyt małe próbki tekstu ; może też oznaczać lekką schizofrenię < 2 - małe dzieci (1.6), teksty bojowe (1.7); także cięższa schizofrenia [R. Ferrer i Cancho, Eur. Phys. J. B 44 (2005) 249] 29

www.prismnet.com/~dierdorf/ww-27.html Prawo Zipfa P ( R) R 1 1 [R. Ferrer-i-Cancho, Eur. Phys. J. B 44 (2005) 249] 30

Uzasadnienie związku i m(n) = N P(n) ilość imion o populacji n m ( n) n n ( R) R Pozycja R w rankingu = ilość imion o większej m R( n) m( n') dn' n n Porównując, mamy 1 1 ale R n 1 1/ [R. Ferrer-i-Cancho, R. V. Sole, Journal of Quantitative Linguistics 8, 165 (2001)] 31

Co oznacza? J. Baixeries et al., PLOS One 8/3 (March 2013) e53227. 32

Dopasowanie danych do prawa Zipfa dla stanu Texas 1910-1990 home.agh.edu.pl/~gos/zipf/ 33

Dane z Belgii wykładnik 34

Ewolucja w klastrach stanów USA South West + Midwest Northeast 35

R. Molloy et al, Journal of Economic Perspectives 25 (2011) 173. 36

podsumowanie 3/4 Prawo Zipfa: Zmierzone wskaźniki Zipfa wykazują systematyczną zależność od regionu: (West) < (Northeast) < (South) teraz będzie: prezydenci i inni

Number of namesakes Grover Cleveland, 1885-89, 1893-97 the office was taken

Number of namesakes Woodrow Wilson, 1913-21 voting rights for women

Number of namesakes Franklin D. Roosevelt, 1933-45 prohibition released Gallup founded

Number of namesakes Dwight Eisenhower, 1953-61

Number of namesakes John F. Kennedy, 1961-63

Number of namesakes Jacqueline

Number of namesakes Lyndon B. Johnson, 1963-69 campaign for the Great Society

Johnson cult In February, 1964, the territory of Papua and New Guinea held elections to choose representatives to the newly formed House of Assembly. In New Hanover about half the population of 7,000 refused to follow the prescribed balloting procedure and instead proclaimed, through spokesmen and blackboard announcements, that they all wanted to vote for only one man: Johnson of America. [D. K. Billings, Oceania 40/1 (1969) 13]

Number of namesakes Richard Nixon, 1969-74

Number of namesakes Gerald Ford, 1974-77

Number of namesakes Ronald Reagan, 1981-89

Number of namesakes George H. W. Bush, 1989-93 end of the Desert Storm

Number of namesakes Bill Clinton, 1993-2001

Number of namesakes George W. Bush, 2001-09

Number of namesakes Barack Obama, 2009-

Number of namesakes Malia Obama

Number of namesakes Marlene Dietrich Blue Angel

Number of namesakes Elvis Presley Love Me Tender death

Number of namesakes Dustin Hoffman Kramer vs Kramer

Number of namesakes Selena Quintanilla Pérez death

0 y max{ y 1, y0, y 1} Propozycja indeksu y - dane w roku objęcia urzędu Dla danych { y 5, y 4, y 3, y 2, y 1, y0, y 1} obliczamy kwartyle q r Wskaźnik c definiujemy jako c q y 0.75 q q 0.5 0.25 www.mathplanet.com/education/pre-algebra/probability-and-statistic/stem-and-leaf-plots-and-box-and-whiskers-plot

Przykład: Lyndon B. Johnson Dane {y i }: 1958; 162 1959; 192 1960; 246 1961; 207 1962; 148 1963; 177 1964; 512 Dane uporządkowane {z i }: 148 162 177 192 207 246 512 y q q q c 0.5 0.25 0.75 max{148,177,512} z 4 ( z 512 236 (3z 5 2 192 z 3z 192 166 3 6 ) / 4 ) / 4 4.6 166 236 512

Wyniki prezydenci Johnson Calvin Coolidge C Th. Roosevelt Bill Imiona przyjęte jak www.whitehouse.gov/1600/presidents

Wyniki inni Selena (death) C Shirley Linda (song) Jacqueline Michelle (song) Elvis (death) Whitney Leonardo Malia Dustin Britney

Propozycja interpretacji : ~1980 ~1950 [A. H. Maslow, A theory of human motivation, Psychol. Review 50 (1943) 370]

Załóżmy że przyszłość jest lepsza: Kraje gdzie potrzeby są zaspokojone gorzej Kraje gdzie potrzeby są zaspokojone lepiej Indywidualny stopień zaspokojenia potrzeb Indywidualny stopień zaspokojenia potrzeb [L. Tay, E. Diener, Needs and Subjective Well-Being around the world, J. of Personality and Social Psychology 101 (2011) 354.]

Czy to jest tak? Nie. [M. R. Hagerty, Testing Maslow s hierarchy of needs, Social Indicators Research 46 (1999) 249]

Czyżby bezpieczeństwo wyłączało potrzebę bliskości? Czy potrzeby wyższe są tylko wysublimowanymi formami potrzeb niższych? http://www.slideshare.net/nadeemjafar1/happy-green-dussehra

podsumowanie 4/4 Zaproponowano wskaźnik do pomiaru wpływu pojawienia się danej osoby na ilość jej imienników. Dane wskazują, że moda na nadawanie dziecku imienia aktualnego prezydenta USA wygasła w latach 60-tych. Nie odnosi się to do imion przynajmniej niektórych osobistości świata rozrywki.

literatura M. J. Krawczyk, A. Dydejczyk and K. Kułakowski, The Simmel effect and babies names, Physica A 395 (2014) 384 M. Pomorski, M. J. Krawczyk, K. Kułakowski, J. Kwapień and M. Ausloos, Inferring cultural regions from correlation networks of given names, Physica A (2016), w druku K. Kułakowski, P. Kulczycki, K. Misztal, A. Dydejczyk, P. Gronek, and M. J. Krawczyk, No more presidents in my family, w przygotowaniu dla Acta Phys. Pol. A Dziekuje za uwage