Historia Rachunku Prawdopodobieństwa i Statystyki WYKŁAD VI: Galton, Edgeworth i Karl Pearson.

Podobne dokumenty
Testowanie hipotez statystycznych.

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Badanie zależności skala nominalna

Historia Rachunku Prawdopodobieństwa i Statystyki WYKŁAD VII: Ronald Fisher. Statystyka Matematyczna jako oddzielna dyscyplina

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Wykład 8 Dane kategoryczne

Opis przedmiotu: Probabilistyka I

Metody probabilistyczne

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Estymacja parametrów rozkładu cechy

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Spis treści 3 SPIS TREŚCI

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

STATYSTYKA

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

1.1 Wstęp Literatura... 1

Weryfikacja hipotez statystycznych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Korelacja krzywoliniowa i współzależność cech niemierzalnych

1 Estymacja przedziałowa

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Dokładne i graniczne rozkłady statystyk z próby

Wykład 11 Testowanie jednorodności

MATEMATYKA3 Mathematics3. Elektrotechnika. I stopień ogólnoakademicki. studia stacjonarne. Katedra Matematyki dr Zdzisław Piasta

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Podstawy statystyki matematycznej w programie R

Rozkłady statystyk z próby

Test t-studenta dla jednej średniej

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Z poprzedniego wykładu

Testowanie hipotez statystycznych

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Z-0033z Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki. Stacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

STATYSTYKA MATEMATYCZNA

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Centralne twierdzenie graniczne

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wykład 12: Tablice wielodzielcze

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Testy adaptacyjne dla problemu k prób

Wnioskowanie statystyczne. Statystyka w 5

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

W1. Wprowadzenie. Statystyka opisowa

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyka matematyczna i ekonometria

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

STATYSTYKA MATEMATYCZNA

Rozkłady statystyk z próby. Statystyka

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka matematyczna

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład z dnia 8 lub 15 października 2014 roku

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Własności statystyczne regresji liniowej. Wykład 4

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Statystyka matematyczna. Wykład VI. Zesty zgodności

Statystyka Matematyczna Anna Janicka

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Transkrypt:

Historia Rachunku Prawdopodobieństwa i Statystyki WYKŁAD VI: Galton, Edgeworth i Karl Pearson. MiNI PW, semestr zimowy 2016/2017

Galton, Edgeworth i Pearson Trzej badacze, którzy razem, korzystając wzajemnie ze swoich wyników osiągnęli więcej, niż każdy z nich osiągnąlby osobno (efekt synergii). Francis Galton: miał bardzo dobre pomysły, ale nie miał dobrych podstaw matematycznych i nie umiał uogólnić swych częsciowych wyników; Francis Edgeworth: dobry matematyk, umiał wyciągnąc wnioski ogólne z wyników częściowych, mial problemy z przekazaniem ich szerzej i nie umiał zebrać danych, aby swe ogólne wnioski potwierdzić; Karl Pearson: nie miał zdolności Galtona i głebokości Edgewortha, ale cechowały go ambicja i upór, które pozwoliły mu, razem z Yule m na stworzenie związanej z odkryciami poprzedników spójnej metodologii i sprzedanie jej światu.

Francis Galton (1822-1911)

Francis Galton (1822-1911) FG był lekarzem w Cambridge, który po odziedziczeniu spadku przerwal pracę zarobkową i zajął się działalnoscią naukową. Główne zainteresowania: eksploracja Afryki 1850 1852 (złoty medal Królewskiego Towarzystwa Geograficznego w 1853); meteorologia (sporządzenie map meteorologicznych); psychologia, antropologia, socjologia, edukacja... głowne zainteresowania po 1865 dotyczyły dziedziczności. Być może jeden z ostatnich naukowców gentelmenów gentlemen scientists (Stigler), niezależnych finansowo naukowców nie związanych z żadną instytucją naukową. Stephen Wolfram? Merytorycznie był potomkiem Queteleta.

Główne osiągnięcia: Narzędzia eksploracyjnej analizy danych (wykres pudełkowy, wykres kwantylowy (ogive) korelacja; regresja prawa dziedziczności, problemy dziedziczenia zdolności; quincunx (deska Galtona);...

Wykres pudełkowy

Ogiwa: protoptyp funkcji kwantylowej FG przedstawiał rozkład w próbie na wykresie zależności wartości cechy od jej rangi. Zbadał jej kształt dla populacji normalnej i nazwał tę krzywą ogiwą Ogiwa

Problem dziedziczenia i oceny zdolności Miara ilościowa stopnia zdolności: Porządkował ludzi w grupie względem zdolności i i-tej randze przyporządkowywał Φ 1 ((n + i 1/2)/2n). Opublikował książke Hereditary Genius, w której starał sie udowodnić, na podstawie zebranych danych o rodzinach polityków, naukowców, poetów itp., że talent jest dziedziczny.

Regresja w kierunku średniej

Problem Galtona Nie umiał przez długi czas poradzić sobie z problemem: Jak to możliwe, że dla cechy, której rozklad w populacji jest normalny (np. dla wzrostu), a więc powinna być, na podstawie warunków zapewniających CTG (warunki Laplace a) wynikiem działania wielu cech o mniej wiecej takiej samej sile, a jednocześnie cecha rodzicielska się dziedziczy, czyli jest dominująca.. CTG musi zachodzić również przy innych załozeniach niż warunki Laplace a.

Koncepcja deski Galtona

Karl Pearson (1857-1936) Z wykształcenia prawnik o szerokich zainteresowaniach, od 1892 roku, pod wpływem Galtona, zajał się statystyką. Ksiązki: Regression, Heredity, and Panmixia, On the general theory of skew correlation and nonlinear regression On the theory of contingency Załozyciel jednego z najważniejszych pism biometrycznych/statystycznych Biometrika (1902).

Karl Pearson (1857-1936) Główne osiągnięcia: analiza dwuwymiarowego rozkładu normalnego; analiza rozkładów skośnych i rodzina rozkładów Pearsona; test chi-kwadrat zgodności rozkładów; analiza tablic kontyngencji; metoda momentów.

Rodzina rozkładów Pearsona Rodzina gęstości spełniających równanie d ln p(x) dx = x + a b 0 + b 1 x + b 2 x 2

Test zgodności chi-kwadrat (X 1,..., X k ) obserwacja z rozkładu wielomianowego Mult(n, p 1,..., p k ) i e i = X i np i róznice między wartościami oczekiwanymi liczby obserwacji w komórkach a X i. Statystyka chi kwadrat χ 2 = k i=1 e 2 i np i = k (X i np i ) 2 i udowodnił, że ma asymptotycznie rozkład χ 2 z k 1 stopniami swobody. i=1 np i

Test zgodności chi-kwadrat z estymowanym parametrami Co w sytuacji, gdy p i nie są znane a jedynie znamy ich formę parametryczną p i = p i (θ)?. Estymujemy wartość parametru i ˆp i = p i (ˆθ) KP załozył błednie, ze zamiana p i na ˆp i nie spowoduje zmiany rozkłądu asymptotycznego. Długa kontrowersja z R. Fisherem, który udowodnił, ze rozklad asymptotyczny to χ 2 k l, gdzie l liczba restrykcji na parametry.

Spór z G. Yule m dotyczący analizy danych jakościowych

Spór z G. Yule m dotyczący analizy danych jakościowych KP uważal, że należy tablice kontyngencji traktować jako wynik obserwacji wartości dwuwymiarowego rozkładu normalnego i szukał takiego rozkładu normalnego, dającego prawdopodobieństwa równe częstościom klatek przy równości rozkładów brzegowych. współczynnik korelacji tetrachorycznej.

Spór z G. Yule m dotyczący analizy danych jakościowych G. Yule uważał, że pewne zmienne są z natury dyskretnie i to co obserwujemy w tablicy kontyngencji to wartości dwuwymiarowej zmiennej o wartościach dyskretnych. Wprowdził iloraz szans (odds ratio) zdefiniowany dla rozkładu 2x2 θ = P(X = 1 Y = 1) = 1 Y = 0) /P(X P(X = 0 Y = 1) P(X = 0 Y = 0) = π 11π 00 π 01 π 10 Q Yule a ˆθ = n 00n 11 n 01 n 10. Q = ˆθ 1 ˆθ + 1 = n 00n 11 n 01 n 10 n 00 n 11 + n 01 n 10.

Spór z G. Yule m dotyczący analizy danych jakościowych Pearson i Heron (1913) 150-stronicowy atak na Yule a i jego miarę: If Mr Yule s views are acccepted, incomparable demage will be done to the growth of modern statistical theory.. Zaatakowano half-baked ideas Yule a i specious reasoning i pogląd, ze Yule powinien wycofać swoje koncepcje jeśli chce zachować swoją reputację jako statystyk. W zależności od danych jedno z konkurencyjnych podejść KP i BY ma rację bytu...

Inne osiągnięcia Yule a Analiza regresji dla pauper data.

Analiza regresji dla pauper data

Użycia i nadużycia testu chi kwadrat.. Przy H 0 nˆp i = 851/12 = 70.917..0025 < p = 0.0283 < 0.05.