Wybór modelu. Nie ma dobrych modeli, ale niektóre są pożyteczne.
|
|
- Ewa Rudnicka
- 8 lat temu
- Przeglądów:
Transkrypt
1 Wybór modelu Nie ma dobrych modeli, ale niektóre są pożyteczne. 1 Dane Wybór modelu to zagadnienie kluczowe w procesie badawczym. Każdy model jest tylko pewnym przybliżeniem rzeczywistości, rzecz w tym, byw wybrać to przybliżenie, które najlepiej odpowie na nasze pytanie badawcze. W analizie tych samych danych różne pytania mogą prowadzić do różnych metod modelowania. Omówimy kilka najważniejszych sposobów szacowania i porównania różnych modeli. Naszym zadaniem będzie porównanie pewnego proponowanego modelu z danymi. Omówmy zatem kwestię podstawową: reprezentacji danych i modelu. Model jest reprezentowany przez bądź funkcję gęstości bądź dystrybuantę bądź jakieś funkcjonały tych wielkości jak na przykład LEV albo MRL (potem). Dane natomiast mogą być reprezentowane w postaci dystrybunaty empirycznej bądź histogramu. Wykresy można łatwo i łądnie zrobić, gdy mamy pełne dane. Często jednak mamy do czynienia z danymi okrojonymi: ocenzurowanymi i obciętymi. Komentarz na boku 1. censoring - ucinanie, cenzurowanie; Cenzurowanie prawostronne: dokładna wartość X nie jest mierzalne, ale są znane wartości: T = min(x, C), δ = I {X C} Obserwacja jest prawostronnie ocenzurowana w punkcie u, jeśli gdy jest powyżej u, to jest zaobserwowana, ale nie znamy jej dokładnej wartości [wiemy 1
2 tylko, że jest u i tą przyjmujemy], a gdy jest poniżej u, to jest zarejestrowana w swojej zaobserwowanej wartości. Przykład: mierzymy śmiertelność w populacji. Możemy stworzyć dane, które kończą się np. na poziomie 80 lat. Oznacza to, że wiemy, że śmierć nastąpiła co najmniej w wieku 80 lat, ale nie wiemy dokładnie, kiedy. O ile mi wiadomo, tablice życia są tak tworzone. Inny przykład: ucinanie może wynikać z ograniczonej skali intrumentu, który nam służy do mierzenia. Np. jak amy wagę, która ma skalę tylko do 200 kilo, a stanie na niej ktoś ważący 250, to będziemy wiedzieli tylko tyle, że waży on co najmniej 200 kilo. Ponieważ zajmujemy się modelami ubezpieczeniowymi, najczęściej mamy do czynienia oczywiście z ucinaniem prawostronnym. Komentarz na boku 2. truncation - obcinanie, wykluczenie; Obserwacja są lewostronnie obcięta/wykluczona w punkcie d, jeśli gdy jest poniżej d nie jest zaobserwowana, ale jeśli jest powyżej d, jest zaobserwowana i znamy jej wartość. Przykład: przeżycie w domach starości. Możemy badać kto w jakim wieku umiera w domu starości, ale nasze badania nie uwzględniają tych, co do tego domu starości nie dożyli. Zazwyczaj w ubezpieczeniach występuje obcinanie/wykluczanie lewostronne. Gdy robimy tablice śmietelności nie jest zbyt wygodnie obserwować każdego człowieka od narodzin aż do śmierci. Zamiast tego najczęściej obserwuje się grupę ludzi w różnym wieku przez ileś lat. Te dane są obcięte z lewej strony, bo gdy zaczynamy obserwację x-latka, to ten x-latek żyje. Nie uwzględniamy tych, którzy nie dożyli. Dane są też ocenzurowane z prawej strony, bo przy zakończeniu badań o x-latku możemy powiedzieć tylko, że wiek jego śmierci jest co najmniej x, choć nie znamy dokładnej wartości. My zajmiemy się tylko przypadkiem, gdy wszystkie dane zostały lewostronnie obcięte (wykluczone) na tym samym poziomie i prawostronnie ocenzurowane również na jednym poziomie. Zauważmy, że o ile cenzurowanie danych nie zmienia nam prawdopodobieńt- 2
3 swa [gdyż rejestrujemy WSZYSTKIE obserwacje], o tyle obcinanie sprawia, że obserwujemy tylko wycinek rzeczywistości. W szczególności, zauważmy, że nasza dystrybuanta empiryczna rozpoczyna się w punkcie obcięcia i reprezentuje prawdopodobieństwo warunkowe - poda warunkiem, że nasza obserwacja przekroczyła punkt cięcia d. Zatem jeśli F jest dystrybuantą naszego modelu, to aby móc zbadać dopasowanie modelu do danych obciętych, musimy też obciąć model, w następujący sposób: 0, x < d F (x) = F (x) F (d) 1 F (d), x d 2 Porównanie graficzne Najprostszą rzeczą, jaką możemy sprawdzić, jak dane pasują do modelu, jest porównanie graficzne. W tym celu rysujemy w jednym układzie współrzędnych wykres dystrybuanty empirycznej i dystrybuanty z modelu i obserwujemy, w jakim stopniu rysunki są do siebie zbliżone [jeśli nie znamy parametrów rozkładu użytego w modelu, najczęściej stosuje się esytamtor największej wiarygodności]. Drugą możliwością jest narysowanie histogramu i funkcji gęstości z modelu. Obserwujemy, czy odchylenia są równo rozłożone wzdłuż całej osi, czy też np. model zaniża wartości dla niskich obserwacji, a zawyża dla dużych. Jeśli obie dystrybuanty [empiryczna i modelowa] są bliskie, może być trudno poczynić jakieś obserwacje z takiego wykresu. Wygodnie jest wtedy rozważyć funkcję będącą różnicą tych dwu:. D(x) := F n (x) F (x) Kolejnym sposobem jest tzw. wykres P-P. Porównujemy w nim dystrybunaty obu rozkładów w następujący sposób: obserwacje porządkujemy w kolejności rosnącej x 1... x n i dla każdej rysujemy na wykresie punkt o współrzędnych (F n (x j ), F (x j )). Jeśli dopasowanie modelu do danych jest dobre, wykres punktów powinien być blisko prostej o nachyleniu 45 stopni biegnącej od (0, 0) 3
4 do (1, 1) [oczywiście, jeśli dane mamy ocenzurowane, to wykres niekoniecznie będzie przebiegał aż do punktu (1, 1)]. Warto wspomnieć, że aby faktycznie naszą graniczną linią była linia 45 stopni, trzeba nieco przedefiniować dystrybuantę empiryczną. Można bowiem wykazać, że wartość oczekiwana F n (x j ) = z takiego wykresu? Omówmy kilka przypadków: j n+1, a nie j n. Co możemy odczytać - lewa strona nad linią, prawa strona pod linią - duże ogony rozkładu; - lewa strona nad linią, prawa pod - małe ogony rozkładu; - wykres zakrzywiony wypukły - skośność prawostronna; - wykres zakrzywiony wklęsły - skłonność lewostronna; 3 Testowanie hipotez Z rysunku można niekiedy wiele odczytać, ale czasem lepiej jest sformalizować swoje wrażenia za pomocą matematyki. Jednym ze sposobów matematycznego ukazania jak podobne są dwa modele jest test hipotezy. H 0 : Dane pochodzą z populacji o zadanym modelu H 1 : Dane nie pochodzą z takiej populacji. Statystyka testowa opisuje jak blisko siebie są model i dane. Jeśli hipoteza zerowa kompletnie opisuje model [np. określa jego parametry], to znamy wartości krytyczne przy odpowiednich przedziałach ufności i wiemy, jak postępować. Jeśli parametry nie są znane, to esytmujemy je z tych samych danych, a więc statystyka testowa będzie mniejsza [bo metoda estymacji stara się dobrać jak najlepiej parametry]. W tym wypadku, testowanie hipotez staje się przybliżone. Ponieważ odrzucenie hipotezy zerowej zachodzi dla wysokich wartości statystyki testowej, przybliżenie zwiększa prawdopodobieństwo błedy II typu, a zmniejsza pr. błędu I typu [jedynie test chi-kwadrat ma wbudowaną korektę tego stanu]. Dla modelowania aktuarialnego jest to ok. Jedną z metod na uniknięcie takiego przybliżenia jest losowe podzielenie próbki na pół. Na jednej części wykonamy estymację parametrów, a na drugiej przeprowadzamy wówczas test hipotezy 4
5 3.1 Test Kołmogorowa-Smirnowa Niech d będzie punktem obcięcia (d=0 lub, jeśli nie ma obcięcia), a u - (być może ) punktem cenzorowania. Wówczas rozważmy statystykę Kołomogorowa: D n = max d x u F n(x) F (x) Wartości D n, co ciekawe, nie zależą od rozkładu F i są stablicowane. 3.2 Test Andersona-Darlinga Test AD jest podobny do testu Kołmogorowa-Smirnowa, choć używa innej miary, by zmierzyć różnicę pomiędzy dystrybuantą empiryczną a modelową. Podczas gdy test Kołmogorowa odwołuje się do odległości w sensie supremum, test AD korzysta z odległości średniokwadratowej. Statystyka testowa ma postać: u A 2 [F n (x) F (x)] 2 = n t F (x)[1 F (x)] f (x)dx Jest to średnia ważona kwadratów odległości pomiędzy empiryczną i modelową dystrybuantą. Warto zauważyć, że jeśli x jest bardzo bliski d lub u, wagi dla tych wielkości są bardzo duże [ze względu na rozmiar mianownika]. Zatem ta statystyka przykłada większą wagę do tego, by rozkłady pasowały do siebie w ogonach, niż w środku. Dla danych dyskretnych całka upraszcza się do sumy: A 2 = nf (u) + n +n k [1 F n (y j )] 2 (ln[1 F (y j )] ln[1 F (y j+1 )]) j=0 k F n (y j ) 2 (ln[f (y j+1 )] ln[f (y j )]) j=0 Dla u = ostatni składnik pierwszej sumy wynosi 0, co warto zauważyć osobno zanim spróbujemy policzyć to np. na komputerze [wg wzoru będzie to wtedy logarytm z 0]. Wartości krytyczne są znane i wynoszą dla poziomów ufności 10%, 5% i 1% odpowiednio: 1.933, i Zainteresowanym wspomnę, że test Andersona-Darlinga jest szczególnym przypadkiem testu Cramera-von Misesa z wagami 1 F (x)(1 F (x)) 5
6 3.3 Test dobrego dopasowania Chi-kwadrat Jest to test zgodności liczebności zaobserwowanej z oczekiwaną. Wybieramy k-1 arbitralnych wartości d = c 0 < c 2 <... < c k = infty. Niech p j = F (c j ) F (c j 1 ) będzie prawdopodobieństwem, że obcięte wartości wpadają do przedziału (c j 1, c j ). Niech p n j == F n (c j ) F n (c j 1 ) będzie analogicznie zdefiniowany prawdopodobieństwem, ale dla dystrybuanty empirycznej. Wówczas statystyka testowa przyjmuje postać: χ 2 = gdzie n jest rozmiarem próbki. k j=1 n(p j p n j) 2 p j, Wartość krytyczna dla tego testu pochodzi z rozkładu chi-kwadrat o licznie stopni swobody k 1 minus liczba estymowanych parametrów. Ten test nie jest zbyt silny i znajduje zastosowanie głównie gdy mamy mało danych [liczba stopni swobody jest niewielka]. Dla dużych próbek lepiej stosować silniejsze testy. Jest on jednak dobry, jeśli nie mamy pojedynczych danych z obserwacji, tylko np. przedziałowe. 3.4 Test oparty na ilorazie wiarygodności Ten test jest używany do odpowiedzi na pytanie postaci: czy populacja ma raczej rozkład A czy B?. Formalnie: H 0 : Dane pochodzą z populacji o rozkładzie A H 1 : Dane pochodzą z populacji o rozkładzie B Aby móc sformułować test, rozkład A musi być specjalnym przypadkiem rozkładu B, np. A to rozkład wykładniczy a B to rozkład gamma. Albo: H 0 : Dane pochodzą z populacji o rozkładzie gamma ze średnią µ = 100 H 1 : Dane pochodzą z populacji o rozkładzie gamma ze średnią µ 100 6
7 4 Wybór modelu Zasada oszczędności: jeśli nie ma wyraźnego powodu by postąpić przeciwnie, z dwóch modeli preferowany jest ten prostszy. Zasada rozsądku: ogranicz przestrzeń modeli do jakiegoś sensownego podzbioru. 4.1 Podejście oparte na własnym osądzie Wybór modelu oparty na własnym osądzie opiera się na jednej lub więcej z trzech koncepcji, które zaraz przedstawię. Kluczową rzeczą jest doświadczenie badawcze i pewne statystyczne obycie. Po pierwsze, wybór może zostać oparty na wykresach i tabelach. To pozwala badaczowi na skupienie się na tych aspektach modelu, które są istotne dla określonych zastosowań. Może być na przykład ważne, żeby dobrze dopasować rozkład na ogonach, ablo żeby dopasować średnie. Nawet jeśli używamy podjeścia opartego na wyliczeniach, dobrze jest podeprzeć wybrany model odpowiednim rysunkiem. Po drugie, na wybór określonego modelu może wpłynąć nasza wiedza o modelach użytych w podobnych badaniach co nasze, albo jeśli jakiś model ma ważne własności czy szczególną wartość dla zastosowań, w których chcemy nasze dane wykorzystać. W czasach, gdy jeszcze nie było komputerów, często decydowano się na wybór prostszych i gorszych modeli po to, by łatwiej przeprowadzać obliczenia, zamiast decydować się na dokładniejsze, ale ciężko wyliczalne. Po trzecie, określona sytuacja w której przeprowadzamy obserwację może określać model. Przykładowo, jeśli ubezpieczenie zdrowotne pokrywa koszty dwóch kontroli dentystycznych w roku i jednostki dwa razy w roku podejmują niezależne decyzje czy wybrać się do dentysty, czy nie z tym samym prawdopodobieństwem p, to ilość wizyt ma rozkład dwumianowy z prawdopodobieństwem p. I w końcu, należy stwierdzić, że stosując podejście algorytmiczne, możemy dla dwóch testów dojść do sprzecznych rezultatów. Zatem korzystając z naszego 7
8 doświadczenia badawczego musimy na podstawie własnej wiedzy podjąć decyzję, które podejście algorytmiczne, czy też który model wybrać. 4.2 Podejście oparte na punktach Podejście oparte na liczbach jest o tyle wygodne w użyciu, że jest, w pewnym sensie, obiektywne, a ponadto może być zaimplementowane np. na komputerze. W takim wypadku każdemu modelowi dajemy punkty i model z najlepszym wynikiem wygrywa. Warto rozważyć na przykład te wartości: 1. Najniższa wartość testu Kołmogorowa. 2. Najniższa wartość testu AD. 3. Najniższa wartość testu dobrego dopasowania chi kwadrat. 4. Najwyższa p-wartość dla testu chi kwadrat. 5. Najwyższa wartość funkcji wiarygodności w jej maksimum. Niestety, wszystkie testy oprócz p-wartości chi kwadrat wydają się nie współgrać z naszą zasadą oszczędności tj. są krzywdzące dla modeli prostszych. Test chi kwadrat jest odporny na ten problem, bo razem ze stopniem komplikacji modelu zmniejszaa się ilość stopni swobody, jest więc możliwe, że bardziej skomplikowany model będzie miał mniejszą p-wartość. Jeśli chodzi o funkcję wiarygodności, to mamy dwa podejścia: albo wykonać test oparty na ilorazie wiarygodności, albo odprowadzać karę za użycie dodatkowych parametrów. Test oparty na ilorazie jest technicznie wykonalny tylko wtedy, gdy jeden model jest specjalnym przypadkiem drugiego. Drugie podejście jest następujące: wybieramy najlepszy model jednoparametrowy (ten z najwyższą wartością logarytmu wiarygodności). Następnie dodajemy do modelu drugi parametr tylko jeśli największa różnica (tj. ta z najlepszego modelu 2-parametrowego) przewyższa wartość 1.92 = 3.84/2 (3.84 jest wartością krytyczną dla 5% poziomu istotności). Jeśli zatem robimy kolejne kroczki o jeden parametr, tylko jeśli model się poprawia o Jeśli w pierwszym kroku pozostaliśmy w jednoparametrowym modelu, to możemy przejść do trzyparametrowego, tylko jeśli poprawa wynosi co najmniej 3. I tak, dla skoku o 3 paramtery 8
9 mamy wymagany wzrost o 3.91, dla itp. W tym postępowaniu możemy zauważyć, że jeśli podwoimy próbkę, tzn. będziemy mieli dwa razy więcej obserwacji, podwaja się także logarytm wiarygodności i wzrasta szansa, że wybierzemy bardziej złożony model, co jest sprzeczne z naszą zasadą oszczędności. Z drugiej strony, może faktycznie dla dużych próbek mamy prawo rozważać bardziej złożone modele? Metodą która próbuje pogodzić te dwa punkty widzenia jest kryterium Schwarza-Bayesa, które radzi, by przy porównywaniu modeli odjąć od każdego loglikelihooda wartość (r/2) ln n, gdzie r jest ilością parametrów, a n- wielkością próbki. Zatem aby dodanie kolejnego parametru było uzasadnione, loglikelihood powinien nam wzrosnąć o co najmniej 0.5 ln n. 9
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Bardziej szczegółowoWeryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Bardziej szczegółowoStatystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Bardziej szczegółowoKorzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD
Bardziej szczegółowoWnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Bardziej szczegółowoRozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
Bardziej szczegółowo166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Bardziej szczegółowoWprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Bardziej szczegółowoWnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Bardziej szczegółowoStatystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Bardziej szczegółowoZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.
Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej
Bardziej szczegółowoKolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
Bardziej szczegółowoStatystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
Bardziej szczegółowoStatystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Bardziej szczegółowoTestowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Bardziej szczegółowoZastosowanie Excela w matematyce
Zastosowanie Excela w matematyce Komputer w dzisiejszych czasach zajmuje bardzo znamienne miejsce. Trudno sobie wyobrazić jakąkolwiek firmę czy instytucję działającą bez tego urządzenia. W szkołach pierwsze
Bardziej szczegółowoW4 Eksperyment niezawodnościowy
W4 Eksperyment niezawodnościowy Henryk Maciejewski Jacek Jarnicki Jarosław Sugier www.zsk.iiar.pwr.edu.pl Badania niezawodnościowe i analiza statystyczna wyników 1. Co to są badania niezawodnościowe i
Bardziej szczegółowoW rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe
Bardziej szczegółowoStatystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
Bardziej szczegółowoZałożenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW
Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa
Bardziej szczegółowoStatystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Bardziej szczegółowoWydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Bardziej szczegółowoTestowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Bardziej szczegółowoSIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Bardziej szczegółowoHISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =
HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki
Bardziej szczegółowoWykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego
Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Przykład Cena metra kwadratowego (w tys. zł) z dla 14 losowo wybranych mieszkań w
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoPOLITECHNIKA WARSZAWSKA
POLITECHNIKA WARSZAWSKA WYDZIAŁ BUDOWNICTWA, MECHANIKI I PETROCHEMII INSTYTUT INŻYNIERII MECHANICZNEJ STATYSTYCZNA KONTROLA PROCESU (SPC) Ocena i weryfikacja statystyczna założeń przyjętych przy sporządzaniu
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
Bardziej szczegółowoTestowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Bardziej szczegółowoAKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA
AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej KATEDRA MATEMATYKI TEMAT PRACY: ROZKŁAD NORMALNY ROZKŁAD GAUSSA AUTOR: BARBARA MARDOSZ Kraków, styczeń 2008 Spis treści 1 Wprowadzenie 2 2 Definicja
Bardziej szczegółowoRachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Bardziej szczegółowoGdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Bardziej szczegółowoWłasności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Bardziej szczegółowoWykład 7 Testowanie zgodności z rozkładem normalnym
Wykład 7 Testowanie zgodności z rozkładem normalnym Wrocław, 05 kwietnia 2017 Rozkład normalny Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie normalnym określonym przez dystrybuantę
Bardziej szczegółowoStatystyka opisowa- cd.
12.03.2017 Wydział Inżynierii Produkcji I Logistyki Statystyka opisowa- cd. Wykład 4 Dr inż. Adam Deptuła HISTOGRAM UNORMOWANY Pole słupka = wysokość słupka x długość przedziału Pole słupka = n i n h h,
Bardziej szczegółowoTestowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Bardziej szczegółowoANALIZA STATYSTYCZNA WYNIKÓW BADAŃ
ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2
Bardziej szczegółowoHipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.
Hipotezy proste Zadanie 1. Niech X ma funkcję gęstości f a (x) = (1 + a)x a, dla 0 < x < 1, Testujemy H 0 : a = 1 przeciwko H 1 : a = 2. Dysponujemy pojedynczą obserwacją X. Wyznaczyć obszar krytyczny
Bardziej szczegółowo1 Estymacja przedziałowa
1 Estymacja przedziałowa 1. PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanym parametrze µ i znanym σ. Przedział ufności: [ ( µ x u 1 α ) ( σn ; x + u 1 α
Bardziej szczegółowoTablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Bardziej szczegółowoZadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Bardziej szczegółowoMATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści
Bardziej szczegółowoWykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Bardziej szczegółowoTESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Bardziej szczegółowoTemat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Bardziej szczegółowoWykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne
Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład
Bardziej szczegółowoTESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne.
Bardziej szczegółowoTESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Bardziej szczegółowoZ Wikipedii, wolnej encyklopedii.
Rozkład normalny Rozkład normalny jest niezwykle ważnym rozkładem prawdopodobieństwa w wielu dziedzinach. Nazywa się go także rozkładem Gaussa, w szczególności w fizyce i inżynierii. W zasadzie jest to
Bardziej szczegółowoIdea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Bardziej szczegółowoPorównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
Bardziej szczegółowoSpis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Bardziej szczegółowoTESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Bardziej szczegółowoStatystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
Bardziej szczegółowoTestowanie hipotez. 1 Testowanie hipotez na temat średniej
Testowanie hipotez Poziom p Poziom p jest to najmniejszy poziom istotności α, przy którym możemy odrzucić hipotezę zerową dysponując otrzymaną wartością statystyki testowej. 1 Testowanie hipotez na temat
Bardziej szczegółowo6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego
6. Zmienne losowe typu ciagłego (2.04.2007) Pole trapezu krzywoliniowego Przypomnienie: figurę ograniczoną przez: wykres funkcji y = f(x), gdzie f jest funkcją ciągłą; proste x = a, x = b, a < b, oś OX
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE
Bardziej szczegółowoOBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp
tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE
Bardziej szczegółowoparametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
Bardziej szczegółowoMatematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Bardziej szczegółowoW2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Bardziej szczegółowoZawartość. Zawartość
Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami
Bardziej szczegółowoSposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
Bardziej szczegółowoTestowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Bardziej szczegółowoLABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Bardziej szczegółowoPODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH
Opracowała: Joanna Kisielińska 1 PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH Rozkład normalny Zmienna losowa X ma rozkład normalny z parametrami µ i σ (średnia i odchylenie standardowe), jeśli jej
Bardziej szczegółowoKORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Bardziej szczegółowoJeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.
Wykład 4 Rozkłady i ich dystrybuanty Dwa typy zmiennych losowych Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x, x 2,...}, to mówimy, że jest to zmienna dyskretna.
Bardziej szczegółowoEkonometria. Zajęcia
Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)
Bardziej szczegółowoTESTOWANIE HIPOTEZ STATYSTYCZNYCH
TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na
Bardziej szczegółowoTemat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Bardziej szczegółowoStatystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Bardziej szczegółowoTestowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
Bardziej szczegółowoRozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.
Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. D A R I U S Z P I W C Z Y Ń S K I 2 2 ROZKŁAD ZMIENNEJ LOSOWEJ Polega na przyporządkowaniu
Bardziej szczegółowoStatystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą
Bardziej szczegółowoPrawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoLABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Bardziej szczegółowoWykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Bardziej szczegółowoTestowanie hipotez statystycznych etc
Testowanie hipotez statystycznych etc Definicje Testy średniej Test Pearsona Test Kołmogorowa-Smirnowa Test znaków Teoria testów Analiza wariancji Krzywe regresji Definicje Parametryczny (test, hipoteza,
Bardziej szczegółowoStatystyka matematyczna
Statystyka matematyczna Wykład 6 Magdalena Alama-Bućko 8 kwietnia 019 Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 1 / 1 Rozkłady ciagłe Magdalena Alama-Bućko Statystyka matematyczna 8
Bardziej szczegółowoStatystyka matematyczna. Wykład VI. Zesty zgodności
Statystyka matematyczna. Wykład VI. e-mail:e.kozlovski@pollub.pl Spis treści 1 Testy zgodności 2 Test Shapiro-Wilka Test Kołmogorowa - Smirnowa Test Lillieforsa Test Jarque-Bera Testy zgodności Niech x
Bardziej szczegółowoStatystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Bardziej szczegółowoBadanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
Bardziej szczegółowoVI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Bardziej szczegółowoweryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Bardziej szczegółowoStatystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Bardziej szczegółowoRozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Bardziej szczegółowoNajprostsze z zadań z prawdopodobieństwa robi się korzystając z dystrybuanty. Zacznijmy od tego - tu mamy rozkład (wyniki pomiarów):
Najprostsze z zadań z prawdopodobieństwa robi się korzystając z dystrybuanty. Zacznijmy od tego - tu mamy rozkład (wyniki pomiarów): Ok. Średnia to środek zbioru. Zazwyczaj mamy podane także odchylenie
Bardziej szczegółowoPDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Bardziej szczegółowoLiteratura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.
Literatura Krysicki W., Bartos J., Dyczka W., Królikowska K, Wasilewski M., Rachunek Prawdopodobieństwa i Statystyka Matematyczna w Zadaniach, cz. I. Leitner R., Zacharski J., Zarys matematyki wyŝszej
Bardziej szczegółowoWykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Bardziej szczegółowoSpis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych
1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja
Bardziej szczegółowoAnalizy wariancji ANOVA (analysis of variance)
ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza
Bardziej szczegółowo