Analiza zależności zmiennych jakościowych. Testy chi - kwadrat.
|
|
- Lidia Baran
- 8 lat temu
- Przeglądów:
Transkrypt
1 Analiza zależności zmiennych jakościowych. Testy chi - kwadrat. JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu 1. Analiza danych jakościowych Zmienne jakościowe (nominalne i inne ) Tablice wielodzielcze. Analiza tablic wielodzielczych zależność zmiennych 3. Test zgodności chi - kwadrat Prosta hipoteza o zgodności rozkładów Statystyka chi - kwadrat, 4. Test niezależności dwóch zmiennych Analiza tablic wielodzielczych z wykorzystaniem testu chi-kwadrat Poprawki w testach 5. Jak to się liczy w różnych programach? 6. Miary siły związku
2 Analiza danych jakościowych Dotychczas omawiano zmienne ilościowe i procedury służące do ich statystycznych analizy. W praktyce często stosujemy także zmienne jakościowe! Przykłady: Płeć, status małżeński, zawód, kolor, marka towarowa, rodzaj lub profil firmy, upodobanie do marki handlowej, gatunku towarów, partii politycznej, umowna skala natężenia choroby, Często występują w analizie danych pochodzących z różnych ankiet czy badania opinii ludzi,, lecz także inne zastosowania. Dotychczas w zakresie tego przedmiotu: Wykłady 1 i właściwe metody statystyki opisowej. Potrzeba metod wnioskowania statystycznego dla takich danych! Typy danych jakościowych Skale pomiarowe nominalne i porządkowe. Rzeczywiste zmienne jakościowe: Dane (zmienne) nominalne, Zmienne o wartościach uporządkowanych. Uwaga! Zapis liczbowy tych zmiennych kodowanie! Ponadto, zmienne ilościowe mogą być zdyskretyzowane! np. wielkość miasta (wg. liczby mieszkańców), wielkość dochodów, Ogólnie mówimy o zmiennych skategoryzowanych! Dalsze rozważania zmienne nominalne.
3 Analiza pary zmiennych jakościowych Ocena zależności między zmiennymi jakościowymi: Przedstawienie danych jednostkowych w postaci tablicy wielodzielczej. Inne nazwy tablica kontyngencji (ang.); dla pary zmiennych tablica dwudzielcza. Założenia: Zmienna X ma k kategorii kodowanych jako x 1, x, K, x k Zmienna Y ma l kategorii kodowanych jako y 1, y, K, y l Próba liczy n par (x,y) n ij jest liczbą wystąpienia w próbie par obserwacji ( x i, y j ) k l i= 1 j = 1 n ij = n Tablica wielodzielcza Macierz o k wierszach i l kolumnach z elementami na przecięciu i-tego wiersza i j-tej kolumny, i = 1,,, k oraz j = 1,,, l. n ij x1 x xi xk y1 n11 n1 ni1 nk1 y n1 n1 ni nk yj n1j nj nij nkj yl n1l nl nil nkl W analizie zależności często oblicza się rozkłady brzegowe.
4 Tablice wielodzielcze przykłady Dane ankietowe nt. oceny wpływu używek (papieros, kawa, alkohol) oraz płeć na pewną chorobę,, 90 osób. Lp Kawa Nigdy Niewiele Dużo Średnio Płeć Nigdy Kobieta Mężczyzna Średnio Dużo Suma Niewiele Średnio Papierosy Alkohol Dużo Nigdy Dużo Papieros Niewiele Nigdy Nigdy 11 Niewiele Nigdy Średnio Papieros Niewiele Niewiele Niewiele 8 Dużo 4 Średnio 4 Nigdy 15 Dużo 1 Nigdy Niewiele Średnio Nigdy Płeć M K K Papieros M Średnio K 6 8 M M 34 K K Papieros Dużo Suma Jak tworzyć tablice automatycznie Czy mamy wsparcie ze strony oprogramowania?
5 Statistica dobrze wspiera! ( Mini-tab -> wspiera Minitab inne popularne oprogramowanie, przykłady jego użycia znajdziesz np. w książce A.Aczel Statystyka w zarządzaniu. Więcej (+ trial) na stronie
6 Ale co w Excel-u? Poczekaj i sprawdź na laboratorium! Analiza współzależności zmiennych w tablicach Przykładowa tablica zestawiająca osoby wg. wykształcenia i miejsca zamieszkania: Wykształcenie Podstawowe lub zawod. Średnie lub wyższe Miejsce zamieszkania Miasto Wieś Czy patrząc na zawartość tablicy możesz wyciągnąć pewne wnioski?
7 Inne przykłady tabel wielodzieczych A A A A B 49 B 3 7 B 1 48 B 6 4 Co możesz wywnioskować z analizy zawartości powyższych tabel? Narzędziem analizy rozkładów wartości jest test wykorzystujący statystykę o rozkładzie χ Schemat wykonywania testu chi-kwadrat Dotyczy badania zgodności obserwowanego rozkładu z rozkładem zadanym, a także niezależności zmiennych. Sformułuj przypuszczenie co do populacji przez określenie odpowiednich hipotez. Oblicz częstości występowania pewnych zdarzeń spodziewanych przy założeniu prawdziwości H0 tzw. liczności oczekiwane w różnych klasach (kategoriach). Zanotuj zaobserwowane liczności punktów pomiarowych w poszczególnych klasach. Zbadaj różnicę między wartościami obserwowanymi i oczekiwanymi wzór na statystykę χ Podejmij decyzję (poziom istotności, l. st. swobody).
8 Statystyka chi-kwadrat k ( Oi Ei ) i = 1 Ei gdzie Oi obserwowana liczność w klasie (kategorii) i. Ei hipotetyczna liczność w klasie (kategorii) i ; oczekiwana przy założeniu prawdziwości H0. Statystyka na rozkład χ z odpowiednia liczbą stopni swobody. Więcej informacji o rozkładzie χ w literaturze! Testy zgodności rozkładu Jest to procedura statystyczna pozwalająca na ustalenie czy dostępne dane potwierdzają założenie o określonym rozkładzie w populacji interesującej nas zmiennej. Innymi słowami: czy rozkład zmiennej jakościowej jest zgodny z pewnym rozkładem zadanym. Przykład prostego testu zgodności dla przypadku rozkładu wielomianowego -mamy k > kategorii / klas i prawdopodobieństwo, że punkt / obserwacja należy do i-tej kategorii jest równa pi.
9 Prosty test zgodności rozkładu Niech zmienna jakościowa X ma k możliwych wartości (kategorii) x 1, x, K, x k i niech prawdopodobieństwo wystąpienia wartości xi wynosi pi dla i = 1,,, k. Zakładamy, że wartości p i w populacji są nieznane. Ponadto niech będzie dany pewien ustalony rozkład prawdopodobieństwa { p, p, K, p }. Rozważamy problem testowania hipotezy o zgodności rozkładu p, p, K, p } z zadanym rozkładem{ p, p, K, p } Hipotezy: { 1 k 0 0 : p i pi H = 1 k dla i = 1,,, k H1: hipoteza zerowa jest fałszywa. 1 k Przykład preferencja co do koloru. Producent zegarków przed wprowadzeniem nowego modelu chce sprawdzić, czy ludzie mają specjalne preferencje co do koloru paska do zegarka, lub czy też wszystkie 4 rozpatrywane kolory są tak samo lubiane. Wybrano losowo próbę 80 osób planujących zakup zegarka; każdej z nich pokazano model zegarka z 4 wersjami kolorystycznymi i poproszono o wybór jednej. Piaskowy Brązowy Kasztanowy Czarny Suma H0: wszystkie kolory pasków do zegarka są jednakowo preferowane, tj. prawdopodobieństwa wyboru są p1 = p = p3 = p4 = 0,5 H1: nie wszystkie kolory są tak samo preferowane.
10 Przykład preferencji co do koloru Kilka pytań: Jak obliczyć liczności oczekiwane E i? Jaka jest wartość statystyki testowej χ? Jaka jest liczba stopni swobody dla obliczenia wartości krytycznych rozkładu χ? Oczekiwana liczność w i-tej klasie / kategorii: E = n i p i Liczba stopni swobody k -1 Założenia wykonywania testu chi - kwadrat Przy jakich założeniach rozkład statystyki testu jest dobrze przybliżony przez rozkład χ? Im większe n, tym przybliżenie jest lepsze. Ponadto oczekiwana liczność klas nie może być zbyt mała! Rozkład chi kwadrat można stosować, gdy oczekiwana liczność w każdej klasie jest równa przynajmniej 5. Co robić jeśli dla jednej lub kilku klas, oczekiwana liczba elementów jest < 5? Połączyć klasy tak aby otrzymać większą liczność. Więcej Aczel A. Statystyka w zarządzaniu, str. 751.
11 Określania liczby stopni swobody Powróćmy do przykładu kolorystycznego Suma Sumaryczna liczność pozwala nie znać jednej jakiejkolwiek liczności klasy; czyli redukuje liczbę stopni swobody o 1! Ogólna zasada (Aczel, str. 753): Jeśli wykorzystuje się dane do estymacji parametrów rozkładu prawdopodobieństwa określonego przez hipotezę zerową, to dla każdego parametru estymowanego na podstawie tych danych traci się dodatkowy stopień swobody. Zadanie domowe genetyczne! Zajrzyj do książki Koronacki, Mielniczuk: Statystyka, str. 367 przykład 6.3. Przykład dotyczy analizy doświadczeń Gregora Mendla z dziedziny genetyki na przykładzie grochu o określonym genotypie. Test zgodności można wykorzystać do sprawdzenia, czy rzeczywiste wyniki doświadczenia z grochem (potomkowie grochu zielonego o genotypie aa) potwierdziły tezę Mendla o dziedziczeniu! Nie czekaj, sprawdź w książce o co chodzi! Ponadto, rozdziały zawierają opisy innych bardziej złożonych testów.
12 Gdzie jesteśmy w trakcie wykładu? 1. Analiza danych jakościowych Zmienne jakościowe (nominalne i inne ) Tablice wielodzielcze. Analiza tablic wielodzielczych zależność zmiennych 3. Test zgodności chi - kwadrat Prosta hipoteza o zgodności rozkładów Statystyka chi - kwadrat, 4. Test niezależności dwóch zmiennych Analiza tablic wielodzielczych z wykorzystaniem testu chi-kwadrat Poprawki w testach 5. Jak to się liczy w różnych programach? 6. Miary siły związku Analiza dwóch zmiennych losowych testowanie niezależności Założenia Rozważamy populację opisaną przez parę jakościowych zmiennych losowych. Dysponujemy n-elementową próbą, gdzie każda obserwacja musi należeć do jednej z kl możliwych kombinacji kategorii pierwszej i drugiej zmiennej. Otrzymane informacje prezentujemy w postaci tablicy dwudzielczej. Niech p(i,j) oznacza prawdopodobieństwo zaobserwowania w jednym doświadczeniu i-tej kategorii X oraz j-tej kategorii Y. Przykład: Zbadajmy czy choroba wieńcowa współwystępuje z podwyższonym ciśnieniem tętniczym dla grupy osób po 50tce (za Stanisz, str. 7). Choroba Nie Tak Suma Ciśnienie podwyższone Nie Tak Suma
13 Test niezależności chi-kwadrat Schemat postępowania (Karl Pearson 1900r) Hipotezy: H0: Zmienne X i Y są wzajemnie niezależne, H1: Zmienne X i Y są zależne. Statystyka testowa ( O E) k l ( Oij Eij ) χ = = i= 1 j = 1 E E gdzie E oczekiwana i O obserwowana liczności komórki Przy założeniu hipotezy zerowej statystka ma asymptotyczny rozkład χ o df = (k - 1) (l - 1) stopniach swobody. Dla założonego poziomu istotności α podjęcie decyzji. ij Jak obliczać wartość oczekiwaną? Liczności oczekiwana obliczamy wykorzystując rozkłady brzegowe Skąd się to wzięło? Zasada niezależności prawdopodobieństwa więc ( suma rzędu) (suma kolumny) E = (suma) P( i j) = P( i) P( j) Eij = n p( i) p( j) = n ( Ri / n) ( C j / n) = Ri C j / n
14 Policzmy przykład Wartości obserwowane Choroba Nie Tak Suma Ciśnienie podwyższone Nie Tak Suma Wartości oczekiwane? Poziom istotności α = 0,001 Przykład (ciśnieniowo-sercowy) Wartości oczekiwane: E11 = = 4,3 E1 = = 9, 7 E1 = = 0, 7 E = = 5, Choroba Nie Tak Suma Ciśnienie podwyższone Nie Tak 4,3 9,7 0,7 5, Suma ( O E) χ = E (37 4,3) = 4,3 (17 9,7) + 9,7 (8 0,7) + 0,7 χ( α, df ) = 10,83 χ oblicz > χ kryt (38 5,3) + 5,3 = 6,54
15 Zadania trzeba nabyć wprawy! A teraz trochę popiszemy i policzymy! Jak obliczać automatycznie test chi kwadrat? Czy mamy wsparcie ze strony oprogramowania?
16 Statsoft : opcja Tablice Wielodzielcze - Chi-kwadrat Minitab opcja Stat:Tables:Chi-squaretest
17 Excel co zrobić? No i nie jest łatwo! Ale przypomnij sobie o tablicach przestawnych; Pierwsze laboratoria! Wybór testów niezależności w Statistica Co to za wersje testów?
18 Poprawki w teście dla tabel Dla tablic typu a c b d Można stosować prostszy wzór ( ad bc) n χ = ( a + b)( c + d)( a + c)( b + d) Poprawka Yatesa (gdy n < 40 i którakolwiek z liczności oczekiwanych < 5) ( ad bc n / ) n χ = ( a + b)( c + d)( a + c)( b + d) Kilka uwag o innych wersjach testu chi-kwadrat χ największej wiarygodności (taki sam jak test Pearsona, lecz innych sposób obliczeń oparty na teorii największej wiarygodności (Wyniki obu testów są zbliżone). Tabele o rozmiarach χ z poprawką Yatesa (liczności oczekiwane małe). Dokładny test Fishera stosowany gdy całkowita liczność obserwacji jest mała lub jeśli małe są liczności oczekiwane). Powiązanym pojęciem jest test McNemary (gdy liczności reprezentują zmienne zależne). Więcej w książkach!
19 Miary siły związku Sama wartość statystyki χ pozwala na sprawdzenie tylko czy występuje współzależność! Nie pozwala na pomiar siły tego związku, bo :) Potrzebne są inne miary siły związku! Pożądana normalizacja wartości! Przykłady miar Współczynnik Φ -Yula Φ = χ n Miara siły związku w tabeli ; wartość znormalizowana od 0 (brak związku) do 1 (całkowite powiązanie). Miary siły związku cd. Współczynnik V Creamera: V = χ n min( k 1; l 1) gdzie k i l są wymiarami tablicy wielodzielcznej. Wartości znormalizowane od 0 (brak związku) do 1. Współczynnik kontyngencji Pearsona: χ C = n + χ gdy zmienne niezależne C = 0, lecz max(c) < 1 i zależy od liczby wierszy i kolumn.
20 Miary siły związku - podsumowanie Interpretacja wartości współczynników: jeśli wartość współczynnika jest równa zero, to cechy X i Y są niezależne, im wartość bliższa jedynki, tym silniejsze jest powiązanie między X i Y. Zastosowania: porównywanie między sobą siły zależności różnych par zmiennych, Możliwości redukcji liczby atrybutów w tablicach danych. Systemy odkrywania wiedzy i eksploracji danych (ang. Knowledge Discovery in Databases) 49ner Jan Żytkow Miary siły związku - Przykład (sercowy): Badanie czy choroba wieńcowa jest współzależna z podwyższonym ciśnieniem tętniczym wg. testu TAK! Choroba Nie Tak Suma Ciśnienie podwyższone Nie Tak Suma Miary siły związku: Φ = V = 0,51 C = 0,46
21 Statistica przykład obliczania miary siły związku para zmiennych Papierosy Skala choroby Miary siły związku Statistica przykład obliczania miary siły związku para zmiennych Praca Skala choroby
22 Dyskusja nt. stosowalności testu chi-kwadrat Uwagi o poprawkach testów minimalne liczności (całkowite i oczekiwane). Pamiętaj, że test chi-kwadrat jest skonstruowany dla zmiennych nominalnych! Zmienne porządkowe i liczbowe (dyskretyzowane) nie wykorzystuje się informacji o porządku wartości; Zalecana ostrożność i wnikliwość analizy (patrz dalej). Inne trudności: Dobór właściwego poziomu istotności (zwłaszcza dla danych o dużych rozmiarach); zbyt wysokie wartości mogą prowadzić do identyfikacji losowych efektów, zbyt rygorystyczne prowadzą do pominięcia niektórych regularności zwłaszcza krytyczne w zdaniach eksploracji danych data mining. tzw. paradoks Simpsona / błąd pominięcia ukrytej zmiennej (zaraz będzie przykład) Wątpliwości w analizie danych porządkowych Złośliwy przykład analizy dwóch zmiennych, których wartości są uporządkowane odpowiednio jako 1,, 3, 4 oraz A, B, C, D. A B C D Test chi daje p-wartość 0,, więc nie można odrzucić hipotezy o niezależności. Lecz przyjrzyjmy się dokładniej układowi liczności w tabeli, np. (4,A) i (1,D),, Czy istnieje monotoniczna regularność małe z małymi, duże z dużymi? Poszukaj innych metod do uwzględnienia porządku
23 Uwagi o paradoksie Simpsona Paradoks Simpsona: pominięcie w analizie zmiennej uwikłanej może zmienić nawet diametralnie otrzymane związki między dwiema innymi zmiennymi jakościowymi. Inne sformułowanie: Koronacki, Mielniczuk, Statystyka, str. 39. There is a positive dependence between attributes A and B in two complementary sets of data C and C, but the dependence becomes negative or vanishes, when we add all data together Jan Żytkow, Automation of discovery in databases: combining AI, statistics and theory of knowledge. Przykład paradoks Simpsona Pewien Wydział Informatyki i Elektroniki rekrutuje studentów na oba kierunki (przed egzaminem kandydat podaje na jaki kierunek zdaje); Oto wyniki egzaminu. Osoby odrzucone Osoby przyjęte Kobiety Mężczyźni Zauważmy, że procent przyjętych mężczyzn jest wyższy od procentu przyjętych kobiet: przyjęto 100(9/03) = 45% kandydatów mężczyzn oraz tylko 100(56/158) = 35% kandydatek.
24 Tablica wyników egzaminu test chi-kwadrat Czy można podejrzewać Wydział o dyskryminację kobiet? Przykład paradoks Simpsona więcej szczegółów W analizie nie uwzględniliśmy trzeciej zmiennej kierunku studiów. Jej uwzględnienie dwie tablice dwudzielcze: Osoby odrzucone Osoby przyjęte Elektronika Kobiety 11 1 Mężczyźni Osoby odrzucone Osoby przyjęte Informatyka Kobiety Mężczyźni Przeanalizujmy procent przyjętych mężczyzn i kobiet: Na elektronikę przyjęto 5% kandydatek oraz 51% kandydatów. Na informatykę przyjęto 3% kandydatek i 3% kandydatów.
25 Przykład cd. testy chi-kwadrat. Elekronika Informatyka Podsumowanie Paradoksu Simpsona Związek między dwiema zmiennymi, ujawniany dla każdej kategorii trzeciej zmiennej oddzielnie, może zostać diametralnie zmieniony przez zagregowanie danych, polegające na zsumowaniu wyników dla różnych kategorii trzeciej zmiennej. Przykład egzaminów Fałszywe wrażenie dyskryminacji kobiet, gdyż nie dostrzeżono faktu znacznie trudniejszego wstępu na kierunek informatyka, przy jednoczenie większej popularności tego kierunku wśród kobiet.
26 Podsumujmy Reszta ciekawych dyskusji i przykładów w zalecanych książkach. Naa..aaprawde warto zajrzeć! Studiowanie to także (i przede wszystkim) samodzielne poszukiwania! Literatura Statystyka dla studentów kierunków technicznych i przyrodniczych, Koronacki Jacek, Mielniczuk Jan, WNT, 001. Statystyka w zarządzaniu, A.Aczel, PWN, 000. Po prostu statystyka, Frances Clegg, WSiP, Przystępny kurs statystyki, Stanisz A., I wiele innych W przykładach wykorzystano także oprogramowanie: Statistica 5.0 ( Statsoft Inc.), Minitab rel. 14 ( Minitab Inc.), Microsoft Excel ( Microsoft).
27 Czego się dowiedzieliśmy podczas tego wykładu? 1. Analiza danych jakościowych Zmienne jakościowe (nominalne i inne ) Tablice wielodzielcze. Analiza tablic wielodzielczych zależność zmiennych 3. Test zgodności chi - kwadrat Prosta hipoteza o zgodności rozkładów Statystyka chi - kwadrat, 4. Test niezależności dwóch zmiennych Analiza tablic wielodzielczych z wykorzystaniem testu chikwadrat Poprawki w testach 5. Jak to się liczy w różnych programach? 6. Miary siły związku 7. Dyskusja problemów w stosowaniu testów chi-kwadrat Dziękuję za uwagę Czytaj także podręczniki oraz sam eksperymentuj z danymi!
Analiza zależności zmiennych jakościowych. Testy χ -kwadrat.
Analiza zależności zmiennych jakościowych. Testy χ -kwadrat. JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu 1. Analiza danych jakościowych Zmienne jakościowe (nominalne i inne
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
dr hab. Dariusz Piwczyński, prof. nadzw. UTP
dr hab. Dariusz Piwczyński, prof. nadzw. UTP Cechy jakościowe są to cechy, których jednoznaczne i oczywiste scharakteryzowanie za pomocą liczb jest niemożliwe lub bardzo utrudnione. nominalna porządek
Weryfikacja hipotez statystycznych testy t Studenta
Weryfikacja hipotez statystycznych testy t Studenta JERZY STEFANOWSKI Marek Kubiak Instytut Informatyki Politechnika Poznańska Standardowy schemat postępowania (znane σ) Założenia: X ma rozkład normalny
Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości
Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości Informatyka 007 009 aktualizacja dla 00 JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu. Przypomnienie testu dla
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Wykład 11 Testowanie jednorodności
Wykład 11 Testowanie jednorodności Wrocław, 17 maja 2018 Test χ 2 jednorodności Niech X i, i = 1, 2,..., k będą niezależnymi zmiennymi losowymi typu dyskretnego przyjmującymi wartości z 1, z 2,..., z l,
Wykład 8 Dane kategoryczne
Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych
Testy post-hoc. Wrocław, 6 czerwca 2016
Testy post-hoc Wrocław, 6 czerwca 2016 Testy post-hoc 1 metoda LSD 2 metoda Duncana 3 metoda Dunneta 4 metoda kontrastów 5 matoda Newman-Keuls 6 metoda Tukeya Metoda LSD Metoda Least Significant Difference
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Badanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA
Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Wykład 9 Testy rangowe w problemie dwóch prób
Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Przykład 1. (A. Łomnicki)
Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele
Wykład 10 Testy jednorodności rozkładów
Wykład 10 Testy jednorodności rozkładów Wrocław, 16 maja 2018 Test Znaków test jednorodności rozkładów nieparametryczny odpowiednik testu t-studenta dla prób zależnych brak normalności rozkładów Test Znaków
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Korelacja krzywoliniowa i współzależność cech niemierzalnych
Korelacja krzywoliniowa i współzależność cech niemierzalnych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)
Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Wykład 12: Tablice wielodzielcze
Wykład 12: Tablice wielodzielcze Drosophila melanogaster Krzyżówka wsteczna (CcNn i ccnn) Kolor oczu czerwone fioletowe Rozmiar skrzydła normalne 39 11 mniejsze 18 32 Zródło:http://pl.wikipedia.org/wiki/Plik:Drosophila_melanogaster1.jpg
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana
GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma
Badanie zależności pomiędzy zmiennymi
Badanie zależności pomiędzy zmiennymi Czy istnieje związek, a jeśli tak, to jak silny jest pomiędzy np. wykształceniem personelu a jakością świadczonych usług? Ogólnie szukamy miary zależności (współzależności),
Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r
Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi
Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi Zadanie 1 Zdaniem wielu komentatorów, kobiety częściej niż mężczyźni głosują na partię rządzącą. Wyniki badań przedstawia
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1
Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zaleŝy
Testy nieparametryczne
Testy nieparametryczne 1 Wybrane testy nieparametryczne 1. Test chi-kwadrat zgodności z rozkładem oczekiwanym 2. Test chi-kwadrat niezależności dwóch zmiennych kategoryzujących 3. Test U Manna-Whitney
Wykład 11: Dane jakościowe. Rozkład χ 2. Test zgodności chi-kwadrat
Wykład 11: Dane jakościowe Obserwacje klasyfikujemy do klas Zliczamy liczbę obserwacji w każdej klasie Jeżeli są tylko dwie klasy, to jedną z nich możemy nazwać sukcesem, a drugą porażką. Generalnie, liczba
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):
Rozkłady dwuwymiarowe Rozkłady brzegowe Rozkłady warunkowe Niezależność Kowariancja Współczynnik korelacji (Przykłady na tablicy) Tablice dwudzielcze Najprostsze tablice 2x2 : dwa rzędy i dwie kolumny
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji
gkrol@mail.wz.uw.edu.pl #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji 1 Ryzyko błędu - powtórzenie Statystyka niczego nie dowodzi, czyni tylko wszystko mniej lub bardziej prawdopodobnym
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Badanie zależności zmiennych kolumnowej i wierszowej:
Wykład : Tablice wielodzielcze Zródło:http://pl.wikipedia.org/wiki/Plik:Drosophila_melanogaster.jpg Drosophila melanogaster Krzyżówka wsteczna (CcNn i ccnn) Kolor oczu czerwone fioletowe Rozmiar skrzydła
Testy dla dwóch prób w rodzinie rozkładów normalnych
Testy dla dwóch prób w rodzinie rozkładów normalnych dr Mariusz Grządziel Wykład 12; 18 maja 2009 Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego)
Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych
Wykład 12 (21.05.07): Testy dla dwóch prób w rodzinie rozkładów normalnych Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego) n 1 = 9 poletek w dąbrowie,
Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona
Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności
Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11
Testy zgodności Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 27. Nieparametryczne testy zgodności Weryfikacja
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
Wykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
TABELE WIELODZIELCZE
TABELE WIELODZIELCZE W wielu badaniach gromadzimy dane będące liczebnościami. Przykładowo możemy klasyfikować chore zwierzęta w badanej próbie do różnych kategorii pod względem wieku, płci czy skali natężenia
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -
Statystyczna analiza danych
Statystyczna analiza danych Testowanie hipotez statystycznych Ewa Szczurek szczurek@mimuw.edu.pl Instytut Informatyki Uniwersytet Warszawski 1/23 Testowanie hipotez średniej w R Test istotności dla wartości
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Weryfikacja hipotez statystycznych - testy dla wartości średniej cz. 2
Weryfikacja hipotez statystycznych - testy dla wartości średniej cz. 2 JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Studia niestacjonarne Informatyka 2016/17 Plan wykładu 1. Test t-studeta
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR
NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR M Zalewska Zakład Profilaktyki ZagrożeńŚrodowiskowych i Alergologii Analiza niezależności zmiennych jakościowych (test niezależności Chi-kwadrat)
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Drzewa Decyzyjne, cz.2
Drzewa Decyzyjne, cz.2 Inteligentne Systemy Decyzyjne Katedra Systemów Multimedialnych WETI, PG Opracowanie: dr inŝ. Piotr Szczuko Podsumowanie poprzedniego wykładu Cel: przewidywanie wyniku (określania
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Test t-studenta dla jednej średniej
Test t-studenta dla jednej średniej Hipoteza zerowa: Średnia wartość zmiennej w populacji jest równa określonej wartości a 0 (a = a 0 ). Hipoteza alternatywna 1.: Średnia wartość zmiennej w populacji jest
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE
Prawdopodobieństwo i statystyka
Wykład XI: Testowanie hipotez statystycznych 12 stycznia 2015 Przykład Motywacja X 1, X 2,..., X N N (µ, σ 2 ), Y 1, Y 2,..., Y M N (ν, δ 2 ). Chcemy sprawdzić, czy µ = ν i σ 2 = δ 2, czyli że w obu populacjach
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne.
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,
Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36
Statystyka Wykład 7 Magdalena Alama-Bućko 3 kwietnia 2017 Magdalena Alama-Bućko Statystyka 3 kwietnia 2017 1 / 36 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Ekonometria. Zajęcia
Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)
Statystyka w analizie i planowaniu eksperymentu
4 kwietnia 2012 Testy nieparametryczne Dotychczas zajmowaliśmy si e praktycznym zastosowaniem testów istotności nasze zadanie sprowadza lo si e do testowania hipotez o parametrach rozk ladu. Teraz b edziemy
TESTOWANIE HIPOTEZ STATYSTYCZNYCH
TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38
Statystyka Wykład 8 Magdalena Alama-Bućko 23 kwietnia 2017 Magdalena Alama-Bućko Statystyka 23 kwietnia 2017 1 / 38 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO
Zakład Metrologii i Systemów Pomiarowych P o l i t e c h n i k a P o z n ańska ul. Jana Pawła II 24 60-965 POZNAŃ (budynek Centrum Mechatroniki, Biomechaniki i Nanoinżynierii) www.zmisp.mt.put.poznan.pl
Elementarne metody statystyczne 9
Elementarne metody statystyczne 9 Wybrane testy nieparametryczne - ciąg dalszy Test McNemary W teście takim dysponujemy próbami losowymi z dwóch populacji zależnych pewnej cechy X. Wyniki poszczególnych
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407
Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde badanie naukowe rozpoczyna
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich
Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich Magdalena Frąszczak Wrocław, 22.03.2017r Problem Behrensa Fishera Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu normalnego
Rozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy
Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2017/2018 STATYSTYKA
KARTA KURSU. Kod Punktacja ECTS* 1
KARTA KURSU Nazwa Nazwa w j. ang. Wprowadzenie do statystyki Introduction to statistics Kod Punktacja ECTS* 1 Koordynator Prof. dr hab. Jerzy Wołek Zespół dydaktyczny Prof. dr hab. Jerzy Wołek doktoranci
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza