Analiza zależności zmiennych jakościowych. Testy χ -kwadrat.
|
|
- Kamila Łukasik
- 6 lat temu
- Przeglądów:
Transkrypt
1 Analiza zależności zmiennych jakościowych. Testy χ -kwadrat. JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska
2 Plan wykładu 1. Analiza danych jakościowych Zmienne jakościowe (nominalne i inne ) Tablice wielodzielcze. Analiza tablic wielodzielczych zależność zmiennych 3. Test zgodności chi kwadrat Prosta hipoteza o zgodności rozkładów Statystyka chi - kwadrat, 4. Test niezależności dwóch zmiennych Analiza tablic wielodzielczych z wykorzystaniem testu chi-kwadrat Poprawki w testach 5. Jak to się liczy w różnych programach? 6. Miary siły związku
3 Analiza danych jakościowych Dotychczas omawiano zmienne ilościowe i procedury służące do ich statystycznych analizy. W praktyce często stosujemy także zmienne jakościowe! Przykłady: Płeć, status małżeński, zawód, kolor, marka towarowa, rodzaj lub profil firmy, upodobanie do marki handlowej, gatunku towarów, partii politycznej, umowna skala natężenia choroby, Często występują w analizie danych pochodzących z różnych ankiet czy badania opinii ludzi,, lecz także inne zastosowania. Dotychczas w zakresie tego przedmiotu: Wykłady 1 i właściwe metody statystyki opisowej.
4 Zastosowania praktyczne Dane porządkowe i nominalne częste w badaniach ankietowych Często występujące także w ankietach internetowych
5 Typy danych jakościowych Skale pomiarowe nominalne i porządkowe. Rzeczywiste zmienne jakościowe: Dane (zmienne) nominalne, Zmienne o wartościach uporządkowanych. Uwaga! Zapis liczbowy tych zmiennych kodowanie! Ponadto, zmienne ilościowe mogą być zdyskretyzowane! np. wielkość miasta (wg. liczby mieszkańców), wielkość dochodów, Ogólnie mówimy o zmiennych skategoryzowanych! Dalsze rozważania zmienne nominalne.
6 Najprostsza analiza zestawienia tabelaryczne Frequency, cross tables, contingency tables
7 Analiza pary zmiennych jakościowych Ocena zależności między zmiennymi jakościowymi: Przedstawienie danych jednostkowych w postaci tablicy wielodzielczej. Inne nazwy tablica kontyngencji (ang.); dla pary zmiennych tablica dwudzielcza. Założenia: Zmienna X ma k kategorii kodowanych jako Zmienna Y ma l kategorii kodowanych jako Próba liczy n par (x,y) x, x,, 1 K y, y,, 1 K x k y l n ij jest liczbą wystąpienia w próbie par obserwacji ( x i, y j ) k l i= 1 j = 1 n ij = n
8 Tablica wielodzielcza Macierz o k wierszach i l kolumnach z elementami na przecięciu i-tego wiersza i j-tej kolumny, i = 1,,, k oraz j = 1,,, l. n ij y1 y yj yl x1 n11 n1 n1j n1l x n1 n1 nj nl xi ni1 ni nij nil xk nk1 nk nkj nkl W analizie zależności często oblicza się rozkłady brzegowe.
9 Tablice wielodzielcze przykłady Dane ankietowe nt. oceny wpływu używek (papieros, kawa, alkohol) oraz płeć na pewną chorobę,, 90 osób. Lp. Kawa Papierosy Alkohol Płeć 1 Nigdy Dużo Niewiele M Niewiele Nigdy Nigdy K 3 Dużo Dużo Papieros Średnio Papieros K Papieros Papieros Suma 4 Średnio Płeć Niewiele Nigdy Niewiele Niewiele M Średnio Dużo 5 Nigdy Nigdy Niewiele K Kobieta Mężczyzna Średnio Dużo 4 Średnio 4 8 M Dużo Suma Nigdy 15 Dużo 1 M Niewiele Nigdy Niewiele K 90 Średnio Średnio Nigdy K
10 Analiza współzależności zmiennych w tablicach Przykładowa tablica zestawiająca osoby wg. wykształcenia i miejsca zamieszkania: Wykształcenie Podstawowe lub zawod. Średnie lub wyższe Miejsce zamieszkania Miasto Wieś Czy patrząc na zawartość tablicy możesz wyciągnąć pewne wnioski?
11 Jak tworzyć tablice automatycznie Czy mamy wsparcie ze strony oprogramowania?
12 Statistica dobrze wspiera! (
13 Mini-tab -> wspiera Minitab inne popularne oprogramowanie, przykłady jego użycia znajdziesz np. w książce A.Aczel Statystyka w zarządzaniu. Więcej (+ trial) na stronie
14 Ale co w Excel-u? Poczekaj i sprawdź na laboratorium! Szukaj Tablice przestawne!
15 Inne przykłady tabel wielodzieczych A A B 49 B 1 48 A A B 3 7 B 6 4 Co możesz wywnioskować z analizy zawartości powyższych tabel? Narzędziem analizy rozkładów wartości jest test wykorzystujący statystykę o rozkładzie χ
16 Schemat wykonywania testu chi-kwadrat Dotyczy badania zgodności obserwowanego rozkładu z rozkładem zadanym, a także niezależności zmiennych. Sformułuj przypuszczenie co do populacji przez określenie odpowiednich hipotez. Oblicz częstości występowania pewnych zdarzeń spodziewanych przy założeniu prawdziwości H0 tzw. liczności oczekiwane w różnych klasach (kategoriach). Zanotuj zaobserwowane liczności punktów pomiarowych w poszczególnych klasach. Zbadaj różnicę między wartościami obserwowanymi i oczekiwanymi wzór na statystykę χ Podejmij decyzję (poziom istotności, l. st. swobody).
17 Statystyka chi-kwadrat gdzie k i = 1 ( O i E E Oi obserwowana liczność w klasie (kategorii) i. Ei hipotetyczna liczność w klasie (kategorii) i ; oczekiwana przy założeniu prawdziwości H0. Statystyka na rozkład χ z odpowiednia liczbą stopni swobody. Więcej informacji o rozkładzie χ w literaturze! i i )
18 Testy zgodności rozkładu Jest to procedura statystyczna pozwalająca na ustalenie czy dostępne dane potwierdzają założenie o określonym rozkładzie w populacji interesującej nas zmiennej. Innymi słowami: czy rozkład zmiennej jakościowej jest zgodny z pewnym rozkładem zadanym. Przykład prostego testu zgodności dla przypadku rozkładu wielomianowego -mamy k > kategorii / klas i prawdopodobieństwo, że punkt / obserwacja należy do i-tej kategorii jest równa pi.
19 Prosty test zgodności rozkładu Niech zmienna jakościowa X ma k możliwych wartości (kategorii) x 1, x, K, x k i niech prawdopodobieństwo wystąpienia wartości wynosi dla i = 1,,, k. Zakładamy, że wartości w populacji są nieznane. Ponadto niech będzie dany pewien ustalony rozkład prawdopodobieństwa { p, p, K, p }. Rozważamy problem testowania hipotezy o zgodności 0 0 rozkładu p, p, K, p } z zadanym rozkładem{ p, p, K, Hipotezy: { 1 k 0 0 : p i pi H = x i p i dla i = 1,,, k H1: hipoteza zerowa jest fałszywa. p 1 k i 0 1 pk }
20 Przykład preferencja co do koloru. Producent zegarków przed wprowadzeniem nowego modelu chce sprawdzić, czy ludzie mają specjalne preferencje co do koloru paska do zegarka, lub czy też wszystkie 4 rozpatrywane kolory są tak samo lubiane. Wybrano losowo próbę 80 osób planujących zakup zegarka; każdej z nich pokazano model zegarka z 4 wersjami kolorystycznymi i poproszono o wybór jednej. Piaskowy Brązowy Kasztanowy Czarny Suma H0: wszystkie kolory pasków do zegarka są jednakowo preferowane, tj. prawdopodobieństwa wyboru są p 1 = p = p3 = p4 = 0,5 H1: nie wszystkie kolory są tak samo preferowane.
21 Przykład preferencji co do koloru Kilka pytań: Jak obliczyć liczności oczekiwane Ei? Jaka jest wartość statystyki testowej χ? Jaka jest liczba stopni swobody dla obliczenia wartości χ krytycznych rozkładu? Oczekiwana liczność w i-tej klasie / kategorii: Ei = n pi Liczba stopni swobody k - 1
22 Przykład dalsze obliczenia. Piaskowy Brązowy Kasztanowy Czarny Suma Rozkład obserwowany Piaskowy Brązowy Kasztanowy Czarny Suma Rozkład oczekiwany χ ( O E) = E = (1 0) 0 + (40 0) 0 + (8 0) 0 + (0 0) 0 = 30,4 Zależy od poziomu istotności / np. dla α = 0.05 i df =1 wartość krytyczna = 3,841 H1: rozkłady nie są zgodne; Czyli nie wszystkie kolory są tak samo preferowane przez ankietowanych!
23 Założenia wykonywania testu chi - kwadrat Przy jakich założeniach rozkład statystyki testu jest dobrze przybliżony przez rozkład χ? Im większe n, tym przybliżenie jest lepsze. Ponadto oczekiwana liczność klas nie może być zbyt mała! Rozkład chi kwadrat można stosować, gdy oczekiwana liczność w każdej klasie jest równa przynajmniej 5. Co robić jeśli dla jednej lub kilku klas, oczekiwana liczba elementów jest < 5? Połączyć klasy tak aby otrzymać większą liczność. Więcej Aczel A. Statystyka w zarządzaniu, str. 751.
24 Określania liczby stopni swobody Powróćmy do przykładu kolorystycznego Suma Sumaryczna liczność pozwala nie znać jednej jakiejkolwiek liczności klasy; czyli redukuje liczbę stopni swobody o 1! Ogólna zasada (Aczel, str. 753): Jeśli wykorzystuje się dane do estymacji parametrów rozkładu prawdopodobieństwa określonego przez hipotezę zerową, to dla każdego parametru estymowanego na podstawie tych danych traci się dodatkowy stopień swobody.
25 Zadanie domowe genetyczne! Zajrzyj do książki Koronacki, Mielniczuk: Statystyka, str. 367 przykład 6.3. Przykład dotyczy analizy doświadczeń Gregora Mendla z dziedziny genetyki na przykładzie grochu o określonym genotypie. Test zgodności można wykorzystać do sprawdzenia, czy rzeczywiste wyniki doświadczenia z grochem (potomkowie grochu zielonego o genotypie aa) potwierdziły tezę Mendla o dziedziczeniu! Nie czekaj, sprawdź w książce o co chodzi! Ponadto, rozdziały zawierają opisy innych bardziej złożonych testów.
26 Gdzie jesteśmy w trakcie wykładu? 1. Analiza danych jakościowych Zmienne jakościowe (nominalne i inne ) Tablice wielodzielcze. Analiza tablic wielodzielczych zależność zmiennych 3. Test zgodności chi - kwadrat Prosta hipoteza o zgodności rozkładów Statystyka chi - kwadrat, 4. Test niezależności dwóch zmiennych Analiza tablic wielodzielczych z wykorzystaniem testu chi-kwadrat Poprawki w testach 5. Jak to się liczy w różnych programach? 6. Miary siły związku
27 Analiza dwóch zmiennych losowych testowanie niezależności Założenia Rozważamy populację opisaną przez parę jakościowych zmiennych losowych. Dysponujemy n-elementową próbą, gdzie każda obserwacja musi należeć do jednej z kl możliwych kombinacji kategorii pierwszej i drugiej zmiennej. Otrzymane informacje prezentujemy w postaci tablicy dwudzielczej. Niech p(i,j) oznacza prawdopodobieństwo zaobserwowania w jednym doświadczeniu i-tej kategorii X oraz j-tej kategorii Y. Przykład: Zbadajmy czy choroba wieńcowa współwystępuje z podwyższonym ciśnieniem tętniczym dla grupy osób po 50tce (za Stanisz, str. 7). Ciśnienie Choroba podwyższone Nie Tak Suma Nie Tak Suma
28 Test niezależności chi-kwadrat Schemat postępowania (Karl Pearson 1900r) Hipotezy: H0: Zmienne X i Y są wzajemnie niezależne, H1: Zmienne X i Y są zależne. Statystyka testowa χ ( O E) k l ( Oij Eij ) = = i= 1 j = 1 E Eij gdzie E oczekiwana i O obserwowana liczności komórki Przy założeniu hipotezy zerowej statystka ma asymptotyczny rozkład χ o df = (k - 1) (l - 1) stopniach swobody. Dla założonego poziomu istotności α podjęcie decyzji.
29 Jak obliczać wartość oczekiwaną? Liczności oczekiwana obliczamy wykorzystując rozkłady brzegowe E = ( suma rzędu) (suma (suma) kolumny) Skąd się to wzięło? Zasada niezależności prawdopodobieństwa P( i j) = P( i) P( j) więc E ij = n p( i) p( j) = n ( R / n) ( C / n) = R C i j i j / n
30 Policzmy przykład Wartości obserwowane Ciśnienie podwyższone Choroba Nie Tak Suma Nie Tak Suma Wartości oczekiwane? Poziom istotności α = 0,001
31 Przykład (ciśnieniowo-sercowy) Wartości oczekiwane: E11 = = 4,3 E1 = = 9, 7 E1 = = 0, 7 E = = 5, Ciśnienie podwyższone Choroba Nie Tak Suma Nie 4,3 9,7 54 Tak 0,7 5,3 46 Suma χ ( O E) = E = (37 4,3) 4,3 + (17 9,7) 9,7 + (8 0,7) 0,7 + (38 5,3) 5,3 = 6,54 χ( α, df ) = 10,83 χ oblicz > χ kryt
32 Zadania trzeba nabyć wprawy! A teraz trochę popiszemy i policzymy!
33 Jak obliczać automatycznie test chi kwadrat? Czy mamy wsparcie ze strony oprogramowania?
34 Statsoft : opcja Tablice Wielodzielcze - Chi-kwadrat
35 Minitab opcja Stat:Tables:Chi-squaretest
36 Excel co zrobić? No i nie jest łatwo! Ale przypomnij sobie o tablicach przestawnych; Pierwsze laboratoria!
37 Wybór testów niezależności w Statistica Co to za wersje testów?
38 Poprawki w teście dla tabel Dla tablic typu a c b d Można stosować prostszy wzór χ ( ad bc) n = ( a + b)( c + d)( a + c)( b + d) Poprawka Yatesa (gdy n < 40 i którakolwiek z liczności oczekiwanych < 5) χ ( ad bc n / ) n = ( a + b)( c + d)( a + c)( b + d)
39 Kilka uwag o innych wersjach testu chi-kwadrat χ największej wiarygodności (taki sam jak test Pearsona, lecz innych sposób obliczeń oparty na teorii największej wiarygodności (Wyniki obu testów są zbliżone). Tabele o rozmiarach χ z poprawką Yatesa (liczności oczekiwane małe). Dokładny test Fishera stosowany gdy całkowita liczność obserwacji jest mała lub jeśli małe są liczności oczekiwane). Powiązanym pojęciem jest test McNemary (gdy liczności reprezentują zmienne zależne). Więcej w książkach!
40 Miary siły związku Sama wartość statystyki χ pozwala na sprawdzenie tylko czy występuje współzależność! Nie pozwala na pomiar siły tego związku, bo :) Potrzebne są inne miary siły związku! Pożądana normalizacja wartości! Przykłady miar Współczynnik Φ -Yula Φ = χ n Miara siły związku w tabeli ; wartość znormalizowana od 0 (brak związku) do 1 (całkowite powiązanie).
41 Miary siły związku cd. Współczynnik V Cramera: V = χ n min( k 1; l 1) gdzie k i l są wymiarami tablicy wielodzielcznej. Wartości znormalizowane od 0 (brak związku) do 1. Współczynnik kontyngencji Pearsona: χ C = n + χ gdy zmienne niezależne C = 0, lecz max(c) < 1 i zależy od liczby wierszy i kolumn.
42 Miary siły związku - podsumowanie Interpretacja wartości współczynników: jeśli wartość współczynnika jest równa zero, to cechy X i Y są niezależne, im wartość bliższa jedynki, tym silniejsze jest powiązanie między X i Y. Zastosowania: porównywanie między sobą siły zależności różnych par zmiennych, Możliwości redukcji liczby atrybutów w tablicach danych. Systemy odkrywania wiedzy i eksploracji danych (ang. Knowledge Discovery in Databases) 49ner Jan Żytkow
43 Miary siły związku - Przykład (sercowy): Badanie czy choroba wieńcowa jest współzależna z podwyższonym ciśnieniem tętniczym wg. testu TAK! Ciśnienie Choroba podwyższone Nie Tak Suma Nie Tak Suma Miary siły związku: Φ = V = 0,51 C = 0,46
44 Statistica przykład obliczania miary siły związku para zmiennych Papierosy Skala choroby Miary siły związk
45 Statistica przykład obliczania miary siły związku para zmiennych Praca Skala choroby
46 Dyskusja nt. stosowalności testu chi-kwadrat Uwagi o poprawkach testów minimalne liczności (całkowite i oczekiwane). Pamiętaj, że test chi-kwadrat jest skonstruowany dla zmiennych nominalnych! Zmienne porządkowe i liczbowe (dyskretyzowane) nie wykorzystuje się informacji o porządku wartości; Zalecana ostrożność i wnikliwość analizy (patrz dalej). Inne trudności: Dobór właściwego poziomu istotności (zwłaszcza dla danych o dużych rozmiarach); zbyt wysokie wartości mogą prowadzić do identyfikacji losowych efektów, zbyt rygorystyczne prowadzą do pominięcia niektórych regularności zwłaszcza krytyczne w zdaniach eksploracji danych data mining. tzw. paradoks Simpsona / błąd pominięcia ukrytej zmiennej (zaraz będzie przykład)
47 Wątpliwości w analizie danych porządkowych Złośliwy przykład analizy dwóch zmiennych, których wartości są uporządkowane odpowiednio jako 1,, 3, 4 oraz A, B, C, D. A B C D Test chi daje p-wartość 0,, więc nie można odrzucić hipotezy o niezależności. Lecz przyjrzyjmy się dokładniej układowi liczności w tabeli, np. (4,A) i (1,D),, Czy istnieje monotoniczna regularność małe z małymi, duże z dużymi? Poszukaj innych metod do uwzględnienia porządku.
48 Uwagi o paradoksie Simpsona Paradoks Simpsona: pominięcie w analizie zmiennej uwikłanej może zmienić nawet diametralnie otrzymane związki między dwiema innymi zmiennymi jakościowymi. Inne sformułowanie: Koronacki, Mielniczuk, Statystyka, str. 39. There is a positive dependence between attributes A and B in two complementary sets of data C and C, but the dependence becomes negative or vanishes, when we add all data together Jan Żytkow, Automation of discovery in databases: combining AI, statistics and theory of knowledge.
49 Przykład paradoks Simpsona Pewien Wydział Informatyki i Elektroniki rekrutuje studentów na oba kierunki (przed egzaminem kandydat podaje na jaki kierunek zdaje); Oto wyniki egzaminu. Kobiety Mężczyźni Osoby odrzucone Osoby przyjęte Zauważmy, że procent przyjętych mężczyzn jest wyższy od procentu przyjętych kobiet: przyjęto 100 (9/03) = 45% kandydatów mężczyzn oraz tylko 100 (56/158) = 35% kandydatek.
50 Tablica wyników egzaminu test chi-kwadrat Czy można podejrzewać Wydział o dyskryminację kobiet?
51 Przykład paradoks Simpsona więcej szczegółów W analizie nie uwzględniliśmy trzeciej zmiennej kierunku studiów. Jej uwzględnienie dwie tablice dwudzielcze: Elektronika Informatyka Kobiety Mężczyźni Kobiety Mężczyźni Osoby odrzucone Osoby odrzucone Osoby przyjęte 1 73 Osoby przyjęte Przeanalizujmy procent przyjętych mężczyzn i kobiet: Na elektronikę przyjęto 5% kandydatek oraz 51% kandydatów. Na informatykę przyjęto 3% kandydatek i 3% kandydatów.
52 Przykład cd. testy chi-kwadrat. Elekronika Informatyka
53 Podsumowanie Paradoksu Simpsona Związek między dwiema zmiennymi, ujawniany dla każdej kategorii trzeciej zmiennej oddzielnie, może zostać diametralnie zmieniony przez zagregowanie danych, polegające na zsumowaniu wyników dla różnych kategorii trzeciej zmiennej. Przykład egzaminów Fałszywe wrażenie dyskryminacji kobiet, gdyż nie dostrzeżono faktu znacznie trudniejszego wstępu na kierunek informatyka, przy jednoczenie większej popularności tego kierunku wśród kobiet.
54 Podsumujmy: Reszta ciekawych dyskusji i przykładów w zalecanych książkach. Naa..aaprawde warto zajrzeć! Studiowanie to także (i przede wszystkim) samodzielne poszukiwania!
55 Literatura Statystyka dla studentów kierunków technicznych i przyrodniczych, Koronacki Jacek, Mielniczuk Jan, WNT, 001. Statystyka w zarządzaniu, A.Aczel, PWN, 000. Po prostu statystyka, Frances Clegg, WSiP, Przystępny kurs statystyki, Stanisz A., I wiele innych W przykładach wykorzystano także oprogramowanie: Statistica 5.0 ( Statsoft Inc.), Minitab rel. 14 ( Minitab Inc.), Microsoft Excel ( Microsoft).
56 Czego się dowiedzieliśmy podczas tego wykładu? 1. Analiza danych jakościowych Zmienne jakościowe (nominalne i inne ) Tablice wielodzielcze. Analiza tablic wielodzielczych zależność zmiennych 3. Test zgodności chi - kwadrat Prosta hipoteza o zgodności rozkładów Statystyka chi - kwadrat, 4. Test niezależności dwóch zmiennych Analiza tablic wielodzielczych z wykorzystaniem testu chikwadrat Poprawki w testach 5. Jak to się liczy w różnych programach? 6. Miary siły związku 7. Dyskusja problemów w stosowaniu testów chi-kwadrat
57 Dziękuję za uwagę Czytaj także podręczniki oraz sam eksperymentuj z danymi!
Analiza zależności zmiennych jakościowych. Testy chi - kwadrat.
Analiza zależności zmiennych jakościowych. Testy chi - kwadrat. JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu 1. Analiza danych jakościowych Zmienne jakościowe (nominalne i
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy
dr hab. Dariusz Piwczyński, prof. nadzw. UTP
dr hab. Dariusz Piwczyński, prof. nadzw. UTP Cechy jakościowe są to cechy, których jednoznaczne i oczywiste scharakteryzowanie za pomocą liczb jest niemożliwe lub bardzo utrudnione. nominalna porządek
Weryfikacja hipotez statystycznych testy t Studenta
Weryfikacja hipotez statystycznych testy t Studenta JERZY STEFANOWSKI Marek Kubiak Instytut Informatyki Politechnika Poznańska Standardowy schemat postępowania (znane σ) Założenia: X ma rozkład normalny
Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości
Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości Informatyka 007 009 aktualizacja dla 00 JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu. Przypomnienie testu dla
Wykład 8 Dane kategoryczne
Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Wykład 11 Testowanie jednorodności
Wykład 11 Testowanie jednorodności Wrocław, 17 maja 2018 Test χ 2 jednorodności Niech X i, i = 1, 2,..., k będą niezależnymi zmiennymi losowymi typu dyskretnego przyjmującymi wartości z 1, z 2,..., z l,
Badanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Testy post-hoc. Wrocław, 6 czerwca 2016
Testy post-hoc Wrocław, 6 czerwca 2016 Testy post-hoc 1 metoda LSD 2 metoda Duncana 3 metoda Dunneta 4 metoda kontrastów 5 matoda Newman-Keuls 6 metoda Tukeya Metoda LSD Metoda Least Significant Difference
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA
Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Korelacja krzywoliniowa i współzależność cech niemierzalnych
Korelacja krzywoliniowa i współzależność cech niemierzalnych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Wykład 9 Testy rangowe w problemie dwóch prób
Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).
Badanie zależności pomiędzy zmiennymi
Badanie zależności pomiędzy zmiennymi Czy istnieje związek, a jeśli tak, to jak silny jest pomiędzy np. wykształceniem personelu a jakością świadczonych usług? Ogólnie szukamy miary zależności (współzależności),
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)
Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Przykład 1. (A. Łomnicki)
Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele
GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana
GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma
Wykład 10 Testy jednorodności rozkładów
Wykład 10 Testy jednorodności rozkładów Wrocław, 16 maja 2018 Test Znaków test jednorodności rozkładów nieparametryczny odpowiednik testu t-studenta dla prób zależnych brak normalności rozkładów Test Znaków
Testy nieparametryczne
Testy nieparametryczne 1 Wybrane testy nieparametryczne 1. Test chi-kwadrat zgodności z rozkładem oczekiwanym 2. Test chi-kwadrat niezależności dwóch zmiennych kategoryzujących 3. Test U Manna-Whitney
Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Wykład 12: Tablice wielodzielcze
Wykład 12: Tablice wielodzielcze Drosophila melanogaster Krzyżówka wsteczna (CcNn i ccnn) Kolor oczu czerwone fioletowe Rozmiar skrzydła normalne 39 11 mniejsze 18 32 Zródło:http://pl.wikipedia.org/wiki/Plik:Drosophila_melanogaster1.jpg
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r
Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI
Wykład 11: Dane jakościowe. Rozkład χ 2. Test zgodności chi-kwadrat
Wykład 11: Dane jakościowe Obserwacje klasyfikujemy do klas Zliczamy liczbę obserwacji w każdej klasie Jeżeli są tylko dwie klasy, to jedną z nich możemy nazwać sukcesem, a drugą porażką. Generalnie, liczba
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi
Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi Zadanie 1 Zdaniem wielu komentatorów, kobiety częściej niż mężczyźni głosują na partię rządzącą. Wyniki badań przedstawia
Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):
Rozkłady dwuwymiarowe Rozkłady brzegowe Rozkłady warunkowe Niezależność Kowariancja Współczynnik korelacji (Przykłady na tablicy) Tablice dwudzielcze Najprostsze tablice 2x2 : dwa rzędy i dwie kolumny
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Badanie zależności zmiennych kolumnowej i wierszowej:
Wykład : Tablice wielodzielcze Zródło:http://pl.wikipedia.org/wiki/Plik:Drosophila_melanogaster.jpg Drosophila melanogaster Krzyżówka wsteczna (CcNn i ccnn) Kolor oczu czerwone fioletowe Rozmiar skrzydła
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1
Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zaleŝy
Testy dla dwóch prób w rodzinie rozkładów normalnych
Testy dla dwóch prób w rodzinie rozkładów normalnych dr Mariusz Grządziel Wykład 12; 18 maja 2009 Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego)
Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych
Wykład 12 (21.05.07): Testy dla dwóch prób w rodzinie rozkładów normalnych Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego) n 1 = 9 poletek w dąbrowie,
Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona
Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności
Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11
Testy zgodności Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 27. Nieparametryczne testy zgodności Weryfikacja
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Wykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
TABELE WIELODZIELCZE
TABELE WIELODZIELCZE W wielu badaniach gromadzimy dane będące liczebnościami. Przykładowo możemy klasyfikować chore zwierzęta w badanej próbie do różnych kategorii pod względem wieku, płci czy skali natężenia
Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji
gkrol@mail.wz.uw.edu.pl #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji 1 Ryzyko błędu - powtórzenie Statystyka niczego nie dowodzi, czyni tylko wszystko mniej lub bardziej prawdopodobnym
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu
Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu Wrocław, 01.03.2017r Przykład 2.1 Właściciel firmy produkującej telefony komórkowe twierdzi, że wśród jego produktów
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -
ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna
Ćwiczenie 4 ANALIZA KORELACJI, BADANIE NIEZALEŻNOŚCI Analiza korelacji jest działem statystyki zajmującym się badaniem zależności pomiędzy rozkładami dwu lub więcej badanych cech w populacji generalnej.
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Weryfikacja hipotez statystycznych - testy dla wartości średniej cz. 2
Weryfikacja hipotez statystycznych - testy dla wartości średniej cz. 2 JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Studia niestacjonarne Informatyka 2016/17 Plan wykładu 1. Test t-studeta
Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36
Statystyka Wykład 7 Magdalena Alama-Bućko 3 kwietnia 2017 Magdalena Alama-Bućko Statystyka 3 kwietnia 2017 1 / 36 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR
NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR M Zalewska Zakład Profilaktyki ZagrożeńŚrodowiskowych i Alergologii Analiza niezależności zmiennych jakościowych (test niezależności Chi-kwadrat)
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38
Statystyka Wykład 8 Magdalena Alama-Bućko 23 kwietnia 2017 Magdalena Alama-Bućko Statystyka 23 kwietnia 2017 1 / 38 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Drzewa Decyzyjne, cz.2
Drzewa Decyzyjne, cz.2 Inteligentne Systemy Decyzyjne Katedra Systemów Multimedialnych WETI, PG Opracowanie: dr inŝ. Piotr Szczuko Podsumowanie poprzedniego wykładu Cel: przewidywanie wyniku (określania
Test t-studenta dla jednej średniej
Test t-studenta dla jednej średniej Hipoteza zerowa: Średnia wartość zmiennej w populacji jest równa określonej wartości a 0 (a = a 0 ). Hipoteza alternatywna 1.: Średnia wartość zmiennej w populacji jest
Statystyczna analiza danych
Statystyczna analiza danych Testowanie hipotez statystycznych Ewa Szczurek szczurek@mimuw.edu.pl Instytut Informatyki Uniwersytet Warszawski 1/23 Testowanie hipotez średniej w R Test istotności dla wartości
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Prawdopodobieństwo i statystyka
Wykład XI: Testowanie hipotez statystycznych 12 stycznia 2015 Przykład Motywacja X 1, X 2,..., X N N (µ, σ 2 ), Y 1, Y 2,..., Y M N (ν, δ 2 ). Chcemy sprawdzić, czy µ = ν i σ 2 = δ 2, czyli że w obu populacjach
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne.
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Ekonometria. Zajęcia
Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Statystyka w analizie i planowaniu eksperymentu
4 kwietnia 2012 Testy nieparametryczne Dotychczas zajmowaliśmy si e praktycznym zastosowaniem testów istotności nasze zadanie sprowadza lo si e do testowania hipotez o parametrach rozk ladu. Teraz b edziemy
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
1.1 Wstęp Literatura... 1
Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40
Statystyka Wykład 9 Magdalena Alama-Bućko 7 maja 2018 Magdalena Alama-Bućko Statystyka 7 maja 2018 1 / 40 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia miary
Elementarne metody statystyczne 9
Elementarne metody statystyczne 9 Wybrane testy nieparametryczne - ciąg dalszy Test McNemary W teście takim dysponujemy próbami losowymi z dwóch populacji zależnych pewnej cechy X. Wyniki poszczególnych
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy
Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2017/2018 STATYSTYKA
Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?
Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Gdy: badana cecha jest mierzalna (tzn. posiada rozkład ciągły); badana cecha posiada rozkład normalny; dysponujemy pojedynczym wynikiem;
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407
Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde badanie naukowe rozpoczyna
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady