(autor Piotr Kwiatkowski)
|
|
- Dariusz Czech
- 8 lat temu
- Przeglądów:
Transkrypt
1 Test chi-kwadrat (autor Piotr Kwiatkowski) W badaniach z zakresu nauk społecznych analizowane zmienne często występują w postaci jakościowej (nominalnej). Zmienność polega na tym, że w badanej populacji poszczególne osoby można przypisać do różnych i rozłącznych kategorii (np. zmienność płci sprowadza się do występowania dwóch kategorii - mężczyzna, kobieta zaś zmienność rodzaju wykształcenia sprowadzic można do czterech kategorii - humanistyczne, matematycznoprzyrodnicze, techniczne, artystyczne). Wiele problemów badawczych w naukach społecznych to pytania o zależności między takim właśnie zmiennymi. Co oznacza termin zależność (określenia bliskoznaczne to związek między zmiennymi albo korelacja)? W opisywanym tu kontekście oznacza on, że istnieje taka prawidłowość w układzie danych, że pewnym wartościom zmiennej A częściej da się przypisać pewne wartości zmiennej B. Inaczej mówiąc, jeśli określone osoby różnią się wartością zmiennej A, to w pewien sposób różnią się także wartościami zmiennej B. Trzymając się podanego przykładu - jeśli poklasyfikujemy ludzi jednocześnie wg płci i wg wykształcenia, to o zależności wykształcenia od płci powiemy, jeżeli pewne rodzaje wykształcenia częściej pojawiają się wśród kobiet a inne rodzaje wykształcenia częściej pojawiają się u mężczyzn. Gdyby poszczególne kategorie wykształcenia z jednakową częstością pojawiały się wśród kobiet i wśród mężczyzn, to nie byłoby podstaw do wnioskowania o istnieniu zależności. W praktyce z reguły stwierdza się jakieś różnice tego rodzaju większe lub mniejsze. Im są one większe, tym mniej jest prawdopodobne, że powstały w wyniku działania czynników losowych. W badaniach statystycznych jakie by one nie były zawsze dążymy do uzyskania odpowiedzi na pytanie jakie jest prawdopodobieństwo, że wykryty w badanym zbiorze układ danych powstał w wyniku działania czynnika losowego (prawdopodobieństwo błędnego czy - jak ktoś woli - niesłusznego odrzucenia tzw. hipotezy zerowej). Zwróćmy uwagę, że określając prawdopodobieństwo przypadkowości uzyskanych wyników wyznaczamy automatycznie prawdopodobieństwo ich nieprzypadkowości, ponieważ prawdopodobieństwa obu wykluczających się alternatyw sumują się do jedności (lub do 100%). Jeśli uznamy, że losowy rozkład danych w populacji generalnej jest mało prawdopodobny, to musimy przyjąć, że istnienie prawidłowości jest wysoce prawdopodobne. W statystyce mówimy w tym kontekście o istotności rezultatów badań (istotne statystycznie oznacza więc tyle, co z niewielkim prawdopodobieństwem losowe ). Zanim przystąpimy do omawiania technicznej strony obliczeń chi-kwadrat, jeszcze jedna uwaga ogólna. Dotyczy ona tego czym są badania statystyczne i na jakich założeniach się opierają. Wnioskowanie statystyczne ma charakter indukcyjny, czyli polega na uogólnianiu wyników (z tzw. próby na populację generalną). Zakładamy, że jeśli próba została pobrana w sposób losowy, to dane z próby są odzwierciedleniem wszelkich prawidłowości obecnych w populacji generalnej, zaś wszelkie odchylenia od tych prawidłowości występujące w próbie mają charakter losowy (nazywamy je błędem losowym). Jeśli próba jest duża, to mówiąc obrazowo owe odchylenia giną w masie.
2 Każdy test statystyczny prowadzi do określenia istotności czyli do ustalenia prawdopodobieństwa słuszności hipotezy zerowej. Hipotezę zerową możemy w wyniku testu odrzucić (jako mało pradopodobną) albo stwierdzić, że brak jest podstaw do odrzucenia hipotezy zerowej (jeśli prawdopodobieństwo jej słuszności jest zbyt duże). W statystyce przyjmuje się, że do odrzucenia hipotezy zerowej upoważnia jej prawdopodobieństwo mniejsze niż 0,05. Granica ta jest jednak umowna i w pewnych okolicznościach może być przesunięta (ale raczej w dół, tzn. możemy wyznaczyć ją na 0,02 albo 0,01 czy 0,001 a uzasadnieniem dla takiego zabiegu może być na przykład bardzo duża liczebność próby). Na marginesie uwaga hipotezy zerowej nie da się udowodnić, bowiem na gruncie indukcji nie można udowodnić nieistnienia czegokolwiek (w tym niestnienia zależności). Jeśli w badanej próbie nie zaobserwowano zakładanej hipotetycznie zależności między zjawiskami lub innej właściwośc,i to nie oznacza, że nie występuje ona w populacji generalnej choćby w niewielkim zakresie. Hipotezę zerową można odrzucić, gdy przemawiają za tym wyniki uzyskane w próbie ale nie można jej potwierdzić w takich badaniach. Dlatego hipotez badawczych nigdy nie formułujemy w brzmieniu hipotezy zerowej, gdyż były one nieweryfikowalne - nie da się udowodnić tezy o równości inteligencji kobiet i mężczyzn, gdyż próbowalibyśmy udowodnić nieistnienie różnic w populacji generalnej na podstawie danych z próby czyli wycinka tej populacji. Gdybyśmy jednak uzyskali pewne różnice i w wyniku testowania statystycznego danych z próby (pobranej w sposób losowy!!!) uznali, że przypadkowość tychże różnic jest mało prawdopodobna, to mielibyśmy prawo odrzucić hipotezę zerową, mówiącą o równości inteligencji obu płci. Teraz przejdźmy do konkretów. W przypadku testu chi-kwadrat będziemy testować hipotezę zerową, która mówi w populacji generalnej rozkład poszczególnych kombinacji wartości dwóch zmiennych ma charakter losowy. Przyjmiemy na wstępie, że kryterium istotności będzie wartość prawdopodobieństwa hipotezy zerowej mniejsza niż 0,05 (zapisujemy to prawdopodobieństwo symbolem p albo grecką literą alfa - czyli p<0,05). Przyjmijmy też do wiadomości, że stosowanie testu chi-kwadrat wymaga spełnienia pewnych warunków co do liczby analizowanych przypadków - ale o tym za chwilę. Na początek będzie nam potrzebna tabela z wynikami badań. Tabela pokaże nam ile osób zbadano w próbie, jak często w próbie pojawiały się poszczególne wartości jednej i drugiej zmiennej oraz jak często w próbie pojawiały się wszystkie możliwe kombinacje wartości obu zmiennych. Tabela musi zawierać liczebności bezwzględne (nazywane czasem liczebnościami surowymi). Pomijamy liczebności względne czyli np. rozkład procentowy, gdyż do obliczeń używamy dane surowe. Przykładowa tabelka poniżej. Rodzaj preferowanego wykształcenia Płeć Humanistyczne Matemat-przyrod. Techniczne Artystyczne Razem Mężczyźni Kobiety Razem Teraz sprawdzimy, czy zasadne jest posłużenie się testem chi-kwadrat. Przyjmuje się, że żadna z liczebności brzegowych w tabeli nie może być mniejsza niż 20. W naszym przykładzie wszystkie wartości są wyższe niż 20 a zatem nic nie stoi na przeszkodzie, by dokonać dalszych obliczeń.
3 Test chi-kwadrat opiera się na porównaniu liczebności bezwzględnych uzyskanych w badaniu empirycznym z liczebnościami, które ujawniłyby się, gdyby dane w tabeli odzwierciedlały losowe przyporządkowanie wartości jednej zmiennej do wartości drugiej zmiennej. Porównanie dotyczy zatem tzw. liczebności empirycznych i liczebności teoretycznych. Liczebności empiryczne mamy już gotowe po zliczeniu danych z próby, zaś liczebności teoretyczne trzeba dopiero obliczyć. Obliczenia te wykonywane sa osobno dla każdego pola w tabeli (z wyjątkiem brzegowych), czyli dla każdej liczebności empirycznej wyznaczamy jej teoretyczny odpowiednik. Obliczenie liczebności teoretycznej polega na wymnożeniu dwóch sum brzegowych odpowiadających danemu polu tabeli i podzieleniu uzyskanej wartości przez całkowitą liczebność próby. Liczebności teoretyczne zaokrąglamy do dwóch miejsc po przecinku. Teraz powinniśmy sprawdzic poprawność wyliczeń sumy brzegowe liczebności teoretycznych powinny być równe sumom brzegowym liczebności empirycznych. Bardzo drobne różnice mogą wynikać z faktu zaokrąglania. Przystępujemy do obliczania cząstowych wartości chi-kwadrat dla każdej pary liczebności teoretycznych i empirycznych (czyli dla każdego pola naszej tabeli roboczej). Korzystamy z następującego wzoru: (E T) 2 /T czyli podniesioną do kwadratu różnicę liczebności teoretycznej i empirycznej dzielimy przez liczebność teoretyczną. Wyniki zaokrąglamy do 3 miejsc po przecinku. Sumujemy teraz wszystkie wartości cząstkowe otrzymując wartość testu chi-kwadrat. Wartość testu chi-kwadrat posłuży nam teraz do określenia istotności statystycznej - poprzez ustalenie prawdopodobieństwa hipotezy zerowej dla naszych danych. Można to prawdopodobieństwo wyliczyć dokładnie, korzystając z dostępnego programu (kalkulator testu w darmowym pakiecie GRETL) albo korzystając z tzw. tablic statystycznych określić czy jest ono mniejsze niż ustalona na wstępie wartość (np. p<0,05). Oba warianty wymagają dodatkowego obliczenia. Trzeba określić tzw. liczbę stopni swobody dla naszej tabeli z danymi. Wzór jest prosty df = (w-1)(k-1) czyli iloczyn pomniejszonej o 1 liczby wierszy i pomniejszonej o 1 liczby kolumn w tabeli (nie licząc brzegowych i nagłówków). W naszym przykładzie df = (2-1)(4-1) = 3. Znając wartość df i przyjmując wartość p=0,05 odczytujemy z tablicy statystycznej jaka odpowiada im wartość krytyczna chi-kwadrat. Porównany teraz obliczoną z danych empirycznych wartość chi-kwadrat dla naszej tabeli z wydobytą z tablicy wartościa krytyczną. Możliwe są dwie alternatywy: 1) Wartość empiryczna jest mniejsza bądź równa wartość krytycznej, co prowadzi do konkluzji o braku podstaw do odrzucenia hipotezy zerowej (badania nie potwierdzają zależności) albo 2) wartość empiryczna jest większa od wartości krytycznej, co oznacza że istnieją podstawy do odrzucenia hipotezy zerowej z prawdopodobieństwem błędu mniejszym niż 0,05 (badania potwierdzają istnienie zależności).
4 Tablica statystyczna. Wartości krytyczne chi-kwadrat dla wybranych poziomów istotności. Założony poziom istotności (p) Stopnie 0,100 0,050 0,025 0,010 0,005 swobody (df) 1 2,7055 3,8415 5,0239 6,6349 7, ,6052 5,9915 7,3778 9, ,5965 6,2514 7,8147 9, , ,8381 7,7794 9, , , ,8602 9, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,3194 Teraz możemy dokonać prezentacji wyniku w postaci edytowalnej tabeli. Dla lepszej ilustracji uwzględniamy w niej oprócz surowych liczebności zestawienie procentowe. Bezpośrednio pod tabelą umieszczamy wynik testu statystycznego składający się z trzech informacji: wartość chi-kwadrat, df oraz wartość p. Na koniec jeszcze jedna ważna uwaga. Wartość testu chi-kwadrat jest zależna od wielkości zbioru. Identyczne proporcje w tabeli dla próby pięciokrotnie większej przyniosą pięć razy większą wartość testu. Zatem wartość ta nie może być wykorzystana dla porównania siły związku między zmiennymi w próbach różniących się liczebnością. Z kolei uzależnienie wartości krytycznych testu od liczby stopni swobody czyni nieporównywalnymi wyniki uzyskane w tabelach różniących się liczbą kolumn lub wierszy. Aby takie porównania były możliwe należy przeliczyć wartość chi-kwadrat na adekwatny do rodzaju danych współczynnik siły związku. Może to być na przykład współczynnik V-Cramera. Współczynniki tego rodzaju są po prostu miarami korelacji między zmiennymi nominalnymi i pozwalają zorientować się w mocy predykcyjnej jednaj zmiennej względem drugiej. Im bliżej zera, tym mniejsza możliwość przewidywania wartości jednej zmiennej na podstawie znanej wartości drugiej zmiennej, im bliżej 1, tym możliwość trafnego przewidywania jest większa.
5 Zadania 1. Oblicz samodzielnie wartość chi-kwadrat i oceń istotność zależności z podanej wyżej przykładowej tabeli (odpowiedź: wartość obliczona w kalkulatorze pakietu statystycznego wynosi 58,731 - czy tyle wyszło w Twoich obliczeniach?). 2. Oblicz współczynnik V Cramera (odpowiedź: 0,37) W kolejnym materiale pokażę, jak wykonać obliczenia za pomocą darmowych pakietów MyStat i GRETL. VERTE.
6 Chi-kwadrat dla leniwych Jeśli dysponujesz gotową tabelą wielodzielczą z danymi uzyskanymi z próby, to zamiast liczyć chi-kwadrat na piechotę skorzystaj z dostępnego w internecie kalkulatora. Link do dobrego kalkulatora ze strony amerykańskiego uniwersytetu Na podanej stronie masz najpierw krótkie wyjaśnienia a potem kalkulator. Są to puste ramki, w które wpisujesz liczebności. Zwyczajnie przepisujesz pola swojej tabeli z danymi (pomijając sumy brzegowe, bo kalkulator sam je obliczy). Potem jedno kliknięcie (Calculate) i w ramkach na dole pojawią się obliczenia. Zwróć uwagę na poprawkę Yatesa. Jeśli pojawi się chi-kwadrat z uwzlędnieniem tej poprawki, to znaczy, że dane zawierały zbyt małe liczebności i stąd konieczne było zastosowanie tej korekty. W tej sytuacji do wnioskowania o zależności między zmiennymi wykorzystaj tylko obliczenia poprawione (tylko te podaj w legendzie pod tabelą).
7 Może zaskoczyć Cię formuła wyniku jeśli liczba p-value zawierałaby dużo zer po przecinku, to wyświetla się wyrażenie, oznaczające pewną liczbę wymnożoną przez dziesięć do ujemnej potęgi. Inny, prosty kalkulator znajdziesz w programie GRETL (program do ściągnięcia z internetu - legalny i darmowy a do tego spolszczony). Niestety kalkulator służy tylko do obliczenia istotności. W okienka programu musisz wpisać obliczoną wartość chi-kwadrat i liczbę stopni swobody (df). Jedno kliknięcie i wyświetli się poziom istotności. Wchodzisz do programu. Klikasz na górnym pasku pole Narzędzia. Z menu wybierz Wyznaczanie wartości p. W okienku pojawi się pasek narzędziowy - wybierz w nim opcję opcję chi-kwadrat. Zobaczysz dwie ramki do wypełnienia - df oraz wartość chi-kwadrat. Klikasz OK i gotowe. Istotność czyli p jest tu nazwana prawostronny obszar krytyczny.
8 Powyższe sposoby mają tę wadę, że trzeba najpierw samodzielnie zbudować tabelę z wynikami. Przy dużej ilości tabel oznacza to bardzo dużo pracy. Do zbudowania tabel krzyżowych lepiej skorzystać z funkcji arkusza kalkulacyjnego albo - jeszcze lepiej - arkusz taki zaimportować do programu statystycznego. Ta ostatnia opcja jest najlepsza, bo wystarczy tu oznaczyć zmienne do analizy i wskazać potrzebne współczynniki (oraz ewentualnie dodatkowe informacje, które się mogą przydać w analizie np. procenty w tabeli itp.), aby program wykonał potrzebne nam obliczenia i jeszcze wydrukował roboczą wersję tabeli do tekstu. W kolejnym tekście opiszę, jak taką analizę wykonać za pomocą darmowych pakietów GRETL i MyStat.
9 Obliczanie chi-kwadrat w pakiecie statystycznym MyStat 12 (darmowa wersja studencka komercyjnego pakietu SYSTAT, wymaga rejestracji na stronie producenta) Podobnie jak w innych programach tego rodzaju najpierw musisz stworzyć w nim albo wygodniej zaimportować z Excela zbiór danych. Import zbioru z excela polega na wyklikaniu ścieżki: File Open Data aż otworzy się okienko Otwieranie i w nim musisz wybrać format pliku (ramka na dole) i określić jego lokalizację (ramka Szukaj w) oraz wybrać plik do ramki Nazwa pliku. Teraz wystarczy kliknąć Otwórz i wyświetli się arkusz z danymi (prawie identyczny jak nasz Excel).
10 Dalej musisz zdefiniować potrzebną Ci procedurę statystyczną i wytypować zmienne do analizy. Test chi-kwadrat znajdujesz z paska górnego wchodząc w ścieżkę: Analyze Tables Two-Way Otworzy się okienko z domyslnie uaktywnioną pierwszą zakładką Main. Tu kolejno z lewej ramki (available variables) wybierz zmienne, po kliknięciu Add wskoczą w wiersze (row variable) oraz w kolumny (column variables) (w podanym przykładzie są to zmienne Plec i Narkoty). Teraz określ wygląd tabeli zaznaczając wybrane opcje poniżej zaznacz liczebności (Counts) oraz jak mają być sumowane procenty - albo w wierszach albo w kolumnach (row percents albo column percents). Z pozostałych opcji warto rozważyć zaznaczenie Include missing values (czyli uwzględnij brakujące dane jako odrębne wartości zmiennej). Jeśli tej opcji nie zaznaczysz, to braki danych zostaną pominięte w obliczeniach.
11 Zwróć uwagę, że podając zmienne do analizy możesz w jednej z ramek (w górnej) podać ich kilka. Program wyliczy wtedy kilka zależności od jednego kliknięcia. Teraz przejdź do drugiej zakładki w okienku czyli Measures zawiera ona statystyki, które program może policzyć - najważniejsze są Pearson chi-square czyli test chi-kwadrat Pearsona oraz Cramer s V czyli współczynnik siły związku V Cramera. Zaznacz je obie. Kliknij OK. Otrzymasz okienko z czterema tabelkami. Pierwsze dwie to dwudzielne tabele liczebności (pierwsza z liczebnościami bezwzględnymi a druga z procentowymi). Trzecia zawiera wartość testu chi-kwadrat, liczbę stopni swobody oraz wartość p. Czwarta zawiera współczynniki V Cramera.
12 Na podstawie tych danych możesz zbudować elegancką tabelę w edytorze tekstu, zaopatrzyć ją w zestawienie wyliczonych statystyk i opisać w tekście dane oraz podać decyzję o odrzuceniu albo o braku podstaw do odrzucenia hipotezy zerowej. Obliczanie chi-kwadrat z danych surowych arkusza kalkulacyjnego za pomocą programu GRETL Przygotuj sobie arkusz danych w excelu. GRETL wymaga, aby wartości zmiennych były zakodowane jako cyfry (nie toleruje liter i symboli). Przykład: kategorie nigdy czasami często należy zapisać jako 1, 2, 3 zaś płeć męska żeńska zapisz jako 0 1 albo 1 2. Zmienne ilościowe (przedziałowe lub rangowe) możesz sprowadzić do postaci nominalnej, wydzielając pewne przedziały wartości jako kategorie (np. wyniki poniżej mediany = 0 a wyniki równe lub większe od mediany = 1 albo jeśli posługujesz się normą testową, to wynik poniżej normy zapisz jako 1, wynik w przedziale normy czyli przeciętny zapisz jako 2, zaś wynik powyżej normy zapisz jako 3). W górnym wierszu excela powinna być podana nazwa każdej zmiennej (najlepiej skrót od nazwy np. kontrola rodzicielska to kontrola albo KR). Arkusz zbudowany jest z wierszy i kolumn - wiersze poziome to wyniki kolejnych osób, zaś kolumny pionowe to poszczególne zmienne. Dla przykładu fragment arkusza (płeć 0,1 i cztery zmienne przedziałowe sprowadzone do postaci nominalnej 1,2,3). Kiedy masz już prawidłowy arkusz z danymi, musisz go zaimportować do programu GRETL. Po uruchomieniu tego programu klikasz i wybierasz kolejno wg poniższej ścieżki: Plik Otwórz dane Import Excel Otworzy się okienko, w którym musisz wybrac lokalizację twojego pliku z danymi excela, zaznacz ten plik i w następnym okienku zatwierdź importowanie (domyślnie ustawione jest ono od wiersza 1 i kolumny 1). Gdy pojawi się
13 pytanie o ewentuaną zmianę typu danych - kliknij Nie (bo masz dane przekrojowe). Pojawi się teraz okienko w zestawem wszystkich zmiennych w twoim zaimportowanym zbiorze.
14 Teraz musisz zdefiniować ustawienia obliczeń. Najpierw w pasku narzędziowym na górze klikasz pole Widok a następnie z podanych Ci opcji wybierasz Tabela krzyżowa. Pojawi się okno, w którym zdefinujesz dwie zmienne do analizy zależności między nimi. Pierwsza wybrana zmienna będzie później ulokowana w wierszach tabeli, zaś druga będzie ulokowana w kolumnach. Musisz wybrać jak mają sumować się procenty (do 100%) - w wierszach czy w kolumnach? Po kliknięciu OK. komputer dokona obliczeń i wyświetli je w ramce. Zobaczysz na górze tabelę krzyżową z danymi z badań a pod spodem statystyki: chikwadrat, liczba stopni swobody i poziom istotności (czyli wartość p).
15
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Bardziej szczegółowoWykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA
Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko
Bardziej szczegółowoTemat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat
Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy
Bardziej szczegółowoP: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali
Bardziej szczegółowoTestowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Bardziej szczegółowodr hab. Dariusz Piwczyński, prof. nadzw. UTP
dr hab. Dariusz Piwczyński, prof. nadzw. UTP Cechy jakościowe są to cechy, których jednoznaczne i oczywiste scharakteryzowanie za pomocą liczb jest niemożliwe lub bardzo utrudnione. nominalna porządek
Bardziej szczegółowoArkusz kalkulacyjny MS EXCEL ĆWICZENIA 4
Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4 Uwaga! Każde ćwiczenie rozpoczynamy od stworzenia w katalogu Moje dokumenty swojego własnego katalogu roboczego, w którym będziecie Państwo zapisywać swoje pliki.
Bardziej szczegółowoKorzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD
Bardziej szczegółowoZawartość. Zawartość
Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami
Bardziej szczegółowoGRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana
GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma
Bardziej szczegółowoTest niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)
Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy
Bardziej szczegółowoTesty nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
Bardziej szczegółowoSpis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych
1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja
Bardziej szczegółowoZałożenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW
Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa
Bardziej szczegółowoIdea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Bardziej szczegółowoZadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Bardziej szczegółowoBadanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
Bardziej szczegółowoInstrukcja obsługi programu SWWS autorstwa Michała Krzemińskiego
Instrukcja obsługi programu SWWS autorstwa Michała Krzemińskiego Krótkie informacje o programie można znaleźć zarówno w pliku readme.txt zamieszczonym w podkatalogu DANE jak i w zakładce O programie znajdującej
Bardziej szczegółowoStatystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Bardziej szczegółowoJak korzystać z przeglądarki danych ESS SoftReport
Jak korzystać z przeglądarki danych ESS SoftReport Instalacja 1. Do korzystania z przeglądarki konieczne jest zainstalowanie programu ESS SoftReport. W tym celu należy wejść na stronę internetową http://www.ifispan.waw.pl/ess
Bardziej szczegółowoTESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Bardziej szczegółowoPrzypomnienie: Ćwiczenie 1.
Strona1 Przypomnienie: Zmienne statystyczne można podzielić na: 1. Ilościowe, czyli mierzalne (przedstawiane liczbowo) w tym: skokowe inaczej dyskretne (przyjmują skończoną lub co najwyżej przeliczalną
Bardziej szczegółowox y
Tym razem pominę wstęp teoretyczny i skupię się na praktycznym aspekcie sprawy, czyli jak szybko policzyć korelację oraz ocenić jej istotność. Bardzo zachęcam do przejrzenia książki autorstwa Adama wspomnianej
Bardziej szczegółowoWnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Bardziej szczegółowoSTATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2
STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;
Bardziej szczegółowoEdytor materiału nauczania
Edytor materiału nauczania I. Uruchomienie modułu zarządzania rozkładami planów nauczania... 2 II. Opuszczanie elektronicznej biblioteki rozkładów... 5 III. Wyszukiwanie rozkładu materiałów... 6 IV. Modyfikowanie
Bardziej szczegółowoSposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
Bardziej szczegółowoLABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Bardziej szczegółowoAnaliza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Bardziej szczegółowoPodstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica
Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica 1. Zarządzanie danymi. Pierwszą czynnością w pracy z pakietem Statistica jest zazwyczaj wprowadzenie danych do arkusza. Oprócz możliwości
Bardziej szczegółowoPopulacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Bardziej szczegółowoparametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
Bardziej szczegółowoJak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
Bardziej szczegółowoStatystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Bardziej szczegółowoTABELE WIELODZIELCZE
TABELE WIELODZIELCZE W wielu badaniach gromadzimy dane będące liczebnościami. Przykładowo możemy klasyfikować chore zwierzęta w badanej próbie do różnych kategorii pod względem wieku, płci czy skali natężenia
Bardziej szczegółowoSIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Bardziej szczegółowoLABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Bardziej szczegółowoĆwiczenie: Wybrane zagadnienia z korelacji i regresji.
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)
Bardziej szczegółowoStatystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
Bardziej szczegółowoWprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Bardziej szczegółowoWeryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Bardziej szczegółowoWeryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja
Bardziej szczegółowoJak utworzyć plik SIO dla aktualnego spisu?
System Informacji Oświatowej Jak utworzyć plik SIO dla aktualnego spisu? Programy Arkusz Optivum, Kadry Optivum, Płace Optivum, Sekretariat Optivum oraz Księgowość Optivum dostarczają znaczną część danych
Bardziej szczegółowoTestowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Bardziej szczegółowoTestowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Bardziej szczegółowoProgram EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu
Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu http://www.jarsoft.poznan.pl/ 1. STRUKTURA PROGRAMU Program EWIDENCJA ODZIEŻY ROBOCZEJ jest aplikacją wspierającą
Bardziej szczegółowoMetody Statystyczne. Metody Statystyczne
#7 1 Czy straszenie jest bardziej skuteczne niż zachęcanie? Przykład 5.2. s.197 Grupa straszona: 8,5,8,7 M 1 =7 Grupa zachęcana: 1, 1, 2,4 M 2 =2 Średnia ogólna M=(M1+M2)/2= 4,5 Wnioskowanie statystyczne
Bardziej szczegółowoINSTRUKCJA OTWIERANIA PLIKU DPT (data point table)
INSTRUKCJA OTWIERANIA PLIKU DPT (data point table) Plik DPT jest tekstowym zapisem widma. Otwarty w notatniku wygląda następująco: Aby móc stworzyć wykres, należy tak zaimportować plik do arkusza kalkulacyjnego,
Bardziej szczegółowoDane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.
STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą
Bardziej szczegółowoZARZĄDZANIE DANYMI W STATISTICA
Wprowadzenie do STATISTICA Krzysztof Regulski AGH, WIMiIP ZARZĄDZANIE DANYMI W STATISTICA 1) Zastosowanie: STATISTICA umożliwia w zakresie zarządzania danymi m.in.: scalanie plików sprawdzanie danych sortowanie
Bardziej szczegółowoNiestandardowa tabela częstości
raportowanie Niestandardowa tabela częstości Przemysław Budzewski Predictive Solutions Do czego dążymy W Generalnym Sondażu Społecznym USA w 1991 roku badaniu poddano respondentów należących do szeregu
Bardziej szczegółowoVI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Bardziej szczegółowoPorównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Bardziej szczegółowoEkonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej
Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Paweł Cibis pawel@cibis.pl 23 lutego 2007 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa
Bardziej szczegółowoKatedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Temat: Analiza wariancji jednoczynnikowa Przykład 1 MS EXCEL Sprawdź czy genotyp jagniąt wpływa statystycznie na cechy użytkowości rzeźnej? Obliczenia wykonaj za pomocą modułu Analizy danych (jaganova.xlsx).
Bardziej szczegółowoSatysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie
Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością
Bardziej szczegółowoWeryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)
Bardziej szczegółowoRozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):
Rozkłady dwuwymiarowe Rozkłady brzegowe Rozkłady warunkowe Niezależność Kowariancja Współczynnik korelacji (Przykłady na tablicy) Tablice dwudzielcze Najprostsze tablice 2x2 : dwa rzędy i dwie kolumny
Bardziej szczegółowoAbacus Tychy, ul. Pod Lasem 20 tel
Abacus Tychy, ul. Pod Lasem 20 www.abacus.tychy.pl adam.lazarski@abacus.tychy.pl tel. 601 411 384 Tychy 2014 Program komputerowy PAW, PUNKTOWA ANALIZA WARTOŚCIOWANIA STANOWISK PRACY jest narzędziem wspomagającym
Bardziej szczegółowoWnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Bardziej szczegółowo166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Bardziej szczegółowoWykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
Bardziej szczegółowoPorównanie wyników grupy w odniesieniu do norm Test t dla jednej próby
Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby 1. Wstęp teoretyczny Prezentowane badanie dotyczy analizy wyników uzyskanych podczas badania grupy rodziców pod kątem wpływu ich przekonań
Bardziej szczegółowoAnalizy wariancji ANOVA (analysis of variance)
ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza
Bardziej szczegółowoWnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Bardziej szczegółowoSpis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23
Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Plik... 7 Okna... 8 Aktywny scenariusz... 9 Oblicz scenariusz... 10 Lista zmiennych... 11 Wartości zmiennych... 12 Lista scenariuszy/lista
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Bardziej szczegółowoAnaliza wariancji. dr Janusz Górczyński
Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik
Bardziej szczegółowoWNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
Bardziej szczegółowoetrader Pekao Podręcznik użytkownika Strumieniowanie Excel
etrader Pekao Podręcznik użytkownika Strumieniowanie Excel Spis treści 1. Opis okna... 3 2. Otwieranie okna... 3 3. Zawartość okna... 4 3.1. Definiowanie listy instrumentów... 4 3.2. Modyfikacja lub usunięcie
Bardziej szczegółowoWykład 2: Arkusz danych w programie STATISTICA
Wykład 2: Arkusz danych w programie STATISTICA Nazwy przypadków Numer i nazwa zmiennej Elementy arkusza danych Cechy statystyczne Zmienne (kolumny) Jednostki statystyczne Przypadki (wiersze) Tworzenie
Bardziej szczegółowob) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:
ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań
Bardziej szczegółowoProgram EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu
Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu http://www.jarsoft.poznan.pl/ 1. STRUKTURA PROGRAMU Program EWIDENCJA ODZIEŻY ROBOCZEJ jest aplikacją pracującą
Bardziej szczegółowoweryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Bardziej szczegółowoTestowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
Bardziej szczegółowoZadanie 1. Analiza Analiza rozkładu
Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja
Bardziej szczegółowoĆwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.
Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby
Bardziej szczegółowoWydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Bardziej szczegółowoWykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Bardziej szczegółowoWykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA
Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA Dobór metody prezentacji danych Dobór metody prezentacji danych zależy od: charakteru danych
Bardziej szczegółowoW statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1
Temat: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00 0,20) Słaba
Bardziej szczegółowoInstalacja i obsługa aplikacji MAC Diagnoza EP w celu wykonania Arkusza obserwacji
Instalacja i obsługa aplikacji MAC Diagnoza EP w celu wykonania Arkusza obserwacji Uruchom plik setup.exe Pojawi się okno instalacji programu MAC Diagnoza EP. Wybierz przycisk AKCEPTUJĘ. Następnie zainstaluj
Bardziej szczegółowoEkonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
Bardziej szczegółowoWIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Bardziej szczegółowoRÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Bardziej szczegółowoWYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
Bardziej szczegółowo1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:
Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane
Bardziej szczegółowoStatystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Bardziej szczegółowoBiblioteki publiczne
Instrukcja pracy w programie do gromadzenia danych statystycznych w ramach projektu Analiza Funkcjonowania Bibliotek Biblioteki publiczne Spis treści 1. Użytkownicy i uprawnienia 1 2. Logowanie/rejestracja
Bardziej szczegółowoBiblioteki publiczne
Instrukcja pracy w programie do gromadzenia danych statystycznych w ramach projektu Analiza Funkcjonowania Bibliotek Biblioteki publiczne Spis treści 1. Użytkownicy i uprawnienia 1 2. Logowanie/rejestracja
Bardziej szczegółowoBadanie normalności rozkładu
Temat: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność
Bardziej szczegółowoStatystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych
Bardziej szczegółowoTablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Bardziej szczegółowoweryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoBadanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa
Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Test serii (test Walda-Wolfowitza) Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane
Bardziej szczegółowoKatedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Temat: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. MS EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w MS Excelu wykorzystujemy funkcję o nazwie T.TEST.
Bardziej szczegółowoKancelaria 2.19 - zmiany w programie czerwiec 2011
1. Finanse, opcje faktur a. Wprowadzono nowe szablony numerowania faktur: nr kolejny w roku/miesiąc/rok, numer kolejny w miesiącu/miesiąc/rok oraz numer kolejny w roku/dowolny symbol/rok. b. Wprowadzono
Bardziej szczegółowoStatystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Bardziej szczegółowo