(autor Piotr Kwiatkowski)

Wielkość: px
Rozpocząć pokaz od strony:

Download "(autor Piotr Kwiatkowski)"

Transkrypt

1 Test chi-kwadrat (autor Piotr Kwiatkowski) W badaniach z zakresu nauk społecznych analizowane zmienne często występują w postaci jakościowej (nominalnej). Zmienność polega na tym, że w badanej populacji poszczególne osoby można przypisać do różnych i rozłącznych kategorii (np. zmienność płci sprowadza się do występowania dwóch kategorii - mężczyzna, kobieta zaś zmienność rodzaju wykształcenia sprowadzic można do czterech kategorii - humanistyczne, matematycznoprzyrodnicze, techniczne, artystyczne). Wiele problemów badawczych w naukach społecznych to pytania o zależności między takim właśnie zmiennymi. Co oznacza termin zależność (określenia bliskoznaczne to związek między zmiennymi albo korelacja)? W opisywanym tu kontekście oznacza on, że istnieje taka prawidłowość w układzie danych, że pewnym wartościom zmiennej A częściej da się przypisać pewne wartości zmiennej B. Inaczej mówiąc, jeśli określone osoby różnią się wartością zmiennej A, to w pewien sposób różnią się także wartościami zmiennej B. Trzymając się podanego przykładu - jeśli poklasyfikujemy ludzi jednocześnie wg płci i wg wykształcenia, to o zależności wykształcenia od płci powiemy, jeżeli pewne rodzaje wykształcenia częściej pojawiają się wśród kobiet a inne rodzaje wykształcenia częściej pojawiają się u mężczyzn. Gdyby poszczególne kategorie wykształcenia z jednakową częstością pojawiały się wśród kobiet i wśród mężczyzn, to nie byłoby podstaw do wnioskowania o istnieniu zależności. W praktyce z reguły stwierdza się jakieś różnice tego rodzaju większe lub mniejsze. Im są one większe, tym mniej jest prawdopodobne, że powstały w wyniku działania czynników losowych. W badaniach statystycznych jakie by one nie były zawsze dążymy do uzyskania odpowiedzi na pytanie jakie jest prawdopodobieństwo, że wykryty w badanym zbiorze układ danych powstał w wyniku działania czynnika losowego (prawdopodobieństwo błędnego czy - jak ktoś woli - niesłusznego odrzucenia tzw. hipotezy zerowej). Zwróćmy uwagę, że określając prawdopodobieństwo przypadkowości uzyskanych wyników wyznaczamy automatycznie prawdopodobieństwo ich nieprzypadkowości, ponieważ prawdopodobieństwa obu wykluczających się alternatyw sumują się do jedności (lub do 100%). Jeśli uznamy, że losowy rozkład danych w populacji generalnej jest mało prawdopodobny, to musimy przyjąć, że istnienie prawidłowości jest wysoce prawdopodobne. W statystyce mówimy w tym kontekście o istotności rezultatów badań (istotne statystycznie oznacza więc tyle, co z niewielkim prawdopodobieństwem losowe ). Zanim przystąpimy do omawiania technicznej strony obliczeń chi-kwadrat, jeszcze jedna uwaga ogólna. Dotyczy ona tego czym są badania statystyczne i na jakich założeniach się opierają. Wnioskowanie statystyczne ma charakter indukcyjny, czyli polega na uogólnianiu wyników (z tzw. próby na populację generalną). Zakładamy, że jeśli próba została pobrana w sposób losowy, to dane z próby są odzwierciedleniem wszelkich prawidłowości obecnych w populacji generalnej, zaś wszelkie odchylenia od tych prawidłowości występujące w próbie mają charakter losowy (nazywamy je błędem losowym). Jeśli próba jest duża, to mówiąc obrazowo owe odchylenia giną w masie.

2 Każdy test statystyczny prowadzi do określenia istotności czyli do ustalenia prawdopodobieństwa słuszności hipotezy zerowej. Hipotezę zerową możemy w wyniku testu odrzucić (jako mało pradopodobną) albo stwierdzić, że brak jest podstaw do odrzucenia hipotezy zerowej (jeśli prawdopodobieństwo jej słuszności jest zbyt duże). W statystyce przyjmuje się, że do odrzucenia hipotezy zerowej upoważnia jej prawdopodobieństwo mniejsze niż 0,05. Granica ta jest jednak umowna i w pewnych okolicznościach może być przesunięta (ale raczej w dół, tzn. możemy wyznaczyć ją na 0,02 albo 0,01 czy 0,001 a uzasadnieniem dla takiego zabiegu może być na przykład bardzo duża liczebność próby). Na marginesie uwaga hipotezy zerowej nie da się udowodnić, bowiem na gruncie indukcji nie można udowodnić nieistnienia czegokolwiek (w tym niestnienia zależności). Jeśli w badanej próbie nie zaobserwowano zakładanej hipotetycznie zależności między zjawiskami lub innej właściwośc,i to nie oznacza, że nie występuje ona w populacji generalnej choćby w niewielkim zakresie. Hipotezę zerową można odrzucić, gdy przemawiają za tym wyniki uzyskane w próbie ale nie można jej potwierdzić w takich badaniach. Dlatego hipotez badawczych nigdy nie formułujemy w brzmieniu hipotezy zerowej, gdyż były one nieweryfikowalne - nie da się udowodnić tezy o równości inteligencji kobiet i mężczyzn, gdyż próbowalibyśmy udowodnić nieistnienie różnic w populacji generalnej na podstawie danych z próby czyli wycinka tej populacji. Gdybyśmy jednak uzyskali pewne różnice i w wyniku testowania statystycznego danych z próby (pobranej w sposób losowy!!!) uznali, że przypadkowość tychże różnic jest mało prawdopodobna, to mielibyśmy prawo odrzucić hipotezę zerową, mówiącą o równości inteligencji obu płci. Teraz przejdźmy do konkretów. W przypadku testu chi-kwadrat będziemy testować hipotezę zerową, która mówi w populacji generalnej rozkład poszczególnych kombinacji wartości dwóch zmiennych ma charakter losowy. Przyjmiemy na wstępie, że kryterium istotności będzie wartość prawdopodobieństwa hipotezy zerowej mniejsza niż 0,05 (zapisujemy to prawdopodobieństwo symbolem p albo grecką literą alfa - czyli p<0,05). Przyjmijmy też do wiadomości, że stosowanie testu chi-kwadrat wymaga spełnienia pewnych warunków co do liczby analizowanych przypadków - ale o tym za chwilę. Na początek będzie nam potrzebna tabela z wynikami badań. Tabela pokaże nam ile osób zbadano w próbie, jak często w próbie pojawiały się poszczególne wartości jednej i drugiej zmiennej oraz jak często w próbie pojawiały się wszystkie możliwe kombinacje wartości obu zmiennych. Tabela musi zawierać liczebności bezwzględne (nazywane czasem liczebnościami surowymi). Pomijamy liczebności względne czyli np. rozkład procentowy, gdyż do obliczeń używamy dane surowe. Przykładowa tabelka poniżej. Rodzaj preferowanego wykształcenia Płeć Humanistyczne Matemat-przyrod. Techniczne Artystyczne Razem Mężczyźni Kobiety Razem Teraz sprawdzimy, czy zasadne jest posłużenie się testem chi-kwadrat. Przyjmuje się, że żadna z liczebności brzegowych w tabeli nie może być mniejsza niż 20. W naszym przykładzie wszystkie wartości są wyższe niż 20 a zatem nic nie stoi na przeszkodzie, by dokonać dalszych obliczeń.

3 Test chi-kwadrat opiera się na porównaniu liczebności bezwzględnych uzyskanych w badaniu empirycznym z liczebnościami, które ujawniłyby się, gdyby dane w tabeli odzwierciedlały losowe przyporządkowanie wartości jednej zmiennej do wartości drugiej zmiennej. Porównanie dotyczy zatem tzw. liczebności empirycznych i liczebności teoretycznych. Liczebności empiryczne mamy już gotowe po zliczeniu danych z próby, zaś liczebności teoretyczne trzeba dopiero obliczyć. Obliczenia te wykonywane sa osobno dla każdego pola w tabeli (z wyjątkiem brzegowych), czyli dla każdej liczebności empirycznej wyznaczamy jej teoretyczny odpowiednik. Obliczenie liczebności teoretycznej polega na wymnożeniu dwóch sum brzegowych odpowiadających danemu polu tabeli i podzieleniu uzyskanej wartości przez całkowitą liczebność próby. Liczebności teoretyczne zaokrąglamy do dwóch miejsc po przecinku. Teraz powinniśmy sprawdzic poprawność wyliczeń sumy brzegowe liczebności teoretycznych powinny być równe sumom brzegowym liczebności empirycznych. Bardzo drobne różnice mogą wynikać z faktu zaokrąglania. Przystępujemy do obliczania cząstowych wartości chi-kwadrat dla każdej pary liczebności teoretycznych i empirycznych (czyli dla każdego pola naszej tabeli roboczej). Korzystamy z następującego wzoru: (E T) 2 /T czyli podniesioną do kwadratu różnicę liczebności teoretycznej i empirycznej dzielimy przez liczebność teoretyczną. Wyniki zaokrąglamy do 3 miejsc po przecinku. Sumujemy teraz wszystkie wartości cząstkowe otrzymując wartość testu chi-kwadrat. Wartość testu chi-kwadrat posłuży nam teraz do określenia istotności statystycznej - poprzez ustalenie prawdopodobieństwa hipotezy zerowej dla naszych danych. Można to prawdopodobieństwo wyliczyć dokładnie, korzystając z dostępnego programu (kalkulator testu w darmowym pakiecie GRETL) albo korzystając z tzw. tablic statystycznych określić czy jest ono mniejsze niż ustalona na wstępie wartość (np. p<0,05). Oba warianty wymagają dodatkowego obliczenia. Trzeba określić tzw. liczbę stopni swobody dla naszej tabeli z danymi. Wzór jest prosty df = (w-1)(k-1) czyli iloczyn pomniejszonej o 1 liczby wierszy i pomniejszonej o 1 liczby kolumn w tabeli (nie licząc brzegowych i nagłówków). W naszym przykładzie df = (2-1)(4-1) = 3. Znając wartość df i przyjmując wartość p=0,05 odczytujemy z tablicy statystycznej jaka odpowiada im wartość krytyczna chi-kwadrat. Porównany teraz obliczoną z danych empirycznych wartość chi-kwadrat dla naszej tabeli z wydobytą z tablicy wartościa krytyczną. Możliwe są dwie alternatywy: 1) Wartość empiryczna jest mniejsza bądź równa wartość krytycznej, co prowadzi do konkluzji o braku podstaw do odrzucenia hipotezy zerowej (badania nie potwierdzają zależności) albo 2) wartość empiryczna jest większa od wartości krytycznej, co oznacza że istnieją podstawy do odrzucenia hipotezy zerowej z prawdopodobieństwem błędu mniejszym niż 0,05 (badania potwierdzają istnienie zależności).

4 Tablica statystyczna. Wartości krytyczne chi-kwadrat dla wybranych poziomów istotności. Założony poziom istotności (p) Stopnie 0,100 0,050 0,025 0,010 0,005 swobody (df) 1 2,7055 3,8415 5,0239 6,6349 7, ,6052 5,9915 7,3778 9, ,5965 6,2514 7,8147 9, , ,8381 7,7794 9, , , ,8602 9, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,3194 Teraz możemy dokonać prezentacji wyniku w postaci edytowalnej tabeli. Dla lepszej ilustracji uwzględniamy w niej oprócz surowych liczebności zestawienie procentowe. Bezpośrednio pod tabelą umieszczamy wynik testu statystycznego składający się z trzech informacji: wartość chi-kwadrat, df oraz wartość p. Na koniec jeszcze jedna ważna uwaga. Wartość testu chi-kwadrat jest zależna od wielkości zbioru. Identyczne proporcje w tabeli dla próby pięciokrotnie większej przyniosą pięć razy większą wartość testu. Zatem wartość ta nie może być wykorzystana dla porównania siły związku między zmiennymi w próbach różniących się liczebnością. Z kolei uzależnienie wartości krytycznych testu od liczby stopni swobody czyni nieporównywalnymi wyniki uzyskane w tabelach różniących się liczbą kolumn lub wierszy. Aby takie porównania były możliwe należy przeliczyć wartość chi-kwadrat na adekwatny do rodzaju danych współczynnik siły związku. Może to być na przykład współczynnik V-Cramera. Współczynniki tego rodzaju są po prostu miarami korelacji między zmiennymi nominalnymi i pozwalają zorientować się w mocy predykcyjnej jednaj zmiennej względem drugiej. Im bliżej zera, tym mniejsza możliwość przewidywania wartości jednej zmiennej na podstawie znanej wartości drugiej zmiennej, im bliżej 1, tym możliwość trafnego przewidywania jest większa.

5 Zadania 1. Oblicz samodzielnie wartość chi-kwadrat i oceń istotność zależności z podanej wyżej przykładowej tabeli (odpowiedź: wartość obliczona w kalkulatorze pakietu statystycznego wynosi 58,731 - czy tyle wyszło w Twoich obliczeniach?). 2. Oblicz współczynnik V Cramera (odpowiedź: 0,37) W kolejnym materiale pokażę, jak wykonać obliczenia za pomocą darmowych pakietów MyStat i GRETL. VERTE.

6 Chi-kwadrat dla leniwych Jeśli dysponujesz gotową tabelą wielodzielczą z danymi uzyskanymi z próby, to zamiast liczyć chi-kwadrat na piechotę skorzystaj z dostępnego w internecie kalkulatora. Link do dobrego kalkulatora ze strony amerykańskiego uniwersytetu Na podanej stronie masz najpierw krótkie wyjaśnienia a potem kalkulator. Są to puste ramki, w które wpisujesz liczebności. Zwyczajnie przepisujesz pola swojej tabeli z danymi (pomijając sumy brzegowe, bo kalkulator sam je obliczy). Potem jedno kliknięcie (Calculate) i w ramkach na dole pojawią się obliczenia. Zwróć uwagę na poprawkę Yatesa. Jeśli pojawi się chi-kwadrat z uwzlędnieniem tej poprawki, to znaczy, że dane zawierały zbyt małe liczebności i stąd konieczne było zastosowanie tej korekty. W tej sytuacji do wnioskowania o zależności między zmiennymi wykorzystaj tylko obliczenia poprawione (tylko te podaj w legendzie pod tabelą).

7 Może zaskoczyć Cię formuła wyniku jeśli liczba p-value zawierałaby dużo zer po przecinku, to wyświetla się wyrażenie, oznaczające pewną liczbę wymnożoną przez dziesięć do ujemnej potęgi. Inny, prosty kalkulator znajdziesz w programie GRETL (program do ściągnięcia z internetu - legalny i darmowy a do tego spolszczony). Niestety kalkulator służy tylko do obliczenia istotności. W okienka programu musisz wpisać obliczoną wartość chi-kwadrat i liczbę stopni swobody (df). Jedno kliknięcie i wyświetli się poziom istotności. Wchodzisz do programu. Klikasz na górnym pasku pole Narzędzia. Z menu wybierz Wyznaczanie wartości p. W okienku pojawi się pasek narzędziowy - wybierz w nim opcję opcję chi-kwadrat. Zobaczysz dwie ramki do wypełnienia - df oraz wartość chi-kwadrat. Klikasz OK i gotowe. Istotność czyli p jest tu nazwana prawostronny obszar krytyczny.

8 Powyższe sposoby mają tę wadę, że trzeba najpierw samodzielnie zbudować tabelę z wynikami. Przy dużej ilości tabel oznacza to bardzo dużo pracy. Do zbudowania tabel krzyżowych lepiej skorzystać z funkcji arkusza kalkulacyjnego albo - jeszcze lepiej - arkusz taki zaimportować do programu statystycznego. Ta ostatnia opcja jest najlepsza, bo wystarczy tu oznaczyć zmienne do analizy i wskazać potrzebne współczynniki (oraz ewentualnie dodatkowe informacje, które się mogą przydać w analizie np. procenty w tabeli itp.), aby program wykonał potrzebne nam obliczenia i jeszcze wydrukował roboczą wersję tabeli do tekstu. W kolejnym tekście opiszę, jak taką analizę wykonać za pomocą darmowych pakietów GRETL i MyStat.

9 Obliczanie chi-kwadrat w pakiecie statystycznym MyStat 12 (darmowa wersja studencka komercyjnego pakietu SYSTAT, wymaga rejestracji na stronie producenta) Podobnie jak w innych programach tego rodzaju najpierw musisz stworzyć w nim albo wygodniej zaimportować z Excela zbiór danych. Import zbioru z excela polega na wyklikaniu ścieżki: File Open Data aż otworzy się okienko Otwieranie i w nim musisz wybrać format pliku (ramka na dole) i określić jego lokalizację (ramka Szukaj w) oraz wybrać plik do ramki Nazwa pliku. Teraz wystarczy kliknąć Otwórz i wyświetli się arkusz z danymi (prawie identyczny jak nasz Excel).

10 Dalej musisz zdefiniować potrzebną Ci procedurę statystyczną i wytypować zmienne do analizy. Test chi-kwadrat znajdujesz z paska górnego wchodząc w ścieżkę: Analyze Tables Two-Way Otworzy się okienko z domyslnie uaktywnioną pierwszą zakładką Main. Tu kolejno z lewej ramki (available variables) wybierz zmienne, po kliknięciu Add wskoczą w wiersze (row variable) oraz w kolumny (column variables) (w podanym przykładzie są to zmienne Plec i Narkoty). Teraz określ wygląd tabeli zaznaczając wybrane opcje poniżej zaznacz liczebności (Counts) oraz jak mają być sumowane procenty - albo w wierszach albo w kolumnach (row percents albo column percents). Z pozostałych opcji warto rozważyć zaznaczenie Include missing values (czyli uwzględnij brakujące dane jako odrębne wartości zmiennej). Jeśli tej opcji nie zaznaczysz, to braki danych zostaną pominięte w obliczeniach.

11 Zwróć uwagę, że podając zmienne do analizy możesz w jednej z ramek (w górnej) podać ich kilka. Program wyliczy wtedy kilka zależności od jednego kliknięcia. Teraz przejdź do drugiej zakładki w okienku czyli Measures zawiera ona statystyki, które program może policzyć - najważniejsze są Pearson chi-square czyli test chi-kwadrat Pearsona oraz Cramer s V czyli współczynnik siły związku V Cramera. Zaznacz je obie. Kliknij OK. Otrzymasz okienko z czterema tabelkami. Pierwsze dwie to dwudzielne tabele liczebności (pierwsza z liczebnościami bezwzględnymi a druga z procentowymi). Trzecia zawiera wartość testu chi-kwadrat, liczbę stopni swobody oraz wartość p. Czwarta zawiera współczynniki V Cramera.

12 Na podstawie tych danych możesz zbudować elegancką tabelę w edytorze tekstu, zaopatrzyć ją w zestawienie wyliczonych statystyk i opisać w tekście dane oraz podać decyzję o odrzuceniu albo o braku podstaw do odrzucenia hipotezy zerowej. Obliczanie chi-kwadrat z danych surowych arkusza kalkulacyjnego za pomocą programu GRETL Przygotuj sobie arkusz danych w excelu. GRETL wymaga, aby wartości zmiennych były zakodowane jako cyfry (nie toleruje liter i symboli). Przykład: kategorie nigdy czasami często należy zapisać jako 1, 2, 3 zaś płeć męska żeńska zapisz jako 0 1 albo 1 2. Zmienne ilościowe (przedziałowe lub rangowe) możesz sprowadzić do postaci nominalnej, wydzielając pewne przedziały wartości jako kategorie (np. wyniki poniżej mediany = 0 a wyniki równe lub większe od mediany = 1 albo jeśli posługujesz się normą testową, to wynik poniżej normy zapisz jako 1, wynik w przedziale normy czyli przeciętny zapisz jako 2, zaś wynik powyżej normy zapisz jako 3). W górnym wierszu excela powinna być podana nazwa każdej zmiennej (najlepiej skrót od nazwy np. kontrola rodzicielska to kontrola albo KR). Arkusz zbudowany jest z wierszy i kolumn - wiersze poziome to wyniki kolejnych osób, zaś kolumny pionowe to poszczególne zmienne. Dla przykładu fragment arkusza (płeć 0,1 i cztery zmienne przedziałowe sprowadzone do postaci nominalnej 1,2,3). Kiedy masz już prawidłowy arkusz z danymi, musisz go zaimportować do programu GRETL. Po uruchomieniu tego programu klikasz i wybierasz kolejno wg poniższej ścieżki: Plik Otwórz dane Import Excel Otworzy się okienko, w którym musisz wybrac lokalizację twojego pliku z danymi excela, zaznacz ten plik i w następnym okienku zatwierdź importowanie (domyślnie ustawione jest ono od wiersza 1 i kolumny 1). Gdy pojawi się

13 pytanie o ewentuaną zmianę typu danych - kliknij Nie (bo masz dane przekrojowe). Pojawi się teraz okienko w zestawem wszystkich zmiennych w twoim zaimportowanym zbiorze.

14 Teraz musisz zdefiniować ustawienia obliczeń. Najpierw w pasku narzędziowym na górze klikasz pole Widok a następnie z podanych Ci opcji wybierasz Tabela krzyżowa. Pojawi się okno, w którym zdefinujesz dwie zmienne do analizy zależności między nimi. Pierwsza wybrana zmienna będzie później ulokowana w wierszach tabeli, zaś druga będzie ulokowana w kolumnach. Musisz wybrać jak mają sumować się procenty (do 100%) - w wierszach czy w kolumnach? Po kliknięciu OK. komputer dokona obliczeń i wyświetli je w ramce. Zobaczysz na górze tabelę krzyżową z danymi z badań a pod spodem statystyki: chikwadrat, liczba stopni swobody i poziom istotności (czyli wartość p).

15

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko

Bardziej szczegółowo

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

dr hab. Dariusz Piwczyński, prof. nadzw. UTP dr hab. Dariusz Piwczyński, prof. nadzw. UTP Cechy jakościowe są to cechy, których jednoznaczne i oczywiste scharakteryzowanie za pomocą liczb jest niemożliwe lub bardzo utrudnione. nominalna porządek

Bardziej szczegółowo

Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4

Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4 Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4 Uwaga! Każde ćwiczenie rozpoczynamy od stworzenia w katalogu Moje dokumenty swojego własnego katalogu roboczego, w którym będziecie Państwo zapisywać swoje pliki.

Bardziej szczegółowo

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD

Bardziej szczegółowo

Zawartość. Zawartość

Zawartość. Zawartość Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami

Bardziej szczegółowo

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma

Bardziej szczegółowo

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Instrukcja obsługi programu SWWS autorstwa Michała Krzemińskiego

Instrukcja obsługi programu SWWS autorstwa Michała Krzemińskiego Instrukcja obsługi programu SWWS autorstwa Michała Krzemińskiego Krótkie informacje o programie można znaleźć zarówno w pliku readme.txt zamieszczonym w podkatalogu DANE jak i w zakładce O programie znajdującej

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Jak korzystać z przeglądarki danych ESS SoftReport

Jak korzystać z przeglądarki danych ESS SoftReport Jak korzystać z przeglądarki danych ESS SoftReport Instalacja 1. Do korzystania z przeglądarki konieczne jest zainstalowanie programu ESS SoftReport. W tym celu należy wejść na stronę internetową http://www.ifispan.waw.pl/ess

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Przypomnienie: Ćwiczenie 1.

Przypomnienie: Ćwiczenie 1. Strona1 Przypomnienie: Zmienne statystyczne można podzielić na: 1. Ilościowe, czyli mierzalne (przedstawiane liczbowo) w tym: skokowe inaczej dyskretne (przyjmują skończoną lub co najwyżej przeliczalną

Bardziej szczegółowo

x y

x y Tym razem pominę wstęp teoretyczny i skupię się na praktycznym aspekcie sprawy, czyli jak szybko policzyć korelację oraz ocenić jej istotność. Bardzo zachęcam do przejrzenia książki autorstwa Adama wspomnianej

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Edytor materiału nauczania

Edytor materiału nauczania Edytor materiału nauczania I. Uruchomienie modułu zarządzania rozkładami planów nauczania... 2 II. Opuszczanie elektronicznej biblioteki rozkładów... 5 III. Wyszukiwanie rozkładu materiałów... 6 IV. Modyfikowanie

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica 1. Zarządzanie danymi. Pierwszą czynnością w pracy z pakietem Statistica jest zazwyczaj wprowadzenie danych do arkusza. Oprócz możliwości

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych? Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

TABELE WIELODZIELCZE

TABELE WIELODZIELCZE TABELE WIELODZIELCZE W wielu badaniach gromadzimy dane będące liczebnościami. Przykładowo możemy klasyfikować chore zwierzęta w badanej próbie do różnych kategorii pod względem wieku, płci czy skali natężenia

Bardziej szczegółowo

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

Jak utworzyć plik SIO dla aktualnego spisu?

Jak utworzyć plik SIO dla aktualnego spisu? System Informacji Oświatowej Jak utworzyć plik SIO dla aktualnego spisu? Programy Arkusz Optivum, Kadry Optivum, Płace Optivum, Sekretariat Optivum oraz Księgowość Optivum dostarczają znaczną część danych

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu

Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu http://www.jarsoft.poznan.pl/ 1. STRUKTURA PROGRAMU Program EWIDENCJA ODZIEŻY ROBOCZEJ jest aplikacją wspierającą

Bardziej szczegółowo

Metody Statystyczne. Metody Statystyczne

Metody Statystyczne. Metody Statystyczne #7 1 Czy straszenie jest bardziej skuteczne niż zachęcanie? Przykład 5.2. s.197 Grupa straszona: 8,5,8,7 M 1 =7 Grupa zachęcana: 1, 1, 2,4 M 2 =2 Średnia ogólna M=(M1+M2)/2= 4,5 Wnioskowanie statystyczne

Bardziej szczegółowo

INSTRUKCJA OTWIERANIA PLIKU DPT (data point table)

INSTRUKCJA OTWIERANIA PLIKU DPT (data point table) INSTRUKCJA OTWIERANIA PLIKU DPT (data point table) Plik DPT jest tekstowym zapisem widma. Otwarty w notatniku wygląda następująco: Aby móc stworzyć wykres, należy tak zaimportować plik do arkusza kalkulacyjnego,

Bardziej szczegółowo

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie. STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą

Bardziej szczegółowo

ZARZĄDZANIE DANYMI W STATISTICA

ZARZĄDZANIE DANYMI W STATISTICA Wprowadzenie do STATISTICA Krzysztof Regulski AGH, WIMiIP ZARZĄDZANIE DANYMI W STATISTICA 1) Zastosowanie: STATISTICA umożliwia w zakresie zarządzania danymi m.in.: scalanie plików sprawdzanie danych sortowanie

Bardziej szczegółowo

Niestandardowa tabela częstości

Niestandardowa tabela częstości raportowanie Niestandardowa tabela częstości Przemysław Budzewski Predictive Solutions Do czego dążymy W Generalnym Sondażu Społecznym USA w 1991 roku badaniu poddano respondentów należących do szeregu

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Paweł Cibis pawel@cibis.pl 23 lutego 2007 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa

Bardziej szczegółowo

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy Temat: Analiza wariancji jednoczynnikowa Przykład 1 MS EXCEL Sprawdź czy genotyp jagniąt wpływa statystycznie na cechy użytkowości rzeźnej? Obliczenia wykonaj za pomocą modułu Analizy danych (jaganova.xlsx).

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)

Bardziej szczegółowo

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny): Rozkłady dwuwymiarowe Rozkłady brzegowe Rozkłady warunkowe Niezależność Kowariancja Współczynnik korelacji (Przykłady na tablicy) Tablice dwudzielcze Najprostsze tablice 2x2 : dwa rzędy i dwie kolumny

Bardziej szczegółowo

Abacus Tychy, ul. Pod Lasem 20 tel

Abacus Tychy, ul. Pod Lasem 20  tel Abacus Tychy, ul. Pod Lasem 20 www.abacus.tychy.pl adam.lazarski@abacus.tychy.pl tel. 601 411 384 Tychy 2014 Program komputerowy PAW, PUNKTOWA ANALIZA WARTOŚCIOWANIA STANOWISK PRACY jest narzędziem wspomagającym

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby 1. Wstęp teoretyczny Prezentowane badanie dotyczy analizy wyników uzyskanych podczas badania grupy rodziców pod kątem wpływu ich przekonań

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23 Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Plik... 7 Okna... 8 Aktywny scenariusz... 9 Oblicz scenariusz... 10 Lista zmiennych... 11 Wartości zmiennych... 12 Lista scenariuszy/lista

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel etrader Pekao Podręcznik użytkownika Strumieniowanie Excel Spis treści 1. Opis okna... 3 2. Otwieranie okna... 3 3. Zawartość okna... 4 3.1. Definiowanie listy instrumentów... 4 3.2. Modyfikacja lub usunięcie

Bardziej szczegółowo

Wykład 2: Arkusz danych w programie STATISTICA

Wykład 2: Arkusz danych w programie STATISTICA Wykład 2: Arkusz danych w programie STATISTICA Nazwy przypadków Numer i nazwa zmiennej Elementy arkusza danych Cechy statystyczne Zmienne (kolumny) Jednostki statystyczne Przypadki (wiersze) Tworzenie

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu

Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu http://www.jarsoft.poznan.pl/ 1. STRUKTURA PROGRAMU Program EWIDENCJA ODZIEŻY ROBOCZEJ jest aplikacją pracującą

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez

Bardziej szczegółowo

Zadanie 1. Analiza Analiza rozkładu

Zadanie 1. Analiza Analiza rozkładu Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja

Bardziej szczegółowo

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA Dobór metody prezentacji danych Dobór metody prezentacji danych zależy od: charakteru danych

Bardziej szczegółowo

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1 Temat: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00 0,20) Słaba

Bardziej szczegółowo

Instalacja i obsługa aplikacji MAC Diagnoza EP w celu wykonania Arkusza obserwacji

Instalacja i obsługa aplikacji MAC Diagnoza EP w celu wykonania Arkusza obserwacji Instalacja i obsługa aplikacji MAC Diagnoza EP w celu wykonania Arkusza obserwacji Uruchom plik setup.exe Pojawi się okno instalacji programu MAC Diagnoza EP. Wybierz przycisk AKCEPTUJĘ. Następnie zainstaluj

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład

Bardziej szczegółowo

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej: Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

Biblioteki publiczne

Biblioteki publiczne Instrukcja pracy w programie do gromadzenia danych statystycznych w ramach projektu Analiza Funkcjonowania Bibliotek Biblioteki publiczne Spis treści 1. Użytkownicy i uprawnienia 1 2. Logowanie/rejestracja

Bardziej szczegółowo

Biblioteki publiczne

Biblioteki publiczne Instrukcja pracy w programie do gromadzenia danych statystycznych w ramach projektu Analiza Funkcjonowania Bibliotek Biblioteki publiczne Spis treści 1. Użytkownicy i uprawnienia 1 2. Logowanie/rejestracja

Bardziej szczegółowo

Badanie normalności rozkładu

Badanie normalności rozkładu Temat: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę) PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Test serii (test Walda-Wolfowitza) Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane

Bardziej szczegółowo

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy Temat: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich. MS EXCEL Do weryfikacji różnic między dwiema grupami jednostek doświadczalnych w MS Excelu wykorzystujemy funkcję o nazwie T.TEST.

Bardziej szczegółowo

Kancelaria 2.19 - zmiany w programie czerwiec 2011

Kancelaria 2.19 - zmiany w programie czerwiec 2011 1. Finanse, opcje faktur a. Wprowadzono nowe szablony numerowania faktur: nr kolejny w roku/miesiąc/rok, numer kolejny w miesiącu/miesiąc/rok oraz numer kolejny w roku/dowolny symbol/rok. b. Wprowadzono

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo