Jedzenie w kawiarni KLASYCZNE PRZEBOJE

Wielkość: px
Rozpocząć pokaz od strony:

Download "Jedzenie w kawiarni KLASYCZNE PRZEBOJE"

Transkrypt

1 Jedzenie w kawiarni W pewnej kawiarni puszczano trojakiego rodzaju podkład muzyczny do posiłku ballady rockowe, klasyczne przeboje lub muzykę taneczną. Badano czas przeznaczony przez losowo wybranych gości na spożycie zamówionych posiłków oraz ich cene, gdy w tle puszczano odpowiedni podkład muzyczny. Wyniki poszczególnyh obserwacji przedstawiają się następująco. BALLADY ROCKOWE KLASYCZNE PRZEBOJE MUZYKA TANECZNA CENA CZAS CECNA CZAS CENA CZAS 41, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , Przygotuj zbiór danych w SPSS i wprowadź uzyskane w badaniu wyniki 2. Oblicz ile złotych na minutę wydał każdy z badanych gości - CENA WDYATEK CAS 3. Dokonaj opisu statystycznego badanych zmiennych średnia, mediana, odch. standardowe, skośność, kurtoza zinterpretuj uzyskane wskaźniki i scharakteryzuj rozkład wyników posługując się nakreślonym histogramem. 4. Zweryfikuj hipotezę, że im szybszy jest podkład muzyczny (ballady rockowe są najmniej szybkie, klasyczne przeboje są nieco szybsze, muzyka taneczna jest najszybsza) tym więcej czasu goście kawiarni spędzają na konsumpcji i tym więcej wydają pieniędzy. a. Jakiej metody statystycznej należy użyć? b. Podaj odpowiednie statystyki i wskaźniki oraz ich interpretację dla potwierdzenia postawionej przez Ciebie tezy. Karol Karasiewicz 1

2 Odpowiedzi 1. Przygotuj zbiór danych w SPSS i wprowadź uzyskane w badaniu wyniki W badaniu można wyróżnić cztery zmienne pierwszą jest rodzaj (jak można wnioskować również tempo) podkładu muzycznego (zmienna prawdopodobnie nominalna, choć w dalszej części gdzie pytano o związek z tempem można wysunąć przypuszczenie, że zakładano jej charakter porządkowy), 1 Ballady Rockowe, 2 Klasyczne przeboje, 3 Muzyka taneczna. Kolejna zmienna to CZAS konsumpcji (zmienna ilościowa) i CENA zamówionego posiłku (zmienna ilościowa). W zbiorze będzie zatem 30 wierszy ponieważ jest 30 obserwacji (prawdopodobnie 30 gości, 30 zamówionych posiłków). Fragment zbioru danych zapisanego w pliku SPSS przedstawia się następująco: Ryc. 1 CENA WDYATEK 2. Oblicz ile złotych na minutę wydał każdy z badanych gości - CAS Aby wykonać to zadanie, należy jedynie wyliczyć nową zmienną WYDATEK która jest wynikiem dzielenia zmiennej CENA przez zmienną CZAS. Więc należy wybrać polecenie PRZEKSZTAŁCENIA OBLICZ WARTOŚCI. Karol Karasiewicz 2

3 Ryc. 2 I w otwartym oknie kreatora obliczania wartości nowej zmiennej należy wpisać nazwę nowej zmiennej do pola Zmienna wynikowa oraz funkcję obliczającą żądany iloraz poprzez wpisanie CENA/CZAS. Ryc. 3 W edytorze danych pojawi się nowa zmienna WYDATEK, która wskaże, ile złotych w przeliczeniu na jedną minutę wizyty wydał każdy z gości w czasie posiłku. 3. Dokonaj opisu statystycznego badanych zmiennych średnia, mediana, odch. standardowe, skośność, kurtoza zinterpretuj uzyskane wskaźniki i scharakteryzuj rozkład wyników posługując się nakreślonym histogramem. Wykonanie tego zadania wymaga użycia jednej z opcji analizy rozkładu np. procedury analizy częstości ANALIZA OPIS STATYSTYCZNY CZĘSTOŚCI. Oddzielnie analizę tę należy przeprowadzić dla zmiennej nominalnej (tutaj MUZYKA) oraz zmiennych ilościowych (tutaj CENA, CZAS, WYDATEK). Dla zmiennej nominalnej analiza częstości posłuży jedynie do tego, aby wskazać, ile (i jaki to stanowiło odsetek całości próby) było obserwacji w towarzystwie muzyki rockowej, klasycznych przebojów i muzyki tanecznej. Interesować nas będą jedynie liczebności i procenty. Choć te ostatnie w małym stopniu, ponieważ primo zmienna jest zmienną niezależną ją się kontroluje a secundo, liczba obserwacji jest mała (znacznie poniżej 100) i dlatego procent jest miarą mało informatywną. Oczywiście dla zmiennych ilościowych warto wskazać szereg podstawowych statystyk wymienionych w poleceniu oraz oszacować normalność rozkładu poprzez histogram. Karol Karasiewicz 3

4 Ryc. 4 A więc dla oszacowania liczebności prób obserwacji w towarzystwie określonej muzyki należy w otwartym oknie kreatora analizy częstości wskazać wszystkie zmienne nominalne tutaj MUZYKA i w oknie WYKRESY zażądać wykresów kołowych. Ryc. 5 W wyniku analizy po zaakceptowaniu wszystkich ustawień otrzymamy raport z podsumowaniem liczby obserwacji w poszczególnych grupach.w odniesieniu do zmiennej MUZYKA jest to raport nieszczególnie interesujący w każdym warunku eksperymentalnym jest N=10 tyle samo obserwacji. PODKŁAD MUZYCZNY Ważne Procent Procent Częstość Procent ważnych skumulowany BALLADY ROCKOWE 10 33,3 33,3 33,3 KLASYCZNE PRZEBOJE 10 33,3 33,3 66,7 MUZYKA TANECZNA 10 33,3 33,3 100,0 Ogółem ,0 100,0 Karol Karasiewicz 4

5 Natomiast w odniesieniu do CENY, CZASU i WYDATKU zmiennych ilościowych należy przeprowadzić tę samą procedurę analizy częstości, lecz przy wyborze WYKRESÓW należy wskazać histogram z kryzwą normalną, natomiast w polu STATYSTYKI należy wskazać średnią, medianę, odh. Standardowe, medianę, minimum i maksimum oraz skośność i kurtozę. Ryc. 6 Po zaakceptowaniu ustawień otrzymamy raport z podsumowaniem statystyk opisowych oraz wykresami funkcji gęstości rozkładu normalnego dla liczebności obserwowanych i oczekiwanych w poszczególnych zmiennych. Goście spędzili na posiłku od 17 do 39 minut i w tym czasie wydali od 8,88 do 47,24 złotych. Przeciętnie gość spędził na posiłku M=27,10 minuty z odchyleniem standardowym SD=5,403 minuty i wydał w tym czasie M=28, złotego z odchyleniem standardowym SD=8,86102 złotego. Przeciętny gość zatem na posiłek przeznacza od 19,16528 do 28,26złtegi i spożywa go w czasie od 21,697 do 27,00 minuty. Połowa gości na posiłek wydaje co najwyżej 28,2600 złotego i spożywa go w czasie nie dłuższym niż 27 minut. 1 Wydaje się oczywiste, że w normalnym raporcie wszystkie wartości byłyby ograniczone do dwóch miejsc po przecinku, ale dla ułatwienia Czytelnikowi odnalezienia wartości w tabeli podano je z dokładnością taką, jaką raportuje to SPSS. Karol Karasiewicz 5

6 Statystyki N CENA ZAMÓWIO NYCH PRODUKT ÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENI U NA MINUTĘ KONSUMPCJI Ważne Braki danych Średnia 28, ,10 1,1087 Mediana 28, ,00 1,0188 Odchylenie standardowe 8, ,403,48299 Skośność,173,173,377 Błąd standardowy skośności,427,427,427 Kurtoza -,194 -,082 -,838 Błąd standardowy kurtozy,833,833,833 Minimum 8,88 17,23 Maksimum 47, ,10 Na podstawie wskaźników skośności i kurtozy (mieszczących się w przedziale od-0,7 do 0,7) można powiedzieć, że oba rozkłady pomiarów pomiar czasu i ceny spożytego posiłku są rozkładami względnie symetrycznymi i mezokurtycznymi. Można zatem powiedzieć, że liczba gości, którzy zapłacili za posiłek mniej niż średnia jest zbliżona do liczby gości płacących więcej niż średnia i analogicznie w odniesieniu do czasu liczba gości spędzających w kawiarni mniej czasu niż średnia jest zbliżona do liczby gości spędzających więcej czasu niż średnia. Zróżnicowanie wyników można uznać za przeciętne. Karol Karasiewicz 6

7 CENA ZAMÓWIONYCH PRODUKTÓW 6 Częstość ,00 20,00 40,00 CENA ZAMÓWIONYCH PRODUKTÓW Średnia =28,0263 OdchStd. =8,86102 N =30 Natomiast rozkład wyników pomiaru wydatku na posiłek w przeliczeniu na jedną minutę wizyty okazują się nieznacznie różnić od rozkładu normalnego charakteryzują się dość wyraźną spłaszczeniem (Kurtoza=-0,838), co oznacza dość duże zróżnicowanie badanej próbki pod względem poziomu wydatków na posiłek w przeliczeniu na jedną minutę wizyty. I rzeczywiście w badanej próbie goście na posiłek wydali w przeliczeniu na jedną minutę od 0,23 złotego do 2,10 złotego. Przeciętnie gość wydał M=1,1087 złotego na minutę z odchyleniem standardowym SD=1, 0188 co oznacza, że typowy gość wydaje w przeliczeniu na jedną minutę od 0,0899 złotego 2,1275. Karol Karasiewicz 7

8 4. Zweryfikuj hipotezę, że im szybszy jest podkład muzyczny (ballady rockowe są najmniej szybkie, klasyczne przeboje są nieco szybsze, muzyka taneczna jest najszybsza) tym więcej czasu goście kawiarni spędzają na konsumpcji i tym więcej wydają pieniędzy. Tutaj jest dość trudna kwestia do rozstrzygnięcia związana z charakterem zmiennej MUZYKA (Tempo tła muzycznego). Z jednej strony logicznym się wydaje, że Ballady Rockowe, Klasyczne przeboje i Muzyka Taneczna należą do innych kategorii, a więc stanowią inną jakość - ergo tworzą zmienną nominalną. Jednakże instrukcja przekazana w hipotezie może sugerować, że zmienna jednak ma charakter porządkowy i należy ją traktować, jak wynik pewnego uporządkowania. Ten dylemat metodologiczny implikuje pewien problem natury statystycznej. Ponieważ, jeśli zmienną MUZYKA traktować jako zmienną nominalną, do oszacowania jej związku ze zmienną ilościową (tzn. CENA, CZAS i WYDATEK) można wykorzystać jednoczynnikową ANOVA. Jeśli natomiast zmienną tę traktować, jak zmienną porządkową nasuwa się rozwiązanie poprzez analizę zależności metodą r ho Spearmana. Bezpieczniejsze wydaje się skorzystanie z metody jednoczynnikowej ANOVA. Każdą zmienną porządkową można traktować, jak zmienną nominalną obniżenie skali szacunkowej jest dopuszczalne, nigdy podwyższenie. A jednocześnie nie mamy podstaw, aby sądzić, że tempo podkładu muzycznego liniowo wiąże się z czasem spożycia, czy ceną zamówionego posiłku. a. Jakiej metody statystycznej należy użyć? Dla oszacowania związku między tempem muzyki, a czasem i ceną oraz wydatkiem w złotych na minutę należy przeprowadzić test jednoczynnikowej ANOVA. W tym celu należy kliknąć ANALIZA PORÓWNYWANIE ŚREDNIECH JEDNOCZYNNIKOWA ANOVA. Ryc. 7 W otwartym oknie kreatora analizy należy zdefiniować zmienne zależne są to zmienne ciągłe o rozkładzie normalnym (Tutaj CENA, CZAS i WYDATEK). Następnie zdefiniować czynnik, tzn. zmienną niezależną jest to zmienna nominalna o więcej niż dwie kategoriach (tutaj jest to MUZYKA). Karol Karasiewicz 8

9 Ryc. 8 Następnie koniecznie należy zdefiniować żądanie odpowiednich statystyk i wykresów poprzez kliknięcie na przycisk OPCJE. Warto wybrać statystyki opisowe testy jednorodności wariancji oraz mocne testy równości średnich Browna-Forsythe i wykres średnich. Ryc. 9 I wreszcie należy zdefiniować testy kontrastów lub testy post hoc dla oszacowania dokładnych różnic między porównywanymi warunkami. Wybierzmy jedne i drugie, choć w praktyce należy raczej zdecydować się na jedne z nich. Zacznijmy od testów post hoc. Służą one do oszacowania różnic między poszczególnymi parami grup. Najczęściej wykorzystywanymi testami post hoc to NIR (najmniej restrykcyjny, daje najwięcej istotnych statystycznie różnic), test Tukey a (w wersji A jest to test dla grup równolicznych, w wersji B dla grup nierównolicznych) lub test T2Tamhane a. Często też, gdy prowadzone są eksperymenty z tzw. grupą kontrolną wykorzystywany jest test Dunnetta, który przeprowadza tylko porównania parami między grupą kontrolną (grupa ta musi być pierwsza lub ostatnia w definicji zmiennej niezależnej) a każdą inną grupą. Ryc. 10 Oczywiście w rzeczywistym badaniu należy zdecydować się na jedno z rozwiązań, w tym opracowaniu przeprowadzone będą wszystkie testy dla pokazania różnicy między nimi. Karol Karasiewicz 9

10 I wreszcie testy kontrastów definiowane poprzez przycisk KONTRASTY. Jednakże zanim przejdziemy do technicznego problemu definiowania kontrastów, należy wspomnieć kilka słów o ich logice. Testy kontrastów to testy szczegółowej hipotezy alternatywnej. O ile jednoczynnikowa ANOVA (tzw. Omnibus F) pozwala oszacować istotność związku między zmienną niezależną i zależną, a testy post hoc pozwalają na oszacowanie istotności różnic między każdą parą średnich, to kontrasty pozwalają zdefiniować dokładnie interesujące różnice nie tylko między parami średnich, ale między średnią jednej grupy i średnią wszystkich pozostałych grup itd. Ponadto kontrasty pozwalają odpowiedzieć na pytanie, czy różnice między średnimi układają się w odpowiednim trendzie liniowym, kwadratowym itd. Najważniejsze, aby pamiętać, że istnieją trzy proste reguły dotyczące definiowania współczynników kontrastów: Każda średnia (każda grupa) powinna otrzymać własny współczynnik (wagę) kontrastu Suma wszystkich współczynników kontrastów powinna wynosić 0 Jeśli dwie grupy otrzymują taki sam współczynnik kontrastu (np. 1 i 1) ich średnie są uśredniane, jeśli przeciwny (np. -1 i 1) są porównywane, jeśli współczynnik dla danej grupy wynosi 0 jej średnia nie jest uwzględniana w porównaniach. Tak więc zdefiniujmy współczynniki kontrastów dla trzech hipotez, które (jak się wydaje) możemy założyć mając podstawową wiedzę odnośnie praw rządzących zachowaniami konsumenta: Wyniki uzyskane przy muzyce tanecznej różnią się od średniej uzyskanej przy balladach rockowych i klasycznych przebojach Istnieje istotny statystycznie liniowy trend zależności między tempem muzyki i ceną oraz czasem i wydatkiem na posiłek. Tzn, że zależność ma charakter liniowy Istnieje istotny nieliniowy (kwadratowy) trend zależności między tempem muzyki i ceną oraz czasem i wydatkiem na posiłek. Tzn. że zależność ta jest krzywoliniowa do pewnego momentu ma charakter rosnący, potem malejący. Zatem przejdźmy do technicznej strony definiowania kontrastów w SPSS. Dla zdefiniowania trendu, tzn. odpowiedzi na pytanie, czy zależność ma określony charakter liniowy lub nieliniowy wystarczy wskazać najwyższy interesujący nas wielomian w naszym przykładzie jest to wielomian kwadratowy. Trzeba pamiętać, że dla oszacowania wielomianu k stopnia (np. drugiego, trzeciego itd.) potrzebnych jest k+1 grup. Zatem w naszym przykładzie, gdzie tempo muzyczne jest zdefiniowane na trzech poziomach mamy możliwość oszacowania jedynie wielomianu drugiego stopnia. SPSS domyślnie oszacuje również wielomiany niższego stopnia. W ten sposób odpadną nam dwa problemy: jak należy przypisać współczynniki kontrastów, aby trend okazał się liniowy, kwadratowy itd. i czy kontrasty te są ortogonalne (niezależne). Jednak dla celów dydaktycznych przedstawię, jak SPSS przypisuje wagi kontrastów dla trendu liniowego i kwadratowego w planie trzygrupowym: Ballady Rockowe Klasyczne Przeboje Muzyka Taneczna Trend Liniowy Trend kwadratowy Karol Karasiewicz 10

11 Do tych dwóch trendów liniowego i kwadratowego my chcemy zdefiniować jeszcze trzeci kontrast o innym (niestandardowym) charakterze tzn Ten kontrast będzie weryfikował pierwszą ze stawianych hipotez, tzn. że wyniki uzyskane przy muzyce tanecznej (grupa trzecia) różnią się od uśrednionych wyników uzyskanych przy muzyce rockowej i klasycznych przebojach obie grupy pierwsza i druga otrzymały tę samą wagę kontrastu. Stąd też po dopisaniu ustalonych współczynników kontrastu do kontrastów trendu liniowego i kwadratowego otrzymujemy następującą macierz współczynników kontrastów: Ballady Rockowe Klasyczne Przeboje Muzyka Taneczna Trend Liniowy Trend kwadratowy Trend potęgowy Kontrasty te nie są ortogonalne (nie są niezależne), ponieważ suma iloczynów współczynników kontrastów (wynosi 5) nie jest równa zero. Można zatem powiedzieć, że wyniki porównania specjalnego, które zaplanowano nie są niezależne od porównań wynikających z trendu liniowego i kwadratowego wynikają z nich. Mocno zalecane jest testowanie kontrastów ortogonalnych, ponieważ tylko wtedy można powiedzieć, jaki jest rzeczywisty poziom istotności każdej z szacowanych różnic. Przy testowaniu kontrastów nieortogonalnych pewna część istotności każdego z nih jest zależna od istotności pozostałych. Ballady Rockowe Klasyczne Przeboje Muzyka Taneczna Trend Liniowy Trend kwadratowy Trend potęgowy Iloczyn wag Suma iloczynów 5 0 Ryc. 11 Aby zatem zdefiniować ten niestandardowy kontrast musimy kolejno według kolejności grup w zmiennej niezależnej (tutaj: 1 - Ballady Rockowe, 2 Klasyczne Przeboje i 3 Muzyka Taneczna) wprowadzić wagi kontrastów. Po wpisaniu jednego współczynnika (np. - 1) należy przycisnąć klawisz DODAJ i wprowadzić kolejny współczynnik. Wprowadzone współczynniki będą pojawiały się na liście i jednocześnie poniżej SPSS kontrolnie będzie obliczał ich sumę tak, aby nie pomylić się przy samodzielnym liczeniu. Gdybyśmy chcieli zdefiniować więcej niż jeden kontrast możemy po wpisaniu współczynników dla Karol Karasiewicz 11

12 wszystkich grup kliknąć przycisk NASTĘPNY i od nowa wprowadzać współczynniki dla następnych kontrastów. Gdyby sobie wyobrazić rozłożenie tych trzech wartości, jako wartości rzędnych (na osi Y) dla kolejnych trzech wartości z osi X, to w klasycznym układzie kwadratowym dałyby one obraz funkcji liniowej lub kwadratowej (patrz: Ryc. 12). Ryc. 12 Co można również zaobserwować, zadany przez nas specjalny kontrast to odwrotny trend pierwiastkowy (tzw. trend potęgowy). b. Podaj odpowiednie statystyki i wskaźniki oraz ich interpretację dla potwierdzenia postawionej przez Ciebie tezy. Statystyki opisowe CENA ZAMÓWIONYCH PRODUKTÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI BALLADY ROCKOWE N Średnia Odchylenie standardowe 10 25, ,14386 KLASYCZNE PRZEBOJE 10 24,6530 4,54726 MUZYKA TANECZNA 10 34,1890 6,68217 Ogółem 30 28,0263 8,86102 BALLADY ROCKOWE 10 29,60 5,967 KLASYCZNE PRZEBOJE 10 29,40 2,675 MUZYKA TANECZNA 10 22,30 3,592 Ogółem 30 27,10 5,403 BALLADY ROCKOWE 10,9347,56897 KLASYCZNE PRZEBOJE 10,8424,16102 MUZYKA TANECZNA 10 1,5490,27227 Ogółem 30 1,1087,48299 Wyniki przeprowadzonej analizy wskazują, że przeciętny czas konsumpcji przy muzyce rockowej (M=29,60) i klasycznych przebojach (M=29,40), czy przeciętny koszt Karol Karasiewicz 12

13 zamówionego posiłku (odpowiednio M=25,2370 dla muzyki rockowej i M=24,6530 dla klasycznych przebojów) nie różnią się w sposób znaczący. Natomiast różnica między ceną i czasem konsumpcji przy muzyce rockowej lub klasycznych przebojach, a analogicznymi wynikami uzyskanymi przy muzyce tanecznej wydaje się wyraźnie większa. Przeciętnie gość w towarzystwie muzyki tanecznej spędził na konsumpcji M=22,30 minut i w tym czasie wydał M=34,1890 złotych na posiłek. Co wydaje się istotne, to fakt, że w grupie gości spędzających czas w towarzystwie muzyki klasycznej ujawniło się znacznie większe zróżnicowanie wyników niż w pozostałych grupach gości (na co wskazuje dużo większe odchylenie standardowe) w obrębie wszystkich analizowanych zmiennych. Test jednorodności wariancji Test Levene'a df1 df2 Istotność CENA ZAMÓWIONYCH PRODUKTÓW 4, ,022 CZAS SPĘDZONY NA KONSUMPCJI 3, ,042 WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI 4, ,022 Obawę o to, że istnieją istotne różnice między wariancjami wyników w trzech porównywanych grupach potwierdza test Levene a dla weryfikacji hipotezy o jednorodności (homogeniczności) porównywanych grup. Test ten okazał się statystycznie istotny w obrębie wszystkich analizowanych zmiennych. Oznacza to znaczące zaburzenie założenia o jednorodności wariancji we wszystkich porównywanych w procedurze jednoczynnikowej ANOVA grup. Co zatem można z tym zrobić, jak poradzić sobie z tym wynikiem? Rozwiązania są co najmniej dwa po pierwsze wydaje się, że ta większa wariancja w jednej grupie może wiązać się z występowaniem w danych jakiejś pojedynczej obserwacji odstającej, po drugie można założyć (jeśli jest to teoretycznie uzasadnione), że większa wariancja wyników w tej grupie jest uzasadniona i prowadzić dalej porównania z założeniem braku równości wariancji. Jak znaleźć ową obserwację odstającą? Wystarczy przeprowadzić analizę rozkładu częstości (patrz: Ryc. 4 i Ryc. 6 w punkcie 2) oddzielnie w każdej z porównywanych grup. Wymaga to jednak wskazania SPSSowi żądania, aby przeprowadził tę analizę oddzielnie w każdej z grup, można to zrobić klikając w DANE PODZIEL NA PODZBIORY. Ryc. 13 Karol Karasiewicz 13

14 Następnie w otwartym oknie edytora podziału danych na podzbiory należy wskazać metodę najlepiej Porównaj grupy i wskazać zmienną wyróżniającą te grupy przenosząc MUZYKA do pola Grupy wyróżnione na podstawie. Ryc. 14 Gdy teraz przeprowadzimy analizę rozkładu częstości wyniki analizy będą przedstawione oddzielnie w każdej z grup. Zwłaszcza interesujące są histogramy rozkładu zmiennych, ponieważ one wydaje się najłatwiej pokazują istnienie obserwacji odstających lub wariancję wyników. Można na nich zauważyć, że w pierwszej grupie gości restauracji nie ma znaczących obserwacji odstających, a jeśli nawet są, to znajdują się na obu krańcach rozkładu i łącznie stanowią 30% liczebności tej grupy Sugeruje to raczej, że rzeczywiście wariancja wyników w grupie pierwszej gości spożywających posiłek w towarzystwie muzyki rockowej jest większa. Stąd też w dalszym postępowaniu przyjmiemy to założenie. Ryc. 15 Wróćmy zatem do wyników jednoczynnikowej ANOVA. Przyjęcie założenia o zróżnicowaniu wariancji wyników powoduje, że nie należy interpretować wyników testu Omnibus F jednoczynnikowej ANOVA, ponieważ nie jest spełnione leżące u ich podstaw założenie, że wariancje w grupach są jednorodne. Jednak dla celów dydaktycznych przyjrzyjmy się tej tabeli. Wyniki przeprowadzonej analizy są podzielone na kilka wierszy w związku z zaplanowaniem testu istotności trendu liniowego i kwadratowego w założonych danych. W pierwszym wierszu nazwanym Połączone znajdują się wyniki oszacowania ogólnego modelu. Innymi słowy w wierszu Połączone są oszacowania poziomu istotności dla hipotezy zerowej mówiącej o równości wszystkich średnich. W przypadku, gdyby nie założono żadnych kontrastów dla trendu, tylko ta hipoteza byłaby testowana i wskaźniki istotności dla składnika połączonego byłyby wyliczone. W wierszu Składnik liniowy kontrast i Składnik kwadratowy kontrast znajdują się oszacowania istotności dla założenia o istnieniu liniowej i kwadratowej zależności między zmienną niezależną i zależną. Ponownie należy przypomnieć testy te są prawdopodobnie w pewnym stopniu nieprecyzyjne (niedokładnie oszacowane) ze względu na niespełnienie warunku Karol Karasiewicz 14

15 jednorodności wariancji w grupach. Jednak są tutaj analizowane wyłącznie dla celów dydaktycznych (poglądowych). Jednoczynnikowa ANOVA CENA ZAMÓWIONYCH PRODUKTÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI Między grupami Wewnątrz grup Ogółem Między grupami Wewnątrz grup Ogółem Między grupami Wewnątrz grup Ogółem (Połączone) F Istotność 4,522,020 Składnik liniowy Kontrast 6,343,018 Odchylenie 2,702,112 Składnik kwadratowy Kontrast 2,702,112 (Połączone) 9,320,001 Składnik liniowy Kontrast 14,362,001 Odchylenie 4,277,048 Składnik kwadratowy Kontrast 4,277,048 (Połączone) 10,445,000 Składnik liniowy Kontrast 13,357,001 Odchylenie 7,534,011 Składnik kwadratowy Kontrast 7,534,011 Można zauważyć, że testy hipotez o równości średnich w porównywanych grupach odnośnie do wszystkich zmiennych okazują się statystycznie istotne, tzn. wskazują dają podstawę do przyjęcia, że średni czas konsumpcji (F(2;27)=9,320; p=0,001), średnia cena zakupu (F(2;27)=4,522; p=0,020) i średnia wydana w przeliczeniu na jedną minutę kwota (F(2;27)=10,445; p<0,001) są istotnie różne w zależności od tempa muzycznego. Jednocześnie testy trendów wskazują, że w odniesieniu do ceny zamówionych posiłków można zaobserwować istotny trend liniowy (F(1;27)=6,343; p=0,018), co oznacza iż cena zamówionego posiłku liniowo wzrasta wraz z tempem podkładu muzycznego im szybsze, tym droższe zamówienie. Natomiast w odniesieniu do czasu konsumpcji istotnym okazuje się równocześnie trend liniowy (F1;27)=14,362; p=0,001), jak i kwadratowy (F(1;27)=4,277; p=0,048). Można więc powiedzieć, że wyniki te wskazują, iż czas konsumpcji maleje wraz z tempem podkładu muzycznego, jednakże spadek ten nie ma charakteru iniowego, przy spokojniejszym podkładzie muzycznym (ballady rockowe i klasyczne przeboje) jest mniejszy, natomiast przy muzyce tanecznej większy. Wyniki analizy wydatku tzn. kwoty wydanej w przeliczeniu na jedną minutę wizyty są podobne do wyników analizy czasu wizyty. Gdzie istotnym okazuje się trend liniowy (F(1;27)=13,357; p=0,001) i kwadratowy F(1;27)=7,534; p=0,011). Bardziej rzetelną miarą testu hipotezy o równości wszystkich średnich w porównywanych grupach, gdy grupy te mogą być uznane za niehomogeniczne jest miara mocnych testów równości średnich bądź to testów Browna-Forsythe bądź też Wlelcha, przy czym testy Welcha są nieco bardziej konserwatywne i wiążą się z większym niż testy Browna-Forsythe błędem II rodzaju. Karol Karasiewicz 15

16 Mocne testy równości średnich CENA ZAMÓWIONYCH PRODUKTÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI Statystyka(a) df1 df2 Istotność Brown-Forsythe 4, ,116,026 Brown-Forsythe 9, ,773,002 Brown-Forsythe 10, ,566,002 a Asymptotyczny rozkład F Wszystkie testy równości średnich potwierdzają istotność różnic między średnimi wyniki jednoczynnikowej ANOVA również to ujawniały jednakże w porównaniu z wynikami jednoczynnikowej ANOVA poziom istotności okazuje się nieco niższy i (co za tym idzie) związek okazuje się nieco słabszy. Wszystko to z powodu zmniejszonej liczby stopni swobody dla różnic wewnątrzgrupowych (df2), które są wprowadzone dla poprawki ze względu na niehomogeniczność wariancji w porównywanych grupach. Kolejny wynik przedstawia tabela dotycząca testu niestandardowego kontrastu zaplanowanego przez nas obok kontrastów trendu. Pierwszą tabelą jest podsumowanie współczynników kontrastu dla testu. Jest to o tyle ważne, żeby nie pomylić się przy interpretacji kontrastu, gdy zdefiniowano więcej niż jeden kontrast. Współczynniki kontrastu PODKŁAD MUZYCZNY BALLADY KLASYCZNE MUZYKA Kontrast ROCKOWE PRZEBOJE TANECZNA Wyniki testu kontrastu są podzielone na dwa rodzaje test z założeniem równości wariancji i założeniem niejednorodności wariancji. Testy Levene a wskazują, że raczej należy przyjąć raczej założenie o braku równości wariancji. Przede wszystkim należy zauważyć, że test kontrastu dla braku równości wariancji ma inną (mniejszą) liczbę stopni swobody dokładnie tak, jak w teście t dla prób niezależnych. Wyniki testu kontrastu wskazują, że kontrast ten jest istotny statystycznie w odniesieniu do wszystkich zmiennych, tak w odniesieniu do ceny (t(19,721)=3,251; p=0,004), jak również w odniesieniu do czasu wizyty (t(20,127)=-4,688; p<0,001), czy wydatku na posiłek (t(19,431)=5,197; p<0,001). Testy kontrastu CENA ZAMÓWIONYCH PRODUKTÓW CZAS SPĘDZONY NA KONSUMPCJI WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI Założenie o równości wariancji Brak założenia o równości wariancji Założenie o równości wariancji Brak założenia o równości wariancji Założenie o równości wariancji Brak założenia o równości wariancji Kontrast t df Istotność (dwustronna) 1 3,003 27, ,251 19,721,004-4,316 27,000-4,688 20,127,000 4,537 27,000 5,197 19,431,000 Karol Karasiewicz 16

17 Ostatnim wreszcie wynikiem jest test porównań post hoc. Tabela ta przedstawia porównania wszystkich średnich parami Ballady Rockowe vs. Klasyczne Przeboje; Ballady Rockowe vs. Muzyka Taneczna i Klasyczne Przeboje vs. Muzyka Taneczna. Jednakże te porównania trzeba wyłuskać, ponieważ SPSS każde z porównań przeprowadza w obie strony Ballady Rockowe porównuje z Klasycznymi Przebojami a w innym miejscu Klasyczne Przeboje z Balladami Rockowymi. Dodatkowo wybór wielu metod porównań post hoc i prowadzenie ich dla wielu zmiennych (jak w niniejszym przykładzie) bardzo szybko powiększa tabelę i utrudnia jej analizę. W niniejszym przykładzie zalecaną metodą porównań post hoc wydaje się test T2 Tamhana, gdyż test ten, jako jedyny nie przyjmuje założenia o równości wariancji w grupach. Porównania wielokrotne Zmienna zależna (I) PODKŁAD MUZYCZNY (J) PODKŁAD MUZYCZNY Istotność CENA ZAMÓWIONYCH Test Tukey'a HSD BALLADY ROCKOWE KLASYCZNE PRZEBOJE PRODUKTÓW,985 MUZYKA TANECZNA,046 KLASYCZNE PRZEBOJE BALLADY ROCKOWE,985 MUZYKA TANECZNA,032 MUZYKA TANECZNA BALLADY ROCKOWE,046 KLASYCZNE PRZEBOJE,032 Test NIR BALLADY ROCKOWE KLASYCZNE PRZEBOJE,871 MUZYKA TANECZNA,018 KLASYCZNE PRZEBOJE BALLADY ROCKOWE,871 MUZYKA TANECZNA,012 MUZYKA TANECZNA BALLADY ROCKOWE,018 KLASYCZNE PRZEBOJE,012 Test Tamhane BALLADY ROCKOWE KLASYCZNE PRZEBOJE,998 MUZYKA TANECZNA,132 KLASYCZNE PRZEBOJE BALLADY ROCKOWE,998 MUZYKA TANECZNA,006 Test t Dunnetta (>średnia kontrolna)(a) MUZYKA TANECZNA BALLADY ROCKOWE,132 KLASYCZNE PRZEBOJE,006 KLASYCZNE PRZEBOJE BALLADY ROCKOWE,729 MUZYKA TANECZNA BALLADY ROCKOWE,017 * Różnica średnich jest istotna na poziomie.05. a Procedura testu t Dunnetta traktuje jedną z grup jako kontrolną i porównuje do niej wszystkie pozostałe grupy. W przytoczonej tabeli dla oszacowania różnic między średnimi cenami posiłku w porównywanych grupach można zaobserwować, jak różne testy post hoc przyjmując różne założenia pokazują różny poziom istotności a więc i siłę zależności) różnic między grupami. Np. można zauważyć, że różnice między średnimi cenami posiłków w grupie Ballady Rockowe i Klasyczne Przeboje oszacowana metodą NIR jest istotna z p=0,0,871, natomiast oszacowane metodą HSD Tukeya p=0,985, a metodą T2 Tmhane p=0,998. W przytoczonym przykładzie wszystkie testy wskazują na brak istotności różnic, natomiast widoczna jest różnica między poziomem istotności najmniej rygorystycznego z nich (NIR) i testami bardziej rygorystycznymi (HSD i T2), która czasem może decydować o przyjęciu lub odrzuceniu założenia o braku istotności różnic między porównywanymi średnimi. Podsumowując, raport z przeprowadzonej analizy na przykładzie ceny zamówionego posiłku mógłby wyglądać mniej więcej w następujący sposób: Karol Karasiewicz 17

18 Wyniki przeprowadzonej analizy wariancji wskazują, że w odniesieniu do ceny zamówionego posiłku można przyjąć założenie, że jest ona różna w zależności od tempa podkładu muzycznego (F(2;18,115)=4,522; p=0,020), jednocześnie, gdy przyjąć, że różnice między tempem poszczególnych rodzajów muzyki jest równe, to związek między tempem podkładu muzycznego a średnią ceną spożywanego posiłku wydaje się mieć charakter liniowy (F(1;18,116)=6,343; p=0,021), jednakże (choć kontrast ten nie jest ortogonalny względem zadanego kontrastu liniowego) ujawnia się istotny statystycznie trend potęgowy (t(119,721)=3,251; p=0,004). Można zatem powiedzieć, że istnieje istotna statystycznie różnica między średnią ceną zamówionego posiłku przy muzyce tanecznej i przy innym podkładzie muzycznym, choć tempo podkładu muzycznego generalnie sprzyja wzrostowi ceny zamówionego posiłku. Karol Karasiewicz 18

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Jednoczynnikowa analiza wariancji

Jednoczynnikowa analiza wariancji Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować

Bardziej szczegółowo

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych? Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu

Bardziej szczegółowo

Gimnastyka artystyczna

Gimnastyka artystyczna Gimnastyka artystyczna Zbadano losową próbę N=40 dziewcząt i chłopców z klas o profilu ogólnym i sportowym pod kątem ich ogólnej sprawności fizycznej ocenianej na skali Hirscha (od 0 do 20 pkt.), gdzie

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

JEDNOCZYNNIKOWA ANOVA

JEDNOCZYNNIKOWA ANOVA Analizę ANOVA wykorzystujemy do wykrycia różnic pomiędzy średnimi w więcej niż dwóch grupach/więcej niż w dwóch pomiarach JEDNOCZYNNIKOWA ANOVA porównania jednej zmiennej pomiędzy więcej niż dwoma grupami

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne

Bardziej szczegółowo

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby 1. Wstęp teoretyczny Prezentowane badanie dotyczy analizy wyników uzyskanych podczas badania grupy rodziców pod kątem wpływu ich przekonań

Bardziej szczegółowo

Zadanie 1. Analiza Analiza rozkładu

Zadanie 1. Analiza Analiza rozkładu Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 Redaktor: Alicja Zagrodzka Korekta: Krystyna Chludzińska Projekt okładki: Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 ISBN 978-83-7383-296-1 Wydawnictwo Naukowe Scholar

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Praca z danymi zaczyna się od badania rozkładu liczebności (częstości) zmiennych. Rozkład liczebności (częstości) zmiennej to jakie wartości zmienna

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

R-PEARSONA Zależność liniowa

R-PEARSONA Zależność liniowa R-PEARSONA Zależność liniowa Interpretacja wyników: wraz ze wzrostem wartości jednej zmiennej (np. zarobków) liniowo rosną wartości drugiej zmiennej (np. kwoty przeznaczanej na wakacje) czyli np. im wyższe

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi) Czy miejsce zamieszkania różnicuje uprawianie sportu? Mieszkańcy

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2 Poniżej prezentujemy przykładowe pytania z rozwiązaniami dotyczącymi dwuczynnikowej analizy wariancji w schemacie 2x2. Wszystkie rozwiązania są

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące

Bardziej szczegółowo

laboratoria 24 zaliczenie z oceną

laboratoria 24 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne

Bardziej szczegółowo

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Przedmowa do wydania polskiego Przedmowa CZĘŚĆ I. PODSTAWY STATYSTYKI Rozdział 1 Podstawowe pojęcia statystyki

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

7.4 Automatyczne stawianie prognoz

7.4 Automatyczne stawianie prognoz szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu

Bardziej szczegółowo

Dysleksja jest dla inteligentnych?

Dysleksja jest dla inteligentnych? Dysleksja jest dla inteligentnych? Zbadano losową próbę 116 chłopców i dziewcząt z trudnościami w uczeniu się pod kątem ilorazu inteligencji (Badanie baterią APIS-Z). Uzyskano następujące wyniki: Tabela

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo

Elementy statystyki STA - Wykład 5

Elementy statystyki STA - Wykład 5 STA - Wykład 5 Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza 1 ANOVA 2 Model jednoczynnikowej analizy wariancji Na model jednoczynnikowej analizy wariancji możemy traktować jako uogólnienie

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą

Bardziej szczegółowo

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0 Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22 Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41 Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie. STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą

Bardziej szczegółowo

1 Analiza wariancji H 1 : 1 6= 2 _ 1 6= 3 _ 1 6= 4 _ 2 6= 3 _ 2 6= 4 _ 3 6= 4

1 Analiza wariancji H 1 : 1 6= 2 _ 1 6= 3 _ 1 6= 4 _ 2 6= 3 _ 2 6= 4 _ 3 6= 4 Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Statystyczna analiza danych Adam Kiersztyn 5 godzin lekcyjnych 2012-02-04 13.00-17.00 1 Analiza wariancji Na wst¾epie zapoznamy

Bardziej szczegółowo

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

dr hab. Dariusz Piwczyński, prof. nadzw. UTP dr hab. Dariusz Piwczyński, prof. nadzw. UTP Porównanie większej niż 2 liczby grup (k>2) Zmienna zależna skala przedziałowa Zmienna niezależna skala nominalna lub porządkowa 2 Istota teorii analizy wariancji

Bardziej szczegółowo

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych; STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych; - badanie skuteczności nowego leku; - badanie stopnia zanieczyszczenia gleb metalami

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

Estymacja parametrów w modelu normalnym

Estymacja parametrów w modelu normalnym Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1 Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

Przykład 1. (A. Łomnicki)

Przykład 1. (A. Łomnicki) Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne Czyli jak bardzo jesteśmy pewni że parametr oceniony na podstawie próbki jest

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA Statystyka opisowa PRZEDMIOT: PODSTAWY STATYSTYKI PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA Statystyka opisowa = procedury statystyczne stosowane do opisu właściwości próby (rzadziej populacji) Pojęcia:

Bardziej szczegółowo