Statystyka i Analiza Danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Statystyka i Analiza Danych"

Transkrypt

1 Warsztaty Statystyka i Analiza Danych Gdańsk, lutego 2014

2 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki - Warsztaty - Statystyka i Analiza Danych

3 Plan wystąpienia Analiza wariancji metoda analizy danych czy coś więcej Trochę o źródłach zmienności Bez obliczeń się nie obejdzie Przykład analizy wyników eksperymentu jednoczynnikowego Opracowanie wyników eksperymentu dwuczynnikowego z powtarzanymi pomiarami i efektem interakcji Analiza wyników eksperymentu zaplanowanego w układzie losowanych bloków (eliminacja niepożądanej zmienności systematycznej)

4 Co oznacza termin: analiza wariancji? W węższym znaczeniu analizę wariancji można traktować jako uogólnienie testów istotności różnic pomiędzy wartościami oczekiwanymi w przypadku dwóch populacji W szerszym znaczeniu analiza wariancji obejmuje techniki analizy danych wykorzystywane w ramach działu statystycznej analizy stosowanej określanego terminem planowanie doświadczeń (ang. experimental design)

5 Planowanie eksperymentu trzy podstawowe decyzje Wybór zmiennej zależnej Ustalenie czynnika (ów) eksperymentalnych Dobór jednostek eksperymentalnych

6 Źródła zmienności wyników Zmienność powodowana przez czynniki eksperymentalne (pożądana) Zmienność związana z błędem pomiaru zmiennej zależnej (niepożądana) Zmienność wynikająca ze zróżnicowania materiału badawczego (niepożądana)

7 Rodzaje zmienności wyników Zmienność systematyczna, zaplanowana (pożądana) Zmienność przypadkowa (z którą można sobie poradzić) Zmienność systematyczna, niepożądana (może uniemożliwić wykazanie efektu, na którym zależy badaczowi)

8 Analiza wariancji od kuchni (bez obliczeń się nie obejdzie) Z punktu widzenia badacza wśród czynników mających wpływ na zmienność wyników eksperymentu możemy wyróżnić czynniki główne i czynniki uboczne Jeśli eksperyment ma być naukową metodą rozwiązywania problemów badawczych, to powinien być tak zaplanowany by przy analizie jego wyników można było oddzielić wpływ czynników głównych i czynników ubocznych

9 Umowną miarą całkowitej zmienności wyników eksperymentu jest suma kwadratów odchyleń poszczególnych wyników od średniej ogólnej: p SK calk = (y ij y) 2 i=1 n j=1 Analiza wariancji (ANOVA) polega na podziale całkowitej zmienności wyników eksperymentu na dwa składniki, odpowiadające zmienności spowodowanej przez czynniki główne (zmienność międzygrupowa) oraz zmienności przypisanej czynnikom ubocznym (zmienność wewnątrzgrupowa).

10 Liczbową miarą pierwszego składnika jest suma kwadratów odchyleń średnich grupowych od średniej ogólnej, nazywana międzygrupową sumą kwadratów: SK między = n (y i y) 2 p i=1 Liczbową miarą drugiego składnika jest suma kwadratów odchyleń poszczególnych pomiarów w grupach od odpowiednich średnich grupowych, nazywana wewnątrzgrupową suma kwadratów odchyleń: p SK wewn = (y ij y i ) 2 n i=1 j=1

11 Z poszczególnymi źródłami zróżnicowania wyników eksperymentu są związane odpowiednie liczby stopni swobody Wynoszą one odpowiednio: df cala = p n - 1 df między = p - 1 df wewn = p (n - 1)

12 W następnym etapie oblicza się tzw. średnie kwadraty odchyleń będące nieobciążonymi estymatorami wariancji z próby. Aby obliczyć wartość średniego kwadratu dla danego źródła zmienności sumy kwadratów dzieli się przez odpowiednie liczby stopni swobody: ŚK cala = ŚK cala df cala ŚK między = ŚK między df między ŚK wewn = ŚK wewn df wewn

13 ANOVA jednoczynnikowa jest metodą statystyczną, która umożliwia ocenę prawdopodobieństwa tego, że różnice między średnimi wyników p (p > 2) grup porównawczych nie są dziełem przypadku Formalnie hipoteza zerowa orzeka, że wartości średnich grupowych p populacji są takie same (równe wartości średniej ogólnej), czyli: H 0 : μ 1 = μ 2 =... = μ p = μ Hipoteza alternatywna (H 1 ) mówi, że w populacji średnie grupowe nie są równe, czyli : H 1 : nieprawda, że H 0

14 Miarą rozbieżności między hipotetycznym a rzeczywistym stanem rzeczy (czyli rozbieżności między H 0 a H 1 ) jest w ANOVA stosunek (iloraz) średnich kwadratów: ŚK między ŚK wewn Jeżeli poziomy czynnika głównego nie mają wpływu na pomiary zmiennej zależnej, to iloraz powinien być równy jedności Jeżeli jednak poziomy czynnika głównego oddziałują w sposób zróżnicowany na zmienną zależną, czyli inaczej mówiąc jeżeli H 0 jest fałszywa wówczas powyższy iloraz będzie większy od jedności. O ile większy, to zależy od różnicy między zaobserwowanymi (zmierzonymi) średnimi grupowymi

15 Interesująca nas miara rozbieżności między stanem rzeczy wynikającym z hipotezy zerowej a stanem rzeczy wynikającym z danych eksperymentalnych, czyli iloraz średnich kwadratów ma postać statystyki F: F = ŚK między ŚK wewn o odpowiednio stopniach swobody p-1 i p (n-1) Ocenę prawdziwości hipotezy zerowej dokonuje się w oparciu o te same zasady jak w przypadku innych testów

16 Podstawowe założenia ANOVA Zmienna zależna powinna być wyrażona przynajmniej na skali przedziałowej Zmienna zależna powinna podlegać rozkładowi normalnemu w obrębie grup porównawczych Wariancje w obrębie różnych grup układu powinny być równe; założenie to jest określane jako założenie o jednorodności (homogeniczności) wariancji

17 Jednoczynnikowa analiza wariancji (przykład analizy w STATISTICA) Problem badawczy: Ocena zróżnicowania odsetka zębów objętych próchnicą przy stosowaniu czterech różnych substancji słodzących Badana zbiorowość: 48 samic szczurów w wieku 6 tyg.

18 Sprawdzenie założeń normalność rozkładu

19 Sprawdzenie założeń równość wariancji

20 Ocena istotności efektu zróżnicowania test F

21 Graficzna ilustracja efektu zróżnicowania

22 Porównania szczegółowe testy post-hoc

23 Graficzna ilustracja danych surowych

24 Dwuczynnikowa analiza wariancji (przykład analizy w STATISTICA) Problem badawczy: Ocena wpływu dwóch różnych leków na przebieg i efekty leczenia Badana zbiorowość: Pacjenci hospitalizowani z rozpoznaniem zespołu maniakalno-depresyjnego o przebiegu depresji

25 Ocena istotności efektów testy F

26 Graficzna ilustracja efektów prostych

27 Graficzna ilustracja efektu interakcji

28 Porównania zaplanowane szczegółowych różnic

29 Analiza wariancji dla układu blokowego (przykład analizy w STATISTICA) Problem badawczy: Ocena skuteczności różnych sposobów zwalczania chwastów w przypadku uprawy ziemniaków

30 Ocena istotności efektu zróżnicowania test F (bez uwzględnienia bloków)

31 Graficzna ilustracja efektu zróżnicowania

32 Porównania szczegółowe testy post-hoc (bez uwzględnienia bloków)

33 Porównania szczegółowe testy post-hoc (bez uwzględnienia bloków)

34 Ocena istotności efektu zróżnicowania test F (z uwzględnieniem bloków)

35 Porównania szczegółowe testy post-hoc (z uwzględnieniem bloków)

36 Porównania szczegółowe testy post-hoc (z uwzględnieniem bloków)

37 Dziękuję za uwagę!

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1.

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1. Weryfikacja hipotez Każde badanie naukowe rozpoczyna się od sformułowania problemu badawczego oraz najbardziej prawdopodobnego (na gruncie wiedzy badającego) ogólnego rozwiązania, czyli hipotezy badawczej.

Bardziej szczegółowo

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 Redaktor: Alicja Zagrodzka Korekta: Krystyna Chludzińska Projekt okładki: Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008 ISBN 978-83-7383-296-1 Wydawnictwo Naukowe Scholar

Bardziej szczegółowo

ZASTOSOWANIA STATYSTYKI W BADANIACH NAUKOWYCH POTRZEBA CZY KONIECZNOŚĆ?

ZASTOSOWANIA STATYSTYKI W BADANIACH NAUKOWYCH POTRZEBA CZY KONIECZNOŚĆ? ZASTOSOWANIA STATYSTYKI W BADANIACH NAUKOWYCH POTRZEBA CZY KONIECZNOŚĆ? Janusz Wątroba, StatSoft Polska Sp. z o.o. Przy próbie oceny korzyści i ograniczeń, jakie występują w przypadku stosowania statystyki

Bardziej szczegółowo

Metody statystyki medycznej stosowane w badaniach klinicznych

Metody statystyki medycznej stosowane w badaniach klinicznych Metody statystyki medycznej stosowane w badaniach klinicznych Statistics for clinical research & post-marketing surveillance część I Program szkolenia część I Wprowadzenie Podstawowe pojęcia statystyczne

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ

WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Wiele zjawisk i procesów występujących w otaczającej nas rzeczywistości ma

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Opracowywanie danych doświadczalnych

Opracowywanie danych doświadczalnych Opracowywanie danych doświadczalnych Michał K. Urbański, Wydział Fizyki Politechniki Warszawskiej, murba@if.pw.edu.pl październik 2014 SPIS TREŚCI 1. Wstęp 2 1.1. Treść skryptu i rozkład materiału......

Bardziej szczegółowo

Numer publikacji EA-04/16 Wytyczne EA dotyczące wyrażania niepewności w badaniach ilościowych CEL Celem niniejszego dokumentu jest ujednolicenie sposobu postępowania przy wyznaczaniu niepewności pomiarów

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

JAK ROZUMIEĆ I WYKONYWAĆ ANALIZĘ PRZEŻYCIA

JAK ROZUMIEĆ I WYKONYWAĆ ANALIZĘ PRZEŻYCIA JAK ROZUMIEĆ I WYKONYWAĆ ANALIZĘ PRZEŻYCIA Andrzej Sokołowski, Centrum Onkologii Oddział w Krakowie, Uniwersytet Ekonomiczny w Krakowie, StatSoft Polska Analiza czasu przeżycia to inaczej analiza czasu

Bardziej szczegółowo

6. PODSTAWY PLANOWANIA EKSPERYMENTU

6. PODSTAWY PLANOWANIA EKSPERYMENTU 6. PODSTAWY PLANOWANIA EKSPERYMENTU 6.. Pojęcie i rola badań doświadczalnych Przez eksperyment rozumiemy badanie jakiegoś zjawiska, polegające na celowym wywoływaniu tego zjawiska lub jego zmian oraz obserwacji

Bardziej szczegółowo

Metodyczne problemy badań preferencji konsumenckich

Metodyczne problemy badań preferencji konsumenckich Anna Szymańska Metodyczne problemy badań preferencji konsumenckich Wstęp Badania preferencji konsumenckich prowadzone są w celu poznania systemu ocen odzwierciedlających potrzeby i upodobania konsumenta,

Bardziej szczegółowo

Sameer Hanna-Juma M.D., Ph.D.

Sameer Hanna-Juma M.D., Ph.D. Sameer Hanna-Juma M.D., Ph.D. Sameer Hanna-Jumma, MB CHB (Bachelor of Medicine, Bachelor of Surgery), MSc (Medical Sciences), FRCA (Fellowship of the Royal College of Anaesthetists), FCAI (Fellowship of

Bardziej szczegółowo

Zmienność w procesach

Zmienność w procesach MODUŁ IV Zmienność w procesach i jej odmiany. Podstawy statystycznego nadzorowanie procesów. Zdatność jakościowa procesu. Elementy koncepcji Six Sigma 1 Zmienność w procesach Zmienność jest naturalnym

Bardziej szczegółowo

Metody stosowane w planowaniu i przeprowadzaniu eksperymentów naukowych w badaniach biomedycznych

Metody stosowane w planowaniu i przeprowadzaniu eksperymentów naukowych w badaniach biomedycznych Metody stosowane w planowaniu i przeprowadzaniu eksperymentów naukowych w badaniach biomedycznych Zakład Zaburzeń Krzepnięcia Krwi Katedry Diagnostyki Laboratoryjnej Uniwersytetu Medycznego w Łodzi cwatala@csk.umed.lodz.pl

Bardziej szczegółowo

AGRESJA SOCJALIZACJA EDUKACJA

AGRESJA SOCJALIZACJA EDUKACJA AGRESJA SOCJALIZACJA EDUKACJA Refleksje i inspiracje Pod redakcją Heleny Grzegołowskiej-Klarkowskiej WYDAWNICTWO AKADEMII PEDAGOGIKI SPECJALNEJ W arszaw a 2012 Profesorowi Adamowi Frączkowi współpracownicy,

Bardziej szczegółowo

4. Metody systemowe zarządzania jakością

4. Metody systemowe zarządzania jakością Zarządzanie jakością w praktyce inżynierskiej 4. Metody systemowe zarządzania jakością 4.1 Metody statystyczne w zarządzaniu jakością Do podstawowych instrumentów monitorowania procesów wytwórczych należą

Bardziej szczegółowo

Regresja prosta. Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie

Regresja prosta. Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie ROZDZIAŁ 1 Regresja prosta 15 Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie Regresja prosta część i modele regresji rozdział 1 W tym

Bardziej szczegółowo

Po drugie jest to dyscyplina naukowa, traktująca o metodach liczbowego opisu i wnioskowania o prawidłowościach występujących w procesach masowych.

Po drugie jest to dyscyplina naukowa, traktująca o metodach liczbowego opisu i wnioskowania o prawidłowościach występujących w procesach masowych. PROJEKTOWANIE BADANIA STATYSTYCZNEGO Termin statystyka ma wiele znaczeń. Po pierwsze określa się nim zbiór informacji liczbowych, dotyczących celowo wybranej grupy zjawisk. W tym sensie mówi się np. o

Bardziej szczegółowo

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH Janusz Wątroba, StatSoft Polska Sp. z o.o. Tematyka artykułu obejmuje wprowadzenie do problematyki modelowania statystycznego i jego roli w badaniu

Bardziej szczegółowo

Opracowanie statystyczne wyników badań w pracach magisterskich i licencjackich

Opracowanie statystyczne wyników badań w pracach magisterskich i licencjackich Edukacja Humanistyczna nr 2 (25), 2011 Szczecin 2011 Agnieszka Koźlarek Wyższa Szkoła Integracji Europejskiej Szczecin Opracowanie statystyczne wyników badań w pracach magisterskich i licencjackich Prawidłowy

Bardziej szczegółowo

Metody statystyczne w zarządzaniu jakością 1

Metody statystyczne w zarządzaniu jakością 1 jakością 1 Metody statystyczne w zarządzaniu jakością Statystyczne sterowanie procesem Rozwój metod statystycznych 1980 Shewhart 191 Deming 195+ I Metody statystyczne w zarządzaniu jakością Podział metod

Bardziej szczegółowo

ZROZUMIEĆ DANE I WYNIKI (NA PRZYKŁADACH BADAŃ EPIDEMIOLOGICZNYCH)

ZROZUMIEĆ DANE I WYNIKI (NA PRZYKŁADACH BADAŃ EPIDEMIOLOGICZNYCH) ZROZUMIEĆ DANE I WYNIKI (NA PRZYKŁADACH BADAŃ EPIDEMIOLOGICZNYCH) Ewa Kawalec, Zakład Epidemiologii i Badań Populacyjnych, Instytut Zdrowia Publicznego, Wydział Ochrony Zdrowia, Collegium Medicum Uniwersytetu

Bardziej szczegółowo

Wydział Badań i Ewaluacji CKE. Warszawa, listopad 2007. Wydanie 2., uzupełnione

Wydział Badań i Ewaluacji CKE. Warszawa, listopad 2007. Wydanie 2., uzupełnione ANALIZA I INTERPRETACJA WYNIKÓW OCENIANIA I EGZAMINOWANIA Wydział Badań i Ewaluacji CKE Warszawa, listopad 7 Wydanie., uzupełnione ANALIZA I INTERPRETACJA WYNIKÓW OCENIANIA I EGZAMINOWANIA Opracowanie:

Bardziej szczegółowo

MATERIAŁY SZKOLENIOWE

MATERIAŁY SZKOLENIOWE Strona1 MATERIAŁY SZKOLENIOWE Części: 26, 27, 28 Wykorzystanie EWD w ewaluacji wewnętrznej szkoły B i a ł y s t o k 2 0 1 4 Projekt Strona2 I. Spis treści I. Koncepcja EWD.... 4 1. Słownik EWD.... 4 Błąd

Bardziej szczegółowo

BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO

BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO AKADEMIA EKONOMICZNA W POZNANIU Krzysztof Cichy BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO PRACA MAGISTERSKA Wydział Zarządzania Kierunek: Zarządzanie i

Bardziej szczegółowo

ZASTOSOWANIE METODY ANALIZY CZYNNIKOWEJ DO BADANIA EKONOMICZNE] STRUKTURY REGIONALNEJ POLSKI

ZASTOSOWANIE METODY ANALIZY CZYNNIKOWEJ DO BADANIA EKONOMICZNE] STRUKTURY REGIONALNEJ POLSKI INSTYTUT G E O G R A F I I POLSKIEJ AKADEMII NAUK PRACE GEOGRAFICZNE Nr 92 TERESA CZYŹ ZASTOSOWANIE METODY ANALIZY CZYNNIKOWEJ DO BADANIA EKONOMICZNE] STRUKTURY REGIONALNEJ POLSKI WROCŁAW WARSZAWA KRAKÓW

Bardziej szczegółowo

Modelowanie ekonometryczne

Modelowanie ekonometryczne Barbara Gładysz Jacek Mercik Modelowanie ekonometryczne Studium przypadku Wydanie II Oficyna Wydawnicza Politechniki Wrocławskiej Wrocław 007 Recenzent Paweł DITTMANN Opracowanie redakcyjne i korekta Alina

Bardziej szczegółowo