Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności



Podobne dokumenty
Test F- Snedecora. będzie zmienną losową chi-kwadrat o k 1 stopniach swobody a χ

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

Estymacja przedziałowa

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

Wyklad 1. Analiza danych za pomocą pakietu SAS. Obiekty i zmienne. Rodzaje zmiennych

Statystyki opisowe. Marcin Zajenkowski. Marcin Zajenkowski () Statystyki opisowe 1 / 57

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Niegrzeczne dzieciaki na gorącym krześle

STA T T A YSTYKA Korelacja

Badanie normalności rozkładu

Ćwiczenie nr 2 Zbiory rozmyte logika rozmyta Rozmywanie, wnioskowanie, baza reguł, wyostrzanie

ROZWIĄZANIA ZADAŃ Zestaw P3 Odpowiedzi do zadań zamkniętych

Połączenie VPN Host-LAN IPSec z wykorzystaniem Windows XP. 1. Konfiguracja serwera VPN. 2. Konfiguracja klienta VPN. 3. Zainicjowanie połączenia

Przykłady wybranych fragmentów prac egzaminacyjnych z komentarzami Technik ochrony fizycznej osób i mienia 515[01]

Efektywność nauczania w Gimnazjum w Lutyni

Nazwa przedmiotu: Rachunek prawdopodobieństwa i statystyka. Nazwa jednostki prowadzącej przedmiot / moduł: WMF Instytut Matematyki

Zadanie 1. Liczba szkód w każdym z trzech kolejnych lat dla pewnego ubezpieczonego ma rozkład równomierny:

7. OPRACOWYWANIE DANYCH I PROWADZENIE OBLICZEŃ powtórka

Moduł Pulpit opcji oraz Narzędzia. Opis v 1.0

Kalkulator Kalorii by CTI. Instrukcja

AUTOR MAGDALENA LACH

Podstawowe testy statystyczne

Ogólna charakterystyka kontraktów terminowych

LABORATORIUM PODSTAW TELEKOMUNIKACJI

I.1.1. Technik mechanizacji rolnictwa 311[22]

INSTRUKCJA WebPTB 1.0

MATEMATYKA 9. INSTYTUT MEDICUS Kurs przygotowawczy do matury i rekrutacji na studia medyczne Rok 2017/2018 FUNKCJE WYKŁADNICZE, LOGARYTMY

DEMERO Automation Systems

Harmonogramowanie projektów Zarządzanie czasem

KARTA KURSU DLA STUDIÓW PODYPLOMOWYCH

TEST WIADOMOŚCI: Równania i układy równań

Warszawska Giełda Towarowa S.A.

Regresja i korelacja. Statystyka w medycynie. Dr inż. Janusz Majewski Katedra Informatyki

np. tu - na pierwszej formatce kreatora zaznaczamy opcję nr 3

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

Matematyka:Matematyka I - ćwiczenia/granice funkcji

Poprawne uwzględnianie nie przerw w ogrzewaniu w audycie energetycznym

Geometria Wykreślna Wykład 3

Karta pracy: Ćwiczenie 5.

PAKIET MathCad - Część III

'()(*+,-./01(23/*4*567/8/23/*98:)2(!."/+)012+3$%-4#"4"$5012#-4#"4-6017%*,4.!"#$!"#%&"!!!"#$%&"#'()%*+,-+

Search. (Wyszukiwarka) (Moduł Magento) v.1.0.0

Analiza wyników egzaminu gimnazjalnego. Test matematyczno-przyrodniczy matematyka. Test GM-M1-122,

Procedura instalacji wtyczki WILO-Content LAB

Czy zdążyłbyś w czasie, w jakim potrzebuje światło słoneczne, aby dotrzeć do Saturna, oglądnąć polski hit kinowy: Nad życie Anny Pluteckiej-Mesjasz?

JTW SP. Z OO. Zapytanie ofertowe. Zakup i dostosowanie licencji systemu B2B część 1

Podejmowanie decyzji. Piotr Wachowiak

Wyniki badań dla trasy kolejowej Warszawa - Poznań.

KALENDARZE. Ćwiczenie 1 Tworzenie nowego, edycja kalendarza. 1. Uruchom nowy projekt. 2. W menu Narzędzia kliknij polecenie Zmień czas pracy

Polska-Warszawa: Usługi w zakresie doradztwa prawnego i reprezentacji prawnej 2015/S

Wniosek o ustalenie warunków zabudowy

PODSTAWY DZIAŁANIA UKŁADÓW CYFROWYCH

DE-WZP JJ.3 Warszawa,

nowe procedury i formy wizualizacji

Zagadnienia transportowe

na dostawę licencji na oprogramowanie przeznaczone do prowadzenia zaawansowanej analizy statystycznej


Mężczyzna na studiach pielęgniarskich sukces czy porażka?

Analiza wariancji. Spis treści. Inżynieria biomedyczna, I rok Analiza danych pomiarowych

Konspekt lekcji otwartej

Zadania. SiOD Cwiczenie 1 ;

Załącznik nr 2 Testy logiczne służące sprawdzeniu jakości danych uczestników projektów współfinansowanych z EFS

I. LOGICZNE STRUKTURY DRZEWIASTE

RAPORT z diagnozy Matematyka na starcie

Standardowe tolerancje wymiarowe

Metody opracowywania dokumentów wielostronicowych. Technologia Informacyjna Lekcja 28

Tematyka i rozwiązania metodyczne kolejnych zajęć lekcyjnych wraz z ćwiczeniami.

R E G U L A M I N. Podstawa prawna: 41 pkt. 28 Statutu Spółdzielni. I POSTANOWIENIA OGÓLNE

Zadania z parametrem

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie arkusza kalkulacyjnego EXCEL do rozwiązywania układów równań liniowych metodą wyznacznikową

Warszawa, dnia 6 listopada 2015 r. Poz ROZPORZĄDZENIE MINISTRA ROLNICTWA I ROZWOJU WSI 1) z dnia 23 października 2015 r.

Podstawy Analiza zależności Statystyka opisowa STATYSTYKA. Stanisław Jaworski. Katedra Ekonometrii i Informatyki Zakład Statystyki

1 Miary asymetrii i koncentracji

Przykłady wybranych fragmentów prac egzaminacyjnych z komentarzami Technik technologii odzieży 311[34]

CitiDirect Online Banking. Powiadomienia

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 5

Ilość w szt PRASA NOŻNA PODWÓJNA

Algorytmy graficzne. Podstawy kompresji danych fragment wykładu. Marcin Wilczewski

Intellect. Business Intelligence. Biblioteka dokumentów Podręcznik. Business Intelligence od 2Intellect.com Sp. z o.o.

Zarządzanie Zasobami by CTI. Instrukcja

Strategia rozwoju kariery zawodowej - Twój scenariusz (program nagrania).

Nowe funkcjonalności

REGULAMIN PRZYZNAWANIA STYPENDIÓW NA KIERUNKACH ZAMAWIANYCH W RAMACH PROJEKTU POKL

I.1.1. Technik organizacji usług gastronomicznych 341[07]

Zamawiający potwierdza, że zapis ten należy rozumieć jako przeprowadzenie audytu z usług Inżyniera.

ZAPYTANIE OFERTOWE W SPRAWIE ZAMÓWIENIA LINIA DO CIĘCIA POPRZECZNEGO. Krzęcin,

PROCEDURA EWALUACJI WEWNĘTRZNEJ W SZKOLE PODSTAWOWEJ IM. JANA PAWŁA II W GRZĘDZICACH

Zakres pomiaru (Ω) Rozdzielczość (Ω) Dokładność pomiaru

Instrukcja logowania do aplikacji ING Agent

NUMER IDENTYFIKATORA:

Kurs wyrównawczy dla kandydatów i studentów UTP

JADWIGA SKIMINA PUBLIKACJA NA TEMAT: NAUKA MS. WORD 2000 W KLASIE IV

PROCEDURA AWANSU ZAWODOWEGO NA STOPIEŃ NAUCZYCIELA MIANOWANEGO W ZESPOLE SZKÓŁ INTEGRACYJNYCH NR 1 W KATOWICACH

Dodano: KALKULATOR BRUTTO-NETTO

Polska-Warszawa: Usługi skanowania 2016/S


Wdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x

Instrukcja do Arkusza kosztorysowania sieci klasy NGA na obszarach wymagających wsparcia publicznego.

Transkrypt:

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność próby była poniżej 2000, gdyż w przeciwnym wypadku daje mylne wyniki. Test ten wymaga, aby cecha miała rozkład ciągły. Kołmogorowa-Smirnowa (K-S): Wymaga znajomości średniej i odchylenie standardowego dla populacji. W sytuacji, gdy nie znamy wyżej wymienionych parametrów stosujemy test K-S z poprawką Lilieforsa. Test K-S wymaga, aby cecha była ciągła. Jest to test mocniejszy, aniżeli test Χ 2. Przykład 1: Sprawdź czy zmienne: imisja SO 2 i pyłu posiadają rozkład zgodny z normalnym. 1. W menu wybieramy polecenie STATYSTYKA STATYSTYKI PODSTAWOWE I TABELE. 2. Klikamy na przycisk Zmienne i wskazujemy na SO2_D24 i Pyl_D24. 3. Następnie klikamy na przycisk Normalność. Statystyka i modelowanie w ochronie środowiska Strona 1

4. W kolejnym kroku zaznaczamy wskazane pola wyboru, a następnie klikamy na Histogramy: WYNIKI: 600 Histogram: SO2_D24 K-S d=.13113, p<.01 ; Lillief ors p<.01 Shapiro-Wilk W=.84723, p=0.0000 500 400 Liczba obs. 300 200 100 0-5 0 5 10 15 20 25 30 35 40 X <= Granica klasy Statystyka i modelowanie w ochronie środowiska Strona 2

Histogram: Pyl_mD1 K-S d=.07521, p<.01 ; Lilliefors p<.01 Shapiro-Wilk W=.94728, p=0.0000 Statystyki opisowe (babulice100.sta) Zmienna 400 N ważnych Średnia Mediana Moda Liczność Minimum Maksimum Odch.std Mody SO2_D24 350 1095 6.64559 5.26560 8.800000 11 0.60000 36.7000 5.20404 Pyl_mD1 1095 54.06121 51.48000 Wielokr. 10 12.60000 146.2384 25.77776 300 Statystyki opisowe Zmienna (babulice100.sta) Skośność 250 Kurtoza SO2_D24 1.788387 4.905109 Pyl_mD1 0.842483 200 0.510501 W celu Liczba obs. 150 100 50 0-20 0 20 40 60 80 100 120 140 160 X <= Granica klasy stwierdzenia czy badana cecha posiada rozkład zgodny z normalnym patrzymy na wartość p. Jeśli ta wartość jest równa lub mniejsza aniżeli 0,05, to mamy podstawę do odrzucenia hipotezy zerowej i stwierdzenia, iż badana cecha nie posiada rozkładu zgodnego z normalnego. W powyższym przykładzie wszystkie testy normalności rozkładu dowodzą, iż istnieją podstawy do odrzucenia hipotezy zerowej. Oznacza to, że rozkład SO 2 i Pyłu jest niezgodny zgodny z rozkładem normalnym. Obydwie cechy posiadają rozkłady asymetryczne dodatnie (prawostronne). Statystyka i modelowanie w ochronie środowiska Strona 3

Przykład 2: Oblicz podstawowe miary położenia i zmienności w odniesieniu do LIPNIK! 1. Kliknij na przycisk SELECT CASES, a następnie wprowadź warunek selekcji! Statystyka i modelowanie w ochronie środowiska Strona 4

Statystyki opisowe (babulice100.sta)warunek uwzględniania: obiekt="lipniki" Zmienna N ważnych Średnia Ufność Ufność Minimum Maksimum Odch.std -95.000% 95.000 SO2_D24 365 5.17849 4.83351 5.52348 0.60000 13.9700 3.35162 Pyl_mD1 365 52.70718 50.17044 55.24391 12.60000 130.5700 24.64488 Zadanie 1 (MS EXCEL). Wykonaj wykresy typu HISTOGRAM, na którym zaprezentujesz rozkład masy i długości ciała noworodków. W tym celu posłuż się modułem Analiza danych. Histogram Częstość 25 20 15 10 5 0 2000 2500 3000 3500 4000 Zbiór danych (koszyk) Więcej Częstość Zadanie 2 (Statistica PL). Sprawdź czy długość, szerokość i masa jaj srok posiadają rozkład zgodny z normalnym (jajasrok.xls). Zadanie 3 (Statistica PL). Jaki rozkład posiadają liczebności drobnoustrojów (bakterie100.xls)? Czy rozkład uległ zmianie po wykonaniu transformacji logarytmicznych? Zadanie 4 (Statistica PL). Czy grubość rogówki posiada rozkład zgodny z normalnym? Statystyka i modelowanie w ochronie środowiska Strona 5

Wyznaczanie przedziałów ufności Estymacja to postępowanie statystyczne zmierzające do oszacowania parametrów populacji generalnej (µ,σ) na podstawie statystyk uzyskanych z populacji próbnej. Estymator statystyka z próby służąca do oszacowania parametru (θ). Może nim być średnia arytmetyczna, odchylenie standardowe, mediana, współczynniki zmienności. Estymator, podobnie jak sama zmienna losowa, posiada własny rozkład. Nie zawsze jednak wymienione wcześniej statystyki będą uznawane za najlepsze estymatory. Powinny spełniać one określone własności. Estymacja przedziałowa - polega na wyznaczeniu przedziału liczbowego, który z określonym prawdopodobieństwem zawiera szacowany parametr. Końce przedziału zależą od wartości estymatora. Przedział ufności - losowy przedział, który z określonym prawdopodobieństwem określa wartość parametru. To inaczej przedział liczbowy, w którym znajduje się prawdziwa, lecz nieznana wartość parametru θ. Przedział (g1,g2) jest przedziałem ufności parametru θ, określonym na poziomie ufności 1-α, jeżeli prawdopodobieństwo, że θ leży w tym przedziale jest równe 1-α. Poziom ufności 1-α jest prawdopodobieństwem, że θ leży w przedziale (g1,g2). Przedział (g1,g2), którym g1 i g2 przyjmują skończone wartości nazywa się dwustronnym przedziałem ufności. Jeżeli α =0,05, to 1-α =0,95 oznacza to, że średnio na każde 100 przedziałów ustalonych na 100 prób losowych, w 95 przypadkach prawdziwa wartość parametru θ znajduje się wewnątrz przedziału, natomiast w 5 przypadkach znajduje się poza przedziałem. Im niższy przyjmiemy poziom ufności, tym mniejsze będzie prawdopodobieństwo błędnego określenia przedziału, jednak jednocześnie wydłużony będzie przedział ufności. Statystyka i modelowanie w ochronie środowiska Strona 6

Przykład: Wyznacz 95% przedział ufności w odniesieniu do imisji SO 2 i pyłu. 1. W menu wybieramy polecenie STATYSTYKA STATYSTYKI PODSTAWOWE I TABELE. 2. Klikamy na przycisk Zmienne i wskazujemy na SO2_D24 i Pyl_D24. 3. Następnie klikamy na przycisk Więcej. Statystyka i modelowanie w ochronie środowiska Strona 7

4. W kolejnym kroku zaznaczamy wskazane pola wyboru: 5. Następnie klikamy na przycisk Podsumowanie. Statystyki opisowe (babulice100.sta) Zmienna N ważnych Średnia Ufność Ufność Minimum Maksimum Odch.std -95.000% 95.000 SO2_D24 1095 6.64559 6.33701 6.95416 0.60000 36.7000 5.20404 Pyl_mD1 1095 54.06121 52.53270 55.58971 12.60000 146.2384 25.77776 Odp.: Wyznaczony przedział ufności pozwala wnioskować z prawdopodobieństwem 95%, że średnia imisja dwutlenku siarki w otoczeniu zakładów przemysłowych o profilu zbliżonym do badanego powinna zawierać się w przedziale 6,33-6,96 µg / m 3. Należy oczekiwać, że średni poziom pyłu winien zawierać się w przedziale 52,53-55,59 µg / m 3. Zadanie 1 (MS EXCEL). 1. Otwórz plik roztocze.xls (wcześnie przekopiuj plik do własnego folderu) zawierający dane dotyczące liczebności roztoczy w pobliżu zakładów produkcyjnych. 2. Skopiuj do kolejnego wolnego arkusza wiersz zawierający nazwy cech. 3. Zmień nazwę tegoż arkusza roboczego na ufnosc. 4. Sporządź tabelę zawierającą wybrane miary położenia i zmienności w odniesieniu do liczby roztoczy w próbach z okolic Białowieży (średnia arytmetyczna, odchylenie standardowe). 5. Oblicz lewą i prawą stronę ufności (95%) dla wszystkich rodzajów mechowców i roztoczy. x S x ( tα ) < Θ < x + n ( t α S x * ) n 6. Sporządź szereg rozdzielczy prezentujący liczebność roztocze na m 2. W oparciu o sporządzony szereg rozdzielczy wykonaj wykres typu histogram. Jaki jest to typ rozkładu (roztocze.xls)? Statystyka i modelowanie w ochronie środowiska Strona 8

Zadanie 2 (STATISTICA PL). 1. Otwórz plik jajasrok.xls, który znajduje się w S:\OS_STAT\BAZY_XLS. Skonstruuj przedziały ufności (95 i 99%) dla długości, szerokości i masy jaj srok. Statystyka i modelowanie w ochronie środowiska Strona 9