Wyklad 1. Analiza danych za pomocą pakietu SAS. Obiekty i zmienne. Rodzaje zmiennych



Podobne dokumenty
Test F- Snedecora. będzie zmienną losową chi-kwadrat o k 1 stopniach swobody a χ

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

AUTOR MAGDALENA LACH

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

Dokonamy analizy mającej na celu pokazanie czy płeć jest istotnym czynnikiem

Niegrzeczne dzieciaki na gorącym krześle

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

ROZWIĄZANIA PRZYKŁADOWYCH ZADAŃ. KORELACJA zmiennych jakościowych (niemierzalnych)

Plakaty (format A3), ulotki (A6) i ogłoszenia muszą zawierać następujące treści i logotypy graficzne:

Statystyki opisowe. Marcin Zajenkowski. Marcin Zajenkowski () Statystyki opisowe 1 / 57

I. LOGICZNE STRUKTURY DRZEWIASTE

RAPORT Z 1 BADANIA POZIOMU SATYSFAKCJI KLIENTÓW URZĘDU MIEJSKIEGO W KOLUSZKACH

Informatyka w selekcji - Wykªad 4

Ćwiczenie nr 2 Zbiory rozmyte logika rozmyta Rozmywanie, wnioskowanie, baza reguł, wyostrzanie

Podstawowe testy statystyczne

Estymacja przedziałowa

Sztuczna inteligencja : Naiwny klasyfikator Bayesa

SCENARIUSZ LEKCJI WYCHOWAWCZEJ: AGRESJA I STRES. JAK SOBIE RADZIĆ ZE STRESEM?

Wiedza niepewna i wnioskowanie (c.d.)

Konspekt lekcji otwartej

Komentarz technik ochrony fizycznej osób i mienia 515[01]-01 Czerwiec 2009

STA T T A YSTYKA Korelacja

Regulamin Obrad Walnego Zebrania Członków Stowarzyszenia Lokalna Grupa Działania Ziemia Bielska

WZÓR UMOWY ZLECENIE Nr.

INFORMATYKA W SELEKCJI

Warszawa, dnia 17 grudnia 2015 r. Poz UCHWAŁA PAŃSTWOWEJ KOMISJI WYBORCZEJ. z dnia 23 listopada 2015 r.

s n = a k (2) lim s n = S, to szereg (1) nazywamy zbieżnym. W przeciwnym przypadku mówimy, że szereg jest rozbieżny.

14.Rozwiązywanie zadań tekstowych wykorzystujących równania i nierówności kwadratowe.

Zadania z parametrem

PODSTAWY DZIAŁANIA UKŁADÓW CYFROWYCH

Diagnoza psychologiczna: podstawowe kompetencje (II część - decyzje diagnostyczne) Rola intuicji w diagnozie

E k o n o m e t r i a S t r o n a 1

KRAJOWY REJESTR SĄDOWY. Stan na dzień godz. 14:59:36 Numer KRS:

SENAT RZECZYPOSPOLITEJ POLSKIEJ VII KADENCJA. Warszawa, dnia 6 listopada 2008 r. SPRAWOZDANIE KOMISJI RODZINY I POLITYKI SPOŁECZNEJ.

PAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows

Badania skuteczności działania filtrów piaskowych o przepływie pionowym z dodatkiem węgla aktywowanego w przydomowych oczyszczalniach ścieków

PROCEDURA EWALUACJI WEWNĘTRZNEJ W SZKOLE PODSTAWOWEJ IM. JANA PAWŁA II W GRZĘDZICACH

I.1.1. Technik organizacji usług gastronomicznych 341[07]

Zapytanie ofertowe. dotyczące robót budowlanych, modernizacji, remontu instalacji elektrycznej oraz remontu instalacji sanitarnej

Polska-Warszawa: Usługi w zakresie doradztwa prawnego i reprezentacji prawnej 2015/S

Załącznik nr 2 Testy logiczne służące sprawdzeniu jakości danych uczestników projektów współfinansowanych z EFS

Umowa Inwestycyjna. Dominika Mizielińska, radca prawny Dorota Koseła, radca prawny. Copyright 2016 by K&L Gates LLP. All rights reserved.

BIOMETRIA 3. Wprowadzenie do pakietu SAS

Rozliczenia z NFZ. Ogólne założenia. Spis treści

WNIOSEK O UDZIELENIE WSPARCIA DLA KREDYTOBIORCY 1) ZNAJDUJĄCEGO SIĘ W TRUDNEJ SYTUACJI FINANSOWEJ, KTÓRY ZACIĄGNĄŁ KREDYT MIESZKANIOWY 2)

PAKIET MathCad - Część III

I. 1) NAZWA I ADRES: Krajowe Centrum ds. AIDS, ul. Samsonowska 1, Warszawa, woj. mazowieckie, tel , faks

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Harmonogramowanie projektów Zarządzanie czasem

Spis treści. 1. Podstawy polityczne i prawne tworzenia programu ograniczania niskiej emisji... 13

ZARZĄDZENIE Nr 61/2015 Rektora Uniwersytetu Wrocławskiego z dnia 7 maja 2015 r.

Zebranie Mieszkańców Budynków, zwane dalej Zebraniem, działa na podstawie: a / statutu Spółdzielni Mieszkaniowej WROCŁAWSKI DOM we Wrocławiu,

Transport Mechaniczny i Pneumatyczny Materiałów Rozdrobnionych. Ćwiczenie 2 Podstawy obliczeń przenośników taśmowych

W. Guzicki Zadanie 23 z Informatora Maturalnego poziom rozszerzony 1

Programu Operacyjnego "Kapitał Ludzki ") współfinansowanego przez Unię Europejską w ramach środków Europejskiego Funduszu Społecznego.

Ogłoszenie o zamówieniu

KARTA KURSU DLA STUDIÓW PODYPLOMOWYCH

Sprawdź, jak obliczyć kwotę wolną od potrąceń w 2009 r.

1. Dofinansowania do turnusów rehabilitacyjnych

ROZDZIAŁ ÓSMY R o z w a ż a n i a n a t e m a t y ż e g l a r s k i e

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

KWESTIONARIUSZ ZGŁOSZENIOWY

Efektywność nauczania w Gimnazjum w Lutyni

Warszawska Giełda Towarowa S.A.

I.1.1. Technik mechanizacji rolnictwa 311[22]

SYSTEM FINANSOWANIA NIERUCHOMOŚCI MIESZKANIOWYCH W POLSCE

MATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel

Eugeniusz Gostomski. Ryzyko stopy procentowej

7. REZONANS W OBWODACH ELEKTRYCZNYCH

W nawiązaniu do korespondencji z lat ubiegłych, dotyczącej stworzenia szerszych

Eksperyment,,efekt przełomu roku

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

Mamy rok 2014, kolejna grupa absolwentów opuściła mury naszej szkoły. Szkołę ukończyły 2 klasy Liceum Ogólnokształcącego i 2 Technikum.

ROZWIĄZANIA ZADAŃ Zestaw P3 Odpowiedzi do zadań zamkniętych

OGŁOSZENIE WYNIKU POSTĘPOWANIA

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Gruntowy wymiennik ciepła PROVENT- GEO

Matematyka ubezpieczeń majątkowych r.

KRAJOWY REJESTR SĄDOWY. Stan na dzień godz. 17:45:57 Numer KRS:

Podejmowanie decyzji. Piotr Wachowiak

Gmina Miejska Kraków, Urząd Miasta Krakowa Adres pocztowy: Plac Wszystkich Świętych 3/4 Miejscowość: Kraków Kod pocztowy: Tel.

DE-WZP JJ.3 Warszawa,

Instalacja. Zawartość. Wyszukiwarka. Instalacja Konfiguracja Uruchomienie i praca z raportem Metody wyszukiwania...

Statystyka matematyczna 2015/2016

Komentarz Sesja letnia zawód: technik organizacji reklamy 342 [01] 1. Treść zadania egzaminacyjnego wraz z załącznikami.

Zmiany w programie C GEO v. 6.5

TEST WIADOMOŚCI: Równania i układy równań

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

WYNIKI BADANIA PT. JAK TAM TWOJE POMIDORY? :)

Instrukcja do ćwiczenia Kompensacja mocy biernej

Techniczne nauki М.М.Zheplinska, A.S.Bessarab Narodowy uniwersytet spożywczych technologii, Кijow STOSOWANIE PARY WODNEJ SKRAPLANIA KAWITACJI

Matematyka:Matematyka I - ćwiczenia/granice funkcji

Regulamin konkursu Konkurs z Lokatą HAPPY II edycja

Regulamin rekrutacji uczniów do klasy pierwszej Szkoły Podstawowej im. Maksymiliana Wilandta w Darzlubiu. Podstawa prawna: (Dz.U.2014 poz.

UCHWAŁA NR XVI/113/15 RADY MIASTA KOŚCIERZYNA. z dnia 30 września 2015 r.

REGULAMIN WYMIANY STOLARKI OKIENNEJ ZASOBÓW MIESZKANIOWYCH SPÓŁDZIELNI MIESZKANIOWEJ W WĄBRZEŹŃIE.

Test smaku syropu antyhistaminowego Contrahist. GfK 2013 GfK Healthcare Test smaku syropu antyhistaminowego Contrahist 1

INSTRUKCJA WYPEŁNIANIA SPRAWOZDANIA CZĘŚCIOWEGO LUB KOŃCOWEGO

Transkrypt:

Bioinformatyka - rozwój oferty edukacyjnej Uniwersytetu Przyrodniczego we Wrocławiu projekt realizowany w ramach Programu Operacyjnego Kapitał Ludzki współfinansowanego ze środków Europejskiego Funduszu Społecznego Wyklad 1 Analiza danych za pomocą pakietu SAS Graficzna reprezentacja danych Statystyki opisowe Podstawy testowania Małgorzata Bogdan Politechnika Wrocławska Obiekty i zmienne Obiekty np. ludzie, zwierzęta, przedmioty Zmienna charakterystyka obiektu Rodzaje zmiennych Zmienne Jakościowe Ilościowe Porządkowe Nie porządkowe Ciągłe Dyskretne

Rodzaje zmiennych Jakościowe Porządkowe: np. wybory w ankiecie ; nigdy, rzadko, czasami, często, zawsze Nie porządkowe: Kształt, kolor, rasa itp Ilościowe Ciągłe : wzrost, waga, stężenie Dyskretne : liczba kwiatów itp. Informacje o pracownikach CyberStat Graficzna reprezentacja danych Zmienne jakościowe Wykres słupkowy Wykres kołowy

Zmienne ilościowe - Histogram Statystyki opisowe Średnia Mediana Kwartyle Wykresy pudełkowe Standardowe odchylenie data deaths; input cause $ numdeath; cards; accident 13602 homicide 4989 suicide 3885 cancer 1724 heartdis 1048 congenit 430 respirat 208 AIDS 197; Program 3 proc gchart data=deaths; vbar cause / freq=numdeath; proc gchart data=deaths; pie cause / freq=numdeath; Program 4 data reading; infile ' c:\mbogdan\ecmi\data\ex01_026.txt'; input drp; proc univariate data=reading plot; var drp;

Testy istotności proc gchart data=reading; vbar drp/type=pct midpoints=14 to 54 by 4; proc univariate data=reading; histogram drp/ midpoints=14 to 54 by 4; Podstawy testowania Hipoteza zerowa i alternatywna P-wartość i poziom istotności. Postawienie hipotezy Hipoteza to stwierdzenie dotyczące parameterów opisujących populację lub model (a nie dane). Stawiamy dwie hipotezy: Hipotezę zerową H 0 Hipotezę alternatywną H a Hipoteza zerowa: Hipoteza zerowa to stwierdzenie, które na wstępie jest ``faworyzowane. Zazwyczaj opisuje mało interesującą sytuację ``braku wpływu lub ``braku zależności. Ustalamy czy dane dostarczają wystarczających przesłanek aby odrzucić hipotezę zerową. Test istotności określa w jakim stopniu dane przemawiają przeciwko hipotezie zerowej. Hipoteza alternatywna: Hipoteza alternatywna opisuje sytuację, która może mieć miejsce zamiast H 0. Często ustalamy najpierw H a - np. określamy spodziewany efekt zmiennej objaśniającej. Następnie określamy H 0 jako brak tego efektu. Przykład 1 ctnd. H 0 : µ = 200 Średnia (w populacji) waga pastylki wynosi 200mg. H a : µ 200 Średnia waga pastylki różni się od 200mg. Jest to alternatywa dwu-stronna. (Szukamy odchylenia w obu kierunkach.)

Przykład 1: Inne możliwe sytuacje H 0 : µ = 200 vs. H a : µ <200 Spodziewamy się mniejszej wagi. Alternatywa jedno-stronna. H 0 : µ = 200 vs. H a : µ >200 Spodziewamy się większej wagi. Alternatywa jedno-stronna. H 0 : µ 200 vs. H a : µ >200 Zasadniczo nie różni się od poprzedniej. Uwaga: O postaci alternatywy należy zdecydować przed analizą danych, w oparciu o ogólną wiedzę lub wcześniejsze eksperymenty. P-wartość P-stwo, że przy prawdziwości H 0 statystyka testowa przyjmie co najmniej tak ekstremalną wartość jak zaobserwowana w naszej próbie. Mała p-wartość świadczy przeciwko H 0. Żeby wyznaczyć p-wartość należy znać rozkład statystyki testowej przy H 0. Poziom istotności: P-stwo błędu pierwszego rodzaju. Wartość z którą porównujemy p-wartości. Zwykle oznaczany przez α. Typowe wartości α: 0.05, 0.01. Poziom istotności Jeżeli P-wartość α to mówimy, że dane są statystycznie istotne na poziomie istotności α tzn. mamy istotne przesłanki aby odrzucić hipotezę zerową. Uwaga: Dane o P-wartości 0.02 są statystycznie istotne na poziomie istotności 0.05, ale nie na poziomie istotności 0.01. Wniosek/decyzja: Jeżeli P-wartość jest mniejsza od ustalonego poziomu istotności to odrzucamy hipotezę zerową (na korzyść alternatywy). W innym przypadku nie mamy wystarczających przesłanek aby hipotezę zerową odrzucić. Uwaga: Razem z konkluzją należy podać p- wartość.