Statystyczna analiza Danych

Podobne dokumenty
Statystyczna analiza danych

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wykład 3 Hipotezy statystyczne

Statystyka Matematyczna Anna Janicka

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Własności statystyczne regresji liniowej. Wykład 4

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Inżynierskie zastosowania statystyki Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna dla leśników

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka

Metody Statystyczne. Metody Statystyczne.

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych

wolne wolne wolne wolne

Testowanie hipotez statystycznych.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Testowanie hipotez statystycznych.

Wydział Matematyki. Testy zgodności. Wykład 03

Podstawy statystyki matematycznej w programie R

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka matematyczna i ekonometria

przedmiot podstawowy obowiązkowy polski drugi

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

PROGRAM NAUCZANIA PRZEDMIOTU OBOWIĄZKOWEGO NA WYDZIALE LEKARSKIM I ROK AKADEMICKI 2014/2015 PRZEWODNIK DYDAKTYCZNY dla STUDENTÓW IV ROKU STUDIÓW

Statystyka matematyczna

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2013/2014

PRZEWODNIK PO PRZEDMIOCIE

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Hipotezy statystyczne

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Statystyka matematyczna (STA230) 2. KIERUNEK: MATEMATYKA. 3. POZIOM STUDIÓW: I stopnia

Opis programu studiów

Na podstawie dokonanych obserwacji:

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Weryfikacja hipotez statystycznych

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Metody statystyczne w pedagogice Kod przedmiotu

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Ekonomii i Finansów Dr Katarzyna Brzozowska-Rup

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

STATYSTYKA MATEMATYCZNA

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Matematyka i statystyka matematyczna dla rolników w SGGW

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

Statystyka SYLABUS A. Informacje ogólne

PDF created with FinePrint pdffactory Pro trial version

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Transkrypt:

Statystyczna analiza Danych Dla bioinformatyków Wykład pierwszy: O testowaniu hipotez

Plan na dziś Quiz! Cele wykładu Plan na semestr Kryteria zaliczenia Sprawy organizacyjne

Quiz (15 minut) Jakie znasz rozkłady prawdopodobieństwa? Co to jest wartość oczekiwana zmiennej losowej? Jakie jest prawdopodobieństwo (w przybliżeniu) wylosowania liczby >=2 z rozkładu normalnego N(0,1)? Co to jest hipoteza statystyczna i jakie błędy można popełnić przy jej testowaniu?

Cele wykładu Podstawowe pojęcia i intuicje statystyczne Praktyczne metody statystyczne w zadaniach bioinformatycznych Praktyczna nauka środowiska Gnu R do analiz statystycznych Umiejętność przetwarzania i wizualizacji danych Umiejętność wyboru metod statystycznych do pytania badawczego

Plan semestru Testy statystyczne Testowanie wielu hipotez Analiza Wariancji Korelacja i regresja Analiza dyskryminacyjna (LDA, QDA) Analiza skupień Modele mieszane

Plan semestru (c.d.) Zagadnienie klasyfikacji, metoda knn Składowe główne i kanoniczne korelacje Klasyfikatory drzewowe Mieszanki klasyfikatorów Klasyfikacja Bayesowska Metody jądrowe (np. SVM, KCCA)

Kryteria zaliczenia Ćwiczenia/Laboratorium 2 projekty: Mały projekt (testowanie hipotez): 10 pkt Duży projekt (klasyfikacja): 20 pkt, prezentacja na zajęciach Wykład egz. pisemny ( komputerowy ) 30 pkt Punkty sumują się razem do zdobycia 60 pkt Do zaliczenia potrzeba 60% (36 punktów)

Sprawy organizacyjne Kontakt: bartek@mimuw.edu.pl Pokój 5770, najlepiej po umówieniu się, Konsultacje Pon, 8.30-10. Strona przedmiotu: http://bioputer.mimuw.edu.pl/~bartek/sad

Literatura Wykłady brak oficjalnego podręcznika, slajdy nie są notatkami z wykładu Metody - http://statweb.stanford.edu/~tibs/elemstatlearn R www.biecek.pl/r/ http://www.biecek.pl/naprzelajprzezdatamining/

Statystyka klasyczna i Bayesowska Thomas Bayes Ronald A. Fisher (1701-1762) (1890-1962)

Przykład z życia Ronald Fisher użył w swojej książce takiegoprzykładu, opartego na ponoć faktycznym eksperymenie przeprowadzonym na Muriel Bristol, która twierdziła, że potrafi rozpoznać, czy do filiżanki najpierw wlano herbatę czy najpierw mleko. Twierdzi, że najpierw herbata Twierdzi, że najpierw mleko Najpierw herbata 3 1 Najpierw mleko 1 3

Test statystyczny W naszym przypadku interesuje nas, czy p. Bristol w istocie potrafi przewidzieć lepiej odpowiedź na nasze pytanie niż losowy rzut monetą. W tym celu definiujemy hipotezę zerową H 0, która mówi, że jej predykcje są losowe Będziemy próbowali odrzucić tę hipotezę, w oparciu o dane z naszej tabelki liczebności Kluczowe pytanie to: jakie jest prawdopodobieństwo uzyskania danych takich jak zaobserwowano lub lepszych przy założeniu H 0

Poziom istotności Dla testu statystycznego, będziemy ustalali poziom istotności, czyli prawdopodobieństwo poniżej którego będziemy odrzucać H 0 Błędem I rodzaju (false-positive) będziemy określać sytuację, w której odrzucimy H 0, która była w rzeczywistości spełniona Błędem II rodzaju (false-negative) będziemy nazywali sytuację odwrotną, czyli przyjęcie H 0, które w istocie nie jest spełnione.

Rozkład hipergeometryczny

Test Fisher'a Dla zadanej tablicy liczebności (contingency table), prawdopodobieństwo osiągnięcia zadanej liczebności przy założeniu hiopotezy zerowej jest zadane rozkładem hipergeometrycznym: Nas interesuje P(X>=x)

Przykłady bardziej bioinformatyczne Spośród 20 000 genów, 5000 podlega ekspresji w tkance A, a 7000 w tkance B. W obu tkankach mamy ekspresję 2000 genów, czy tkanki A i B mogą mieć wspólne mechanizmy ekspresji genów? Mam 10 000 pozycji w genomie, gdzie może wystąpić wiązanie czynnika X, oraz 15 000 miejsc potencjalnych wystąpień wiązania czynnika Y, jeśli wiem, że wszystkich miejsc wiązania może być 100000, to czy mogę zakładać, że X I Y wiążą się niezależnie od siebie, jeśli mają wspólnych 2000 wystąpień?