Wykład 2: Tworzenie danych

Podobne dokumenty
Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Spis treści 3 SPIS TREŚCI

Wykład 10 Zrandomizowany plan blokowy

Wykład 9 Wnioskowanie o średnich

Prawdopodobieństwo i statystyka

Pobieranie prób i rozkład z próby

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

STATYSTYKA MATEMATYCZNA

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

Metody probabilistyczne

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

Wykład 2. Transformacje (przekształcenia) danych

Wykład 2. Standaryzacja: Przykład: wpływ stałej addytywnej: odejmujemy 20. Liniowa transformacja zmiennych. Liniowa transformacja zmiennych, cd.

Statystyka i Analiza Danych

Wnioskowanie statystyczne. Statystyka w 5

METODY STATYSTYCZNE W BIOLOGII

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wykład 10. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Testowanie hipotez statystycznych.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

W1. Wprowadzenie. Statystyka opisowa

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Analiza niepewności pomiarów

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Z poprzedniego wykładu

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

laboratoria 24 zaliczenie z oceną

Analiza wariancji. dr Janusz Górczyński

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

1.1 Wstęp Literatura... 1

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Metody Statystyczne. Metody Statystyczne.

Przykłady bloków: Przykład. Przyporządkowanie. Wykład 9 Zrandomizowany plan blokowy

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Estymacja punktowa i przedziałowa

Przykłady bloków: Przykład. Przyporządkowanie. Wykład 10 Zrandomizowany plan blokowy

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Statystyka i eksploracja danych

KARTA KURSU. Kod Punktacja ECTS* 1

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis

Wykład 8: Testy istotności

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Wykład 3 Momenty zmiennych losowych.

WNIOSKOWANIE STATYSTYCZNE

Statystyka w analizie i planowaniu eksperymentu

Wykład 3 Momenty zmiennych losowych.

Monte Carlo, bootstrap, jacknife

Statystyka w pracy badawczej nauczyciela

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Estymacja parametrów rozkładu cechy

Propensity Score Matching

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Eksperyment jako metoda badawcza

Grupowanie materiału statystycznego

Opis przedmiotu: Probabilistyka I

Testowanie hipotez statystycznych. Wprowadzenie

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Statystyka matematyczna i ekonometria

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Statystyka matematyczna i ekonometria

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Sterowanie wielkością zamówienia w Excelu - cz. 3

Transkrypt:

Wykład 2: Tworzenie danych Plan: Statystyka opisowa a wnioskowanie statystyczne Badania obserwacyjne a eksperyment Planowanie eksperymentu, randomizacja Próbkowanie z populacji Rozkłady próbkowe

Wstępna/opisowa analiza danych ujawnia interesujące cechy danych, ale może być niewystarczająca dla konkretnych wniosków. Bardziej graficzna. Wnioskowanie statystyczne daje informacje wraz z kontrolą wiarygodności. Bardziej liczbowa. Wnioskowanie statystyczne wymaga prawidłowego zbierania danych.

Przykłady i anegdoty a wnioski statystyczne Dostępne dane: US Census Bureau GUS British Medical Journal

Badania obserwacyjne a eksperyment Które jest które? Wpływ palenia na masę urodzeniową. Wpływ spożycia melatoniny na jakość snu. Wpływ ćwiczeń na utratę wagi.

Słownictwo: Cała grupa, która nas interesuje = populacja. Część populacji, którą badamy bezpośrednio = próbka.

Planowanie eksperymentu: słownictwo Obiekty, na których przeprowadzono eksperyment: jednostki eksperymentalne. Specyficzne warunki eksperymentalne zastosowane do jednostek: zabiegi. Zmienna objaśniająca: czynnik. Wartość współczynnika: poziom. Zidentyfikuj je w następującym eksperymencie.

Studium zdrowia lekarzy (1989): 21,996 osób. (atak serca, aspiryna/placebo: 139/239)

Eksperymenty porównawcze Obciążenie: Badanie ma obciążenie/ukryte preferencje, jeśli sprzyja pewnym wynikom. Źródła błędu: wybór jednostek, efekt placebo, brak realizmu. Eksperymenty porównawcze zmniejszają wpływ zmiennych ukrytych, np. efektu placebo. Jeśli to możliwe, użyj grupy kontrolnej i podwójnie ślepego eksperymentu.

Randomizacja/losowanie Przykład 1: Zmierz przyrost masy ciała szczurów na nowej diecie. Użyto 30 szczurów. Najprostszy zrandomizowany plan porównawczy: losowo przydzielamy szczury do leczenia.

3 zasady planowania eksperymentu Porównaj dwa lub więcej zabiegów. Przypisuj jednostki do zabiegów losowo. Replikuj zabiegi na wielu jednostkach, aby zmniejszyć zmienność wyników.

Jak losować: Aby przypisać jednostki do zabiegów użyj tablic liczb losowych, generatorów liczb pseudolosowych itp.

Randomizacja: Przykład 1 cd.: Przypisać 30 szczurów do 2 zabiegów. (Użyj np. linii 130 z Tabeli B.)

Przykład 2: Całkowicie losowy plan eksperymentu dotyczącego zużycia energii. 60 domów

Blokowe schematy randomizacji: Blok = grupa podobnych obiektów. Idea: porównaj zabiegi wewnątrz każdego bloku. Przykład: porównaj dwa zabiegi na parach bliźniąt. Zalety: możliwe są oddzielne wnioski dla każdego bloku i dokładniejsze ogólne wnioski.

Terapia antyrakowa:

Próbkowanie to... wybór części populacji, aby reprezentowała całość.

Próbkowanie: wstępna dyskusja Jak wybrałbyś ludzi do badania opinii publicznej, powiedzmy o polityce?

Problemy z próbkowaniem: Ochotnicy: osoby, które same zgłaszają się by wziąć udział w ankiecie Słaba reprezentacja: pewne grupy nie są objęte procedurą pobierania próbek. Brak odpowiedzi: wybrane przez nas osoby nie chcą współpracować.

Metoda wyboru próbki z populacji = plan próbkowania. Plany próbkowania: Próba prosta (losowa) (PP) = Każdy wybór n osób równie prawdopodobny. Próbkowanie warstwowe = Podział populacji na jednorodne "warstwy". Wybierz PP dla każdej warstwy.

Wybór PP Przykład 3. Wybierz losowo 4 osoby z klasy, by wstały. Porównaj z randomizacją zabiegów. Czy wybrane osoby wyglądają reprezentatywnie? Czy możemy losować lepiej?

Istotność statystyczna Obserwowany efekt tak wyjątkowy, że rzadko zdarza się przez przypadek nazywany statystycznie istotnym. Statystycznie istotny efekt często jest podstawą do podjęcia przełomowych decyzji / zmiany oceny rzeczywistości.

Wnioskowanie statystyczne Parametr = liczba opisująca populację. Statystyka = liczba opisująca próbkę. Wnioskowanie statystyczne = za pomocą statystyki wnioskować o parametrze

Rozkłady próbkowe:

Meta-eksperyment:

Wiele próbek o wielkości n = 100 z populacji o parametrze p = 0,60. Rozkład statystyki p^ pokazany po prawej stronie.

Rozkład próbkowy Rozkład próbkowy to rozkład wartości badanej statystyki dla wszystkich możliwych próbek (losowych) o danym rozmiarze z populacji.

Obciążenie i rozrzut statystyki Statystyka użyta do oszacowania parametru jest nieobciążona, gdy średnia z jej rozkładu (próbkowego) jest równa parametrowi. Zmienność statystyki opisana jest przez rozrzut jej rozkładu, np. próbkowe odchylenie standardowe. Te własności zależą od populacji, od wielkości próby, a także od schematu próbkowania i postaci statystyki.

Rozkłady próbkowe średniej dla różnych wielkości próbek (n=10, n=50).

Uwagi: Zmienność statystyki zależy od wielkości próby, a nie zależy od wielkości populacji. Randomizacja często daje rozkłady scentrowane w pobliżu parametru populacji, przy czym rozrzut rozkładu maleje, gdy wielkość próbki n rośnie. Rozkłady próbkowe są badane za pomocą teorii prawdopodobieństwa.