Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Podobne dokumenty
Wykład 2. Standaryzacja: Przykład: wpływ stałej addytywnej: odejmujemy 20. Liniowa transformacja zmiennych. Liniowa transformacja zmiennych, cd.

Wykład 2. Transformacje (przekształcenia) danych

Wykład 10. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Pobieranie prób i rozkład z próby

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Prawdopodobieństwo i statystyka

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Wykład 2: Tworzenie danych

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Testowanie hipotez statystycznych.

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Oszacowanie i rozkład t

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Estymacja parametrów rozkładu cechy

Metody Statystyczne. Metody Statystyczne.

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Analiza statystyczna w naukach przyrodniczych

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

STATYSTYKA I DOŚWIADCZALNICTWO

Testowanie hipotez statystycznych.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Wykład 3. Rozkład normalny

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Wykład 5: Statystyki opisowe (część 2)

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

W1. Wprowadzenie. Statystyka opisowa

Testowanie hipotez statystycznych.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

STATYSTYKA MATEMATYCZNA

Zadania ze statystyki, cz.6

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Rozkłady statystyk z próby. Statystyka

STATYSTYKA MATEMATYCZNA

Wnioskowanie statystyczne. Statystyka w 5

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Testowanie hipotez statystycznych

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Statystyczne metody analizy danych

INFORMATYKA W CHEMII Dr Piotr Szczepański

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

WYKŁAD 5 TEORIA ESTYMACJI II

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Centralne twierdzenie graniczne

1 Podstawy rachunku prawdopodobieństwa

Estymacja punktowa i przedziałowa

1.1 Wstęp Literatura... 1

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Metody probabilistyczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść I

Spis treści 3 SPIS TREŚCI

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Z poprzedniego wykładu

Rozkłady statystyk z próby

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

METODY STATYSTYCZNE W BIOLOGII

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2

Analiza wariancji. dr Janusz Górczyński

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Xi B ni B

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Ważne rozkłady i twierdzenia c.d.

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Wykład 9 Wnioskowanie o średnich

Transkrypt:

Wykład Zmiana wartości wynikająca ze zmiany jednostek dana jest zwykle funkcją liniową: y = ay + c Wpływ przekształceń Co się stanie ze średnią i odchyleniem standardowym, gdy zmienimy jednostki? Przykłady: stopnie Celsiusza stopnie Fahrenheita dolary 1,000 dolarów wartość faktyczna odległość od minimum cm : mm, in, nm, m, ft; dolary : euro Przykłady: y = 1.8 y + 3 y = 1/1000 y ( + 0) y = (1)y - y min Wpływ stałej (odejmujemy 0) Uwagi: a-współczynnik (kierunkowy) c-stała niekiedy a = 1 lub c = 0 Funkcja liniowa nie zmienia w zasadniczy sposób kształtu histogramu. Może go rozszerzyć ( a >1), ścieśnić ( a <1), przesunąć (c<>0) i obrócić (a<0). Średnia y 6 8 6 Dev. 0 y 6 8 6 Dev 0 Średnia y zmienia się tak jak y. Mamy: Wariancja jest kwadratem SD. Mamy: y = a y + c s = a s Odchylenie standardowe s zmienia się tylko pod wpływem współczynnika a (stała c nie ma wpływu na odchylenie standardowe, ponieważ zależy ono jedynie od odchyleń od średniej). Mamy: Przykład: Y- temperatura w F: y = 98.6, s = 0.9, s = 0.81 Oblicz średnią, odchylenie standardowe i wariancję dla tych samych danych wyrażonych w stopniach Celsjusza. s = a s 1

Rozwiązanie: Standaryzacja: Jakich wyników należy oczekiwać, gdy dane przekształcimy w następujący sposób y' = (y- y )/s =(y-98.6)/0.9? Jest to transformacja liniowa: y' = 1/s y - y/s. Odpowiedź: Liniowa transformacja zmiennych: inne statystyki Funkcja liniowa zmienia: medianę i kwartyle tak, jak średnią, rozstęp i IQR tak, jak odchylenie standardowe. Transformacje nieliniowe Funkcje nieliniowe (np. logarytm) zmieniają kształt histogramu i na ogół nie ma prostych formuł dla nowej średniej i nowego odchylenia standardowego. Przykład: dla y =log(y) na ogół y log y Wielkości te liczymy z korzystając z nowego zbioru danych. Z medianą i kwartylami jest lepiej... Funkcji nieliniowych używany niekiedy po to, aby przekształcić dane skośne w dane bardziej symetryczne.

Wnioskowanie statystyczne Próba a populacja Populacja: Zbiór, z którego losujemy próbę i który chcemy opisać. Czasami rzeczywista, czasami abstrakcyjna (np. nieskończenie duża próba ). Próba: Podzbiór populacji. Próba powinna być reprezentatywna dla populacji. Wnioskowanie statystyczne: Wnioskowanie o populacji w oparciu o próbę. Populacja Grupa wykładowa Wszyscy pacjenci biorący Prozac ``wszystkie rzuty kostkami Wszystkie owocówki ze śmietnika, albo Wszystkie owocówki w okolicy Parametry : µ, σ Populacja µ σ Próbkowanie Próba 10 losowo wybranych studentów 30 pacjentów biorących Prozac rzutów kostką Owocówki złapane na śmietniku Wnioskowanie Próba y s Statystyki y, s Parametry populacji µ = średnia w populacji, µ=ey, wartość oczekiwana zmiennej Y σ = odchylenie standardowe w populacji, σ =(Var Y) 1/, pierwiastek kwadratowy wariancji zmiennej Y, Var Y=E(Y-µ)...i inne. Statystyki z próby są estymatorami, służą do oceny parametrów całej populacji. Parametry i estymatory odróżniamy w notacji. Przykład: Grupy krwi u 3696 osób żyjących w Anglii. Grupa krwi A B AB O suma Liczność 1,634 Około 44% ludzi w próbie ma grupę krwi A. A w Anglii?? (Czy nie było systematycznego błędu przy próbkowaniu? Czy rozmiar próby był dość duży?) 37 119 1616 3696 Możliwe błędy przy próbkowaniu: Próba złożona z przyjaciół i pracowników może nie być reprezentatywna..mimo tego... Grupy krwi mogą być reprezentatywne...ale już... Pomiary ciśnienia nie byłyby reprezentatywne (ciśnienie na ogół wzrasta z wiekiem). 3

Populacja a próba Średnia z próby y na ogół różni się od wartości oczekiwanej µ=ey (średniej w populacji), ale w miarę wzrostu rozmiaru próby różnica między tymi wielkościami zwykle dąży do zera. Średnia z próby jest estymatorem wartości oczekiwanej. Podobnie próbkowe odchylenie standardowe s i wariancja próbkowa s są estymatorami odpowiednich parametrów w populacji: σ i σ =Var Y. Przykład Rozmiar populacji=0, średnia w populacji =6.48 Populacja:. 17.8 36.7 9.8 40.7 6.0 7.7 7.7 10.3.3 4.4 43.4 0. 4. 44. 1.6.7 48.6 3.9 7. 17.0 19. 47.7 3.9 39.3 9. 30.7 18.9.7 3.8 16.8 11.7 13.9 4.9 49.4 30. 0.7 38.1.6 40.7 4.0 30.8 11.3 34.0 49.7 1.3 3. 8.7 19.7 3.6 Stopniowo powiększamy próbę losową do rozmiarów n=10, 0, 30, 40 Otrzymana średnia z próby: 3. (dla n=10), 7.3 (n=0), 6.7 (n=30), 6.4 (n=40) Prosta próba losowa: Próbkowanie, cd. Każdy osobnik z populacji może być wybrany z tym samym prawdopodobieństwem. Wybory poszczególnych osobników są od siebie niezależne. Jak wybrać prostą próbę losową: Mechanizm losujący, np.: Przyznajemy numer każdemu osobnikowi Losujemy numery=osobników, tyle razy, ile wynosi rozmiar próby Do losowania możemy użyć urn, komputera lub gotowej tablicy liczb (cyfr) losowych (zob. dalej). Gdy rozmiar populacji nie jest ustalony lub nie mamy dostępu do wszystkich osobników, zadanie jest dużo trudniejsze. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy) Dziennikarka Ann Landers spytała swoich czytelników Gdybyście mogli zacząć je-szcze raz: czy mielibyście znowu dzieci? Odpisało prawie 10,000 czytelników i 70% powiedziało: Nie! Populacja: wszyscy rodzice w USA 4

Przykład 1 (Ochotnicy) cd. Próba: część populacji, która zdecydowała się odpisać, n=10,000. Czasopismo Newsday przeprowadziło statystycznie zaplanowaną ankietę, w której 91% z 1,373 przepytanych rodziców odpowiedziało: Tak! Wniosek: ochotnicy=bardzo zła reprezentatywność (badanie bezwartościowe). Przykład Przewidywanie wyników wyborów prezydenckich w USA, 1936: Literary Digest wysłało kwestionariusze do 10 milionów ludzi (% głosujących) Odpowiedziało.4 miliona: Przewidywanie: Landon 7%, Roosevelt 43% Wynik wyborów: Roosevelt 6%, Landon 38% Uwagi: F.D. Roosevelt, Partia Demokratyczna, prezydent w latach 193394; Wielki Kryzys: 199-1933 Przyczyny błędu Literary Digest: Obciążenie w próbkowaniu Złe (dyskryminujące) próbkowanie: Użyto książek telefonicznych, list członkowskich klubów, listy zamówień pocztowych, listy właścicieli pojazdów Brak odpowiedzi: Tylko 4% odpowiedziało (niemal wyłącznie Republikanie) Uwaga: George Gallup przewidział poprawnie na podstawie reprezentatywnej próbki 0 000 osób. Obciążenie w próbkowaniu występuje, gdy mamy do czynienia z systematycznym błędem faworyzującym pewną część populacji. W przypadku takiego obciążenia nie pomoże nawet duży rozmiar próby. Losowy wybór elementów do próby zwykle eliminuje takie obciążenie. Warianty losowego wyboru: Stratyfikacja Dzielimy populację na pod-populacje podobnych jednostek (warstwy) i oddzielnie próbkujemy w każdej warstwie. Przykłady warstw: studenci & studentki grupy zawodowe regiony geograficzne Warianty losowego wyboru cd.: Próbkowanie wielostopniowe Przykład: Badanie w USA dotyczące struktury zatrudnienia. Ankietuje się około 60.000 gospodarstw domowych co miesiąc. Poziom 1: losowa próba z 3,000 counties Poziom : losowa próba reprezentująca powiaty w każdym wybranym county Poziom 3: losowa próba reprezentująca gminy w każdym wybranym powiecie Poziom 4: losowa próba gospodarstw domowych w każdej wybranej gminie