Funkcja sample() Funkcja sample(), domyślnie generuje dane bez powtórzeń.

Podobne dokumenty
Funkcja sample, domyślnie generuje dane bez powtórzeń.

Programowanie Generowanie danych. Uwagi ogólne

Programowanie Generowanie danych. Uwagi ogólne

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Analiza niepewności pomiarów

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Wnioskowanie Statystyczne - Ćwiczenia Michał Marosz Monday, February 23, 2015

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka i Analiza Danych

Wydział Matematyki. Testy zgodności. Wykład 03

Rozkłady statystyk z próby

Spis treści 3 SPIS TREŚCI

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Wykład 3 Hipotezy statystyczne

Hipotezy statystyczne

Hipotezy statystyczne

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

OPIS MODUŁ KSZTAŁCENIA (SYLABUS)

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Środowisko R wprowadzenie c.d. Wykład R2; Struktury danych w R c.d.

STATYSTYKA

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Własności statystyczne regresji liniowej. Wykład 4

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Prawdopodobieństwo i statystyka r.

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Metoda największej wiarygodności

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Statystyka Matematyczna Anna Janicka

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Estymacja parametrów w modelu normalnym

Niepewność pomiaru. Wynik pomiaru X jest znany z możliwa do określenia niepewnością. jest bledem bezwzględnym pomiaru

Statystyka matematyczna i ekonometria

STATYSTYKA MATEMATYCZNA, LISTA 3

Testy nieparametryczne

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Weryfikacja hipotez statystycznych

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

Testowanie hipotez statystycznych

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Opis przedmiotu: Probabilistyka I

W3 - Niezawodność elementu nienaprawialnego

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79

Testowanie hipotez statystycznych.

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

przedmiot podstawowy obowiązkowy polski drugi

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wykład 7 Testowanie zgodności z rozkładem normalnym

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Ważne rozkłady i twierdzenia

Testowanie hipotez statystycznych.

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

4.Zmienne losowe X 1, X 2,..., X 100 są niezależne i mają rozkład wykładniczy z α = 0.25 Jakie jest prawdopodobieństwo, że 1

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Testowanie hipotez statystycznych

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

KARTA KURSU. Kod Punktacja ECTS* 1

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Monte Carlo, bootstrap, jacknife

Wykład 10 Testy jednorodności rozkładów

Aleksander Adamowski (s1869) zmienn ą losow ą T o rozkładzie wykładniczym o średniej 5 minut.

LABORATORIUM Z FIZYKI

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Transkrypt:

Generowanie dowolnych danych Funkcja sample() Funkcja sample(), domyślnie generuje dane bez powtórzeń. Predefiniowane wektory W R znajdują się pewne predefiniowane wektory, z których możemy losować elementy za pomocą funkcji sample. Są to: letters (małe litery), LETTERS (wielkie litery), month.abb (skróty trzyliterowe angielskich nazw miesięcy), month.name (angielskie nazwy miesięcy). Funkcja gl() Funkcja gl() służy do generowania zmiennych czynnikowych. gl(n = l. poziomów, k = l. powtórzeń, length = długość, labels = poziomy)

Funkcje dotyczące rozkładów prawdopodobieństwa Rozkład Dystrybuanta Gęstość Kwantyl Generator dwumianowy pbinom dbinom qbinom rbinom Poissona ppois dpois qpois rpois ujemny dwumianowy pnbinom dnbinom qnbinom rnbinom geometryczny pgeom dgeom qgeom rgeom hipergeometryczny phyper dhyper qhyper rhyper wielomianowy dmultinom rmultinom jednostajny punif dunif qunif runif beta pbeta dbeta qbeta rbeta wykładniczy pexp dexp qexp rexp gamma pgamma dgamma qgamma rgamma normalny pnorm dnorm qnorm rnorm logarytmiczno-normalny plnorm dlnorm qlnorm rlnorm Weibulla pweibull dweibull qweibull rweibull chi-kwadrat pchisq dchisq qchisq rchisq t pt dt qt rt Cauchy ego pcauchy dcauchy qcauchy rcauchy F pf df qf rf

Rodzaje błędów Błąd pomiarowy Rachunek błędów jest to zespół zagadnień na pograniczu metrologii, statystyki i matematyki. Obejmuje zasady opracowywania i prezentacji wyników doświadczalnych. Wszelkie wyniki pomiarów pozbawione dyskusji błędów, a zwłaszcza określenia błędu pomiarowego (różnica pomiędzy wynikiem pomiaru, a prawdziwą wartością), są w istocie wyłącznie wskazaniami. Błąd pomiarowy nie powstaje jedynie w wyniku pomyłki, jest on nieodłącznym czynnikiem procesu pomiarowego.

Rodzaje błędów Elementy błędu pomiarowego Błąd pomiarowy składa się z dwóch elementów: 1 Błąd statystyczny, przypadkowy błąd wynikający z ogółu wpływów środowiska, których często nie można zidentyfikować czy wyeliminować. Charakteryzuje się niewielką wartością oraz losowym znakiem i wartością. Związany jest z pomiarem i nie można go całkowicie wyeliminować. Redukuje się go poprzez powtarzanie pomiarów i uśrednianie. 2 Błąd systematyczny błąd wynikający z zastosowanej metody pomiaru lub innych przyczyn (np. niedających się wykluczyć, ale znanych zjawisk mających wpływ na pomiar). Charakteryzuje się stałym znakiem, tj. zawsze powoduje zawyżenie lub zaniżenie wartości wyniku pomiaru, wpływa jednakowo na wszystkie pomiary. Błąd systematyczny o znanej wartości nazywamy poprawką.

Rodzaje błędów pomiarowych

Błąd gruby Błąd gruby Wyróżnia się również błąd gruby (pomyłkę), który jest pewną odmianą błędu przypadkowego, w sensie jego przypadkowego pojawiania się. Ma miejsce, gdy któryś z wyników pomiaru odbiega znacznie od pozostałych. Możemy wówczas podejrzewać, że pewne zdarzenie wypaczyło wynik eksperymentu. Błędy grube mogą wynikać np. ze złego odczytania skali przyrządu pomiarowego, pomyłki przy zapisie miejsca przecinka, pomiaru błędnego obiektu. Wyniki takie powinny zostać odrzucone podczas analizy statystycznej.

Błąd gruby Eliminacja błędów grubych (obserwacji odstających) 1 Odrzucamy wynik zauważając podejrzaną wartość. 2 Kryterium Chauveneta obliczamy średnią oraz wariancję z całej próby, następnie dla podejrzanej obserwacji liczymy t = x x. s Jeśli możemy założyć normalność pomiarów, to znajdujemy prawdopodobieństwo, że zmienna losowa będzie oddalona od średniej o nie mniej niż ts, czyli p = P( X x ts) = 1 P( X x < ts) = 2 2 Φ(t). Dysponując próbą o liczebności n, spodziewamy się, że poza tym przedziałem znajdzie się np obserwacji. Odrzucamy obserwację jeśli np < 1/2.

Błąd gruby Eliminacja błędów grubych (obserwacji odstających) 3 Kryterium Peirce a pozwala wykryć więcej niż jedną obserwację odstającą przy założeniu normalności danych. 4 Odpowiedni test statystyczny: Test Dixona (test Q) stosujemy go dla próbek o liczności poniżej 26, dodatkowo zakładamy normalność danych. Test Grafa (dla próbek powyżej 25) odrzucamy obserwacje, które leżą poza przedziałem ( x 4s, x + 4s), gdzie x oraz s liczone są z wyłączeniem podejrzanej obserwacji. Test Grubbsa najbardziej polecany, jest ulepszoną wersją testu Grafa, zakładamy normalność danych.

Błąd gruby Benjamin Peirce (1809-1880) Bibliografia William Chauvenet (1820-1870) Frank Grubbs (1913-2000) Chauvenet, William. (1863). A manual of spherical and practical astronomy. American Journal of Science 2(36):378 384. Grubbs, Frank E. (1950). Sample criteria for testing outlying observations. Annals of Mathematical Statistics 21(1):27 58. Peirce, Benjamin (1852). Criterion for the rejection of doubtful observations. Astronomical Journal 2(45):161 163.

Błąd gruby Eliminacja błędów grubych (obserwacji odstających) przykład Wyniki oznaczeń zawartości jonów miedzi (Cu 2+ ) w próbce ścieków [mg/dm 3 ] wyglądają następująco: 0,875, 0,863, 0,876, 0,868, 0,771, 0,881, 0,878, 0,869, 0,866. Czy jakaś z obserwacji może zostać uznana za odstającą, jeśli zakładamy, że zawartość jonów ma rozkład normalny? Korzystając z kryterium Chauveneta otrzymujemy 0.771 0.8608 t = = 2.63. 0.0341 p = 2 2 Φ(2.63) = 0.0085 np = 9 0.0085 = 0.077 < 1/2. Zatem, najmniejsza obserwacja jest obserwacją odstającą.

P-wartość P-wartość (ang. p-value) to prawdopodobieństwo (przy prawdziwości H 0 ) otrzymania wartości równej lub bardziej ekstremalnej niż zaobserwowana. P-wartość pozwala bezpośrednio ocenić wiarygodność hipotezy. Im p-wartość jest większa, tym bardziej brak nam podstaw, aby w nią wątpić. Mała p-wartość świadczy przeciwko hipotezie zerowej.

P-wartość