Funkcja sample, domyślnie generuje dane bez powtórzeń.

Podobne dokumenty
Funkcja sample() Funkcja sample(), domyślnie generuje dane bez powtórzeń.

Programowanie Generowanie danych. Uwagi ogólne

Programowanie Generowanie danych. Uwagi ogólne

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wnioskowanie Statystyczne - Ćwiczenia Michał Marosz Monday, February 23, 2015

Testowanie hipotez statystycznych.

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Spis treści 3 SPIS TREŚCI

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Weryfikacja hipotez statystycznych

Analiza niepewności pomiarów

Rozkłady statystyk z próby

Niepewność pomiaru. Wynik pomiaru X jest znany z możliwa do określenia niepewnością. jest bledem bezwzględnym pomiaru

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Wykład 3 Hipotezy statystyczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Ważne rozkłady i twierdzenia

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka i Analiza Danych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Hipotezy statystyczne

Hipotezy statystyczne

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

Środowisko R wprowadzenie c.d. Wykład R2; Struktury danych w R c.d.

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Testy nieparametryczne

W3 - Niezawodność elementu nienaprawialnego

Prawdopodobieństwo i statystyka r.

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

LABORATORIUM Z FIZYKI

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Opis przedmiotu: Probabilistyka I

Aleksander Adamowski (s1869) zmienn ą losow ą T o rozkładzie wykładniczym o średniej 5 minut.

Testowanie hipotez statystycznych

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Rozkłady prawdopodobieństwa

Statystyka i eksploracja danych

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Statystyka matematyczna dla leśników

Metoda największej wiarygodności

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Matematyka i statystyka matematyczna dla rolników w SGGW

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

STATYSTYKA MATEMATYCZNA, LISTA 3

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa


ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Komputerowa Analiza Danych Doświadczalnych

Biostatystyka, # 3 /Weterynaria I/

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

przedmiot podstawowy obowiązkowy polski drugi

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Komputerowa analiza danych doświadczalnych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Określanie niepewności pomiaru

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Prawdopodobieństwo i statystyka

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Wydział Matematyki. Testy zgodności. Wykład 03

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Statystyczna analiza danych

STATYSTYKA MATEMATYCZNA

OPIS MODUŁ KSZTAŁCENIA (SYLABUS)

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Transkrypt:

Generowanie danych Generowanie dowolnych danych Funkcja sample, domyślnie generuje dane bez powtórzeń.

Generowanie danych Generowanie dowolnych danych W R znajdują się pewne predefiniowane wektory, z których możemy losować elementy za pomocą funkcji sample. Są to: letters(małe litery), LETTERS(wielkie litery), month.abb(skróty trzyliterowe angielskich nazw miesięcy), month.name(angielskie nazwy miesięcy).

Generowanie danych Generowanie dowolnych danych Funkcja gl do generowania zmiennych czynnikowych. gl(n=l.poziomów,k=l.powtórzeń,length=długość,labels= poziomy)

Generowanie danych Funkcje dotyczące rozkładów prawdopodobieństwa Rozkład Dystrybuanta Gęstość Kwantyl Generator dwumianowy pbinom dbinom qbinom rbinom Poissona ppois dpois qpois rpois ujemny dwumianowy pnbinom dnbinom qnbinom rnbinom geometryczny pgeom dgeom qgeom rgeom hipergeometryczny phyper dhyper qhyper rhyper wielomianowy dmultinom rmultinom jednostajny punif dunif qunif runif beta pbeta dbeta qbeta rbeta wykładniczy pexp dexp qexp rexp gamma pgamma dgamma qgamma rgamma normalny pnorm dnorm qnorm rnorm logarytmiczno-normalny plnorm dlnorm qlnorm rlnorm Weibulla pweibull dweibull qweibull rweibull chi-kwadrat pchisq dchisq qchisq rchisq t pt dt qt rt Cauchy ego pcauchy dcauchy qcauchy rcauchy F pf df qf rf

Rodzaje błędów Generowanie danych Rachunek błędów jest to zespół zagadnień na pograniczu metrologii, statystyki i matematyki. Obejmuje zasady opracowywania i prezentacji wyników doświadczalnych. Wszelkie wyniki pomiarów pozbawione dyskusji błędów, a zwłaszcza określenia błędu pomiarowego(różnica pomiędzy wynikiem pomiaru, a prawdziwą wartością), są w istocie wyłącznie wskazaniami. Błąd pomiarowy nie powstaje jedynie w wyniku pomyłki, jest on nieodłącznym czynnikiem procesu pomiarowego. Błąd pomiarowy składa się z dwóch elementów:

Rodzaje błędów Generowanie danych błąd statystyczny, przypadkowy błąd wynikający z ogółu wpływów środowiska, których często nie można zidentyfikować czy wyeliminować. Charakteryzuje się niewielką wartością oraz losowym znakiemiwartością.związanyjestzpomiareminiemożnago całkowicie wyeliminować. Redukuje się go poprzez powtarzanie pomiarów i uśrednianie. Jest najczęściej nieznany, a wyznacza się go w pomiarach razem z wartością pomiaru, jako tzw. błąd pojedynczego pomiaru. błąd systematyczny błąd wynikający z zastosowanej metody pomiaru lub innych przyczyn(np. niedających się wykluczyć, ale znanych zjawisk mających wpływ na pomiar). Charakteryzuje się stałym znakiem, tj. zawsze powoduje zawyżenie lub zaniżenie wartości wyniku pomiaru, wpływa jednakowo na wszystkie pomiary. Błąd systematyczny o znanej wartości nazywamy poprawką.

Generowanie danych Rodzaje błędów pomiarowych

Błąd gruby Generowanie danych Wyróżnia się również błąd gruby(pomyłkę), który jest pewną odmianą błędu przypadkowego, w sensie jego przypadkowego pojawiania się. Ma miejsce, gdy któryś z wyników pomiaru odbiega znacznie od pozostałych. Możemy wówczas podejrzewać, że pewne zdarzenie wypaczyło wynik eksperymentu. Błędy grube mogą wynikać np. ze złego odczytania skali przyrządu pomiarowego, pomyłki przy zapisie miejsca przecinka, pomiaru błędnego obiektu. Wyniki takie powinny zostać odrzucone podczas analizy statystycznej. Eliminacja błędów grubych możliwa jest na trzy sposoby:

Błąd gruby Generowanie danych 1. Odrzucamy wynik w rezultacie zauważenia nagłej podejrzanej wartości.

Błąd gruby Generowanie danych 2. Kryterium Chauveneta obliczamy średnią oraz wariancję z całej próby, następnie dla podejrzanej obserwacji liczymy t = x x. s Jeśli możemy założyć normalność pomiarów, to znajdujemy prawdopodobieństwo, że zmienna losowa będzie oddalona od średniej o niemniejniż ts,czyli p = P( X x ts) =1 P( X x < ts) =2 2Φ(t). Dysponując próbą o liczebności n, spodziewamy się, że poza tym przedziałem znajdzie się np obserwacji. Powstaje pytanie kiedy obserwację odrzucić. W większości przypadków odrzucamy taką obserwację jeśli powyższy iloczyn jest mniejszy od 1/2.

Błąd gruby Generowanie danych 3. Odpowiedni test statystyczny: Test Dixona stosujemy go dla próbek o liczności poniżej 26, dodatkowo zakładamy normalność danych. Test Grafa(dla próbek powyżej 25) odrzucamy obserwacje, któreleżąpozaprzedziałem ( x 4s, x +4s),gdzie xoraz sliczone są z wyłączeniem podejrzanej obserwacji. Test Grubbsa najbardziej polecany, jest ulepszoną wersją testu Grafa, zakładamy normalność danych.

Generowanie danych Eliminacja błędów grubych przykład Wynikioznaczeńzawartościjonówmiedzi(Cu 2+ )wpróbceścieków [mg/dm 3 ]wyglądająnastępująco:0,875,0,863,0,876,0,868,0,771, 0,881, 0,878, 0,869, 0,866. Czy jakaś z obserwacji może zostać uznana za odstającą(przyjąć poziom istotności α = 0,05), jeśli zakładamy, że zawartość jonów ma rozkład normalny? Spróbujmy wykorzystać kryterium Chauveneta. Otrzymujemy t = 0,771 0,8608 =2,63. 0,0341 p =2 2Φ(2,63) =0,0085 np =9 0,0085 =0,077 <1/2. Zatem, najmniejsza obserwacja jest obserwacją odstającą. Do przeprowadzenia testu Dixona i Grubbsa używany jest pakiet outliers, w którym znajdują się procedury procedury dotyczące testu Dixona i Grubbsa. I tak mamy polecenia dixon.test oraz grubbs.test.