Testy zgodności 9 113

Wielkość: px
Rozpocząć pokaz od strony:

Download "Testy zgodności 9 113"

Transkrypt

1 Testy zgodności TESTY ZGODNOŚCI 9. Różne sytuace praktyczne W praktyce badań statystycznych, ak uż poprzednio stwierdzono, cały proces analizy statystyczne dzielimy na dwa etapy: formułowanie hipotezy statystyczne oraz weryfikace hipotezy statystyczne, które powinny być oparte na niezależnych obserwacach. Oznacza to, że po sformułowaniu hipotezy należy zebrać nowe obserwace dla e sprawdzenia. Prawda obiektywna nie może opierać się tylko na ednym materiale statystycznym. Często w praktyce podświadomie hipotezę statystyczną, którą sformułowaliśmy, traktuemy ako własną, edynie słuszną, traktuąc odrzucenie hipotezy ak osobistą porażkę. Emoconalny stosunek do hipotezy zerowe nie est właściwym podeściem do testowania hipotez statystycznych, bowiem grozi statystycznym oszustwem. Niestety, często nawet w nauce zdarzaą się takie sytuace, w których celem est obrona własne, edynie słuszne hipotezy. W takich sytuacach powstae manipulaca statystyczna udaąca naukowe podeście do problemu. Dlatego też raporty z badań statystycznych powinny być przeźroczyste pozwalaące na łatwą kontrolę obliczeń statystycznych. I stąd bierze się wymóg weryfikaci każde hipotezy na niezależnym materiale. W dalszym ciągu przytacza się trochę zmieniony podrozdział 5.3 książki Plucińskich (990). Mówiąc o zagadnieniach estymaci, ak również weryfikaci hipotezy parametryczne, często zakładaliśmy, że znamy postać rozkładu interesuące nas cechy elementów populaci generalne, a w przypadku nieznaomości postaci rozkładu, korzystaliśmy z twierdzeń granicznych. Obecnie omówione zostaną testy pozwalaące na weryfikacę hipotezy dotyczące postaci nieznanego rozkładu. Niech dana będzie populaca, w które rozkład cechy X elementów est nieznany. Pobieramy n-elementową próbkę. Zaobserwowane w próbce wartości zawieraą oczywiście informace o nieznanym rozkładzie cechy X. Naprostszą metodą prowadzącą do uzyskania wstępnych informaci o postaci rozkładu interesuące nas cechy elementów populaci est narysowanie histogramu rozkładu

2 4 Testy zgodności 9 zaobserwowanego w próbce. Uzyskane z rysunku informace są ednak niepełne i oczywiście tylko wzrokowe. Niepełne przede wszystkim ze względu na to, że nie uwzględnia się losowego składu próbki. Jednakże te wzrokowe informace zawarte w histogramie pozwalaą na zorientowanie się, akie ewentualnie rozkłady mogą być brane pod uwagę. Popatrzmy na histogramy podane na rysunkach 9.. O ile na prawym histogramie skłonni byliśmy dopuścić możliwość występowania rozkładu Erlanga rzędu lub więce, o tyle taka ewentualność dla lewego histogramu nie powinna być brana pod uwagę. Rys. 9.. Przykładowe histogramy z badań statystycznych Oczywiście, spostrzeżenia oparte na kształcie histogramu nie mogą służyć za podstawę do akichś ogólnieszych rozważań. Niezbędna est bardzie precyzyna miara zgodności między rozkładem w próbce a hipotetycznym rozkładem cechy elementów populaci. Pierwszym krokiem, podobnie ak to miało miesce w przypadku hipotez parametrycznych, powinno być ustalenie zbioru możliwych w danym zagadnieniu hipotez, tzn. zbioru możliwych rozkładów, które mogą być brane pod uwagę. Następnie wyróżnienie z tego zbioru hipotezy zerowe. Kolenym krokiem est przyęcie odpowiednie statystyki, która może służyć za test do weryfikaci hipotezy zerowe. Rozważmy szczegółowo kilka testów nieparametrycznych. 9..Test χ Pearsona Niech cecha x elementów populaci ma rozkład o dystrybuancie F. Podzielmy całą oś rzeczywistą na r + rozłącznych przedziałów I, I,..., I r + za pomocą liczb = α < α <... < α r < α r =. Oznaczmy przez p prawdopodobieństwo, że zmienna 0 + losowa X przymie wartość z przedziału I, tzn.

3 Testy zgodności 9 5 ( ) ( ) p = F α F α, =,,..., r + (9.) i niech p > 0 dla każdego. Liczba np est oczekiwaną liczbą obserwaci n-elementowe próbki, które powinny się znaleźć w przedziale I. Niech N oznacza zmienną losową o wartościach n będących liczbą obserwaci, które znalazły się w przedziale I. Suma kwadratów różnic n np tzn. r+ = ( n np ) (9.) może służyć za miarę zgodności rozkładu zaobserwowanego w próbce z rozkładem hipotetycznym. Wartość sumy (9.) zmienia się od próbki do próbki, a statystyka, które wartościami są te sumy ma bardzo złożony rozkład. Okazue się ednak, że odpowiednie wyważenie kwadratów ( n np ) K Pearson udowodnił mianowicie, że statystyka pozwala na uzyskanie znanego rozkładu granicznego. χ = ( np ) r+ N = np (9.3) ma, gdy n, rozkład chi-kwadrat o r stopniach swobody. Statystyka (9.3) znana est w literaturze pod nazwą testu χ Pearsona. Zauważmy, że statystyka χ nie zależy od tego, aka est postać dystrybuanty cechy X elementów populaci. Istotną rolę odgrywaą tu prawdopodobieństwa p P( X I ) =, przy czym podział na przedziały I został dokonany w sposób zupełnie dowolny. Ten sam układ prawdopodobieństw p, p,..., p r + może odpowiadać wielu różnym rozkładom zarówno typu ciągłego, ak i skokowego. Oznacza to, że w gruncie rzeczy za pomocą testu χ możemy zweryfikować hipotezę dotyczącą układu prawdopodobieństw p, p,..., p r +, a nie postaci rozkładu cechy X elementów populaci. Dlatego też za hipotezę zerową będziemy tu uważać

4 6 Testy zgodności 9 klasę wszystkich rozkładów, dla których P( X I ) = p ( = r + ),,...,. Hipotezą alternatywną est klasa rozkładów, dla których co namnie dla ednego est ( ) P X I p. Oczywiście, obydwie wymienione klasy rozkładów są dość szerokie. Możne e na ogół bardzo zawęzić korzystaąc z informaci dotyczących przebiegu badanego zawiska czy istoty zagadnienia, np. że cecha X elementów populaci est zmienną losową typu ciągłego lub że przymue wartości całkowite, czy też że przymue wartości z pewnego niewielkiego przedziału. Jednakże mimo zawężenia hipoteza zerowa, ak i alternatywna będą nadal bardzo licznymi klasami rozkładów. Oznacza to, że przy dane próbce statystyka χ będzie mieć tę samą wartość dla wielu rozkładów. Te rozkłady, dla których prawdopodobieństwo odrzucenia hipotezy zerowe est takie samo i hipotezę odrzucamy, nie będą nas interesowały. Przyęcie hipotezy zerowe est równoważne stwierdzeniu, że każdy rozkład należący do nie może służyć do opisu danego zawiska, czy doświadczenia. Wystarczy zatem wybrać eden z rozkładów należących do hipotezy zerowe. Dlatego też w dalszych rozważaniach, dla uproszczenia, hipotezę zerową formułować będziemy ako przypuszczenie, że cecha X elementów populaci ma rozkład o dystrybuancie F. Maąc sprecyzowaną hipotezę zerową i wybrany test do weryfikaci te hipotezy postępuemy w sposób analogiczny ak w przypadku hipotez parametrycznych. Za pomocą testu χ hipotezę zerową weryfikuemy w sposób następuący. Przymuemy poziom istotności testu α. Zbiorem krytycznym est zbiór {(,,..., ):. } W = x x x n χ zaobs χ α, gdzie χ α est liczbą odczytaną z tablic rozkładu chi-kwadrat o r stopniach swobody spełniaącą warunek ( ) ( ) P χ > χα = k r x dx = α, χ α przy czym k ( x) r est gęstością prawdopodobieństwa zmienne losowe o rozkładzie chikwadrat z r stopniami swobody.

5 Testy zgodności 9 7 Zatem hipotezę H 0 odrzucamy, gdy χ zaobs. χ α > (9.4) i przymuemy, gdy χ zaobs. χ α, (9.5) gdzie χ zaobs. oznacza wartość statystyki (9.3) zaobserwowaną w próbce. Przedstawiona metoda weryfikaci hipotezy o postaci rozkładu est oparta na granicznym rozkładzie statystyki (9.3), a zatem n musi być dostatecznie duże. Przymue się, że test χ można stosować, gdy np 0 dla =, 3,..., r oraz np, np r + 5. W przypadku takiego podziału osi OX na przedziały, w którym ( ) p = r + =,,..., r + można stosować graniczny rozkład testu χ o r stopniach swobody na poziomie istotności α = lub α = 0. 0 uż dla niewielkich n (5-0) i n =. drogowych na PRZYKŁAD 9. (Plucińscy, 990) przeprowadzono obserwace dotyczące wypadków określonym terenie spowodowanych w ciągu roku przez kierowców będących w stanie nietrzeźwym. Otrzymany rozkład wypadków w poszczególne dni tygodnia podae następuąca tabelka: Pn Wt Śr Czw Pt So N Przymuąc poziom istotności α = zweryfikować hipotezę, że prawdopodobieństwo zdarzenia się na tym terenie wypadku spowodowanego przez kierowcę w stanie nietrzeźwym est ednakowe dla wszystkich dni tygodnia. Mamy tu siedem przedziałów I, I,..., I 7 oraz p = p =... = p7 = 7, a liczności n podane są w tabelce. Z danych liczbowych wynika, że n =, np = = 6, 7

6 8 Testy zgodności 9 χ zaobs. ( ) = = = Z tablicy rozkładu chi-kwadrat dla 6 stopni swobody i poziomu istotności α = znaduemy χ α =. 59. Ponieważ χ < χ więc hipotezę H 0 o równości zaobs. prawdopodobieństw przymuemy. Omówiona metoda weryfikaci hipotez nieparametrycznych odnosi się wyłącznie do tych przypadków, gdy dystrybuanta F ednoznacznie określa hipotetyczny rozkład, bowiem tylko wtedy w sposób ednoznaczny można określić prawdopodobieństwa p. Nie można na przykład przedstawionym testem χ zweryfikować hipotezy, że cecha X elementów populaci ma rozkład normalny, eśli parametry tego rozkładu nie są znane. Można ednak ulepszyć, a dokładnie poszerzyć metodę zaproponowaną przez Pearsona. Fisher udowodnił, że przy spełnieniu pewnych warunków odnośnie do nieznanych parametrów dystrybuanty F test χ może być zastosowany również w tych przypadkach, gdy dystrybuanta F precyzue edynie pewną klasę rozkładów, a ściśle mówiąc, zależy od nieznanych parametrów. Przedstawimy teraz zmodyfikowany przzez Fishera test χ. Sformułuemy napierw twierdzenie udowodnione przez Fishera. cząstkowe TWIERDZENIE 9.. Niech p = p ( λ λ λ ),,..., i niech istnieą ciągłe pochodne m δp δ p,, =,,..., r + ; i, l =,,..., m. δλ δλ δλ i l Jeżeli macierz [ δp δλ ] ( r i m) i =,,..., + ; =,,..., est rzędu m, a parametry λ, λ,..., λm zostały wyznaczone metodą nawiększe wiarygodności, to rozkład statystyki χ Pearsona zmierza, gdy n, do rozkładu chi-kwadrat o r-m stopniach swobody. Z twierdzenia 9. wynika, że eżeli chcemy zweryfikować hipotezę H 0, że cecha X elementów populaci ma rozkład o dystrybuancie F zależne od m parametrów, to do weryfikaci takie hipotezy można użyć testu χ Pearsona. Zbiorem krytycznym w tym przypadku będzie zbiór

7 Testy zgodności 9 9 {(,,..., ):. } W = x x x n χ zaobs > χ α, gdzie χ α est liczbą odczytaną z tablicy rozkładu chi-kwadrat spełniaącą warunek ( ) ( ) P χ > χα = k r m x dx = α, χ α przy czym k ( x) r m est gęstością prawdopodobieństwa zmienne losowe o rozkładzie chikwadrat z r-m stopniami swobody. PRZYKŁAD 9. (Plucińscy, 990). W dziale kontroli techniczne pewne fabryki konfekci badanie akości partii płaszczy damskich przeprowadza się wyrywkowo. W celu zbadania akości partii płaszczy damskich pobrano próbkę o liczności 80 sztuk i zbadano liczby usterek otrzymuąc następuące dane liczbowe: Liczba usterek Liczba płaszczy Przymuąc poziom istotności α = 0. 05, zweryfikować hipotezę H 0, że rozkład liczby usterek w płaszczach produkowanych w te fabryce est rozkładem Poissona. Mamy tu eden nieznany parametr λ. Jak wiemy estymatorem NW parametru λ est X n, a więc ako oszacowania parametru λ przymuemy x n = 5.. I I I 3 I 4 I 5

8 0 Testy zgodności 9 Rys. 9.. Podział na przedziały zmienności Przymimy podziały na przedziały I ak na Rys. 9.. Dwie ostatnie kolumny danych z tabelki połączyliśmy ze względu na małe liczności w tych kolumnach. Z tablicy rozkładu Poissona dla λ = 5. odczytuemy prawdopodobieństwa p. Następnie obliczamy wartość statystyki χ Pearsona zapisuąc kolene obliczenia w następuące tabelce: n p np n np ( n np) ( n np) np χ zaobs. =.3464 Mamy więc tu 5 przedziałów i eden parametr wyznaczony na podstawie próbki, zatem liczba stopni swobody est równa 3. Z tablic rozkładu chi-kwadrat dla α = i trzech stopni swobody odczytuemy χ zaobs. = < χ α = 7. 85, więc przymuemy hipotezę H 0, że rozkład liczby usterek w płaszczach est rozkładem Poissona. 9.3.Test λ Kołmogorowa

9 Testy zgodności 9 Test nieparametryczny można również skonstruować na podstawie twierdzenia Kołmogorowa. Przypuśćmy, że interesuąca nas cecha X elementów populaci est zmienną losową typu ciągłego. Na podstawie n elementowe próbki (n co namnie rzędu kilku dziesiątków) chcemy zweryfikować hipotezę H 0, że cecha X ma dystrybuantę F. Jako test do weryfikaci hipotezy H 0 możemy przyąć statystykę nd = n sup F ( x) F( x), (9.6) n < x< n gdzie F n est dystrybuantą empiryczną. Rozkład graniczny statystyki nd n precyzue twierdzenie Kołmogorowa (patrz np. Plucińscy, 990). Przymimy poziom istotności α. Zbiorem krytycznym est tu zbiór {( n ) n } W = x, x,..., x : nd > λ, (9.7) gdzie λ est liczbą spełniaącą warunek ( ) ( ) P nd > λ = n Q λ = α, (9.8) przy czym ( ) Q λ est wartością dystrybuanty rozkładu określone w twierdzeniu Kołmogorowa (patrz np. Plucińscy, 990). Dla danego α znamy Q( λ ), a z odpowiednie tablicy odczytamy wartość λ. Hipotezę H 0, że cecha X ma dystrybuantę F odrzucamy, gdy nd n > λ (9.9) i przymuemy, gdy nd n λ. (9.0)

10 Testy zgodności 9 Należy podkreślić, że przy stosowaniu testu λ Kołmogorowa trzeba mieć na uwadze pewne ograniczenia. Po pierwsze dystrybuanta F musi ednoznacznie określać hipotetyczny rozkład w tym sensie, że nie może zależeć od parametrów szacowanych na podstawie próbki. W przypadku zależności F od nieznanych parametrów twierdzenie Kołmogorowa nie est prawdziwe. Po drugie w związku z założeniem ciągłości dystrybuanty F wyników obserwaci nie można grupować. 9.4.Test Kołmogorowa- Smirnowa Przymimy, że dane są dwie populace. Chcemy zweryfikować hipotezę H 0, że cecha X elementów obydwu populaci ma taką samą ciągłą dystrybuantę F. Test dla zweryfikowania takie hipotezy oparty est na następuącym twierdzeniu Smirnowa: TWIERDZENIE 9.. Niech: a) X, X,..., X i Y, Y,..., Y będą niezależnymi zmiennymi losowymi o ednakowym n n rozkładzie z ciągłą dystrybuantą F, b) F i F n n będą dystrybuantami empirycznymi określonymi wzorami F F n n n Card i : X x i n i,,,..., (9.) ( x) = { < = } n Card i : Y x i n i,,,..., (9.) ( x) = { < = } c) ( ) ( ) δ n Wówczas nn = sup Fn x Fn x, n = < x< n + n. ( n < ) = ( ) lim P nδ x Q x (9.3) n n gdzie

11 Testy zgodności 9 3 ( ) Q x k k x ( ) e x > 0 = k = (9.4) 0 x 0 Wygodnym testem do weryfikowania sformułowane hipotezy est statystyka ( ) ( ) nδ n = n sup Fn x Fn x < x<. (9.5) Opiszemy teraz metodę postępowania przy weryfikaci. Mamy dwie populace. Pobieramy z nich próbki odpowiednio o liczebnościach n i n. Przypuśćmy, że zaobserwowaliśmy wartości x, x,..., x n oraz y, y,..., y n. Na podstawie tych danych znaduemy dystrybuanty empiryczne F ( x) n i F ( x), a następnie kres n górny bezwzględne wartości różnicy tych dystrybuant i wartość statystyki nδ n. Ustalamy poziom istotności α, a następnie zbiór krytyczny {( n n ) n } W = x, x,..., x, y, y,..., y : n δ > λ, (9.6) gdzie λ est liczbą spełniaącą warunek P ( n n ) δ > λ = α. (9.7) Liczba ( ) Q λ est wartością dystrybuanty (9.4). Wartości dystrybuanty są stablicowane (patrz np. Plucińscy, 990). Dla danego α, a tym samym ( ) Q λ z tablicy odczytuemy wartość λ. gdy Hipotezę H 0 o równości dystrybuant cechy X elementów obu populaci odrzucamy, nδ n > λ (9.8) i przymuemy, gdy nδ n λ. (9.9)

12 4 Testy zgodności 9 Pamiętać należy, że test Kołmogorowa-Smirnowa oparty est na granicznym rozkładzie statystyki nδ n, a więc być stosowany tylko wtedy, gdy liczebności są dostatecznie duże (co namnie rzędu kilku dziesiątek). PRZYKŁAD 9.3 (Plucińscy, 990). W celu zbadania trwałości opon samochodowych produkowanych przez fabryki A i B pobrano próbki z bieżące produkci obu fabryk i otrzymano następuące dane dotyczące maksymalnego przebiegu samochodów na badanych oponach (wyrażone w tysiącach km): Maksymalny przebieg Liczba opon z fabryki A z fabryki B Razem Przymuąc poziom istotności α = 0. 0 zweryfikować hipotezę H 0, że rozkłady przebiegów dla opon produkowanych przez obie fabryki maą tę samą ciągłą dystrybuantę F. Zastosuemy tu test Kołmogorowa-Smirnowa, a obliczenia zapiszemy w postaci następuące tabelki: x n n n sk n sk F ( x) n F ( x) n F ( x) F ( x) n n

13 Testy zgodności , W tabelce te przez n sk i n sk oznaczyliśmy tzw. Częstości skumulowane, tzn. n i. Z ostatnie kolumny tabelki odczytuemy, że n x x Ponieważ ( ) ( ) = sup F x F x = (9.0) δ n n n nn n = n + n = = 84. 7, n = 9., (9.) więc δ = = (9.) n n Przyęliśmy α = 0. 0, tzn. Q( λ ) = Dla te wartości Q( λ ) z tablicy rozkładu Kołmogorowa (patrz np. Plucińscy, 990) odczytuemy λ = 5.. Zatem otrzymaliśmy, że nδ n = > λ = 5., (9.3)

14 6 Testy zgodności 9 czyli spełniona est nierówność (9.8). Oznacza to, że hipotezę H 0 o równości dystrybuant dla maksymalnych przebiegów opon pochodzących z fabryk A i B należy odrzucić. Na zakończenie należy podkreślić, że w założeniach twierdzenia Smirnowa występue warunek ciągłości dystrybuanty F, co est równoważne temu, że prawdopodobieństwo wystąpienia w próbce dwóch ednakowych wartości est równe zeru. Grupowanie wyników w przedziałach może doprowadzić do błędnych wniosków (patrz np. Plucińscy, 990). Niemnie ednak w praktyce wielkości badane obserwue się tylko z pewną dokładnością związaną z przyętym układem ednostek, co siłą rzeczy prowadzi do grupowania wyników. Przedziały grupowania nie powinny być większe niż ednostka przyęte dla danego zagadnienia skali.

15 Testy zgodności 9 7 Problemy rozdziału 9. Histogramy statystyczne ako źródła hipotez statystycznych o rozkładach prawdopodobieństwa w pierwszym etapie badań statystycznych.. Weryfikaca hipotezy o rozkładzie prawdopodobieństwa. 3. Test chi-kwadrat Pearsona. 4. Rozkład chi-kwadrat. 5. Klasy obserwaci a liczba obserwaci. 6. Zbiór krytyczny w teście chi-kwadrat. 7. Modyfikaca Fishera testu chi-kwadrat. 8. Liczba stopni swobody testu chi-kwadrat. 9. Test Kołmogorowa. 0. Zbiór krytyczny testu Kołmogorowa.. Test Kołmogorowa-Smirnowa.. Zbiór krytyczny testu Kołmogorowa-Smirnowa. 3. Porównanie akości testu chi-kwadrat a Kołmogorowa.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

POLITECHNIKA WARSZAWSKA

POLITECHNIKA WARSZAWSKA POLITECHNIKA WARSZAWSKA WYDZIAŁ BUDOWNICTWA, MECHANIKI I PETROCHEMII INSTYTUT INŻYNIERII MECHANICZNEJ STATYSTYCZNA KONTROLA PROCESU (SPC) Ocena i weryfikacja statystyczna założeń przyjętych przy sporządzaniu

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

STATYSTYKA wykład 5-6

STATYSTYKA wykład 5-6 TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Przykład Cena metra kwadratowego (w tys. zł) z dla 14 losowo wybranych mieszkań w

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III ZALICZENIA W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III 1 Wariant I. PROBLEM WŁASNY Sformułować własne zadanie statystyczne związane z własną pracą badawczą

Bardziej szczegółowo

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

III. ZMIENNE LOSOWE JEDNOWYMIAROWE III. ZMIENNE LOSOWE JEDNOWYMIAROWE.. Zmienna losowa i pojęcie rozkładu prawdopodobieństwa W dotychczas rozpatrywanych przykładach każdemu zdarzeniu była przyporządkowana odpowiednia wartość liczbowa. Ta

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Zadania o numerze 4 z zestawów licencjat 2014.

Zadania o numerze 4 z zestawów licencjat 2014. Zadania o numerze 4 z zestawów licencjat 2014. W nawiasie przy zadaniu jego występowanie w numerze zestawu Spis treści (Z1, Z22, Z43) Definicja granicy ciągu. Obliczyć granicę:... 3 Definicja granicy ciągu...

Bardziej szczegółowo

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński Własności estymatora parametru lambda transformacji potęgowej Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński 1. Wstęp Najczęstszym powodem transformowania zmiennej losowej jest jej normalizacja,

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Gdy: badana cecha jest mierzalna (tzn. posiada rozkład ciągły); badana cecha posiada rozkład normalny; dysponujemy pojedynczym wynikiem;

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

Rozkłady zmiennych losowych

Rozkłady zmiennych losowych Rozkłady zmiennych losowych Wprowadzenie Badamy pewną zbiorowość czyli populację pod względem występowania jakiejś cechy. Pobieramy próbę i na podstawie tej próby wyznaczamy pewne charakterystyki. Jeśli

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/13 STATYSTYKA

Bardziej szczegółowo

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI

Bardziej szczegółowo

Badanie zależności zmiennych kolumnowej i wierszowej:

Badanie zależności zmiennych kolumnowej i wierszowej: Wykład : Tablice wielodzielcze Zródło:http://pl.wikipedia.org/wiki/Plik:Drosophila_melanogaster.jpg Drosophila melanogaster Krzyżówka wsteczna (CcNn i ccnn) Kolor oczu czerwone fioletowe Rozmiar skrzydła

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych Marek Ptak 21 października 2013 Marek Ptak Statystyka 21 października 2013 1 / 70 Część I Wstęp Marek Ptak Statystyka 21 października 2013 2 / 70 LITERATURA A. Łomnicki, Wprowadzenie

Bardziej szczegółowo

Testowanie hipotez. 1 Testowanie hipotez na temat średniej

Testowanie hipotez. 1 Testowanie hipotez na temat średniej Testowanie hipotez Poziom p Poziom p jest to najmniejszy poziom istotności α, przy którym możemy odrzucić hipotezę zerową dysponując otrzymaną wartością statystyki testowej. 1 Testowanie hipotez na temat

Bardziej szczegółowo

Test lewostronny dla hipotezy zerowej:

Test lewostronny dla hipotezy zerowej: Poznajemy testowanie hipotez statystycznych w środowisku R Zajęcia z dnia 11 maja 2011 roku Najpierw teoria TESTY ISTOTNOŚCI WARTOŚCI ŚREDNIEJ W POPULACJI GENERALNEJ gdy znana jest wariancja!!! Test prawostronny

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1.

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1. Weryfikacja hipotez Każde badanie naukowe rozpoczyna się od sformułowania problemu badawczego oraz najbardziej prawdopodobnego (na gruncie wiedzy badającego) ogólnego rozwiązania, czyli hipotezy badawczej.

Bardziej szczegółowo

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40 Statystyka dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl wersja 20.01.2013/13:40 Tematyka wykładów 1. Definicja statystyki 2. Populacja, próba 3. Skale pomiarowe 4. Miary położenia (klasyczne i pozycyjne)

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących Cezary Dendek Wydział Matematyki i Nauk Informacyjnych PW Plan prezentacji Plan prezentacji Wprowadzenie

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Ekonometria. Weryfikacja modelu. Paweł Cibis pcibis@o2.pl. 6 kwietnia 2006

Ekonometria. Weryfikacja modelu. Paweł Cibis pcibis@o2.pl. 6 kwietnia 2006 Weryfikacja modelu Paweł Cibis pcibis@o2.pl 6 kwietnia 2006 1 Badanie istotności parametrów strukturalnych modelu Testy Pakiet Analiza Danych Uwagi 2 Test dla małej próby Test dla dużej próby 3 Test Durbina-Watsona

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Gdy: badana cecha jest mierzalna (ewentualnie policzalna); dysponujemy dwoma próbami; chcemy porównać, czy wariancje w tych próbach

Bardziej szczegółowo

Zastosowanie Excela w matematyce

Zastosowanie Excela w matematyce Zastosowanie Excela w matematyce Komputer w dzisiejszych czasach zajmuje bardzo znamienne miejsce. Trudno sobie wyobrazić jakąkolwiek firmę czy instytucję działającą bez tego urządzenia. W szkołach pierwsze

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu 1. Metody wnioskowania statystycznego vs. metody opisu 2. Testowanie hipotez statystycznych

Bardziej szczegółowo

STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH

STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH Dane bibliograiczne o artykule: http://mieczyslaw_polonski.users.sggw.pl/mppublikacje STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH Mieczysław Połoński 1 1. Metodyka statystycznego opracowania

Bardziej szczegółowo

Z Wikipedii, wolnej encyklopedii.

Z Wikipedii, wolnej encyklopedii. Rozkład normalny Rozkład normalny jest niezwykle ważnym rozkładem prawdopodobieństwa w wielu dziedzinach. Nazywa się go także rozkładem Gaussa, w szczególności w fizyce i inżynierii. W zasadzie jest to

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

CZĘŚĆ 5. ZMIENNA DWUWYMIAROWA ORAZ BADANIE ZALEŻNOŚCI

CZĘŚĆ 5. ZMIENNA DWUWYMIAROWA ORAZ BADANIE ZALEŻNOŚCI CZĘŚĆ 5. ZMIENNA DWUWYMIAROWA ORAZ BADANIE ZALEŻNOŚCI Zadanie. Dla wylosowanych z pewne populaci gospodarstw domowych w dużym mieście definiuemy zmienne: X-miesięczne dochody gospodarstwa domowego (zaokrąglone

Bardziej szczegółowo

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy Wykład 9: Testy Studenta Jest kilka typów testów Studenta. Mają podobną strukturę, ale służą do testowania różnych hipotez i różnią się nieco postacią statystyki testowej. Trzy podstawowe typy testów Studenta

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Wykład 14 Test chi-kwadrat zgodności

Wykład 14 Test chi-kwadrat zgodności Wykład 14 Test chi-kwadrat zgodności Obserwacje klasyfikujemy do jakościowych klas Zliczamy liczbę obserwacji w każdej klasie Jeżeli są tylko dwie klasy, to liczba obserwacji w pierszej klasie ma rozkład

Bardziej szczegółowo

Wybór modelu. Nie ma dobrych modeli, ale niektóre są pożyteczne.

Wybór modelu. Nie ma dobrych modeli, ale niektóre są pożyteczne. Wybór modelu Nie ma dobrych modeli, ale niektóre są pożyteczne. 1 Dane Wybór modelu to zagadnienie kluczowe w procesie badawczym. Każdy model jest tylko pewnym przybliżeniem rzeczywistości, rzecz w tym,

Bardziej szczegółowo

PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH

PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH Opracowała: Joanna Kisielińska 1 PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH CIĄGŁYCH Rozkład normalny Zmienna losowa X ma rozkład normalny z parametrami µ i σ (średnia i odchylenie standardowe), jeśli jej

Bardziej szczegółowo

50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami

50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami Jan Rusinek 50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami UWAGA! Ten tekst jest w trakcie przygotowania i sprawdzania. Może zawierać błędy. Jest sukcesywnie poprawiany

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych 1.10.2012 r.

Matematyka ubezpieczeń majątkowych 1.10.2012 r. Zadanie. W pewnej populacji każde ryzyko charakteryzuje się trzema parametrami q, b oraz v, o następującym znaczeniu: parametr q to prawdopodobieństwo, że do szkody dojdzie (może zajść co najwyżej jedna

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Wielkość a wartość przedsiębiorstwa studium na podstawie raportów wybranych spółek

Wielkość a wartość przedsiębiorstwa studium na podstawie raportów wybranych spółek ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO nr 854 Finanse, Rynki Finansowe, Ubezpieczenia nr 73 (2015) s. 469 475 Wielkość a wartość przedsiębiorstwa studium na podstawie raportów wybranych spółek Sławomir

Bardziej szczegółowo

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15 II WYKŁAD STATYSTYKA 12/03/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 2 Rachunek prawdopodobieństwa zdarzenia elementarne zdarzenia losowe zmienna losowa skokowa i ciągła prawdopodobieństwo i gęstość prawdopodobieństwa

Bardziej szczegółowo

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; 4.06.07 Weryfikacja założenia o normalności rozkładu populacji

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; 4.06.07 Weryfikacja założenia o normalności rozkładu populacji Środowisko R Założenie normalności metody nieparametryczne Wykład R4; 4.06.07 Weryfikacja założenia o normalności rozkładu populacji Dane są obserwacje x 1, x 2,..., x n. Czy można założyć, że x 1, x 2,...,

Bardziej szczegółowo

Diagnostyka w Pakiecie Stata

Diagnostyka w Pakiecie Stata Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.

Bardziej szczegółowo

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się.

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się. 1 Wstęp Będziemyrozważaćgeneratorytypux n+1 =f(x n,x n 1,...,x n k )(modm). Zakładamy,żeargumentamifunkcjifsąliczbycałkowitezezbioru0,1,...,M 1. Dla ustalenia uwagi mogą to być generatory liniowe typu:

Bardziej szczegółowo

TABELE WIELODZIELCZE

TABELE WIELODZIELCZE TABELE WIELODZIELCZE W wielu badaniach gromadzimy dane będące liczebnościami. Przykładowo możemy klasyfikować chore zwierzęta w badanej próbie do różnych kategorii pod względem wieku, płci czy skali natężenia

Bardziej szczegółowo

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2 Instytut Matematyczny Uniwersytet Wrocławski Zakres egzaminu magisterskiego Wybrane rozdziały anazlizy i topologii 1 i 2 Pojęcia, fakty: Definicje i pojęcia: metryka, iloczyn skalarny, norma supremum,

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję.

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję. Zad Rozkład zmiennej losowej dyskretnej : a)dane są wartości zmiennej losowej: 2, 4, 2,,, 3, 2,. Obliczyć wartość średnią i wariancję. b)oceny z pracy klasowej w tabeli: Ocena 2 3 4 5 6 Liczba uczniów

Bardziej szczegółowo

Testy normalności rozkładu

Testy normalności rozkładu Testy normalności rozkładu Wiele testów parametrycznych wymaga by dane pochodziły z rozkładu zbliżonego do normalnego. Dlatego testy badające normalność rozkładów są tak istotne. W testach tych zawsze

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t.

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t. Procesy stochastyczne WYKŁAD 5 Proces Poissona. Proces {N(t), t } nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t. Proces zliczający musi

Bardziej szczegółowo

Środowisko R wprowadzenie c.d. Wykład R2; 21.05.07 Struktury danych w R c.d.

Środowisko R wprowadzenie c.d. Wykład R2; 21.05.07 Struktury danych w R c.d. Środowisko R wprowadzenie c.d. Wykład R2; 21.05.07 Struktury danych w R c.d. Oprócz zmiennych i wektorów strukturami danych w R są: macierze; ramki (ang. data frames); listy; klasy S3 1 Macierze Macierze

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych.

Przedmiot statystyki. Graficzne przedstawienie danych. Przedmiot statystyki. Graficzne przedstawienie danych. dr Mariusz Grządziel 23 lutego 2009 Przedmiot statystyki Statystyka dzieli się na trzy części: -zbieranie danych; -opracowanie i kondensacja danych

Bardziej szczegółowo

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów. Rachunek prawdopodobieństwa MAP1181 Wydział PPT, MS, rok akad. 213/14, sem. zimowy Wykładowca: dr hab. Agnieszka Jurlewicz Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Bardziej szczegółowo

Proces modelowania zjawiska handlu zagranicznego towarami

Proces modelowania zjawiska handlu zagranicznego towarami Załącznik nr 1 do raportu końcowego z wykonania pracy badawczej pt. Handel zagraniczny w województwach (NTS2) realizowanej przez Centrum Badań i Edukacji Statystycznej z siedzibą w Jachrance na podstawie

Bardziej szczegółowo

Statystyka matematyczna

Statystyka matematyczna Statystyka matematyczna dla kierunku Zarządzanie na studiach drugiego stopnia Wojciech Kordecki Wyższa Szkoła Handlowa we Wrocławiu Wrocław 2012 Materiał wyłącznie do użytku edukacyjnego. Reprodukcja do

Bardziej szczegółowo

EGZAMIN MAGISTERSKI, 25.06.2009 Biomatematyka

EGZAMIN MAGISTERSKI, 25.06.2009 Biomatematyka Biomatematyka 80...... Zadanie 1. (8 punktów) Rozpatrzmy prawo Hardy ego Weinberga dla loci związanej z chromosomem X o dwóch allelach A 1 i A 2. Załóżmy, że początkowa częstość allelu A 2 u kobiet jest

Bardziej szczegółowo

Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego. Katarzyna Kuziak

Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego. Katarzyna Kuziak Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego Katarzyna Kuziak Cel: łączenie różnych rodzajów ryzyka rynkowego za pomocą wielowymiarowej funkcji powiązań 2 Ryzyko rynkowe W pomiarze ryzyka

Bardziej szczegółowo

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k: Statystyczne opracowanie danych pomiarowych W praktyce pomiarowej często spotykamy się z pomiarami wielokrotnymi, gdy podczas pomiaru błędy pomiarowe (szumy miernika, czynniki zewnętrzne) są na tyle duże,

Bardziej szczegółowo

2008-03-18 wolne wolne 2008-03-25 wolne wolne

2008-03-18 wolne wolne 2008-03-25 wolne wolne PLAN SPOTKAŃ ĆWICZEŃ: Data Grupa 2a Grupa 4a Grupa 2b Grupa 4b 2008-02-19 Zajęcia 1 Zajęcia 1 2008-02-26 Zajęcia 1 Zajęcia 1 2008-03-04 Zajęcia 2 Zajęcia 2 2008-03-11 Zajęcia 2 Zajęcia 2 2008-03-18 wolne

Bardziej szczegółowo

Przykład 1 ceny mieszkań

Przykład 1 ceny mieszkań Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Janusz Woch Instytut Transportu Politechniki Śląskiej w Katowicach. Statystyka procesów transportowych

Janusz Woch Instytut Transportu Politechniki Śląskiej w Katowicach. Statystyka procesów transportowych Janusz Woch Instytut Transportu Politechniki Śląskiej w Katowicach Statystyka procesów transportowych Katowice maj 2000 Wstęp 2 SPIS TREŚCI 2 WSTĘP 4 1. Zakres Statystyki Procesów Transportowych 13 1.1

Bardziej szczegółowo

Statystyka Opisowa z Demografią oraz Biostatystyka. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Statystyka Opisowa z Demografią oraz Biostatystyka. Aleksander Denisiuk. denisjuk@euh-e.edu.pl Statystyka Opisowa z Demografią oraz Biostatystyka TesttStudenta Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka p.

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way

Bardziej szczegółowo

1 Praktyczne metody wyznaczania podstawowych miar bez zastosowania komputerów

1 Praktyczne metody wyznaczania podstawowych miar bez zastosowania komputerów Kurs w zakresie zaawansowanych metod komputerowej analizy danych Podstawy statystycznej analizy danych 8.03.014 - godziny ćwiczeń autor: Adam Kiersztyn 1 Praktyczne metody wyznaczania podstawowych miar

Bardziej szczegółowo

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych kod modułu: 2BL_02 1. Informacje ogólne koordynator

Bardziej szczegółowo

Matematyka Dyskretna Zestaw 2

Matematyka Dyskretna Zestaw 2 Materiały dydaktyczne Matematyka Dyskretna (Zestaw ) Matematyka Dyskretna Zestaw 1. Wykazać, że nie istnieje liczba naturalna, która przy dzieleniu przez 18 daje resztę 13, a przy dzieleniu przez 1 daje

Bardziej szczegółowo

A B. 2 5 8 18 2 x x x 5 x x 8 x 18

A B. 2 5 8 18 2 x x x 5 x x 8 x 18 Narzędzia modelowania niezawodności 1 Arkusz kalkulacyjny - jest to program zbudowany na schemacie relacyjnych baz danych. Relacje pomiędzy dwiema (lub więcej) cechami można zapisać na kilka sposobów.

Bardziej szczegółowo

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6 Zad. 1. Zbadano wydajność odmiany pomidorów na 100 poletkach doświadczalnych. W wyniku przeliczeń otrzymano przeciętną wydajność na w tonach na hektar x=30 i s 2 x =7. Przyjmując, że rozkład plonów pomidora

Bardziej szczegółowo

dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę.

dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę. dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę. Statistics in academic papers, what to avoid and what to focus on. Uniwersytet Medyczny im. Piastów Śląskich

Bardziej szczegółowo

Katedra Technik Wytwarzania i Automatyzacji STATYSTYCZNA KONTROLA PROCESU

Katedra Technik Wytwarzania i Automatyzacji STATYSTYCZNA KONTROLA PROCESU Katedra Technik Wytwarzania i Automatyzacji METROLOGIA I KONTKOLA JAKOŚCI - LABORATORIUM TEMAT: STATYSTYCZNA KONTROLA PROCESU 1. Cel ćwiczenia Zapoznanie studentów z podstawami wdrażania i stosowania metod

Bardziej szczegółowo

Rozwiązywanie algebraicznych układów równań liniowych metodami iteracyjnymi. Plan wykładu:

Rozwiązywanie algebraicznych układów równań liniowych metodami iteracyjnymi. Plan wykładu: Rozwiązywanie algebraicznych układów równań liniowych metodami iteracynymi Plan wykładu: 1. Przykłady macierzy rzadkich i formaty ich zapisu 2. Metody: Jacobiego, Gaussa-Seidla, nadrelaksaci 3. Zbieżność

Bardziej szczegółowo

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy Ćwiczenie: Analiza zmienności prosta Przykład w MS EXCEL Sprawdź czy genotyp jagniąt wpływa statystycznie na cechy użytkowości rzeźnej? Obliczenia wykonaj za pomocą modułu Analizy danych (jaganova.xls).

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

O ŚREDNIEJ STATYSTYCZNEJ

O ŚREDNIEJ STATYSTYCZNEJ O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków Rachunek Prawdopodobieństwa i Statystyka Kraków, 20 26 IX 2009 r. WYNIKI OBSERWACJI X 1, X 2,..., X n WYNIKI

Bardziej szczegółowo

Zależność cech (wersja 1.01)

Zależność cech (wersja 1.01) KRZYSZTOF SZYMANEK Zależność cech (wersja 1.01) 1. Wprowadzenie Często na podstawie wiedzy, że jakiś przedmiot posiada określoną cechę A możemy wnioskować, że z całą pewnością posiada on też pewną inną

Bardziej szczegółowo