166 Wstȩp do statystyki matematycznej

Wielkość: px
Rozpocząć pokaz od strony:

Download "166 Wstȩp do statystyki matematycznej"

Transkrypt

1 166 Wstȩp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwi azać nasz zasadniczy problem zwi azany z identyfikacj a cechy populacji generalnej w jȩzyku teorii prawdopodobieństwa. Powinniśmy wiedzieć, jakiego typu jest to rozk lad i dysponować oszacowaniem jego parametrów. Statystyka dysponuje jednak jeszcze jednym narzȩdziem, którego rola polega miȩdzy innymi na weryfikacji wiedzy, jak a pozyskaliśmy stosuj ac zaprezentowane wyżej metody 2 i 3. Narzȩdziem tym jest teoria testów statystycznych. Niech dane bȩdzie populacja generalna bȩd aca przedmiotem obserwacji z punktu widzenia cechy X. Przez hipotezȩ statystyczn a bȩdziemy rozumieli każde przypuszczenie odnosz ace siȩ do rozk ladu tej cechy formu lowane w kategoriach b adź jakościowych dotycz acych postaci tego rozk ladu, b adź ilościowych zwi azanych z jego parametrami. Bȩdziemy wtedy mówili, że mamy do czynienia odpowiednio z hipotez a nieparametryczn a albo hipotez a parametryczn a. Podstaw a do formu lowania przypuszczeń na temat cechy populacji generalnej jest próba prosta. Proces weryfikacji sformu lowanej hipotezy nazywamy testem statystycznym. St ad też procedura testowania hipotez dzieli siȩ na:testy parametryczne i nieparametryczne. U podstawkażdego testu znajduje siȩza lożenie, że obok hipotezy weryfikowanej, zwanej też hipotez a zerow a i oznaczan a przez H o,formu luje siȩ hipotezȩ bȩd ac a w swojej treści wynikiem zaprzeczenia hipotezy H o,któr a nazywamy z tego powodu hipotez a alternatywn a i oznaczamy przez H 1. Wtedy, w przypadku odrzucenia hipotezy H o w wyniku przeprowadzonego testu, za prawdziw a uznajesiȩ hipotezȩ H 1. Jak zaznaczyliśmy wyżej, podstaw a do przeprowadzenia weryfikacji hipotezy H o przeciwko hipotezie H 1 jest próba prosta. Z teoretycznego punktu widzenia istnieje wiȩc możliwość pope lnienia b lȩdu. Mog a zdarzyćsiȩconajmniejdwie sytuacje: H o jest prawdziwa albo H o jest fa lszywa. Jeśli w sytuacji pierwszej odrzucimy H o (a wiȩc przyjmiemy H 1 ), to mówimy wtedy o pope lnionym b lȩdzie I rodzaju, a jego miar a jest wtedy pewna liczba α. W sytuacji drugiej, jeśli H o przyjmujemy (a wiȩc odrzucamy H 1 ), to mówimy o b lȩdzie II rodzaju ijegomiarȩ oznaczamy przez β. Abyzrozumieć znaczenie obu zdefiniowanych b lȩdów musimy dok ladniej opisać przebieg procesu testowania hipotez. Niech (x 1,...,x n )=(X 1,...,X n )(ω o ) dla pewnego zdarzenia elementarnego ω o oznacza próbȩ prost a naszej populacji generalnej. Wtedy (x 1,...,x n ) W =(X 1,...,X n )(Ω) R n, co oznacza, że próba prosta jest jedn a z wielu realizacji procesu obserwacji populacji generalnej, któr a opisuje tutaj mnogość W. Zadaniem testu statystycznego jest skonstruowanie takiego podzbioru Q W,że jeśli (x 1,...,x n ) Q, tohipotezȩ H o odrzucimy na korzyść hipotezy H 1 oraz w przypadku gdy (x 1,...,x n )

2 6.4 Podstawowe metody statystyczne 167 W \ Q, toh o przyjmujemy. Z tego wzglȩdu zbiór Q nazywamy obszarem krytycznym (mówimy też o obszarze odrzucenia), w przeciwieństwie do zbioru W \ Q zwanego obszarem przyjȩcia hipotezy H o. Wtedy znaczenie ilościowe zdefiniowanych wyżej b lȩdów α i β jest nastȩpuj ace: α = P ((x 1,...,x n ) Q H o ),β= P ((x 1,...,x n ) W \ Q H 1 ). Z metodologicznego punktu widzenia pierwsz a zpowyższych równości traktuje siȩ jako równanie z niewiadom a Q, przyjmuj ac, że α jest ma l a liczb a równ a zazwyczaj 0, 1 albo 0, 05. Nazywamy j a wtedy poziomem istotności (wtedy 1 α nazywa siȩ poziomem ufności). Testy statystyczne, które kontroluj a tylko b l ad I rodzaju nazywamy testami istotności. Można zapytać, co dzieje siȩ z b lȩdem II rodzaju, jeśli b l ad I rodzaju zosta l zminimalizowany. Czy on również przyjmuje minimaln a wartość? Okazuje siȩ, że tak nie jest. Jest akurat na odwrót, czyli wartości β rosn a, jeśli wartości α malej a (patrz np. [19]). Wobec tego testy istotności jako metoda ignoruj aca z za lożenia kontrolȩ b lȩdu II-rodzaju z jednej strony kontroluj a na poziomie α odrzucenie hipotezy H o (gdy (x 1,x 2,...,x n ) Q), ale nie wypowiadaj a siȩna temat jej przyjȩcia. Dlatego wnioskowanie w przypadku przeprowadzenia takiego testu sprowadza siȩ do nastȩpuj acej konkluzji: 1. odrzucenia hipotezy H o iprzyjȩcia H 1 albo 2. braku podstaw do odrzucenia hipotezy H o. Zaczniemy od omówienia podstaw zwi azanych z tzw. testami parametrycznymi (patrz też [4], [19]). Przypuśćmy, że na podstawie próby prostej (x 1...x n )=(X 1...X n )(ω o ) oraz metod opartych na pojȩciu dystrybuanty empirycznej (histogramu) i teorii estymacji otrzymaliśmy nastȩpuj ace wyniki: 1. poznaliśmy typ rozk ladu cechy X, czyli jej dystrybuantȩ F, ewentualnie dysponujemy wiedz a na temat istnienia momentów tego rozk ladu i parametrów, od których rozk lad ten zależy, 2. zak ladaj ac, celem uproszczenia sytuacji, że rozk lad F zależy od jednego parametru, powiedzmy τ, określiliśmy metod a estymacji przedzia lowej jego przedzia l na zadanym poziomie ufności 1 α. Pojawia siȩ problem wyboru wartości tego parametru. Faza wstȩpna testu parametrycznego polega na zdefiniowaniu dwóch hipotez: hipotezy zerowej H o przeciwko hipotezie alternatywnej H 1,

3 168 Wstȩp do statystyki matematycznej gdzie gdzie τrτ o H o : τ = τ o, H 1 : τrτ o, na ogó l oznacza jedn a z trzech relacji: τ τ o, τ < τ o, τ > τ o. Rola testu statystycznego, jak pisaliśmy wyżej, polega na tym, aby zweryfikować hipotezȩ zerow a przeciwko hipotezie alternatywnej. Pozytywna weryfikacja kończy siȩ na ogó l stwierdzeniem, że nie ma powodów do jej odrzucenia, co nie musi oznaczać, że hipotezȩ zerow a przyjmuje siȩ. Zazwyczaj w tej sytuacji ca ly proces analizy statystycznej zaczyna siȩ od pocz atku, a wiȩc od pobrania nowej próby prostej. W przypadku negatywnej weryfikacji hipotezy zerowej albo przy aktualnych wynikach zmienia siȩ jej treść i powtarza weryfikacjȩ albo przyjmuje siȩ hipotezȩ alternatywn a. Podstaw a procesu weryfikacji jest, jak pisaliśmy wyżej, obszar krytyczny Q, który w praktyce definiuje siȩjakopodzbiór prostej rzeczywistej, a nie przestrzeni R n. Aby go wyznaczyć potrzebna jest odpowiednia statystyka Z, czyli gdzie Z = f(x 1...X n ), (x 1...x n )=(X 1...X n )(ω o ) jest prób a prost a cechy X populacji generalnej. Wtedy obszar Q wyznaczony jest przez warunek (patrz definicja b lȩdu I rodzaju) P ({ω Ω : Z(ω) Q}) =α, przy za lożeniu, że zasz la hipoteza H o. Jeśli teraz z obs = Z(ω o ) Q, gdzie z obs jest wartości a zaobserwowan a statystyki Z, to hipotezȩ H o należy odrzucić nakorzyść hipotezy H 1. W przeciwnym razie mówimy, że nie ma podstaw do jej odrzucenia. Dalej w kolejnych przyk ladach pokażemy sposoby konstruowania statystyki Z i odpowiadaj acych jej obszarów krytycznych (patrz też [10]).

4 6.4 Podstawowe metody statystyczne 169 Przyk lad Cecha X populacji generalnej ma rozk lad typu N (m, σ 2 ), gdzie parametr σ jest znany. Wtedy dla zweryfikowania hipotezy zerowej H o : m = m o pos lugujemy siȩ styatystyk a Natomiast hipoteza alternatywna H 1 1. Z = X n m n. σ i obszar krytyczny maj a wtedypostać: H 1 : m m o, Q =(, n α ) (n α, + ), gdzie n α,przyza lożeniu hipotezy H o określone jest równaniem P ({ω Ω : Z o (ω) n α })=2(1 Φ(n α )) = α, 2. bowiem statystyka Z o = X n m o n σ ma przy za lożeniu hipotezy zerowej rozk lad standardowy normalny. H 1 : m>m o, Q =(n + α, + ) gdzie n + α,przyza lożeniu hipotezy H o określone jest równaniem P ({ω Ω: Z o (ω) >n + α }) =1 Φ(n + α )=α, 3. gdzie statystyka Z o jest identyczna, jak w sytuacji poprzedniej. H 1 : m<m o, Q =(, n + α ) gdzie n + α i statystyka Z o s a jakwyżej. Przeprowadźmy teraz symulacjȩ liczbow a. W tym celu odwo lamy siȩ dowyników z przyk ladu Dostaliśmy tam Postawmy hipotezȩ zerow a m (1,838, 2,328), x 4 =2,083, σ =0,25, α =0,05. H o : m =2przeciwko H 1 : m 2.

5 170 Wstȩp do statystyki matematycznej Wtedy, przy za lożeniu hipotezy zerowej n α =1,96, i przedzia l krytyczny ma postać Q =(, 1,96) (1,96, + ). Tymczasem z obs = 2, ,25 =0,684 / Q, co oznacza, że nie ma powodu do odrzucenia hipotezy zerowej. Z drugiej strony bior ac dostalibyśmy H o : m =1,9 przeciwko H 1 : m<1,9 Φ(n + α )=1 α =0,95, sk ad Q =(, 1,65). Ponieważ terazz obs = 1,46, zatem również nie ma podstaw, aby nie przyj ać m =1,9. Okazuje siȩ, że dopiero H o : m =2,3 przeciwko H 1 : m<2,3 daje z obs = 1,736 Q = (, 1,65), co oznacza, że hipotezȩ tȩnależy odrzucić. Jeśli pobrana próba by la reprezentatywna, to oznacza to, że najprawdopodobnie wartość średnia cechy X jest mniejsza od 2,3. Przyk lad Cecha X populacji generalnej ma rozk lad typu N (m, σ 2 ), gdzie oba parametry s a nieznane. Wtedy dla zweryfikowania hipotezy zerowej H o : m = m o wykorzystamy styatystykȩ t = X n m n 1. S Natomiast hipoteza alternatywna H 1 i obszar krytyczny maj a wtedypostać: 1. H 1 : m m o, Q =(, t α ) (t α, + ), gdzie t α,przyza lożeniu hipotezy H o określone jest równaniem P ({ω Ω : t o (ω) t α })=α, bowiem statystyka t o = X n m o n 1 S ma przy za lożeniu hipotezy zerowej rozk lad t Studenta o n 1 stopniach swobody.

6 6.4 Podstawowe metody statystyczne H 1 : m>m o, Q =(t + α, + ) gdzie t + α,przyza lożeniu hipotezy H o określone jest równaniem P ({ω Ω : t o (ω) t + α }) =α, gdzie statystyka t o jest identyczna, jak w sytuacji poprzedniej. Dla przeprowadzenia symulacji odwo lamy siȩ dowyników z przyk ladu Przypomnijmy, że wtedy m (1,899, 2,267), x 4 =2,083, s =0,1. Ponieważ z tabeli rozk ladu t Studenta dla trzech stopni swobody t α =3,182, wiȩc bior ac H 1 : m =2przeciwko H 1 : m 2 obszar krytyczny bȩdzie mia l postać Q =(, 3,182) (3,182, + ). Tymczasem t obs = 2, ,73 = 1,4359 / Q, 0,1 co oznacza, że nie ma powodu, aby odrzucić hipotezȩzerow a. Sprawdźmy, czy dla tej próby prostej można przyj ać, że m =1,9. Wtymceluweźmy H o : m =1,9 przeciwko H 1 : m>1,9. Ponieważ terazt + α =2,4, to Q =(2,4, + ). Ale t obs = 2,083 1,9 0,1 1,73 = 3,1659 Q, co oznacza, że hipotezȩ zerow anależy odrzucić. Zauważmy, że wartość 1,9teżnależy do przedzia lu wartości średniej wyznaczonego metod a estymacji. Na koniec pokażemy przyk ladowy test dla wariancji. Przyk lad Cecha X populacji generalnej ma rozk lad typu N (m, σ 2 ), gdzie oba parametry s a nieznane. Wtedy dla zweryfikowania hipotezy zerowej H o : σ = σ o

7 172 Wstȩp do statystyki matematycznej wykorzystamy styatystykȩ Natomiast hipoteza alternatywna H 1 χ 2 = ns2 σ 2. i obszar krytyczny maj a wtedypostać: H 1 : σ>σ o, (ponieważ σ>0), Q =(χ 2 α, + ), gdzie przy za lożeniu hipotezy zerowej statystyka χ 2 o = ns2 σ 2 o ma rozk lad chi kwadrat o n 1 stopniach swobody, a χ 2 α równania P ({ω Ω : χ 2 o (ω) >χ2 α })=α. jest rozwi azaniem Stosown a symulacjȩ przeprowadzimy, wykorzystuj ac wyniki z Przyk ladu Dostaliśmy tam wówczas σ 2 (0,0002, 0,267), s 2 =0,1, α =0,1. Przeprowadźmy test dla środka tego przedzia lu, tzn. niech H o : σ =0,366 przeciwko H 1 : σ>0,366. Ponieważ χ 2 α =1,0636, wiȩc Q =(1,0636, + ). Ale χ 2 obs = 50,0377 =0,515 / Q, 0,366 co pokazuje, że nie ma powodów odrzucać takiegowyboru. Bardzo czȩsto spotykamy siȩ z problemem potrzeby porównania ze sob a dwóch różnych populacji generalnych. Możemy na przyk lad mieć do czynienia z populacj a ludzi chorych i zdrowych, ludzi czynnych zawodowo i emerytów itd. Chcielibyśmy takie populacje ze sob a porównaćpodk atem wyróżnionej cechy, na przyk lad w drugiej sytuacji może ni a być preferencja wyborcza, któr a oznaczymy przez X. Zbudujemy model statystyczny dla takiej sytuacji. W modelu tym zak lada siȩ, że na przestrzeni probabilistycznej (Ω, Σ,P) mamy dwie zmienne losowe X i Y,których rozk lady opisuj a cechȩ X dla populacji pierwszej i drugiej. Pobieramy materia l statystyczny z obu populacji w ten sposób, że otrzymane próby proste s a stochastycznie niezależne i maj a postać: (x 1,x 2,...,x n )=(X 1,X 2,...,X n )(ω o )

8 6.4 Podstawowe metody statystyczne 173 dla pierwszej populacji i dla populacji drugiej, gdzie (y 1,y 2,...,y m )=(Y 1,Y 2,...,Y m )(ω o ) d(x j )=d(x), d(y i )=d(y ) dla wszystkich i oraz j. Dla uproszczenia za lóżmy, że obie populacje maj a rozk lad normalny, czyli X, Y N(m k,σk 2 ), k = 1, 2. Interesuje nas kwestia czy ich średnie s a sobierówne, czyli czy m 1 = m 2? Stawiamy wiȩc hipotezȩ zerow a H o : m 1 = m 2 przeciwko hipotezie alternatywnej H 1 : m 1 m 2. Aby wyznaczyć obszar krytyczny Q ustalamy poziom istotności α i bierzemy statystykȩ testow a określon a wzorem Z = X Y, σ1 2 n + σ2 2 m o ile obie wariancje s a znane. Można pokazać, że przy za lożeniu hipotezy zerowej statystyka Z ma standardowy rozk lad normalny (patrz np. [4]). Wtedy obszar krytyczny jest obszarem dwustronnym opisanym równaniem P ({ω Ω: Z(ω) Q}) =α. W sytuacji kiedy wariancje nie s a znane i różne, oraz d lugości obu prób s a duże (co najmnie równe 30), to statystyka testowa ma postać Z = X Y, S1 2 n + S2 2 m gdzie S1 2 i S2 2 s a wariancjami teoretycznymi z próby prostej dla obu populacji generalnych. Wtedy przy za lożeniu hipotezy zerowej statystyka Z ma standardowy rozk lad normalny i na tej podstawie możemy wyznaczyć obszar krytyczny. W przypadku kiedy 2 n, m < 30 i wariancje nie s a znane oraz s a różne, to korzystamy ze statystyki bȩd acej modyfikacj a statystyki zdefiniowanej powyżej i wygl adaj acej nastȩpuj aco X Y Z =, S 2 1 n 1 + S2 2 m 1 która przy za lożeniu hipotezy zerowej ma rozk lad t Studenta o s stopniach swobody, gdzie s = ( ( ) S S2 2 n 1 m 1 ) 2 ( ) 2 S 1 2 S 2 2 n 1 m 1 + n 1 m 1.

9 174 Wstȩp do statystyki matematycznej Wreszcie możemy mieć do czynienia z sytuacj a kiedy wariancje s a jednakowe i nie s a znane. Jeśli obie próby proste s a duże (co najmnie licz a po30elementów), to dla wyznaczenia obszaru krytycznego używamy statystyki Z = X Y ns ms 2 2 nm, która przy za lożeniu hipotezy zerowej też ma standardowy rozk lad normalny albo w przypadku kiedy próby s a krótkie ( 30) bierzemy Z = X Y ns 2 1 +ms2 2 n+m 2 ( 1 n + 1 m ), która przyza lożeniu hipotezy zerowej ma rozk lad t Studenta o n+m 2 stopniach swobody. Przyk lad Wdwóch losowo wybranych firmach zbadano efektywny czas pracy jej pracowników, a wiȩc ten czas, który poświȩcaj a na wykonywanie tylko swoich czynności przewidzianych zakresem uprawnień. W obu z badanych firm rozk lad efektywnie wykorzystywanego czasu jest normalny z odchyleniem standardowym równym 1, 1 godzinȩ. Z badań wynika,że średni efektywny czas pracy w 25 elementowej próbie pracowników zatrudnionych w pierwszej firmie wyniós l 6, 5 godzin, a w 20 elementowej próbie wśród zatrudnionych w drugiej 5, 9 godzin. Na poziomie istotności α =0, 05 należy zweryfikować hipotezȩ, że średnie efektywne czasy pracy w obu firmach s a jednakowe. Zza lożenia rozk lady X i Y dla obu populacji generalnych s a normalne,o wartoścach oczekiwanych równych odpowiednio m 1 i m 2 oraz o jednakowych dyspersjach σ 1 = σ 2 =1, 1. Ponadto mamy dwie niezależne próby proste o liczebności n =25i m =20mniejsze od 30. Wykorzystamy statystykȩ testow apostaci Z = X Y ns 2 1 +ms2 2 n+m 2 ( 1 n + 1 m ), która przy za lożeniu hipotezy zerowej ma rozk lad t Studenta o n + m 2=43 stopniach swobody. Z tabeli rozk ladu t Studenta wynika, że dla przyjȩtego stopnia poziomu istotności α =0, 05 P ({ω Ω: t(ω) t α,m+n 2 })=α daje wartość krytyczn a t α,m+n 2 =2, 042 i Q =(, 2, 042) (2, 042, + ). Z drugiej strony wartość zaobserwowana przyjȩtej statystyki t obs przy za lożeniu

10 6.4 Podstawowe metody statystyczne 175 hipotezy zerowej H o : m 1 = m 2 wynosi t obs = 6, 5 5, 9 = 1, (1,1) (1,1) 2 (0, , 05) 43 Ponieważ H 1 : m 1 m 2 oraz t obs / Q, hipoteza zweryfikowana zosta la negatywnie, co oznacza, że nie mamy powodów do jej odrzucenia. Parametryczne testy istotności, jak pewnie zauważyliśmy na ogó l odnosz a siȩ do populacji normalnych. W sytuacji kiedy rozk lad cechy X populacji generalnej jest dwumianowy, to bȩdziemy mówili o testach dla frekwencji. W tym przypadku bȩdziemy weryfikowali hipotezȩ zerow a H o : p = p o przeciwko hipotezie alternatywnej H 1,która może mieć jedn a z trzech postaci: p p o, p>p o, p<p o. Oczywiście parametr p oznacza tutaj prawdopodobieństwo teoretyczne pojawienia siȩ sukcesu, zwane też frekwencj a. Ponieważ w metodzie stosuje siȩ CTG, bȩdziemy też zak ladali, że pobrana próba prosta jest dostatecznie duża, czyli że n 100. W tym przypadku statystyka testowa ma postać Z = X n p S n. Przy za lożeniu hipotezy zerowej, z CTG jest rozk lad jest asyptotycznie standardowym rozk ladem normalnym. Wtedy wartość zaobserwowan a dlapróby prostej obliczymy ze wzoru gdzie z obs = Z(ω o )= m poqo n p n o, p o + q o =1,moznacza liczbȩ sukcesów. W takim razie narzȩdzie to pozwala nam analizować zagadnienia zasygnalizowane w przyk ladzie Prześledzimy to na nastȩpuj acym przyk ladzie Przyk lad Na jednej z uczelni zrobiono badania na temat stopnia przygotowania studentów do sesji egzaminacyjnej. W tym celu wylosowano próbȩ prost a z lożon a ze 150 studentów i stwierdzono, że 45 spośród nich zda lo wszystkie egzaminy w pierwszym terminie. Na poziomie istotności 0, 05 należy zweryfikować hipotezȩ, że mniej aniżeli trzecia czȩść studentów zdaje na tej uczelni wszystkie egzaminy w pierwszym terminie. Niech X oznacza cechȩ naszej populacji generalnej określaj ac a liczbȩzdaj acych wszystkie egzaminy. Z za lożenia X B(m, p), gdzien = 150 i p jest nieznane. Z

11 176 Wstȩp do statystyki matematycznej trści wynika, że H o : p = 1 przeciwko hipotezie H 3 1: p< 1. Aby zweryfikować tȩ 3 hipotezȩ zastsujemy test dla frekwencji. Wtedy z obs = = 0, 346. Tymczasem lewostronny obszar krytyczny Q = (, n α ), gdzie n α jest rozwi azaniem równania P ({ω Ω: X (ω n α )}) =α równoważnego równaniu 2(1 Φ(n α )) = α dla α =0, 05 ma postać Q =(, 2, 23). Ponieważ z obs / Q, wiȩc wnosimy, że nie ma powodów do odrzucenia hipotesy zerowej. Należy wiȩ przyj ać, że co najmniej trzecia czȩść studentów badanej uczelni zdaje wszystkie egzaminy w pierwszym terminie. Zaprezentujemy teraz podstawowe metody nieparametrycznych testów istotności. Na ogó l testy te dotycz a trzech kwestii: 1. rozstrzygniȩcia hipotezy czy rozk lad cechy X populacji generalnej jest określonego typu F.Mówimy wtedy o tzw. teście zgodności, 2. zbadania, czy pobrany materia l statystyczny spe lnia wymogi określone przez definicjȩ próby prostej. Takie testy nazywamy testami losowości, 3. zbadanie wspó lzależności dwóch i wiȩcej cech tej samej populacji. Mówimy wtedy o testach niezależności. Test zgodności chi kwadrat (χ 2 ) Pearsona. Niech (x 1,...,x n )=(X 1,...,X n )(ω o )bȩdzie prób a prost a cechy X populacji generalnej. Stawiamy hipotezȩ na temat nieznanego rozk ladu F cechy X w postaci H o : F = F o,dlapewnegorozk ladu F o o k parametrach. Wtedy hipoteza alternatywna H 1 oznacza, że dystrybuanta F jest inna aniżeli F o, czyli H 1 : F F o. Dla celów weryfikacji hipotezy H o ustalamy poziom istotności α (na ogó l α =0, 05) oraz za statystykȩ testow a bierzemy statystykȩ χ 2 Pearsona, o której wiȩcej powiemy za chwilȩ. Najpierw musimy zwrócić uwagȩ na kilka faktów zwi azanych ze struktur a próby prostej. Przede wszystkim należy podkreślić, że test zgodności χ 2 pearsona ma zastosowanie zarówno dla rozk ladów ci ag lych jak i dyskretnych. Poniżej

176 Wstȩp do statystyki matematycznej = 0, 346. uczelni zdaje wszystkie egzaminy w pierwszym terminie.

176 Wstȩp do statystyki matematycznej = 0, 346. uczelni zdaje wszystkie egzaminy w pierwszym terminie. 176 Wtȩp do tatytyki matematycznej trści wynika że H o : p 1 przeciwko hipotezie H 3 1: p< 1. Aby zweryfikować tȩ 3 hipotezȩ zatujemy tet dla frekwencji. Wtedy z ob 45 1 150 3 1 3 2 3 150 0 346. Tymczaem

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

Rozkłady zmiennych losowych

Rozkłady zmiennych losowych Rozkłady zmiennych losowych Wprowadzenie Badamy pewną zbiorowość czyli populację pod względem występowania jakiejś cechy. Pobieramy próbę i na podstawie tej próby wyznaczamy pewne charakterystyki. Jeśli

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

STATYSTYKA wykład 5-6

STATYSTYKA wykład 5-6 TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

Test lewostronny dla hipotezy zerowej:

Test lewostronny dla hipotezy zerowej: Poznajemy testowanie hipotez statystycznych w środowisku R Zajęcia z dnia 11 maja 2011 roku Najpierw teoria TESTY ISTOTNOŚCI WARTOŚCI ŚREDNIEJ W POPULACJI GENERALNEJ gdy znana jest wariancja!!! Test prawostronny

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

LOGIKA ALGORYTMICZNA

LOGIKA ALGORYTMICZNA LOGIKA ALGORYTMICZNA 0.0. Relacje. Iloczyn kartezjański: A B := (a, b) : a A i b B} (zak ladamy, że (x, y) i (u, v) s a równe wtedy i tylko wtedy gdy x = u i y = v); A n := (x 1,..., x n ) : x i A}; R

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Dyskretne modele populacji

Dyskretne modele populacji Dyskretne modele populacji Micha l Machtel Adam Soboczyński 17 stycznia 2007 Typeset by FoilTEX Dyskretne modele populacji [1] Wst ep Dyskretny opis modelu matematycznego jest dobry dla populacji w których

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Testowanie hipotez. 1 Testowanie hipotez na temat średniej

Testowanie hipotez. 1 Testowanie hipotez na temat średniej Testowanie hipotez Poziom p Poziom p jest to najmniejszy poziom istotności α, przy którym możemy odrzucić hipotezę zerową dysponując otrzymaną wartością statystyki testowej. 1 Testowanie hipotez na temat

Bardziej szczegółowo

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40 Statystyka dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl wersja 20.01.2013/13:40 Tematyka wykładów 1. Definicja statystyki 2. Populacja, próba 3. Skale pomiarowe 4. Miary położenia (klasyczne i pozycyjne)

Bardziej szczegółowo

Dyskretne modele populacji

Dyskretne modele populacji Dyskretne modele populacji Micha l Machtel Adam Soboczyński 19 stycznia 2007 Typeset by FoilTEX Dyskretne modele populacji [1] Wst ep Dyskretny opis modelu matematycznego jest dobry dla populacji w których

Bardziej szczegółowo

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/13 STATYSTYKA

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny? Gdy: badana cecha jest mierzalna (tzn. posiada rozkład ciągły); badana cecha posiada rozkład normalny; dysponujemy pojedynczym wynikiem;

Bardziej szczegółowo

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Wykład 10 (12.05.08). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego Przykład Cena metra kwadratowego (w tys. zł) z dla 14 losowo wybranych mieszkań w

Bardziej szczegółowo

Przykład 1 ceny mieszkań

Przykład 1 ceny mieszkań Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie

Bardziej szczegółowo

MATEMATYKA DYSKRETNA - wyk lad 1 dr inż Krzysztof Bryś. Wprowadzenie

MATEMATYKA DYSKRETNA - wyk lad 1 dr inż Krzysztof Bryś. Wprowadzenie 1 MATEMATYKA DYSKRETNA - wyk lad 1 dr inż Krzysztof Bryś Wprowadzenie Istniej a dwa różne kryteria mówi ace, które narzȩdzia matematyczne należy zaliczyć do matematyki dyskretnej. Pierwsze definiuje matematykȩ

Bardziej szczegółowo

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III ZALICZENIA W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III 1 Wariant I. PROBLEM WŁASNY Sformułować własne zadanie statystyczne związane z własną pracą badawczą

Bardziej szczegółowo

POLITECHNIKA WARSZAWSKA

POLITECHNIKA WARSZAWSKA POLITECHNIKA WARSZAWSKA WYDZIAŁ BUDOWNICTWA, MECHANIKI I PETROCHEMII INSTYTUT INŻYNIERII MECHANICZNEJ STATYSTYCZNA KONTROLA PROCESU (SPC) Ocena i weryfikacja statystyczna założeń przyjętych przy sporządzaniu

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Zastosowanie Excela w matematyce

Zastosowanie Excela w matematyce Zastosowanie Excela w matematyce Komputer w dzisiejszych czasach zajmuje bardzo znamienne miejsce. Trudno sobie wyobrazić jakąkolwiek firmę czy instytucję działającą bez tego urządzenia. W szkołach pierwsze

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Analiza zrekonstruowanych śladów w danych pp 13 TeV

Analiza zrekonstruowanych śladów w danych pp 13 TeV Analiza zrekonstruowanych śladów w danych pp 13 TeV Odtwarzanie rozk ladów za pomoc a danych Monte Carlo Jakub Cholewiński, pod opiek a dr hab. Krzysztofa Woźniaka 31 lipca 2015 r. Jakub Cholewiński, pod

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

STATYSTYKA zadania do ćwiczeń. Weryfikacja hipotez część I.

STATYSTYKA zadania do ćwiczeń. Weryfikacja hipotez część I. STATYSTYKA zadania do ćwiczeń Weryfikacja hipotez część I Zad 1 W pewnej firmie postanowiono zbadać staż pracy pracowników W tym celu wylosowano prostą próbę losową z populacji pracowników i otrzymano,

Bardziej szczegółowo

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Gdy: badana cecha jest mierzalna (ewentualnie policzalna); dysponujemy dwoma próbami; chcemy porównać, czy wariancje w tych próbach

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu 1. Metody wnioskowania statystycznego vs. metody opisu 2. Testowanie hipotez statystycznych

Bardziej szczegółowo

KURS STATYSTYKA. Lekcja 2 Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE. www.etrapez.pl Strona 1

KURS STATYSTYKA. Lekcja 2 Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE. www.etrapez.pl Strona 1 KUR TATYTYKA Lekcja Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE www.etrapez.pl trona 1 Część 1: TET Zaznacz poprawną odpowiedź (tylko jedna jest prawdziwa). Pytanie 1 We wnioskowaniu statystycznym

Bardziej szczegółowo

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy Wykład 9: Testy Studenta Jest kilka typów testów Studenta. Mają podobną strukturę, ale służą do testowania różnych hipotez i różnią się nieco postacią statystyki testowej. Trzy podstawowe typy testów Studenta

Bardziej szczegółowo

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way

Bardziej szczegółowo

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl Statystyka Opisowa z Demografią oraz Biostatystyka Zmienne losowe Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka p.

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych Marek Ptak 21 października 2013 Marek Ptak Statystyka 21 października 2013 1 / 70 Część I Wstęp Marek Ptak Statystyka 21 października 2013 2 / 70 LITERATURA A. Łomnicki, Wprowadzenie

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych.

Przedmiot statystyki. Graficzne przedstawienie danych. Przedmiot statystyki. Graficzne przedstawienie danych. dr Mariusz Grządziel 23 lutego 2009 Przedmiot statystyki Statystyka dzieli się na trzy części: -zbieranie danych; -opracowanie i kondensacja danych

Bardziej szczegółowo

SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ. Ewa Madalińska. na podstawie prac:

SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ. Ewa Madalińska. na podstawie prac: SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ Ewa Madalińska na podstawie prac: [1] Lukaszewicz,W. (1988) Considerations on Default Logic: An Alternative Approach. Computational Intelligence, 44[1],

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH

STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH Dane bibliograiczne o artykule: http://mieczyslaw_polonski.users.sggw.pl/mppublikacje STATYSTYCZNE OPRACOWANIE WYNIKÓW KONTROLI JAKOŚCI ROBÓT ZIEMNYCH Mieczysław Połoński 1 1. Metodyka statystycznego opracowania

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2011/2012

Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2011/2012 Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu Karta Instytut Pedagogiczny obowiązuje studentów rozpoczynających studia w roku akademickim 011/01 Kierunek studiów: Matematyka Profil: Ogólnoakademicki Forma

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; 4.06.07 Weryfikacja założenia o normalności rozkładu populacji

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; 4.06.07 Weryfikacja założenia o normalności rozkładu populacji Środowisko R Założenie normalności metody nieparametryczne Wykład R4; 4.06.07 Weryfikacja założenia o normalności rozkładu populacji Dane są obserwacje x 1, x 2,..., x n. Czy można założyć, że x 1, x 2,...,

Bardziej szczegółowo

Statystyka Opisowa z Demografią oraz Biostatystyka. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Statystyka Opisowa z Demografią oraz Biostatystyka. Aleksander Denisiuk. denisjuk@euh-e.edu.pl Statystyka Opisowa z Demografią oraz Biostatystyka TesttStudenta Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka p.

Bardziej szczegółowo

Wyk lad 5 Grupa ilorazowa, iloczyn prosty, homomorfizm

Wyk lad 5 Grupa ilorazowa, iloczyn prosty, homomorfizm Wyk lad 5 Grupa ilorazowa, iloczyn prosty, homomorfizm 1 Grupa ilorazowa Niech H b edzie dzielnikiem normalnym grupy G. Oznaczmy przez G/H zbiór wszystkich warstw lewostronnych grupy G wzgl edem podgrupy

Bardziej szczegółowo

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy Ćwiczenie: Analiza zmienności prosta Przykład w MS EXCEL Sprawdź czy genotyp jagniąt wpływa statystycznie na cechy użytkowości rzeźnej? Obliczenia wykonaj za pomocą modułu Analizy danych (jaganova.xls).

Bardziej szczegółowo

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński Własności estymatora parametru lambda transformacji potęgowej Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński 1. Wstęp Najczęstszym powodem transformowania zmiennej losowej jest jej normalizacja,

Bardziej szczegółowo

Testy zgodności 9 113

Testy zgodności 9 113 Testy zgodności 9 3 9. TESTY ZGODNOŚCI 9. Różne sytuace praktyczne W praktyce badań statystycznych, ak uż poprzednio stwierdzono, cały proces analizy statystyczne dzielimy na dwa etapy: formułowanie hipotezy

Bardziej szczegółowo

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15 II WYKŁAD STATYSTYKA 12/03/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 2 Rachunek prawdopodobieństwa zdarzenia elementarne zdarzenia losowe zmienna losowa skokowa i ciągła prawdopodobieństwo i gęstość prawdopodobieństwa

Bardziej szczegółowo

CHEMIA KWANTOWA MONIKA MUSIA L METODA HÜCKLA. Ćwiczenia. http://zcht.mfc.us.edu.pl/ mm

CHEMIA KWANTOWA MONIKA MUSIA L METODA HÜCKLA. Ćwiczenia. http://zcht.mfc.us.edu.pl/ mm CHEMIA KWANTOWA MONIKA MUSIA L METODA HÜCKLA Ćwiczenia Zwi azki organiczne zawieraj ace uk lady π-elektronowe Sprzȩżony uk lad wi azań podwójnych: -C=C-C=C-C=C-C=C- Skumulowany uk lad wi azań podwójnych:

Bardziej szczegółowo

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1.

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1. Weryfikacja hipotez Każde badanie naukowe rozpoczyna się od sformułowania problemu badawczego oraz najbardziej prawdopodobnego (na gruncie wiedzy badającego) ogólnego rozwiązania, czyli hipotezy badawczej.

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

2.2 Model odsetek prostych 9

2.2 Model odsetek prostych 9 2.2 Model odsetek prostych 9 Uwaga 2.2.2 Komentarza wymaga znaczenie stopy bazowej. Z definicji wynika, że i T = FV PV, co wcale nie oznacza, że wartość indeksu i PV T zależy od wartości pocz atkowej PV.Wskaźnik

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

2008-03-18 wolne wolne 2008-03-25 wolne wolne

2008-03-18 wolne wolne 2008-03-25 wolne wolne PLAN SPOTKAŃ ĆWICZEŃ: Data Grupa 2a Grupa 4a Grupa 2b Grupa 4b 2008-02-19 Zajęcia 1 Zajęcia 1 2008-02-26 Zajęcia 1 Zajęcia 1 2008-03-04 Zajęcia 2 Zajęcia 2 2008-03-11 Zajęcia 2 Zajęcia 2 2008-03-18 wolne

Bardziej szczegółowo

Jeden przyk lad... czyli dlaczego warto wybrać MIESI.

Jeden przyk lad... czyli dlaczego warto wybrać MIESI. Jeden przyk lad... czyli dlaczego warto wybrać MIESI. Micha l Ramsza Szko la G lówna Handlowa Micha l Ramsza (Szko la G lówna Handlowa) Jeden przyk lad... czyli dlaczego warto wybrać MIESI. 1 / 13 Dlaczego

Bardziej szczegółowo

1 Praktyczne metody wyznaczania podstawowych miar bez zastosowania komputerów

1 Praktyczne metody wyznaczania podstawowych miar bez zastosowania komputerów Kurs w zakresie zaawansowanych metod komputerowej analizy danych Podstawy statystycznej analizy danych 8.03.014 - godziny ćwiczeń autor: Adam Kiersztyn 1 Praktyczne metody wyznaczania podstawowych miar

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Wykład 14 Test chi-kwadrat zgodności

Wykład 14 Test chi-kwadrat zgodności Wykład 14 Test chi-kwadrat zgodności Obserwacje klasyfikujemy do jakościowych klas Zliczamy liczbę obserwacji w każdej klasie Jeżeli są tylko dwie klasy, to liczba obserwacji w pierszej klasie ma rozkład

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Temat: WYKRYWANIE ODCHYLEO W DANYCH Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Przykładem Box Plot wygodną metodą

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę.

dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę. dr Dominik M. Marciniak Analizy statystyczne w pracach naukowych czego unikać, na co zwracać uwagę. Statistics in academic papers, what to avoid and what to focus on. Uniwersytet Medyczny im. Piastów Śląskich

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona Nieparametryczne odpowiedniki testów T-Studenta stosujemy gdy zmienne mierzone są na skalach porządkowych (nie można liczyć średniej) lub kiedy mierzone są na skalach ilościowych, a nie są spełnione wymagania

Bardziej szczegółowo

Analiza Współzależności

Analiza Współzależności Statystyka Opisowa z Demografią oraz Biostatystyka Analiza Współzależności Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: Kierunek: Statystyka komputerowa Computer statistics Zarządzanie i Inżynieria Produkcji Management and Engineering of Production Rodzaj przedmiotu: Fakultatywny - oferta Poziom studiów:

Bardziej szczegółowo

Egzamin ze statystyki, Studia Licencjackie Stacjonarne. TEMAT C grupa 1 Czerwiec 2007

Egzamin ze statystyki, Studia Licencjackie Stacjonarne. TEMAT C grupa 1 Czerwiec 2007 Egzamin ze statystyki, Studia Licencjackie Stacjonarne TEMAT C grupa 1 Czerwiec 2007 (imię, nazwisko, nr albumu).. Przy rozwiązywaniu zadań, jeśli to konieczne, naleŝy przyjąć poziom istotności 0,01 i

Bardziej szczegółowo

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2 Instytut Matematyczny Uniwersytet Wrocławski Zakres egzaminu magisterskiego Wybrane rozdziały anazlizy i topologii 1 i 2 Pojęcia, fakty: Definicje i pojęcia: metryka, iloczyn skalarny, norma supremum,

Bardziej szczegółowo

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się.

Generatory takie mają niestety okres, po którym sekwencja liczb powtarza się. 1 Wstęp Będziemyrozważaćgeneratorytypux n+1 =f(x n,x n 1,...,x n k )(modm). Zakładamy,żeargumentamifunkcjifsąliczbycałkowitezezbioru0,1,...,M 1. Dla ustalenia uwagi mogą to być generatory liniowe typu:

Bardziej szczegółowo

Opis efektów kształcenia i sposobów ich weryfikacji

Opis efektów kształcenia i sposobów ich weryfikacji PROGRAM PRZEDMIOTU Nazwa przedmiotu WNIOSKOWANIE STATYSTYCZNE Rok akademicki / 26, semestr zimowy, grupy UE 1 Prof. zw. dr hab. Andrzej Luszniewicz Wymagania wstępne Studenci wnioskowania statystycznego

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela

Statystyka w pracy badawczej nauczyciela Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem

Bardziej szczegółowo

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych Podstawowe pojęcia: Badanie statystyczne - zespół czynności zmierzających do uzyskania za pomocą metod statystycznych informacji charakteryzujących interesującą nas zbiorowość (populację generalną) Populacja

Bardziej szczegółowo

Statystyczne metody analizy danych

Statystyczne metody analizy danych Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezińska Definicje Statystyka (ang.statistics) - to nauka zajmująca się zbieraniem, prezentowaniem i analizowaniem

Bardziej szczegółowo

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6 Zad. 1. Zbadano wydajność odmiany pomidorów na 100 poletkach doświadczalnych. W wyniku przeliczeń otrzymano przeciętną wydajność na w tonach na hektar x=30 i s 2 x =7. Przyjmując, że rozkład plonów pomidora

Bardziej szczegółowo

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k: Statystyczne opracowanie danych pomiarowych W praktyce pomiarowej często spotykamy się z pomiarami wielokrotnymi, gdy podczas pomiaru błędy pomiarowe (szumy miernika, czynniki zewnętrzne) są na tyle duże,

Bardziej szczegółowo

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji. 5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń

Bardziej szczegółowo

2015-01-15. Edycja pierwsza 2014/1015. dla kierunku fizyka medyczna, I rok, studia magisterskie

2015-01-15. Edycja pierwsza 2014/1015. dla kierunku fizyka medyczna, I rok, studia magisterskie 05-0-5. Opis różnicę pomiędy błędem pierwsego rodaju a błędem drugiego rodaju Wyniki eksperymentu składamy w dwie hipotey statystycne: H0 versus H, tak, by H0 odrucić i pryjąć H. Jeśli decydujemy, że pryjmujemy

Bardziej szczegółowo