SKRYPT DLA STUDENTÓW KIERUNKU CHEMIA. Opracowanie wyników pomiarów eksperymentalnych

Wielkość: px
Rozpocząć pokaz od strony:

Download "SKRYPT DLA STUDENTÓW KIERUNKU CHEMIA. Opracowanie wyników pomiarów eksperymentalnych"

Transkrypt

1 Projekt Zwiększenie liczby absolwentów kierunku chemia ZLAB realizowany w ramach Priorytetu IV Szkolnictwo wyższe i nauka, Poddziałanie Programu Operacyjnego Kapitał Ludzki SKRYPT DLA STUDENTÓW KIERUNKU CHEMIA Opracowanie wyników pomiarów eksperymentalnych Ivana Stanimirova-Daszykowska Uniwersytet Śląski w Katowicach Instytut Chemii Katowice 2013 Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

2 Spis treści Przedmowa... 3 Problem badawczy, pytanie badawcze i hipoteza badawcza... 4 Zmienne pomiarowe... 5 Rodzaje błędów pomiarowych... 5 Statystka jako nauka i jej przedmiot... 7 Wprowadzenie do statystyki losowej zmiennej... 7 Parametry opisujące rozkład losowej zmiennej... 9 Miary położenia środka rozkładu... 9 Miary dyspersji rozkładu wyników Próbkowanie i rozkład próbkowania Rozkład normalny i wystandardyzowany rozkład normalny Centralne twierdzenie graniczne Rozkład chi kwadrat Testowanie hipotez statystycznych Podstawowe testy statystyczne Porównanie wartości średnich dwóch grup wyników - test t Porównanie wartości średniej z wartością deklarowaną Sparowany test t Testowanie wariancji test F Przedział ufności wartości średniej Wprowadzenie do analizy wariancji (ANOVA) Metody kalibracyjne - regresja jednokrotna i wieloraka Regresja jednoparametrowa Regresja wieloraka Badanie siły liniowej zależności dwóch parametrów Stabilne warianty podstawowych estymatorów Literatura Dodatek: wybrane tablice statystyczne

3 Przedmowa Oddajemy w Państwa ręce materiały dydaktyczne, które w sposób bardzo syntetyczny przedstawiają elementarne zagadnienia z zakresu statystyki i metod opracowania wyników eksperymentalnych. Materiały te tylko w pewnej mierze przybliżają omawiane zagadnienia, a zakres i forma ich prezentacji są wynikiem kompromisu pomiędzy wymaganą wiedzą, oczekiwanymi efektami kształcenia, a realną potrzebą wykorzystania prezentowanych treści w pracy zawodowej chemika. Przyjęty zakres merytoryczny opracowania to wynik ponad trzyletniego doświadczenia osiągniętego podczas prowadzenia zajęć w ramach modułu Matematyka stosowana z elementami chemometrii dla studentów drugiego roku studiów licencjackich na kierunku chemia. Rolą prowadzonego kursu jest zwrócenie uwagi na szczególne miejsce jakie zajmuje statystyka i inne metody matematyczne w opracowaniu wyników pomiarowych uzyskanych w trakcie prowadzonych eksperymentów. Pomimo dostępnych licznych pozycji literaturowych poruszających zagadnienia z zakresu statystyki, wedle naszego przekonania, istniała konieczność przygotowania opracowania napisanego językiem prostym, zrozumiałym dla studentów kierunku chemia wraz z typowymi przykładami zastosowań. Wierzymy, iż niniejsze opracowanie będzie Państwu pomocne nie tylko w ramach zajęć, ale i późniejszej pracy zawodowej chemika. Zachęcamy do zgłaszania ewentualnych uwag lub propozycji modyfikacji treści, mając nadzieje, że przez to kolejne wersje opracowania będą jeszcze lepsze. 3

4 Problem badawczy, pytanie badawcze i hipoteza badawcza W chemii, główną istotą prowadzonych badań eksperymentalnych jest próba rozwiązania podjętego problemu badawczego zazwyczaj ujętego w formie pytania. Precyzuje one zakres problemu badawczego, który zamierzamy rozwiązać, a także sugeruje formę oczekiwanej odpowiedzi. W zależności od rodzaju pytania badawczego, uzyskamy odpowiedź tak lub nie dla tzw. pytań rozstrzygnięcia, albo odpowiedź złożoną w przypadku tzw. pytań dopełnienia. Oto kilka przykładowych pytań badawczych ilustrujących wybrane problemy chemiczne i możliwe odpowiedzi: Czy badana próbka wina pochodzi z Włoch? (pytanie rozstrzygnięcia) Problem badawczy: śledzenie pochodzenia geograficznego próbek na podstawie ich składu chemicznego Odpowiedź: tak lub nie Czy stężeniu cynku w analizowanej próbce nie przekracza 50 mg dm -3? (pytanie rozstrzygnięcia) Problem badawczy: badania jakości środowiska (dopuszczalne stężenie to na przykład 50 mg dm -3 ) Odpowiedź: tak lub nie (pytanie rozstrzygnięcia) O ile zwiększy się stopień odzysku molibdenu, jeśli przed analizą techniką rentgenowskiej fluorescencji próbkę zagęszczono odpowiednio poprzez adsorpcję na nanorurkach i utlenionych nanorurkach? Problem badawczy: analiza chemiczna Przykładowa odpowiedź: zagęszczanie próbki z wykorzystaniem jako adsorbenta utlenionych nanorurek prowadzi do zwiększenia odzysku o 60% w stosunku do adsorpcji prowadzonej na nanorurkach bez modyfikacji powierzchni. Jak zmieni się wydajność reakcji chemicznej, jeśli będzie ona prowadzona przy temperaturach 20 C i 40 C? (pytanie dopełnienia) Problem badawczy: optymalizacja procesu (ustalenie wpływu temperatury na wydajność reakcji chemicznej) Przykładowa odpowiedź: w temperaturze 40 C obserwuje się dwukrotny wzrost wydajności reakcji chemicznej w stosunku do wydajności reakcji chemicznej prowadzonej w temperaturze 20 C. Planując, a później realizując eksperyment, oczekujemy iż uzyskane wyniki pomiarów umożliwią udzielenie jednoznacznej odpowiedzi na postawione pytanie badawcze. Stąd też, formułując pytanie badawcze należy mieć na uwadze by było ono precyzyjne, zrozumiałe i rozstrzygalne mając do dyspozycji dostępne środki (np. aparaturę, odpowiednie odczynniki, etc.). Zazwyczaj, sformułowanie problemu badawczego i odpowiedniego pytania skłania nas do refleksji nad możliwym wynikiem eksperymentu, a w konsekwencji zachęca do próby odpowiedzi na pytanie badawcze. Przeczuwalna odpowiedź może być postrzegana jako fundament do budowy hipotezy badawczej. 4

5 Hipoteza badawcza to zdanie twierdzące, mówiące o przewidywanym rezultacie prowadzonego eksperymentu. Hipoteza badawcza ma pomóc uzyskać odpowiedź na pytanie badawcze. Odpowiednio sformułowana hipoteza badawcza jest prosta. Ma dobrą moc predykcyjną (własność, dzięki której istnieje możliwość przewidzenia wyniku na podstawie określonych parametrów). Ponadto, hipoteza badawcza musi być weryfikowalna czyli empirycznie możliwa do sprawdzenia. Każdy, dobrze zaplanowany i poprawnie przeprowadzony eksperyment warunkuje wiarygodne pomiary (wyniki), które mogą posłużyć by zweryfikować prawdziwość postulowanej hipotezy badawczej. Dokonuje się tego stosując wybrane metody wnioskowania statystycznego, które umożliwiają uzyskanie obiektywnych sądów co do prawdziwości weryfikowanych hipotez. Zmienne pomiarowe Wynikiem prowadzonych eksperymentów jest zbiór pomiarów, które charakteryzują badane próbki. Najczęściej, są one opisane przez pomiary wybranych parametrów np. stężenia niektórych metali lub związków chemicznych, rozpuszczalność, aktywność biologiczną, ph, gęstość, lepkość, przewodnictwo, itp. Tego typu pomiary to tzw. zmienne ilościowe, gdyż ich wartości przyjmują dowolne wartości z określonego przedziału. Drugim typem zmiennych są zmienne jakościowe. Takie zmienne mogą przyjmować pewne wartości z zawężonego zbioru możliwości, np. barwa, kraj pobrania próbki (pochodzenie geograficzne), informacja czy próbkę pobrano od pacjenta zdrowego czy chorego, fakt autentyczności badanej próbki, itp. Przeważnie w badaniach chemicznych mamy styczność ze zmiennymi ilościowymi i to właśnie one w głównej mierze są przedmiotem opracowania statystycznego. Rodzaje błędów pomiarowych Każdy pomiar analityczny jest obarczony błędem. Poprzez błąd rozumiemy różnicę pomiędzy wartością oczekiwaną pomiaru (rzeczywistą), a wartością wyznaczoną eksperymentalnie. Na pomiar analityczny ma wpływ duża liczba czynników. Przyczyn powstawania błędów pomiarowych można doszukiwać się w niestabilnych warunkach pomiaru (np. wahania temperatury), wadliwej pracy podzespołów, zaburzeniach w stałości prądu elektrycznego, zarudzeniu aparatury, itp. Błędy mogą także wynikać z używanej metody analitycznej, np. powolna lub niezakończona reakcja czy niestabilne komponenty próbki. Możemy wyróżnić trzy podstawowe rodzaje błędów pomiarowych. Są to błędy grube, systematyczne i błędy losowe (tzw. przypadkowe). Błędy grube (z ang. gross errors), to takie które powodują iż, wynik pomiaru rażąco odbiega od wyników pozostałych pomiarów. Przyczyną błędu grubego są zazwyczaj incydentalne zdarzenia. Na przykład, może to być problem techniczny z przyrządem, na 5

6 którym dokonywany jest pomiar, niewłaściwe wpisanie wyniku (np. złe oddzielenie cyfr dziesiętnych przecinkiem), zaniedbanie w czynnościach określonych w protokole przygotowania próbki do analizy, użycie zanieczyszczonego szkła lub odczynnika, itp. Błędy systematyczne (z ang. systematic error), to takie, które w przypadku wielokrotnie powtarzanych w tych samych warunkach pomiarów są praktycznie stałe lub zmieniają się wedle pewnej prawidłowości. Są one np. następstwem źle wykalibrowanego przyrządu, zabrudzenia szalki wagi, itp. Wówczas mówi się o obciążeniu wyniku pomiaru (z ang. bias) zakładając, iż błąd losowy jest zaniedbywalny. Błąd systematyczny można stosunkowo łatwo wyeliminować poprzez użycie odpowiednich metod i materiałów certyfikowanych. Wykrycie błędu systematycznego jest niemożliwe poprzez wykonanie serii powtórzeń. Błędy losowe (z ang. random errors) powodują, iż wyniki powtarzanych pomiarów prowadzonych w tych samych warunkach nieznacznie się od siebie różnią. Wpływają na precyzję i dokładność metody. Obecność błędu losowego jest powodowana poprzez szereg błędów elementarnych, które występują w toku postępowania analitycznego. Wielkość błędu losowego może być oszacowana poprzez wykonanie serii powtórzeń. Minimalizację błędu losowego realizuje się poprzez dopracowanie wykorzystywanej techniki pomiarowej i samej metodyki pomiaru, jednak nie da się całkowicie wyeliminować błędu losowego. Z pojęciem błędu pomiarowego wiążą się także takie definicje jak dokładność metody (z ang. accuracy) i precyzja metody (z ang. precision). Dokładność metody określa różnicę pomiędzy uzyskanym wynikiem pomiaru, a wartością prawdziwą (oczekiwaną). Precyzja metody determinuje stopień zgodności uzyskanych wyników, a zatem opisuje powtarzalność pomiarów. Dokładność i precyzja Precyzja i brak dokładności + + Dokładność i brak precyzji + Brak dokładności i precyzji + Rysunek 1 Graficzna prezentacja definicji precyzji i dokładności metody w odniesieniu do rozrzutu czterech wyników i prawdziwej wartości oznaczonej jako + 6

7 Należy podkreślić, iż metoda analityczna prowadząca do precyzyjnych wyników wcale nie musi być metodą dokładną. Ten problem ilustruje powyższy rysunek, na którym przedstawiono hipotetyczne cztery wyniki pomiarów oraz wartość prawdziwą znajdującą się w środku. Statystka jako nauka i jej przedmiot Statystyka jest nauką, w ramach której rozwijane są techniki ułatwiające badanie i podejmowanie decyzji o zjawiskach, procesach lub populacjach na podstawie analizy informacji zawartej w próbie pochodzącej z danej populacji. Metody statystyczne odgrywają istotną rolę w rozwiązywaniu zagadnień z dziedziny kontroli jakości wyników i produktów, a także ułatwiają wskazanie możliwych kierunków poprawy badanego procesu, metody, itp. Statystyka dostarcza odpowiednich narzędzi, które wspomagają proces próbkowanie procesu, jego testowanie, ocenę, usprawnienie i polepszenie jakości. Może być także postrzegana jako język, dzięki któremu można w sposób obiektywny mówić o jakości. Ogólnie, możemy wyróżnić trzy zasadnicze zastosowania narzędzi statystki. Metody statystki opisowej umożliwiają syntetyczne przedstawienie informacji zawartej w zbiorze wyników. Rozkłady prawdopodobieństwa mają za zadanie wyjaśniać zamienność określonego parametru monitorowanego w trakcie eksperymentu czy procesu. Podejścia wnioskowania statystycznego pozwalają formułować ogólne i obiektywne wnioski, dotyczące prawidłowości dla populacji wyników na podstawie losowej próby (podzbioru wyników). Wprowadzenie do statystyki losowej zmiennej Zbiór wyników uzyskanych dla wielokrotnie powtórzonych pomiarów danego parametru możemy postrzegać jako zmienną losową. Zmienna losowa powstaje jako wynik działania funkcji, która elementom zmiennej losowej z określnym prawdopodobieństwem przyporządkowuje wartości pomiarowe. Strukturę prawdopodobieństwa zmiennej losowej opisuje jej rozkład prawdopodobieństwa. W przypadku zmiennej losowej, y, o charakterze dyskretnym, rozkład prawdopodobieństwa nazywany jest funkcją prawdopodobieństwa, p(y), natomiast w przypadku zmiennej losowej o charakterze ciągłym jest to funkcja gęstości prawdopodobieństwa, f(y). Poniższe dwa rysunki obrazują hipotetyczne rozkłady prawdopodobieństwa dyskretny i ciągły. 7

8 25 20 częstotliwość f(y) y Rysunek 2 Rozkłady prawdopodobieństwa dyskretny i ciągły y W przypadku dyskretnego rozkładu prawdopodobieństwa, wysokość poszczególnych słupków to wartości funkcji dla wyników pomiarów, p(y i ), bezpośrednio mówi o prawdopodobieństwie wystąpienia wyniku lub wyników z określonego przedziału wartości. Dla ciągłego rozkładu prawdopodobieństwa, prawdopodobieństwo determinuje pole powierzchni pod krzywą f(y) dla zadanego przedziału pomiarów. Dla zmiennej losowej o charakterze dyskretnym, własności rozkładu prawdopodobieństwa można przedstawić następująco: dla wszystkich wartości y i 2. P= = dla wszystkich wartości y i 3. =1 W przypadku zmiennej losowej ciągłej, własności rozkładu prawdopodobieństwa są następujące: = 3. =1 8

9 Parametry opisujące rozkład losowej zmiennej Do opisu rozkładu losowej zmiennej wykorzystuje się estymatory. Ich rolą jest przybliżyć wartość oczekiwaną (wartość prawdziwą) na podstawie zbioru wyników pomiarów. Estymator opisuje populację wyników. Rozkład zmiennej losowej charakteryzuje się poprzez położenie środka rozkładu oraz jego dyspersję (rozrzut wyników). Do oszacowania środka rozkładu i jego dyspersji można posłużyć się różnymi estymatorami. Te najbardziej powszechnie stosowane, zostaną scharakteryzowane w dalszej części. Miary położenia środka rozkładu Klasyczne miary położenia środka rozkładu to średnia arytmetyczna, moda i mediana. Średnia arytmetyczna, µ, często nazywana średnią, zdefiniowana jest jako suma wszystkich wartości podzielona przez ich ilość. Dla m wartości pomiarów zmiennej losowej y jej średnią obliczamy zgodnie z poniższym wzorem: = 1 W przypadku zmiennej losowej, której m wartości można pogrupować, średnią dla n grup wyników można przedstawić następująco: razy +!+! + +!! razy + + "+ " + + " # " razy 1 $ +!! + + " " % +!!+ + " " " & ' Moda to najczęściej pojawiający pomiar się w rozkładzie wartości wyników. Na ogół, moda nie jest najlepszą miarą położenia rozkładu gdyż ma na nią wpływ możliwe grupowanie wyników. Mediana, w przypadku nieparzystej liczby pomiarów, odpowiada wartości środkowej pomiarów uszeregowanych od najmniejszej do największej wartości. Dla parzystej liczby pomiarów, mediana zmiennej losowej o uszeregowanych wartościach to średnia arytmetyczna wyników dwóch pomiarów położonych po obu stronach środka. Zaletą tej miary położenia środka jest jej stabilność nawet, gdy niektóre z wyników znacząco odbiegają od pozostałych (tzw. obiekty odległe). Zagadnienie to zostało bliżej przedstawione w ostatnim rozdziale niniejszego opracowania. 9

10 Miary dyspersji rozkładu wyników Zazwyczaj, stopień dyspersji rozkładu opisuje się poprzez rozstęp, średnią wartość absolutnych wartości odchyłek od wartości średniej (z ang. mean absolute deviation), odchylenie standardowe i wariancję. Rozstęp, r, definiowany jest jako różnica pomiędzy największą, a najmniejszą wartością pomiarów: (=) +, Średnia absolutnych wartości odchyłek od wartości średniej, MAD, wymaga obliczenia odchyłek od wartości średniej,, dla wszystkich pomiarów zmiennej losowej. MAD = 1 Należy podkreślić, iż użycie wartości bezwzględnej w powyższym równaniu jest konieczne, by wyeliminować efekt znaku różnic (odchyłki od wartości średniej mogą mieć znak dodatni lub ujemy, a w efekcie ich suma może być równa zero). Innym sposobem eliminacji problemu znaku jest operacja podniesienia poszczególnych wartości różnic do kwadratu, co daje możliwość obliczenia pochodnej dla takiego wyrażenia. Z tego właśnie powodu, tak zdefiniowana miara rozrzutu wyników nazywana jest średnią kwadratowych odchyłek od wartości średniej (z ang. mean squared deviation), MSD: MSD = 1! Estymator MSD przybliża dyspersję rozkładu tylko dla fragmentu populacji wyników. W przypadku wykorzystania tego estymatora dla populacji wyników wykazuje on obciążenie. Oznacza to, iż średnia wartość MSD obliczonych dla wielokrotne wylosowanych z populacji podzbiorów wyników różni się od wartości oczekiwanej. Z tego właśnie powodu, zaproponowano nieobciążony estymator, znany jako wariancja, σ 2 : /! = 1 1! 10

11 Innym estymatorem rozrzutu wyników jest odchylenie standardowe, zdefiniowane jako pierwiastek kwadratowy wariancji. W odróżnieniu od wariancji, odchylenie standardowe jest wyrażone w tych samych jednostkach co pomiary tworzące zmienną losową. Próbkowanie i rozkład próbkowania Wnioskowanie statystyczne w głównej mierze ma pomóc poznać (scharakteryzować) określoną populację na podstawie relatywnie mało licznego podzbioru wyników tzw. próby. Innymi słowy, jest to podejście zmierzające ku uogólnieniu pewnych własności na całą populację wyników. Większość metod statystycznych zakłada, iż w tym celu zostanie użyty zbiór próbek losowo wybrany z całej populacji. Taki sposób wyboru próbek narzuca by na ich wybór nie miał wpływ żaden czynnik. Jeżeli każdy wynik ma jednakową szansę by być wylosowany, wówczas możemy mówić o losowym próbkowaniu. W tym miejscu, należy zadać pytanie kiedy na podstawie podzbioru wyników będzie możliwe w miarę poprawne opisanie całej populacji? Warunkiem koniecznym jest zapewnienie reprezentatywności próby. Zagadnienie reprezentatywności próby najlepiej zrozumieć w kontekście planowania i prowadzenia sondaży przedwyborczych. Reprezentatywna próba respondentów powinna dobrze charakteryzować strukturę całej populacji. Tak więc ograniczenie sondażu do np. pewnej grupy wiekowej, osób zamieszkałych w jednym regionie czy określonej płci respondentów i wnioskowanie na podstawie takiej próby nie prowadzi do wiarygodnych konkluzji. Rozkład prawdopodobieństwa wystąpienia wartości określonej statystyki nazywany jest rozkładem próbkowania. Rozkład normalny i wystandardyzowany rozkład normalny Jednym z najbardziej rozpowszechnionych rozkładów próbkowania jest rozkład normalny. Przyjmując, że zbiór pomiarów y to losowa zmienna, jej rozkład prawdopodobieństwa f(y) można opisać następującą funkcją: = 1 / 22 exp3! 2/! 4 gdzie, wartość średnia znajduje się w przedziale - < µ <, a wariancja przyjmuje wartości większe od zera, a oznaczenie exp{x} oznacza wykładnik funkcji e x. W literaturze, można dla zmiennej losowej y spotkać oznaczenie y N(µ, σ 2 ), co oznacza iż pochodzi ona z populacji o rozkładzie normalnym o średniej równej µ i wariancji σ 2. Jednocześnie zapis ten wyraźnie wskazuje, iż średnia i wariancja to dwa kluczowe parametry rozkładu normalnego, które mają bezpośredni wpływ na kształt funkcji gęstości prawdopodobieństwa rozkładu normalnego. 11

12 Rozkład normalny odgrywa ważną rolę w analizie wyników uzyskanych w trakcie zaplanowanych eksperymentów. Wyniki pomiarów, które różnią się od siebie z powodu istnienia błędu losowego można z powodzeniem opisać używając rozkład normalny. Specjalnym przypadkiem rozkładu normalnego jest jego wystandaryzowana postać, z N(µ, σ 2 ), dla której średnia przyjmuje wartość zero, a wariancja rozkładu wynosi jeden. Nowa zmienna z powstaje po transformacji zmiennej losowej y, która obejmuje dwie operacje centrowania i skalowania, co prowadzi do średniej równej zero i jednostkowego odchylenia standardowego (z N(0, 1)): 5= / Tak zdefiniowana transformacja zmiennej losowej nazywana jest także z-transformacją, standaryzacją lub autoskalowaniem. Przyjmując, że w przypadku wystandaryzowanego rozkładu prawdopodobieństwa µ = 0 i σ 2 = 1, funkcja gęstości prawdopodobieństwa wystandaryzowanej zmiennej losowej, f(z), ulega znacznemu uproszczeniu do postaci: 5= 1 22 exp3 5! 2 4 Na poniższym rysunku, przedstawiono funkcję gęstości prawdopodobieństwa dla rozkładu normalnego dla µ = 0 i różnych trzech wartościach σ = 0,5, σ = 1 i σ = σ=0,5 σ=1 σ=2 0.5 f(y) y Rysunek 3 Funkcja gęstości prawdopodobieństwa dla rozkładu normalnego: linia niebieska y N(0; 0,5), linia czerwona y N(0; 1) oraz linia czarna y N(0; 2) 12

13 Wystandaryzowana postać funkcji gęstości prawdopodobieństwa dla rozkładu normalnego umożliwia przedstawienie w tablicach wartości prawdopodobieństwa, które określone jest jako pole powierzchni pod wybranym obszarem krzywej. Całkowite pole powierzchni pod krzywą funkcji gęstości prawdopodobieństwa dla wystandaryzowanego rozkładu normalnego wynosi jeden. Natomiast, prawdopodobieństwo iż wystandaryzowana zmienna, z, przyjmie wartości z przedziału [u a, u b ] wymaga obliczenia całki oznaczonej, zwanej całką Laplace a, o następującej postaci: 8 9 5= ! 2 4d5 8 : Schematycznie, wartość prawdopodobieństwa określoną dla przedziału wartości z [z 1, z 2 ], gdzie z 1 = 1 i z 2 =, możemy zaznaczyć jako szary obszar pod wykresem f(z) z Rysunek 4 Funkcja gęstości prawdopodobieństwa dla wystandaryzowanej zmiennej z o rozkładzie normalnym z zaznaczonym obszarem, który odpowiada prawdopodobieństwu wystąpienia wartości tejże zmiennej w przedziale [1; ] Wykorzystując tablicowe wartości obliczonej całki dla unormowanego rozkładu normalnego, załączone w końcowej części opracowania, możemy relatywnie łatwo oszacowywać z jakim prawdopodobieństwem będą występowały wartości pomiarowe w zadanym przedziale. Rozważmy następujący przykład. Przykład 1 Przeprowadzono wyznaczenie wartości ph roztworu uzyskując rozkład normalny wyników o średniej 10,15 oraz odchyleniu standardowym 0,02. Jaka część pomiarów będzie się znajdować w przedziale wartości ph od 10,12 do 10,20? 13

14 Na początku, obliczamy wartość zmiennej wystandaryzowanej odpowiednio dla dwóch krańców przedziału wartości, tj. 10,12 i 10,20 jako: 5 = / = 10,12*10,15 0,02 5! 10,20*10,15 0,02 2,5 *1,5 Następnie, z tablic statystycznych dla wystandaryzowanej postaci funkcji gęstości prawdopodobieństwa (zob. dodatek) odczytujemy wartość prawdopodobieństwa dla obszaru [- ; -1,5] oraz dla obszaru [- ; 2,5]. Prawdopodobieństwo w zakresie [-1,5; 2,5] można obliczyć jako różnicę wartości prawdopodobieństwa dla obszaru [- ; 2,5] i obszaru [- ; -1,5].,= *5 2 4d5 0,0668!,= 5! *5! 2 4d5 0,9938!! Schematycznie, poszczególne operacje obliczenia wartości prawdopodobieństwa ilustruje poniższy rysunek. Rysunek 5 Schematyczne przedstawienie idei obliczania prawdopodobieństwa wystąpienia wyniku w zadanym przedziale wartości zmiennej z dla wystandaryzowanego rozkładu normalnego (obszar oznaczony czerwoną dwustronną strzałką) 14

15 Na tej podstawie możemy wnioskować, iż powtarzając wielokrotnie pomiary zmiennej, 92,70% wszystkich pomiarów należy oczekiwać w przedziale od 10,12 do 10,20. Innymi słowy, wykonując 100 pomiarów 93 z nich przyjmie wartość z tego przedziału. W podobny sposób, możemy rozważyć jaka część wszystkich wyników znajdzie się w przedziale wokół wartości średniej określonym przez µ ± σ, µ ± 2σ, oraz µ ± 3σ. Zakładając, iż σ = 1, w przedziale µ ± σ znajduje się 68% wyników, w przedziale µ ± 2σ będzie 95% wyników, natomiast w przedziale µ ± 3σ jest 99,7% wszystkich wyników. Centralne twierdzenie graniczne Wiele podejść statystycznych zakłada, iż zmienne losowe przyjmują rozkład normalny. Centralne twierdzenie graniczne pozwala uzasadnić dlaczego obserwowane rozkłady prawdopodobieństwa są często zbliżone do rozkładu normalnego. Centralne twierdzenie graniczne to twierdzenie matematyczne, które postuluje iż jeżeli zmienne y 1, y 2,, y m są niezależne o jednakowym rozkładzie i takiej samej wartości średniej i skończonej wariancji (σ 2 > 0), a x = y 1 + y y m wówczas zmienna losowa z wyrażona jako: 5= ) /! gdzie m, zbiega według standardowego rozkładu normalnego N(0, 1). Zastosowanie centralnego twierdzenia granicznego w praktyce, pozwala uniknąć trudnych obliczeń dla dużej liczby próbek i skomplikowanych rozkładów poprzez przyjęcie rozkładu normalnego. Rozkład chi kwadrat Rozkład chi kwadrat, χ 2, to inny typ rozkładu próbkowania zmiennej losowej. Podobnie jak rozkład normalny, rozkład chi kwadrat może być zdefiniowany posługując się standardowymi zmiennymi losowymi. Jeżeli z 1, z 2,, z m to niezależne zmienne losowe o średniej zero i wariancji równej jeden, wówczas losowa zmienna wyrażona jako: )=5! +5!! + +5 B! 15

16 ma rozkład chi kwadrat o k stopniach swobody. Funkcja gęstości prawdopodobieństwa dla zmiennej losowej x, f(x), określa następujący wzór: 1 )= 2 B/! ΓE F ) B/! H I/! dla )>0 2 G gdzie Γ to tzw. funkcja gamma zdefiniowana jako Γ(k) = (k - 1)!, a symbol! oznacza silnię. W odróżnieniu od rozkładu normalnego, rozkład chi kwadrat określony jest tylko dla dodatnich wartości zmiennej losowej x, jest niesymetryczny i skrzywiony. Wartość średnia i wariancja wynoszą odpowiednio µ = k i σ 2 = 2k. Poniższy rysunek przedstawia kilka przykładowych wykresów rozkładów chi kwadrat ze względu na liczbę stopni swobody k, przyjmując że k = 1, k = 3, k = 5 i k = k=1 k=3 k=5 k=7 0.3 f(χ 2 ) χ 2 Rysunek 6 Różne rozkłady funkcji gęstości prawdopodobieństwa chi kwadrat ze względu na liczbę stopni swobody Jednym z przykładów zmiennej, która przyjmuje rozkład chi kwadrat jest zmienna losowa y 1, y 2,, y m z rozkładu normalnego N(µ, σ 2 ) postaci: SS! /!=! /! ~M gdzie, SS to tzw. suma kwadratów różnic. Zapis w powyższym równaniu oznacza, że zmienna SS/σ 2 ma rozkład chi kwadrat o m-1 stopniach swobody. 16

17 W statystyce jak i wnioskowaniu statystycznym, wiele technik w praktyczny sposób opiera się o obliczanie sumy kwadratów różnic. Przykładem może być wariancja próby, którą alternatywnie możemy zapisać jako: /! = SS 1 Innym, niezwykle ważnym rodzajem rozkładu jest tzw. rozkład t (rozkład t-studenta), wykorzystywany do testowania hipotez statystycznych, a także do ewaluacji błędu pomiarowego. Rozkład Studenta o k stopniach swobody jest rozkładem zmiennej losowej t o ogólnej postaci: N= 5 O F gdzie, z jest zmienną losową standardyzowaną, tj. pochodzącą z rozkładu normalnego N(0, 1), a u to zmienna losowa o rozkładzie chi kwadrat o k stopniach swobody. Zmienne z i u są niezależnymi zmiennymi losowymi. Funkcję gęstości prawdopodobieństwa dla zmiennej losowej t przy k stopniach swobody określa następujący wzór: N,F= ΓEF+1 2 G ΓE F P1+ N! B 2 G F2 F Q! gdzie µ = 0, a σ 2 = k/(k-2) dla k > 2, a t [- ; ]. Jak wskazuje powyższe równanie, zmieniając liczbę stopni swobody k, można utworzyć całą rodzina rozkładów prawdopodobieństwa. Należy zwrócić uwagę, że istnieje duże podobieństwo pomiędzy rozkładem normalnym, a rozkładem Studenta. Dla dużych wartości k, rozkład Studenta zmierza do standardowego rozkładu normalnego, a dla nieskończenie dużej wartości k rozkład Studenta jest tożsamy ze standardowym rozkładem normalnym. Ponieważ w praktyce analitycznej, ze względu na koszt pomiarów i inne aspekty, liczba pomiarów bywa często relatywnie mała, rozkład Studenta jest najczęściej wykorzystywany. Na poniższym rysunku, przedstawiono wykres funkcji gęstości prawdopodobieństwa dla zmiennej losowej t przy k nieskończenie dużym (rozkład normalny), k = 3 i k = 7. 17

18 normalny k=3 k= f(t) t Rysunek 7 Funkcja gęstości prawdopodobieństwa dla zmiennej losowej t, dla: k = (czarna linia), k = 3 (czerwona linia) oraz k = 7 (niebieska linia) Zakładając, iż zbiór y 1, y 2,, y m jest losową próbą o rozkładzie N(µ, σ 2 ), wówczas wielkość t zdefiniowana jako: N= R // przyjmuje rozkład Studenta o m-1 stopniach swobody. Innym ważnym rozkładem próbkowania jest tzw. rozkład F. Jeżeli zmienne x i y są zmiennymi niezależnymi o rozkładzie chi-kwadrat odpowiednio o m 1 i m 2 stopniach swobody, to zmienna F wyrażona jako: S :, 9 = M I! / M T! /! przyjmuje rozkład F. Funkcję gęstości prawdopodobieństwa rozkładu F dla zmiennej losowej x o m 1 i m 2 stopniach swobody określa następujący wzór: )= ΓE +! GE G :/! ) : /! 2! ΓE! GΓE 2 GUE! G)+1V : 9/! gdzie, zmienna losowa x przyjmuje wartości większe od zera. 18

19 Klasycznym przykładem zmiennej przyjmującej rozkład F jest zmienna wyrażona jako stosunek wariancji dwóch populacji o rozkładzie normalnym. Zakładając, iż pierwsza populacja składa się z losowej próby o m 1 próbkach, dla których dokonano pomiaru określonej własności, y 11, y 12,, y 1m1, a druga zawiera losową próbę m 2 próbek, dla których dokonano pomiaru tej samej własności, y 21, y 22,, y 2m2, wówczas stosunek wariancji, /! i /!! dla tychże populacji przyjmuje rozkład F o df1 = m 1-1 i df2 = m 2-1 stopniach swobody: /! /!! ~S : ; 9 Poniższy rysunek przedstawia kilka przykładowych rozkładów F o różnej liczbie stopni swobody, F df1,df2 : df1=5,df2=5 df1=7,df2=10 df1=10,df2=10 df1=10,df2= f(f) F Rysunek 8 Kilka wybranych rozkładów F dla różnej liczby stopni swobody df1 i df2 19

20 Testowanie hipotez statystycznych Przyjmijmy, iż celem prowadzonych przez nas badań jest porównanie efektywności odzysku pewnego związku stosując procedurę ekstrakcji w dwóch rozpuszczalnikach o różnej polarności. W eksperymencie dwa rodzaje rozpuszczalnika możemy traktować jako dwa poziomy czynnika nazwanego rozpuszczalnik. Oznaczmy te poziomy indeksem i. W wyniku prowadzonych badań powstaną dwa zbiory zawierające m 1 wyników dla poziomu i = 1 i m 2 wyników dla poziomu i = 2, odpowiednio y 11, y 12,, y 1m1 i y 21, y 22,, y 2m2. Uzyskane wyniki pomiarów eksperymentalnych da się opisać stosując ogólny model przedstawiający j-ty wynik pomiaru dla i tego poziomu obarczony pewnym błędem pomiarowym, e ij : Y = +H Y gdzie w przypadku powyższego modelu µ i możemy postrzegać jako średni pomiar dla i-tego poziomu. Zakładając, że wartości błędów e ij dla danego czynnika pochodzą z rozkładu normalnego o średniej zero i wariancji σ i 2, możemy wówczas mówić o losowym błędzie. Dla omawianego przykładu przyjmiemy następującą hipotezę badawczą: rodzaj użytego rozpuszczalnika (jego polarność) ma wpływ na efektywność odzysku. Prawdziwość hipotezy zostanie weryfikowana w oparciu o przeprowadzone pomiary eksperymentalne. W praktyce, weryfikacja tej hipotezy badawczej oznacza porównanie dwóch zbiorów wyników, a w szczególności ustalenie czy wartości średnie dwóch grup pomiarów różnią się od siebie statystycznie istotnie. Wyjściową hipotezę rodzaj użytego rozpuszczalnika (jego polarność) ma wpływ na efektywność odzysku można sformułować prościej, używając w tym celu wartości średnie dwóch zbiorów wyników, odpowiednio µ 1 i µ 2. Procedura testowania hipotez poddaje pod ocenę dwa alternatywne scenariusze hipoteza jest prawdziwa, albo hipoteza jest nieprawdziwa. W statystyce rozróżnia się hipotezę zerową (H 0 ) i tzw. hipotezę alternatywną (H 1 ). Dla omawianego przykładu hipotezę zerową i alternatywną definiujemy następująco: Z [ : =! Z :! Alternatywnie hipotezy można także zapisać jako: Z [ :! =0 Z :! 0 20

21 Tak sformułowana alternatywna hipoteza nazywana jest hipotezą dwustronną, a testowanie testowaniem hipotezy dwustronnej, gdyż taki typ hipotezy zostanie spełniony w dwóch przypadkach µ 1 < µ 2 i µ 1 > µ 2. Ilustruje to poniższy rysunek, na którym zaznaczono dwa obszary krzywej rozkładu odpowiadające prawdopodobieństwu odrzucenia hipotezy zerowej przy założeniu, iż jest ona prawdziwa. Innymi słowy, jest to prawdopodobieństwo popełnienia błędu tzw. błąd α nazywany także błędem I-go rodzaju lub poziomem istotności. Innym rodzajem błędu, który można popełnić podczas testowania hipotez jest błąd β (błąd II-go rodzaju). Błąd II-go rodzaju wyraża prawdopodobieństwo, że hipoteza zerowa nie zostanie odrzucona jeśli jest fałszywa. 0.4 H 0 : µ=1,2 H 1 : µ=1, f(x) błąd β błąd α x Rysunek 9 Ilustracja błędu α i błędu β na przykładzie dwóch hipotez H 0 : µ = 1,2 oraz H 1 : µ = 1,8 Hipoteza alternatywna może także zawierać znak nierówności. Tak sformułowana hipoteza pozwala stwierdzić, czy prawdziwe jest stwierdzenie, że jedna wartość średnia jest mniejsza albo większa od drugiej. W takim przypadku, mówimy o teście jednostronnym lub testowaniu jednostronnej hipotezy. Hipoteza zerowa zawiera znak równości, a hipoteza alternatywna znak nierówności: Z [ : =! Z : <! lub Z : >! W dalszej części opracowania, zagadnienie testowania hipotez jedno- i dwustronnych zostanie bliżej omówione na realnych przykładach. 21

22 Testowanie hipotez zakłada użycie procedury zapewniającej pozyskanie losowej próby wyników, a następnie wykorzystanie odpowiedniego testu statystycznego (statystki) w celu potwierdzenia lub odrzucenia hipotezy zerowej. Należy podkreślić, iż w wyniku przeprowadzonego testowania jedna i tylko jedna z hipotez zostaje przyjęta albo hipoteza zerowa albo hipoteza alternatywna. Podstawowe testy statystyczne Porównanie wartości średnich dwóch grup wyników - test t Test t wykorzystywany jest w celu porównania istotności różnic pomiędzy wartościami średnimi dwóch zbiorów wyników otrzymanych w wyniku losowego próbkowania. Zakładając, iż wariancje dwóch grup wyników nie różnią się od siebie statystycznie istotnie, statystykę t 0 definiuje się jako:! N [ = _/`!E G! gdzie, m 1 i m 2 to liczba próbek odpowiednio w pierwszej i drugiej grupie wyników, a /`! to tzw. uwspólniona wariancja (zakładamy, że /! =/!! =/`!). Uwspólnioną wariancję, /`!, obliczamy jako wypadkową wariancję dwóch grup wyników, uwzględniając liczebność poszczególnych zbiorów, wedle następującego wzoru: /`!= /! 1+/!!! 1 +! 2 Wyrażenie w mianowniku powyższego równania określa liczbę stopni swobody. Próbkując dwie populacje wyników poprzez losowane z dwóch niezależnych rozkładów normalnych, możemy przyjąć, iż rozkład różnic µ 1 -µ 2 przyjmuje rozkład normalny o następujących parametrach N(µ 1 -µ 2, σ 2 (1/m 1 +1/m 2 )). Jednakże, konieczność uwspólnienia wariancji dla dwóch grup próbek (przy założeniu, iż wariancje grup są porównywalne), powoduje zmianę rozkładu statystyki t 0 z rozkładu normalnego do rozkładu t o (m 1 +m 2-2) stopniach swobody. Zauważmy, iż w zależności od wartości średniej wynik działania (µ 1 -µ 2 ) może przyjąć wartość dodatnią (gdy µ 1 > µ 2 ) lub ujemną (gdy µ 1 < µ 2 ). W celu weryfikacji prawdziwości hipotezy zerowej, należy porównać wartość statystyki t 0 z rozkładem t o (m 1 +m 2-2) stopniach swobody i przyjętym poziomem istotności α. 22

23 Przyjmując hipotezę zerową i alternatywną w formie: Z [ : =! Z :! przeprowadzamy testowanie dwustronnej hipotezy alternatywnej, gdyż będzie ona spełniona jeżeli µ 1 < µ 2 i µ 1 > µ 2. Testowanie hipotezy odbywa się poprzez porównanie wartości obranej statystyki t 0, z wartością krytyczną rozkładu t o (m 1 +m 2-2) stopniach swobody i poziomie istotności równym α/2 (w przypadku dwustronnej hipotezy alternatywnej). Należy zauważyć, iż hipoteza zerowa zostanie przyjęta wówczas, gdy: N [ N a! ; : 9! a odrzucona, jeśli: N [ >N a! ; : 9! Powyższe dwa zapisy wskazują, iż ze względu na możliwe wartości statystyki t 0 istnieje przedział wartości, w obrębie którego hipoteza zerowa jest spełniona. Co więcej, bazując na krzywej rozkładu prawdopodobieństwa dla tejże statystyki, można powiedzieć, dla ustalonego poziomu istotności, np. α = 0,05 (5%), oczekujemy iż 100(1-α) = 95% wartości znajdzie się w tym przedziale. Granice przedziału określają wartości graniczne rozkładu t: N [ c N a! ; : 9!,N a! ; : 9! d N a! ; : 9! N [ N a! ; : 9! Przedział wartości liczbowych dowolnej statystyki, których możemy z określonym prawdopodobieństwem oczekiwać nazywany jest przedziałem jej ufności. Na poniższym rysunku, schematyczne przedstawiono przedział ufności dla statystyki t 0, przyjmując poziom istotności α = 0,05 i liczbę stopni swobody

24 f(t 0 ) Odrzóć jeśli t < Odrzóć jeśli t 0 > t 0 Rysunek 10 Przedział ufności wokół statystyki t 0 dla poziomu istotności α = 0,05 i liczby stopni swobody 16 W przeciwieństwie do hipotezy dwustronnej, w pewnych przypadkach może istnieć konieczność testowania hipotezy jednostronnej. Podajmy jako przykłady dwa hipotetyczne scenariusze testowania hipotez porównania wartości średnich: kontrolując jakość surowca (rudy żelaza), ze względów ekonomicznych, sprzedawca może być zainteresowany testowaniem jednostronnej hipotezy alternatywnej na okoliczność zawyżonej zawartości żelaza: Z [ : =! Z : >! Hipoteza alternatywna postaci H 1 : µ 1 > µ 2 zostanie odrzucona, gdy: N [ >N a;: 9! kupujący rudę może być zainteresowany testowaniem jednostronnej hipotezy alternatywnej na okoliczność zaniżonej zawartości żelaza: Z [ : =! Z : <! Odrzucenie hipotezy alternatywnej H 1 : µ 1 < µ 2 wymaga spełnienia warunku: 24

25 N [ < N a;: 9! Schematycznie dwa warianty testu jednostronnego przedstawiono na poniższym rysunku (dla α = 0,025 i N = 16) f(t 0 ) 0.2 f(t 0 ) Odrzóć jeśli t 0 < Odrzóć jeśli t 0 > t t 0 Rysunek 11 Ilustracja dwóch różnych hipotez alternatywnych i warunków ich przyjęcia: po lewej H 1 : µ 1 < µ 2, a po prawej H 1 : µ 1 > µ Przykład 2 Zilustrujmy praktyczne wykorzystanie testu t do rozwiązania realnego problemu analitycznego - porównanie efektywność odzysku pewnego pierwiastka wykorzystując dwie różne metodyki przygotowania próbki. Stosując niezależnie jedną z dwóch metodyk przygotowania próbki, wykonano po 10 niezależnych oznaczeń pierwiastka. Następnie, obliczono dla dwóch zbiorów wartości średnie, wariancje i odchylenia standardowe: metodyka 1: µ 1 = 16,76 σ 1 2 = 0,100 σ 1 = 0,316 m 1 = 10 metodyka 2: µ 2 = 17,04 σ 2 2 = 0,061 σ 1 = 0,248 m 2 = 10 Załóżmy, że chcemy potwierdzić słuszność hipotezy mówiącej, iż dwie metodyki przygotowania próbki nie prowadzą do statystycznie istotnych różnic w odzysku oznaczanego pierwiastka. Krótko, w języku hipotez statystycznych możemy ten problem sformułować w postaci następującej hipotezy zerowej: H 0 : µ 1 = µ 2. W omawianym przypadku, powinniśmy rozważyć testowanie dwustronnej hipotezy alternatywnej H 1 : µ 1 µ 2. Przyjmując poziom istotności testowania hipotezy równy α = 0,05, fakt testowania dwustronnej hipotezy alternatywnej i liczbę stopni swobody równej (m 1 +m 2-2) = = 18, wartość krytyczna rozkładu t, t (0,025;18), odczytana z tablic statystycznych dla testu jednostronnego wynosi 2,

26 Nim ustalimy wartość statystyki t 0 należy obliczyć uwspólnioną wariancję dla dwóch grup wyników. Podstawiając realne wartości, otrzymujemy: /`! = /! 1+/!!! 1 +! 2 = 90,100+90, =0,081 Na tej podstawie, wartość statystyki t 0 wynosi:! N [ = _/`!E = 16,76 17,04 0,28 G _0,081E 1! = 10 G 0,127 = 2,20 Ponieważ wartość bezwzględna statystyki t 0 jest większa od wartości krytycznej rozkładu t dla t (0,025;18) = 2,101 (wartość krytyczna odczytana z tablic dla testu jednostronnego), możemy stwierdzić iż dwa sposoby przygotowania próbki dają statystycznie istotnie różne wyniki (odrzucona została hipoteza zerowa, a przyjęta hipoteza alternatywna). Inna wersja możliwej odpowiedzi to: z 95% ufnością można twierdzić, iż dwa sposoby przygotowania próbki różnią się od siebie statystycznie istotnie. Podobnych przykładów, jak ten przytoczony powyżej, w chemii analitycznej możemy odszukać wiele. W szczególności, testowanie hipotez statystycznych ma za zadanie wspomóc chemika analityka w podejmowaniu decyzji w sposób obiektywny na podstawie empirycznych przesłanek np. wybór jednej z dwóch możliwych metod analitycznych pod kątem ich efektywności czy ekonomiczności. Zapewne bardziej uważni czytelnicy dostrzegli, iż wybierając tak zdefiniowaną statystykę t 0 przyjęliśmy z góry pewne założenia. Pierwsze z nich zakłada, iż próbki dla których dokonano oznaczeń zostały pobrane w sposób losowy. Drugie założenie postuluje równość wariancji dwóch zbiorów wyników. W praktyce, takie założenia nie muszą być słuszne. Stąd, konieczność potwierdzenia tego faktu. Jednym z narzędzi wspomagającym ocenę słuszności przyjętego rozkładu wyników jest tzw. normalny wykres prawdopodobieństwa. Przedstawia on uszeregowane od najniższej do najwyższej wartości wyniki i odpowiadającej im wartości kumulacyjnej częstości występowania. W przypadku danych, które przyjmują rozkład normalny, punkty na wykresie rozmieszczone są wzdłuż linii prostej. W przypadku, gdy różnice pomiędzy wariancjami dwóch grup wyników znacząco od siebie odbiegają, test t wymaga modyfikacji. Załóżmy, iż hipoteza zerowa i alternatywna są zdefiniowane następująco: 26

27 Z [ : =! Z :! Statystyka t 0 powinna uwzględniać fakt różnej wariancji grup, estymowanych na podstawie próby losowej, a także ich liczebność: N [ =! h /! + /!!! Rozkład zmodyfikowanej statystyki t 0 nie do końca jest zgodny z rozkładem t. Jego relatywnie dobre przybliżenie można uzyskać poprzez korekcję liczbę stopni swobody, k: & /! + /!!' F=! /! /! 1 +/!! /!!! 1! W przypadku, gdy wariancje grup próbek są znane a priori (to znaczy, nie są estymowane na podstawie małej losowej próby losowanej z rozkładu normalnego), lub liczba próbek jest relatywnie duża, możemy założyć iż rozkład statystyki t 0 przyjmuje rozkład normalny N(0, 1). Dla odróżnienia tego faktu, przyjmijmy nowe oznaczenie statystyki, z 0 : 5 [ =! h /! + /!!! Zakładając test dwustronny (dwustronna hipoteza alternatywna), porównamy wartość statystyki z 0 z wartością krytyczną unormowanego rozkładu normalnego przy zadanym poziomie istotności α, z α. Hipoteza zerowa zostanie odrzucona, jeśli z 0 > z α/2. Porównanie wartości średniej z wartością deklarowaną W niektórych przypadkach, prowadzony eksperyment ma dostarczyć danych w celu potwierdzenia czy średnia uzyskanych wyników statystycznie istotnie odbiega od wartości deklarowanej. Na przykład, wyrywkowo kontrolując partię leku sprawdza się czy zawartość 27

28 aktywnego składnika nie różni się od wartości deklarowanej przez producenta. Testujemy następujące dwie hipotezy: Z [ : = [ Z : [ gdzie, przez µ 0 oznaczymy wartość deklarowaną przez producenta. Jeżeli rozkład wyników jest w przybliżeniu normalny, lub liczba próbek jest relatywnie duża można posłużyć się wartościami krytycznymi dla unormowanego rozkładu normalnego. Wówczas statystykę z 0 definiujemy następująco: 5 [ = [ // Zatem, w przypadku dwustronnej hipotezy alternatywnej, hipoteza ta zostanie przyjęta jeśli z 0 > z α/2. Korzystając z definicji przedziału ufności, stwierdzamy, czy wartość deklarowana znajduje się w przedziale: 5a [ /! 5a! Alternatywnie, przedział ufności w którym należy oczekiwać wartości deklarowanej (spełnienie hipotezy zerowej) można zapisać jako: [ ±5a! / Jeśli liczba próbek jest relatywnie mała, to należy założyć iż statystyka z 0 nie przyjmuje rozkładu normalnego, a rozkład t. Wówczas, wartość t 0 porównujemy z wartością krytyczną rozkładu t dla zadanego poziomu ufności i przyjętej liczby stopni swobody t (α;k). By zaznaczyć ten fakt, przyjmijmy, że: N [ = [ // 28

29 Dla dwustronnej hipotezy alternatywnej, hipoteza ta zostanie przyjęta jeśli t 0 > t (α/2;k). Korzystając z definicji przedziału ufności, stwierdzamy, czy wartość deklarowana znajduje się w przedziale: N a E! ;BG [ / N E a! ;BG Alternatywnie, przedział ufności w którym należy oczekiwać wartości deklarowanej (spełnienie hipotezy zerowej) można zapisać jako: [ ±N E a! ;BG / Przykład 3 Podejrzewa się, iż pewna metoda analityczna oparta o miareczkowanie kwasu zasadą wykazuje znaczny pozytywny błąd systematyczny. W celu wykrycia tego faktu, przygotowano roztwór titranta o dokładnym stężeniu 0,1 mol dm -3, który posłużył do miareczkowania 25,00 ml 0,1 mol dm -3 zasady. W kolejnych sześciu miareczkowaniach, zużyto następujące objętości titranta (w ml): 25,06 25,18 24,87 25,51 25,34 25,41 Testujemy zatem hipotezę pozytywnego błędu systematycznego metody, wykorzystując porównanie wartości średniej wyników z wartością deklarowaną. Tak sformułowana hipoteza z góry zakłada jednostronny wariant hipotezy alternatywnej, ponieważ pozytywny błąd systematyczny metody będzie oznaczał, że µ-µ 0 > 0. Z [ : = [ ; Z [ : =25,00 ml Z : > [ ; Z : >25,00 ml Na podstawie serii wyników, wartość średnia i odchylenie standardowe wynoszą odpowiednio 25,228 ml i 0,238 ml. Obliczamy wartość statystyki t 0 jako: N [ = [ // =25,228 25,00 =2,35 0,238/ 6 29

30 Zakładając poziom istotności jednostronnego testu α = 0,05, wartość krytyczna rozkładu dla (6-1) stopni swobody, t (0,05;5), wynosi 2,02. Przy tak sformułowanych hipotezach, hipoteza zerowa zostanie odrzucona, jeśli t 0 > t (0,05;5). W omawianym przykładzie, wartość bezwzględna t 0 jest większa niż wartość krytyczna, dlatego należy przyjąć hipotezę alternatywną. W wyniku przeprowadzonego testowania możemy z 95% ufnością stwierdzić, że badana metoda analityczna faktycznie jest obarczona dodatnim błędem statystycznym. Rozważmy jeszcze co stałoby się, gdyby zamiast jednostronnego testu zastosować test dwustronny. W takim wypadku, wartość krytyczna rozkładu dla poziomu istotności α = 0,05 wynosi t (0,025;5) = 2,57. W konsekwencji, musielibyśmy przyjąć hipotezę zerową, a nie alternatywną jak to miało miejsce wcześniej. W pierwszej chwili, można mieć wrażenie, iż istnieje tu sprzeczność, jednak powodem takiego wyniku testowania jest niewłaściwe założenie hipotezy alternatywnej. To czy podczas testowania należy użyć jedno- czy dwustronnego testu zależy od wstępnej wiedzy, a w omawianym przykładzie wyraźnie zaznaczono, iż oczekujemy pozytywnej wartości błędu systematycznego, co świadczy o zawyżonej wartości średniej oznaczeń w stosunku do wartości deklarowanej. Przykład 4 Podczas produkcji benzyny 95-oktanowej losowo pobrano 6 próbek paliwa i oznaczono dla nich liczbę oktanową. Wyniki kolejnych oznaczeń są następujące: 94,78 95,01 94,87 95,05 95,07 94,98 Czy możemy z 95% ufnością twierdzić, że paliwo może być sprzedawane jako 95-oktanowe? W tym przypadku, możemy założyć, iż interesuje nas jedynie stwierdzenie faktu istnienia istotności statystycznej różnic, a zatem hipotezy należy zdefiniować następująco (test dwustronny): Z [ : = [ ; Z [ : =95,00 Z : [ ; Z : 95,00 Na podstawie serii wyników, wartość średnia i odchylenie standardowe wynoszą odpowiednio 94,96 i 0,113. Obliczamy wartość statystyki t 0 jako: N [ = [ // =94,96 95,00 = 0,87 0,113/ 6 Zakładając 95% ufność, poziom istotności wynosi α% = (100-95) = 5% czyli α = 0,05. Wartość krytyczna rozkładu dla poziomu istotności α = 0,05 wynosi t (0,025;5) = 2,57 (wartość 30

31 odczytana z tablic dla testu jednostronnego). Ponieważ t 0 < t (0,025;5) przyjmujemy hipotezę zerową. Zatem, z 95% ufnością możemy twierdzić, iż benzyna spełnia specyfikację 95-oktanowego paliwa. Sparowany test t We wcześniejszej części opracowania przedstawiliśmy sposób porównania dwóch metod na podstawie uzyskanych zbirów wyników powstałych poprzez losowe próbkowanie dwóch niezależnych populacji o rozkładach normalnych. W praktyce, możemy także spotkać podejście zakładające wykonanie pomiaru dwoma niezależnymi technikami czy metodami dla tej samej grupy próbek. Innymi słowy oznacza to, iż ta sama próbka wpierw analizowana jest metodą pierwszą, a potem drugą w konsekwencji uzyskując zbiór par wyników. Ten fakt, znajduje odzwierciedlenie w nazwie testu sparowany test t - który można wykorzystać, aby badać różnice pomiędzy metodami. Test ten zakłada badanie różnic pomiędzy parami wyników, d, i stwierdzenie czy te różnice są statystycznie różne od zera. N [ = l 0 // gdzie, µ d to wartość średnia dla m różnic wyników obliczonych pomiędzy odpowiadającymi sobie próbkami. Z [ : l 0=0 Z : l 0 0 Mając do czynienia z dwustronnym testem, hipotezę zerową przyjmiemy jeśli t 0 > t (α/2;k). Przykład 5 Oznaczano zawartość składnika aktywnego - paracetamolu w tabletkach. W tym celu wykorzystano dwie techniki analityczne. Z 10 różnych partii leku pobrano losowo po jednej tabletce i poddano je analizie. Uzyskano wyniki zamieszczone w poniższej tabeli. Czy te dwie techniki analityczne dają statystycznie istotnie różne wyniki? 31

32 Tabela 1 Wyniki pomiarów uzyskanych dwoma metodami i wartości ich różnic d Partia Metoda 1 Metoda 2 d 1 84,63 83,15 1, ,38 83,72 0, ,08 83,84 0, ,41 84,2 0, ,82 83,92-0,1 6 83,55 84,16-0, ,92 84,02-0,1 8 83,69 83,6 0, ,06 84,13-0, ,03 84,24-0,21 Wartość średnia i odchylenie standardowe różnic wynoszą odpowiednio 0,159 i 0,57. Wartość statyki t 0 wynosi: N [ = l 0 // = 0,159 0,57/ 10 =0,88 Zakładając 95% poziom ufności, wartość krytyczna rozkładu t dla (10-1) stopni swobody (odczytana z tablic dla testu jednostronnego), t (0,025;9), wynosi 2,23. Ponieważ t 0 < t (0,025;9) przyjmujemy hipotezę zerową i stwierdzamy z 95% ufnością, że dwie metody dają te same wyniki. Możemy wyobrazić sobie sytuację, w której chemik analityk ma do swojej dyspozycji dwie metody analityczne, różniące się od siebie ze względu np. koszt pomiaru, czas pomiaru, przygotowanie próbki, etc. Naturalnym działaniem jest próba zastępowania metod analitycznych innymi ze względów ekonomicznych. Jednakże, wymaga to obiektywnego potwierdzenia, iż zamiana metody nie powoduje straty w kontekście jakości uzyskanych wyników. Metody wnioskowania statystycznego, dają analitykowi możliwość wiarygodnego i obiektywnego porównania działania metod. Testowanie wariancji test F Wcześniej opisane statystyki umożliwiały wykrycie błędów systematycznych wynikających z różnic pomiędzy średnimi lub średnią, a wartością deklarowaną. Innym ważnym aspektem jest porównanie wariancji dwóch metod, czyli stwierdzenie faktu ich podobnej precyzji. 32

33 W tym celu można użyć testu F, który zdefiniowany jest jako stosunek wariancji dwóch grup próbek. S [ = /! /!! 1 gdzie, zakładamy, iż /! >/!!. Tak zdefiniowana statystyka F 0 przyjmuje rozkład F o dwóch stopniach swobody wynikających z liczebności grupy pierwszej i drugiej. Wartość krytyczną dla tego rozkładu odczytujemy z tablic wartości krytycznych dla rozkładu dla zadanego poziomu istotności oraz liczby stopni swobody S a;: ; 9 (zob. tabele w dodatku opracowania). Jeżeli wartość statystyki znacząco odbiega od jedności, F 0 > S a;: ; 9, można z pewnością równą (1-α) wnioskować, iż różnice precyzji dwóch metod nie wynikają z przyczyn losowego błędu. Podobnie jak we wcześniej omawianych przypadkach, zdefiniowanie hipotez zerowej i alternatywnej zależy od zamierzonego celu. Stwierdzenie czy istnieją różnice w precyzji dwóch metod analitycznych wymaga rozważenia dwustronnego testu, podczas gdy stwierdzenie, która z metod jest bardziej lub mniej precyzyjna wymaga użycia testu jednostronnego. Przykład 6 Wykorzystano dwie metody analityczne (proponowaną i standardową) pozwalające określić chemiczne zapotrzebowanie na tlen w próbkach ścieków. Wykonano niezależne oznaczenia dla losowo pobranych próbek, po osiem dla każdej metody. Uzyskano następujące wartości średnich i odchyleń standardowych: metoda proponowana (1): µ 1 = 72,00 mg dm -3 ; σ 1 = 3,31 mg dm -3 metoda standardowa (2): µ 2 = 72,00 mg dm -3 ; σ 2 = 1,51 mg dm -3 Czy wariancja proponowanej metody jest istotnie większa niż wariancja metody standardowej? Dla tak postawionego problemu badawczego, wykorzystamy test jednostronny by zbadać słuszność hipotezy zerowej: Z [ : σ! =σ!! Z : σ! >σ!! Należy pamiętać, iż im mniejsza wariancja wyników pomiarów tym większa precyzja metody. Stąd znak nierówności w hipotezie alternatywnej mówi o większej wariancji metody proponowanej od wariancji metody standardowej. 33

Prawdopodobieństwo i rozkład normalny cd.

Prawdopodobieństwo i rozkład normalny cd. # # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl

Bardziej szczegółowo

Wprowadzenie do statystyki dla. chemików testowanie hipotez

Wprowadzenie do statystyki dla. chemików testowanie hipotez chemików testowanie hipotez Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl http://www.sites.google.com/site/chemomlab/

Bardziej szczegółowo

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska D syst D śr m 1 3 5 2 4 6 śr j D 1

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15 VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N = HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych cd. Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:

Bardziej szczegółowo

Estymacja punktowa i przedziałowa

Estymacja punktowa i przedziałowa Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Rozkład Gaussa i test χ2

Rozkład Gaussa i test χ2 Rozkład Gaussa jest scharakteryzowany dwoma parametramiwartością oczekiwaną rozkładu μ oraz dyspersją σ: METODA 2 (dokładna) polega na zmianie zmiennych i na obliczeniu pk jako różnicy całek ze standaryzowanego

Bardziej szczegółowo

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem. Teoria błędów Wskutek niedoskonałości przyrządów, jak również niedoskonałości organów zmysłów wszystkie pomiary są dokonywane z określonym stopniem dokładności. Nie otrzymujemy prawidłowych wartości mierzonej

Bardziej szczegółowo

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów Wstęp do probabilistyki i statystyki Wykład 4. Statystyki i estymacja parametrów dr hab.inż. Katarzyna Zakrzewska, prof.agh, Katedra Elektroniki, WIET AGH Wstęp do probabilistyki i statystyki. Wykład 4

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

Zawartość. Zawartość

Zawartość. Zawartość Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79 Test F =służy do porównania precyzji dwóch niezależnych serii pomiarowych uzyskanych w trakcie analizy próbek o zawartości analitu na takim samym poziomie #obliczyć wartość odchyleń standardowych dla serii

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński Wstęp do teorii niepewności pomiaru Danuta J. Michczyńska Adam Michczyński Podstawowe informacje: Strona Politechniki Śląskiej: www.polsl.pl Instytut Fizyki / strona własna Instytutu / Dydaktyka / I Pracownia

Bardziej szczegółowo

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY

Bardziej szczegółowo

Analiza i monitoring środowiska

Analiza i monitoring środowiska Analiza i monitoring środowiska CHC 017003L (opracował W. Zierkiewicz) Ćwiczenie 1: Analiza statystyczna wyników pomiarów. 1. WSTĘP Otrzymany w wyniku przeprowadzonej analizy ilościowej wynik pomiaru zawartości

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1. Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi

Bardziej szczegółowo

Analiza niepewności pomiarów

Analiza niepewności pomiarów Teoria pomiarów Analiza niepewności pomiarów Zagadnienia statystyki matematycznej Dr hab. inż. Paweł Majda www.pmajda.zut.edu.pl Podstawy statystyki matematycznej Histogram oraz wielobok liczebności zmiennej

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA narzędzie do opracowywania i interpretacji wyników pomiarów

STATYSTYKA MATEMATYCZNA narzędzie do opracowywania i interpretacji wyników pomiarów STATYSTYKA MATEMATYCZNA narzędzie do opracowywania i interpretacji wyników pomiarów Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Statystyka matematyczna - część matematyki

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

LABORATORIUM Z FIZYKI

LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI I PRACOWNIA FIZYCZNA C w Gliwicach Gliwice, ul. Konarskiego 22, pokoje 52-54 Regulamin pracowni i organizacja zajęć Sprawozdanie (strona tytułowa, karta pomiarowa)

Bardziej szczegółowo

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych Dr inż. Marcin Zieliński I Pracownia Fizyczna dla Biotechnologii, wtorek 8:00-10:45 Konsultacje Zakład Fizyki Jądrowej

Bardziej szczegółowo

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Statystyka opisowa. Wykład I. Elementy statystyki opisowej Statystyka opisowa. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Elementy statystyku opisowej 1 Elementy statystyku opisowej 2 3 Elementy statystyku opisowej Definicja Statystyka jest to nauka o

Bardziej szczegółowo

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów

Bardziej szczegółowo

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych dla studentów Chemii 2007 Paweł Korecki 2013 Andrzej Kapanowski Po co jest Pracownia Fizyczna? 1. Obserwacja zjawisk i

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

INFORMATYKA W CHEMII Dr Piotr Szczepański

INFORMATYKA W CHEMII Dr Piotr Szczepański INFORMATYKA W CHEMII Dr Piotr Szczepański Katedra Chemii Fizycznej i Fizykochemii Polimerów WPROWADZENIE DO STATYSTYCZNEJ OCENY WYNIKÓW DOŚWIADCZEŃ 1. BŁĄD I STATYSTYKA błąd systematyczny, błąd przypadkowy,

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

WYKŁAD 8 ANALIZA REGRESJI

WYKŁAD 8 ANALIZA REGRESJI WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo