SKRYPT DLA STUDENTÓW KIERUNKU CHEMIA. Opracowanie wyników pomiarów eksperymentalnych

Podobne dokumenty
Prawdopodobieństwo i rozkład normalny cd.

Wprowadzenie do statystyki dla. chemików testowanie hipotez

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna dla leśników

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych

166 Wstęp do statystyki matematycznej

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Testowanie hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wykład 3 Hipotezy statystyczne

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych cd.

Estymacja punktowa i przedziałowa

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Rozkład Gaussa i test χ2

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Zadania ze statystyki, cz.6

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testy nieparametryczne

Wprowadzenie do analizy korelacji i regresji

Testowanie hipotez statystycznych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wnioskowanie statystyczne. Statystyka w 5

Zawartość. Zawartość

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Statystyka matematyczna i ekonometria

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Hipotezy statystyczne

Hipotezy statystyczne

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

WNIOSKOWANIE STATYSTYCZNE

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Pobieranie prób i rozkład z próby

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Analiza i monitoring środowiska

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Rozkłady statystyk z próby

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Statystyka i Analiza Danych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Wykład 9 Wnioskowanie o średnich

Zadania ze statystyki cz.8. Zadanie 1.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka matematyczna i ekonometria

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Analiza niepewności pomiarów

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

STATYSTYKA MATEMATYCZNA narzędzie do opracowywania i interpretacji wyników pomiarów

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez statystycznych.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

STATYSTYKA MATEMATYCZNA

LABORATORIUM Z FIZYKI

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Oszacowanie i rozkład t

INFORMATYKA W CHEMII Dr Piotr Szczepański

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

WYKŁAD 8 ANALIZA REGRESJI

PDF created with FinePrint pdffactory Pro trial version

Transkrypt:

Projekt Zwiększenie liczby absolwentów kierunku chemia ZLAB realizowany w ramach Priorytetu IV Szkolnictwo wyższe i nauka, Poddziałanie 4.1.2 Programu Operacyjnego Kapitał Ludzki SKRYPT DLA STUDENTÓW KIERUNKU CHEMIA Opracowanie wyników pomiarów eksperymentalnych Ivana Stanimirova-Daszykowska Uniwersytet Śląski w Katowicach Instytut Chemii Katowice 2013 Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

Spis treści Przedmowa... 3 Problem badawczy, pytanie badawcze i hipoteza badawcza... 4 Zmienne pomiarowe... 5 Rodzaje błędów pomiarowych... 5 Statystka jako nauka i jej przedmiot... 7 Wprowadzenie do statystyki losowej zmiennej... 7 Parametry opisujące rozkład losowej zmiennej... 9 Miary położenia środka rozkładu... 9 Miary dyspersji rozkładu wyników... 10 Próbkowanie i rozkład próbkowania... 11 Rozkład normalny i wystandardyzowany rozkład normalny... 11 Centralne twierdzenie graniczne... 15 Rozkład chi kwadrat... 15 Testowanie hipotez statystycznych... 20 Podstawowe testy statystyczne... 22 Porównanie wartości średnich dwóch grup wyników - test t... 22 Porównanie wartości średniej z wartością deklarowaną... 27 Sparowany test t... 31 Testowanie wariancji test F... 32 Przedział ufności wartości średniej... 34 Wprowadzenie do analizy wariancji (ANOVA)... 35 Metody kalibracyjne - regresja jednokrotna i wieloraka... 38 Regresja jednoparametrowa... 38 Regresja wieloraka... 45 Badanie siły liniowej zależności dwóch parametrów... 49 Stabilne warianty podstawowych estymatorów... 51 Literatura... 53 Dodatek: wybrane tablice statystyczne... 54 2

Przedmowa Oddajemy w Państwa ręce materiały dydaktyczne, które w sposób bardzo syntetyczny przedstawiają elementarne zagadnienia z zakresu statystyki i metod opracowania wyników eksperymentalnych. Materiały te tylko w pewnej mierze przybliżają omawiane zagadnienia, a zakres i forma ich prezentacji są wynikiem kompromisu pomiędzy wymaganą wiedzą, oczekiwanymi efektami kształcenia, a realną potrzebą wykorzystania prezentowanych treści w pracy zawodowej chemika. Przyjęty zakres merytoryczny opracowania to wynik ponad trzyletniego doświadczenia osiągniętego podczas prowadzenia zajęć w ramach modułu Matematyka stosowana z elementami chemometrii dla studentów drugiego roku studiów licencjackich na kierunku chemia. Rolą prowadzonego kursu jest zwrócenie uwagi na szczególne miejsce jakie zajmuje statystyka i inne metody matematyczne w opracowaniu wyników pomiarowych uzyskanych w trakcie prowadzonych eksperymentów. Pomimo dostępnych licznych pozycji literaturowych poruszających zagadnienia z zakresu statystyki, wedle naszego przekonania, istniała konieczność przygotowania opracowania napisanego językiem prostym, zrozumiałym dla studentów kierunku chemia wraz z typowymi przykładami zastosowań. Wierzymy, iż niniejsze opracowanie będzie Państwu pomocne nie tylko w ramach zajęć, ale i późniejszej pracy zawodowej chemika. Zachęcamy do zgłaszania ewentualnych uwag lub propozycji modyfikacji treści, mając nadzieje, że przez to kolejne wersje opracowania będą jeszcze lepsze. 3

Problem badawczy, pytanie badawcze i hipoteza badawcza W chemii, główną istotą prowadzonych badań eksperymentalnych jest próba rozwiązania podjętego problemu badawczego zazwyczaj ujętego w formie pytania. Precyzuje one zakres problemu badawczego, który zamierzamy rozwiązać, a także sugeruje formę oczekiwanej odpowiedzi. W zależności od rodzaju pytania badawczego, uzyskamy odpowiedź tak lub nie dla tzw. pytań rozstrzygnięcia, albo odpowiedź złożoną w przypadku tzw. pytań dopełnienia. Oto kilka przykładowych pytań badawczych ilustrujących wybrane problemy chemiczne i możliwe odpowiedzi: Czy badana próbka wina pochodzi z Włoch? (pytanie rozstrzygnięcia) Problem badawczy: śledzenie pochodzenia geograficznego próbek na podstawie ich składu chemicznego Odpowiedź: tak lub nie Czy stężeniu cynku w analizowanej próbce nie przekracza 50 mg dm -3? (pytanie rozstrzygnięcia) Problem badawczy: badania jakości środowiska (dopuszczalne stężenie to na przykład 50 mg dm -3 ) Odpowiedź: tak lub nie (pytanie rozstrzygnięcia) O ile zwiększy się stopień odzysku molibdenu, jeśli przed analizą techniką rentgenowskiej fluorescencji próbkę zagęszczono odpowiednio poprzez adsorpcję na nanorurkach i utlenionych nanorurkach? Problem badawczy: analiza chemiczna Przykładowa odpowiedź: zagęszczanie próbki z wykorzystaniem jako adsorbenta utlenionych nanorurek prowadzi do zwiększenia odzysku o 60% w stosunku do adsorpcji prowadzonej na nanorurkach bez modyfikacji powierzchni. Jak zmieni się wydajność reakcji chemicznej, jeśli będzie ona prowadzona przy temperaturach 20 C i 40 C? (pytanie dopełnienia) Problem badawczy: optymalizacja procesu (ustalenie wpływu temperatury na wydajność reakcji chemicznej) Przykładowa odpowiedź: w temperaturze 40 C obserwuje się dwukrotny wzrost wydajności reakcji chemicznej w stosunku do wydajności reakcji chemicznej prowadzonej w temperaturze 20 C. Planując, a później realizując eksperyment, oczekujemy iż uzyskane wyniki pomiarów umożliwią udzielenie jednoznacznej odpowiedzi na postawione pytanie badawcze. Stąd też, formułując pytanie badawcze należy mieć na uwadze by było ono precyzyjne, zrozumiałe i rozstrzygalne mając do dyspozycji dostępne środki (np. aparaturę, odpowiednie odczynniki, etc.). Zazwyczaj, sformułowanie problemu badawczego i odpowiedniego pytania skłania nas do refleksji nad możliwym wynikiem eksperymentu, a w konsekwencji zachęca do próby odpowiedzi na pytanie badawcze. Przeczuwalna odpowiedź może być postrzegana jako fundament do budowy hipotezy badawczej. 4

Hipoteza badawcza to zdanie twierdzące, mówiące o przewidywanym rezultacie prowadzonego eksperymentu. Hipoteza badawcza ma pomóc uzyskać odpowiedź na pytanie badawcze. Odpowiednio sformułowana hipoteza badawcza jest prosta. Ma dobrą moc predykcyjną (własność, dzięki której istnieje możliwość przewidzenia wyniku na podstawie określonych parametrów). Ponadto, hipoteza badawcza musi być weryfikowalna czyli empirycznie możliwa do sprawdzenia. Każdy, dobrze zaplanowany i poprawnie przeprowadzony eksperyment warunkuje wiarygodne pomiary (wyniki), które mogą posłużyć by zweryfikować prawdziwość postulowanej hipotezy badawczej. Dokonuje się tego stosując wybrane metody wnioskowania statystycznego, które umożliwiają uzyskanie obiektywnych sądów co do prawdziwości weryfikowanych hipotez. Zmienne pomiarowe Wynikiem prowadzonych eksperymentów jest zbiór pomiarów, które charakteryzują badane próbki. Najczęściej, są one opisane przez pomiary wybranych parametrów np. stężenia niektórych metali lub związków chemicznych, rozpuszczalność, aktywność biologiczną, ph, gęstość, lepkość, przewodnictwo, itp. Tego typu pomiary to tzw. zmienne ilościowe, gdyż ich wartości przyjmują dowolne wartości z określonego przedziału. Drugim typem zmiennych są zmienne jakościowe. Takie zmienne mogą przyjmować pewne wartości z zawężonego zbioru możliwości, np. barwa, kraj pobrania próbki (pochodzenie geograficzne), informacja czy próbkę pobrano od pacjenta zdrowego czy chorego, fakt autentyczności badanej próbki, itp. Przeważnie w badaniach chemicznych mamy styczność ze zmiennymi ilościowymi i to właśnie one w głównej mierze są przedmiotem opracowania statystycznego. Rodzaje błędów pomiarowych Każdy pomiar analityczny jest obarczony błędem. Poprzez błąd rozumiemy różnicę pomiędzy wartością oczekiwaną pomiaru (rzeczywistą), a wartością wyznaczoną eksperymentalnie. Na pomiar analityczny ma wpływ duża liczba czynników. Przyczyn powstawania błędów pomiarowych można doszukiwać się w niestabilnych warunkach pomiaru (np. wahania temperatury), wadliwej pracy podzespołów, zaburzeniach w stałości prądu elektrycznego, zarudzeniu aparatury, itp. Błędy mogą także wynikać z używanej metody analitycznej, np. powolna lub niezakończona reakcja czy niestabilne komponenty próbki. Możemy wyróżnić trzy podstawowe rodzaje błędów pomiarowych. Są to błędy grube, systematyczne i błędy losowe (tzw. przypadkowe). Błędy grube (z ang. gross errors), to takie które powodują iż, wynik pomiaru rażąco odbiega od wyników pozostałych pomiarów. Przyczyną błędu grubego są zazwyczaj incydentalne zdarzenia. Na przykład, może to być problem techniczny z przyrządem, na 5

którym dokonywany jest pomiar, niewłaściwe wpisanie wyniku (np. złe oddzielenie cyfr dziesiętnych przecinkiem), zaniedbanie w czynnościach określonych w protokole przygotowania próbki do analizy, użycie zanieczyszczonego szkła lub odczynnika, itp. Błędy systematyczne (z ang. systematic error), to takie, które w przypadku wielokrotnie powtarzanych w tych samych warunkach pomiarów są praktycznie stałe lub zmieniają się wedle pewnej prawidłowości. Są one np. następstwem źle wykalibrowanego przyrządu, zabrudzenia szalki wagi, itp. Wówczas mówi się o obciążeniu wyniku pomiaru (z ang. bias) zakładając, iż błąd losowy jest zaniedbywalny. Błąd systematyczny można stosunkowo łatwo wyeliminować poprzez użycie odpowiednich metod i materiałów certyfikowanych. Wykrycie błędu systematycznego jest niemożliwe poprzez wykonanie serii powtórzeń. Błędy losowe (z ang. random errors) powodują, iż wyniki powtarzanych pomiarów prowadzonych w tych samych warunkach nieznacznie się od siebie różnią. Wpływają na precyzję i dokładność metody. Obecność błędu losowego jest powodowana poprzez szereg błędów elementarnych, które występują w toku postępowania analitycznego. Wielkość błędu losowego może być oszacowana poprzez wykonanie serii powtórzeń. Minimalizację błędu losowego realizuje się poprzez dopracowanie wykorzystywanej techniki pomiarowej i samej metodyki pomiaru, jednak nie da się całkowicie wyeliminować błędu losowego. Z pojęciem błędu pomiarowego wiążą się także takie definicje jak dokładność metody (z ang. accuracy) i precyzja metody (z ang. precision). Dokładność metody określa różnicę pomiędzy uzyskanym wynikiem pomiaru, a wartością prawdziwą (oczekiwaną). Precyzja metody determinuje stopień zgodności uzyskanych wyników, a zatem opisuje powtarzalność pomiarów. Dokładność i precyzja Precyzja i brak dokładności + + Dokładność i brak precyzji + Brak dokładności i precyzji + Rysunek 1 Graficzna prezentacja definicji precyzji i dokładności metody w odniesieniu do rozrzutu czterech wyników i prawdziwej wartości oznaczonej jako + 6

Należy podkreślić, iż metoda analityczna prowadząca do precyzyjnych wyników wcale nie musi być metodą dokładną. Ten problem ilustruje powyższy rysunek, na którym przedstawiono hipotetyczne cztery wyniki pomiarów oraz wartość prawdziwą znajdującą się w środku. Statystka jako nauka i jej przedmiot Statystyka jest nauką, w ramach której rozwijane są techniki ułatwiające badanie i podejmowanie decyzji o zjawiskach, procesach lub populacjach na podstawie analizy informacji zawartej w próbie pochodzącej z danej populacji. Metody statystyczne odgrywają istotną rolę w rozwiązywaniu zagadnień z dziedziny kontroli jakości wyników i produktów, a także ułatwiają wskazanie możliwych kierunków poprawy badanego procesu, metody, itp. Statystyka dostarcza odpowiednich narzędzi, które wspomagają proces próbkowanie procesu, jego testowanie, ocenę, usprawnienie i polepszenie jakości. Może być także postrzegana jako język, dzięki któremu można w sposób obiektywny mówić o jakości. Ogólnie, możemy wyróżnić trzy zasadnicze zastosowania narzędzi statystki. Metody statystki opisowej umożliwiają syntetyczne przedstawienie informacji zawartej w zbiorze wyników. Rozkłady prawdopodobieństwa mają za zadanie wyjaśniać zamienność określonego parametru monitorowanego w trakcie eksperymentu czy procesu. Podejścia wnioskowania statystycznego pozwalają formułować ogólne i obiektywne wnioski, dotyczące prawidłowości dla populacji wyników na podstawie losowej próby (podzbioru wyników). Wprowadzenie do statystyki losowej zmiennej Zbiór wyników uzyskanych dla wielokrotnie powtórzonych pomiarów danego parametru możemy postrzegać jako zmienną losową. Zmienna losowa powstaje jako wynik działania funkcji, która elementom zmiennej losowej z określnym prawdopodobieństwem przyporządkowuje wartości pomiarowe. Strukturę prawdopodobieństwa zmiennej losowej opisuje jej rozkład prawdopodobieństwa. W przypadku zmiennej losowej, y, o charakterze dyskretnym, rozkład prawdopodobieństwa nazywany jest funkcją prawdopodobieństwa, p(y), natomiast w przypadku zmiennej losowej o charakterze ciągłym jest to funkcja gęstości prawdopodobieństwa, f(y). Poniższe dwa rysunki obrazują hipotetyczne rozkłady prawdopodobieństwa dyskretny i ciągły. 7

25 20 częstotliwość 15 10 f(y) 5 0 1 2 3 4 5 6 7 8 y Rysunek 2 Rozkłady prawdopodobieństwa dyskretny i ciągły y W przypadku dyskretnego rozkładu prawdopodobieństwa, wysokość poszczególnych słupków to wartości funkcji dla wyników pomiarów, p(y i ), bezpośrednio mówi o prawdopodobieństwie wystąpienia wyniku lub wyników z określonego przedziału wartości. Dla ciągłego rozkładu prawdopodobieństwa, prawdopodobieństwo determinuje pole powierzchni pod krzywą f(y) dla zadanego przedziału pomiarów. Dla zmiennej losowej o charakterze dyskretnym, własności rozkładu prawdopodobieństwa można przedstawić następująco: 1. 0 1 dla wszystkich wartości y i 2. P= = dla wszystkich wartości y i 3. =1 W przypadku zmiennej losowej ciągłej, własności rozkładu prawdopodobieństwa są następujące: 1. 0 2. = 3. =1 8

Parametry opisujące rozkład losowej zmiennej Do opisu rozkładu losowej zmiennej wykorzystuje się estymatory. Ich rolą jest przybliżyć wartość oczekiwaną (wartość prawdziwą) na podstawie zbioru wyników pomiarów. Estymator opisuje populację wyników. Rozkład zmiennej losowej charakteryzuje się poprzez położenie środka rozkładu oraz jego dyspersję (rozrzut wyników). Do oszacowania środka rozkładu i jego dyspersji można posłużyć się różnymi estymatorami. Te najbardziej powszechnie stosowane, zostaną scharakteryzowane w dalszej części. Miary położenia środka rozkładu Klasyczne miary położenia środka rozkładu to średnia arytmetyczna, moda i mediana. Średnia arytmetyczna, µ, często nazywana średnią, zdefiniowana jest jako suma wszystkich wartości podzielona przez ich ilość. Dla m wartości pomiarów zmiennej losowej y jej średnią obliczamy zgodnie z poniższym wzorem: = 1 W przypadku zmiennej losowej, której m wartości można pogrupować, średnią dla n grup wyników można przedstawić następująco: 1 + + + razy +!+! + +!! razy + + "+ " + + " # " razy 1 $ +!! + + " " % +!!+ + " " " & ' Moda to najczęściej pojawiający pomiar się w rozkładzie wartości wyników. Na ogół, moda nie jest najlepszą miarą położenia rozkładu gdyż ma na nią wpływ możliwe grupowanie wyników. Mediana, w przypadku nieparzystej liczby pomiarów, odpowiada wartości środkowej pomiarów uszeregowanych od najmniejszej do największej wartości. Dla parzystej liczby pomiarów, mediana zmiennej losowej o uszeregowanych wartościach to średnia arytmetyczna wyników dwóch pomiarów położonych po obu stronach środka. Zaletą tej miary położenia środka jest jej stabilność nawet, gdy niektóre z wyników znacząco odbiegają od pozostałych (tzw. obiekty odległe). Zagadnienie to zostało bliżej przedstawione w ostatnim rozdziale niniejszego opracowania. 9

Miary dyspersji rozkładu wyników Zazwyczaj, stopień dyspersji rozkładu opisuje się poprzez rozstęp, średnią wartość absolutnych wartości odchyłek od wartości średniej (z ang. mean absolute deviation), odchylenie standardowe i wariancję. Rozstęp, r, definiowany jest jako różnica pomiędzy największą, a najmniejszą wartością pomiarów: (=) +, Średnia absolutnych wartości odchyłek od wartości średniej, MAD, wymaga obliczenia odchyłek od wartości średniej,, dla wszystkich pomiarów zmiennej losowej. MAD = 1 Należy podkreślić, iż użycie wartości bezwzględnej w powyższym równaniu jest konieczne, by wyeliminować efekt znaku różnic (odchyłki od wartości średniej mogą mieć znak dodatni lub ujemy, a w efekcie ich suma może być równa zero). Innym sposobem eliminacji problemu znaku jest operacja podniesienia poszczególnych wartości różnic do kwadratu, co daje możliwość obliczenia pochodnej dla takiego wyrażenia. Z tego właśnie powodu, tak zdefiniowana miara rozrzutu wyników nazywana jest średnią kwadratowych odchyłek od wartości średniej (z ang. mean squared deviation), MSD: MSD = 1! Estymator MSD przybliża dyspersję rozkładu tylko dla fragmentu populacji wyników. W przypadku wykorzystania tego estymatora dla populacji wyników wykazuje on obciążenie. Oznacza to, iż średnia wartość MSD obliczonych dla wielokrotne wylosowanych z populacji podzbiorów wyników różni się od wartości oczekiwanej. Z tego właśnie powodu, zaproponowano nieobciążony estymator, znany jako wariancja, σ 2 : /! = 1 1! 10

Innym estymatorem rozrzutu wyników jest odchylenie standardowe, zdefiniowane jako pierwiastek kwadratowy wariancji. W odróżnieniu od wariancji, odchylenie standardowe jest wyrażone w tych samych jednostkach co pomiary tworzące zmienną losową. Próbkowanie i rozkład próbkowania Wnioskowanie statystyczne w głównej mierze ma pomóc poznać (scharakteryzować) określoną populację na podstawie relatywnie mało licznego podzbioru wyników tzw. próby. Innymi słowy, jest to podejście zmierzające ku uogólnieniu pewnych własności na całą populację wyników. Większość metod statystycznych zakłada, iż w tym celu zostanie użyty zbiór próbek losowo wybrany z całej populacji. Taki sposób wyboru próbek narzuca by na ich wybór nie miał wpływ żaden czynnik. Jeżeli każdy wynik ma jednakową szansę by być wylosowany, wówczas możemy mówić o losowym próbkowaniu. W tym miejscu, należy zadać pytanie kiedy na podstawie podzbioru wyników będzie możliwe w miarę poprawne opisanie całej populacji? Warunkiem koniecznym jest zapewnienie reprezentatywności próby. Zagadnienie reprezentatywności próby najlepiej zrozumieć w kontekście planowania i prowadzenia sondaży przedwyborczych. Reprezentatywna próba respondentów powinna dobrze charakteryzować strukturę całej populacji. Tak więc ograniczenie sondażu do np. pewnej grupy wiekowej, osób zamieszkałych w jednym regionie czy określonej płci respondentów i wnioskowanie na podstawie takiej próby nie prowadzi do wiarygodnych konkluzji. Rozkład prawdopodobieństwa wystąpienia wartości określonej statystyki nazywany jest rozkładem próbkowania. Rozkład normalny i wystandardyzowany rozkład normalny Jednym z najbardziej rozpowszechnionych rozkładów próbkowania jest rozkład normalny. Przyjmując, że zbiór pomiarów y to losowa zmienna, jej rozkład prawdopodobieństwa f(y) można opisać następującą funkcją: = 1 / 22 exp3! 2/! 4 gdzie, wartość średnia znajduje się w przedziale - < µ <, a wariancja przyjmuje wartości większe od zera, a oznaczenie exp{x} oznacza wykładnik funkcji e x. W literaturze, można dla zmiennej losowej y spotkać oznaczenie y N(µ, σ 2 ), co oznacza iż pochodzi ona z populacji o rozkładzie normalnym o średniej równej µ i wariancji σ 2. Jednocześnie zapis ten wyraźnie wskazuje, iż średnia i wariancja to dwa kluczowe parametry rozkładu normalnego, które mają bezpośredni wpływ na kształt funkcji gęstości prawdopodobieństwa rozkładu normalnego. 11

Rozkład normalny odgrywa ważną rolę w analizie wyników uzyskanych w trakcie zaplanowanych eksperymentów. Wyniki pomiarów, które różnią się od siebie z powodu istnienia błędu losowego można z powodzeniem opisać używając rozkład normalny. Specjalnym przypadkiem rozkładu normalnego jest jego wystandaryzowana postać, z N(µ, σ 2 ), dla której średnia przyjmuje wartość zero, a wariancja rozkładu wynosi jeden. Nowa zmienna z powstaje po transformacji zmiennej losowej y, która obejmuje dwie operacje centrowania i skalowania, co prowadzi do średniej równej zero i jednostkowego odchylenia standardowego (z N(0, 1)): 5= / Tak zdefiniowana transformacja zmiennej losowej nazywana jest także z-transformacją, standaryzacją lub autoskalowaniem. Przyjmując, że w przypadku wystandaryzowanego rozkładu prawdopodobieństwa µ = 0 i σ 2 = 1, funkcja gęstości prawdopodobieństwa wystandaryzowanej zmiennej losowej, f(z), ulega znacznemu uproszczeniu do postaci: 5= 1 22 exp3 5! 2 4 Na poniższym rysunku, przedstawiono funkcję gęstości prawdopodobieństwa dla rozkładu normalnego dla µ = 0 i różnych trzech wartościach σ = 0,5, σ = 1 i σ = 2. 0.8 0.7 0.6 σ=0,5 σ=1 σ=2 0.5 f(y) 0.4 0.3 0.2 0.1 0-6 -4-2 0 2 4 6 y Rysunek 3 Funkcja gęstości prawdopodobieństwa dla rozkładu normalnego: linia niebieska y N(0; 0,5), linia czerwona y N(0; 1) oraz linia czarna y N(0; 2) 12

Wystandaryzowana postać funkcji gęstości prawdopodobieństwa dla rozkładu normalnego umożliwia przedstawienie w tablicach wartości prawdopodobieństwa, które określone jest jako pole powierzchni pod wybranym obszarem krzywej. Całkowite pole powierzchni pod krzywą funkcji gęstości prawdopodobieństwa dla wystandaryzowanego rozkładu normalnego wynosi jeden. Natomiast, prawdopodobieństwo iż wystandaryzowana zmienna, z, przyjmie wartości z przedziału [u a, u b ] wymaga obliczenia całki oznaczonej, zwanej całką Laplace a, o następującej postaci: 8 9 5= 1 22 6 3 5! 2 4d5 8 : Schematycznie, wartość prawdopodobieństwa określoną dla przedziału wartości z [z 1, z 2 ], gdzie z 1 = 1 i z 2 =, możemy zaznaczyć jako szary obszar pod wykresem. 0.45 0.4 0.35 0.3 0.25 f(z) 0.2 0.15 0.1 0.05 0-6 -4-2 0 2 4 6 z Rysunek 4 Funkcja gęstości prawdopodobieństwa dla wystandaryzowanej zmiennej z o rozkładzie normalnym z zaznaczonym obszarem, który odpowiada prawdopodobieństwu wystąpienia wartości tejże zmiennej w przedziale [1; ] Wykorzystując tablicowe wartości obliczonej całki dla unormowanego rozkładu normalnego, załączone w końcowej części opracowania, możemy relatywnie łatwo oszacowywać z jakim prawdopodobieństwem będą występowały wartości pomiarowe w zadanym przedziale. Rozważmy następujący przykład. Przykład 1 Przeprowadzono wyznaczenie wartości ph roztworu uzyskując rozkład normalny wyników o średniej 10,15 oraz odchyleniu standardowym 0,02. Jaka część pomiarów będzie się znajdować w przedziale wartości ph od 10,12 do 10,20? 13

Na początku, obliczamy wartość zmiennej wystandaryzowanej odpowiednio dla dwóch krańców przedziału wartości, tj. 10,12 i 10,20 jako: 5 = / = 10,12*10,15 0,02 5! 10,20*10,15 0,02 2,5 *1,5 Następnie, z tablic statystycznych dla wystandaryzowanej postaci funkcji gęstości prawdopodobieństwa (zob. dodatek) odczytujemy wartość prawdopodobieństwa dla obszaru [- ; -1,5] oraz dla obszaru [- ; 2,5]. Prawdopodobieństwo w zakresie [-1,5; 2,5] można obliczyć jako różnicę wartości prawdopodobieństwa dla obszaru [- ; 2,5] i obszaru [- ; -1,5].,= 5 1 22 6 3*5 2 4d5 0,0668!,= 5! 1 22 6 3*5! 2 4d5 0,9938!! Schematycznie, poszczególne operacje obliczenia wartości prawdopodobieństwa ilustruje poniższy rysunek. Rysunek 5 Schematyczne przedstawienie idei obliczania prawdopodobieństwa wystąpienia wyniku w zadanym przedziale wartości zmiennej z dla wystandaryzowanego rozkładu normalnego (obszar oznaczony czerwoną dwustronną strzałką) 14

Na tej podstawie możemy wnioskować, iż powtarzając wielokrotnie pomiary zmiennej, 92,70% wszystkich pomiarów należy oczekiwać w przedziale od 10,12 do 10,20. Innymi słowy, wykonując 100 pomiarów 93 z nich przyjmie wartość z tego przedziału. W podobny sposób, możemy rozważyć jaka część wszystkich wyników znajdzie się w przedziale wokół wartości średniej określonym przez µ ± σ, µ ± 2σ, oraz µ ± 3σ. Zakładając, iż σ = 1, w przedziale µ ± σ znajduje się 68% wyników, w przedziale µ ± 2σ będzie 95% wyników, natomiast w przedziale µ ± 3σ jest 99,7% wszystkich wyników. Centralne twierdzenie graniczne Wiele podejść statystycznych zakłada, iż zmienne losowe przyjmują rozkład normalny. Centralne twierdzenie graniczne pozwala uzasadnić dlaczego obserwowane rozkłady prawdopodobieństwa są często zbliżone do rozkładu normalnego. Centralne twierdzenie graniczne to twierdzenie matematyczne, które postuluje iż jeżeli zmienne y 1, y 2,, y m są niezależne o jednakowym rozkładzie i takiej samej wartości średniej i skończonej wariancji (σ 2 > 0), a x = y 1 + y 2 + + y m wówczas zmienna losowa z wyrażona jako: 5= ) /! gdzie m, zbiega według standardowego rozkładu normalnego N(0, 1). Zastosowanie centralnego twierdzenia granicznego w praktyce, pozwala uniknąć trudnych obliczeń dla dużej liczby próbek i skomplikowanych rozkładów poprzez przyjęcie rozkładu normalnego. Rozkład chi kwadrat Rozkład chi kwadrat, χ 2, to inny typ rozkładu próbkowania zmiennej losowej. Podobnie jak rozkład normalny, rozkład chi kwadrat może być zdefiniowany posługując się standardowymi zmiennymi losowymi. Jeżeli z 1, z 2,, z m to niezależne zmienne losowe o średniej zero i wariancji równej jeden, wówczas losowa zmienna wyrażona jako: )=5! +5!! + +5 B! 15

ma rozkład chi kwadrat o k stopniach swobody. Funkcja gęstości prawdopodobieństwa dla zmiennej losowej x, f(x), określa następujący wzór: 1 )= 2 B/! ΓE F ) B/! H I/! dla )>0 2 G gdzie Γ to tzw. funkcja gamma zdefiniowana jako Γ(k) = (k - 1)!, a symbol! oznacza silnię. W odróżnieniu od rozkładu normalnego, rozkład chi kwadrat określony jest tylko dla dodatnich wartości zmiennej losowej x, jest niesymetryczny i skrzywiony. Wartość średnia i wariancja wynoszą odpowiednio µ = k i σ 2 = 2k. Poniższy rysunek przedstawia kilka przykładowych wykresów rozkładów chi kwadrat ze względu na liczbę stopni swobody k, przyjmując że k = 1, k = 3, k = 5 i k = 7. 0.45 0.4 0.35 k=1 k=3 k=5 k=7 0.3 f(χ 2 ) 0.25 0.2 0.15 0.1 0.05 0 0 2 4 6 8 10 12 14 16 18 χ 2 Rysunek 6 Różne rozkłady funkcji gęstości prawdopodobieństwa chi kwadrat ze względu na liczbę stopni swobody Jednym z przykładów zmiennej, która przyjmuje rozkład chi kwadrat jest zmienna losowa y 1, y 2,, y m z rozkładu normalnego N(µ, σ 2 ) postaci: SS! /!=! /! ~M gdzie, SS to tzw. suma kwadratów różnic. Zapis w powyższym równaniu oznacza, że zmienna SS/σ 2 ma rozkład chi kwadrat o m-1 stopniach swobody. 16

W statystyce jak i wnioskowaniu statystycznym, wiele technik w praktyczny sposób opiera się o obliczanie sumy kwadratów różnic. Przykładem może być wariancja próby, którą alternatywnie możemy zapisać jako: /! = SS 1 Innym, niezwykle ważnym rodzajem rozkładu jest tzw. rozkład t (rozkład t-studenta), wykorzystywany do testowania hipotez statystycznych, a także do ewaluacji błędu pomiarowego. Rozkład Studenta o k stopniach swobody jest rozkładem zmiennej losowej t o ogólnej postaci: N= 5 O F gdzie, z jest zmienną losową standardyzowaną, tj. pochodzącą z rozkładu normalnego N(0, 1), a u to zmienna losowa o rozkładzie chi kwadrat o k stopniach swobody. Zmienne z i u są niezależnymi zmiennymi losowymi. Funkcję gęstości prawdopodobieństwa dla zmiennej losowej t przy k stopniach swobody określa następujący wzór: N,F= ΓEF+1 2 G ΓE F P1+ N! B 2 G F2 F Q! gdzie µ = 0, a σ 2 = k/(k-2) dla k > 2, a t [- ; ]. Jak wskazuje powyższe równanie, zmieniając liczbę stopni swobody k, można utworzyć całą rodzina rozkładów prawdopodobieństwa. Należy zwrócić uwagę, że istnieje duże podobieństwo pomiędzy rozkładem normalnym, a rozkładem Studenta. Dla dużych wartości k, rozkład Studenta zmierza do standardowego rozkładu normalnego, a dla nieskończenie dużej wartości k rozkład Studenta jest tożsamy ze standardowym rozkładem normalnym. Ponieważ w praktyce analitycznej, ze względu na koszt pomiarów i inne aspekty, liczba pomiarów bywa często relatywnie mała, rozkład Studenta jest najczęściej wykorzystywany. Na poniższym rysunku, przedstawiono wykres funkcji gęstości prawdopodobieństwa dla zmiennej losowej t przy k nieskończenie dużym (rozkład normalny), k = 3 i k = 7. 17

0.4 0.35 normalny k=3 k=7 0.3 0.25 f(t) 0.2 0.15 0.1 0.05 0-6 -4-2 0 2 4 6 t Rysunek 7 Funkcja gęstości prawdopodobieństwa dla zmiennej losowej t, dla: k = (czarna linia), k = 3 (czerwona linia) oraz k = 7 (niebieska linia) Zakładając, iż zbiór y 1, y 2,, y m jest losową próbą o rozkładzie N(µ, σ 2 ), wówczas wielkość t zdefiniowana jako: N= R // przyjmuje rozkład Studenta o m-1 stopniach swobody. Innym ważnym rozkładem próbkowania jest tzw. rozkład F. Jeżeli zmienne x i y są zmiennymi niezależnymi o rozkładzie chi-kwadrat odpowiednio o m 1 i m 2 stopniach swobody, to zmienna F wyrażona jako: S :, 9 = M I! / M T! /! przyjmuje rozkład F. Funkcję gęstości prawdopodobieństwa rozkładu F dla zmiennej losowej x o m 1 i m 2 stopniach swobody określa następujący wzór: )= ΓE +! GE G :/! ) : /! 2! ΓE! GΓE 2 GUE! G)+1V : 9/! gdzie, zmienna losowa x przyjmuje wartości większe od zera. 18

Klasycznym przykładem zmiennej przyjmującej rozkład F jest zmienna wyrażona jako stosunek wariancji dwóch populacji o rozkładzie normalnym. Zakładając, iż pierwsza populacja składa się z losowej próby o m 1 próbkach, dla których dokonano pomiaru określonej własności, y 11, y 12,, y 1m1, a druga zawiera losową próbę m 2 próbek, dla których dokonano pomiaru tej samej własności, y 21, y 22,, y 2m2, wówczas stosunek wariancji, /! i /!! dla tychże populacji przyjmuje rozkład F o df1 = m 1-1 i df2 = m 2-1 stopniach swobody: /! /!! ~S : ; 9 Poniższy rysunek przedstawia kilka przykładowych rozkładów F o różnej liczbie stopni swobody, F df1,df2 : 0.9 0.8 0.7 df1=5,df2=5 df1=7,df2=10 df1=10,df2=10 df1=10,df2=30 0.6 f(f) 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 F Rysunek 8 Kilka wybranych rozkładów F dla różnej liczby stopni swobody df1 i df2 19

Testowanie hipotez statystycznych Przyjmijmy, iż celem prowadzonych przez nas badań jest porównanie efektywności odzysku pewnego związku stosując procedurę ekstrakcji w dwóch rozpuszczalnikach o różnej polarności. W eksperymencie dwa rodzaje rozpuszczalnika możemy traktować jako dwa poziomy czynnika nazwanego rozpuszczalnik. Oznaczmy te poziomy indeksem i. W wyniku prowadzonych badań powstaną dwa zbiory zawierające m 1 wyników dla poziomu i = 1 i m 2 wyników dla poziomu i = 2, odpowiednio y 11, y 12,, y 1m1 i y 21, y 22,, y 2m2. Uzyskane wyniki pomiarów eksperymentalnych da się opisać stosując ogólny model przedstawiający j-ty wynik pomiaru dla i tego poziomu obarczony pewnym błędem pomiarowym, e ij : Y = +H Y gdzie w przypadku powyższego modelu µ i możemy postrzegać jako średni pomiar dla i-tego poziomu. Zakładając, że wartości błędów e ij dla danego czynnika pochodzą z rozkładu normalnego o średniej zero i wariancji σ i 2, możemy wówczas mówić o losowym błędzie. Dla omawianego przykładu przyjmiemy następującą hipotezę badawczą: rodzaj użytego rozpuszczalnika (jego polarność) ma wpływ na efektywność odzysku. Prawdziwość hipotezy zostanie weryfikowana w oparciu o przeprowadzone pomiary eksperymentalne. W praktyce, weryfikacja tej hipotezy badawczej oznacza porównanie dwóch zbiorów wyników, a w szczególności ustalenie czy wartości średnie dwóch grup pomiarów różnią się od siebie statystycznie istotnie. Wyjściową hipotezę rodzaj użytego rozpuszczalnika (jego polarność) ma wpływ na efektywność odzysku można sformułować prościej, używając w tym celu wartości średnie dwóch zbiorów wyników, odpowiednio µ 1 i µ 2. Procedura testowania hipotez poddaje pod ocenę dwa alternatywne scenariusze hipoteza jest prawdziwa, albo hipoteza jest nieprawdziwa. W statystyce rozróżnia się hipotezę zerową (H 0 ) i tzw. hipotezę alternatywną (H 1 ). Dla omawianego przykładu hipotezę zerową i alternatywną definiujemy następująco: Z [ : =! Z :! Alternatywnie hipotezy można także zapisać jako: Z [ :! =0 Z :! 0 20

Tak sformułowana alternatywna hipoteza nazywana jest hipotezą dwustronną, a testowanie testowaniem hipotezy dwustronnej, gdyż taki typ hipotezy zostanie spełniony w dwóch przypadkach µ 1 < µ 2 i µ 1 > µ 2. Ilustruje to poniższy rysunek, na którym zaznaczono dwa obszary krzywej rozkładu odpowiadające prawdopodobieństwu odrzucenia hipotezy zerowej przy założeniu, iż jest ona prawdziwa. Innymi słowy, jest to prawdopodobieństwo popełnienia błędu tzw. błąd α nazywany także błędem I-go rodzaju lub poziomem istotności. Innym rodzajem błędu, który można popełnić podczas testowania hipotez jest błąd β (błąd II-go rodzaju). Błąd II-go rodzaju wyraża prawdopodobieństwo, że hipoteza zerowa nie zostanie odrzucona jeśli jest fałszywa. 0.4 H 0 : µ=1,2 H 1 : µ=1,8 0.35 0.3 0.25 f(x) 0.2 0.15 0.1 0.05 błąd β błąd α 0 0.3 0.6 0.9 1.2 1.5 1.8 2.1 2.4 2.7 x Rysunek 9 Ilustracja błędu α i błędu β na przykładzie dwóch hipotez H 0 : µ = 1,2 oraz H 1 : µ = 1,8 Hipoteza alternatywna może także zawierać znak nierówności. Tak sformułowana hipoteza pozwala stwierdzić, czy prawdziwe jest stwierdzenie, że jedna wartość średnia jest mniejsza albo większa od drugiej. W takim przypadku, mówimy o teście jednostronnym lub testowaniu jednostronnej hipotezy. Hipoteza zerowa zawiera znak równości, a hipoteza alternatywna znak nierówności: Z [ : =! Z : <! lub Z : >! W dalszej części opracowania, zagadnienie testowania hipotez jedno- i dwustronnych zostanie bliżej omówione na realnych przykładach. 21

Testowanie hipotez zakłada użycie procedury zapewniającej pozyskanie losowej próby wyników, a następnie wykorzystanie odpowiedniego testu statystycznego (statystki) w celu potwierdzenia lub odrzucenia hipotezy zerowej. Należy podkreślić, iż w wyniku przeprowadzonego testowania jedna i tylko jedna z hipotez zostaje przyjęta albo hipoteza zerowa albo hipoteza alternatywna. Podstawowe testy statystyczne Porównanie wartości średnich dwóch grup wyników - test t Test t wykorzystywany jest w celu porównania istotności różnic pomiędzy wartościami średnimi dwóch zbiorów wyników otrzymanych w wyniku losowego próbkowania. Zakładając, iż wariancje dwóch grup wyników nie różnią się od siebie statystycznie istotnie, statystykę t 0 definiuje się jako:! N [ = _/`!E 1 + 1 G! gdzie, m 1 i m 2 to liczba próbek odpowiednio w pierwszej i drugiej grupie wyników, a /`! to tzw. uwspólniona wariancja (zakładamy, że /! =/!! =/`!). Uwspólnioną wariancję, /`!, obliczamy jako wypadkową wariancję dwóch grup wyników, uwzględniając liczebność poszczególnych zbiorów, wedle następującego wzoru: /`!= /! 1+/!!! 1 +! 2 Wyrażenie w mianowniku powyższego równania określa liczbę stopni swobody. Próbkując dwie populacje wyników poprzez losowane z dwóch niezależnych rozkładów normalnych, możemy przyjąć, iż rozkład różnic µ 1 -µ 2 przyjmuje rozkład normalny o następujących parametrach N(µ 1 -µ 2, σ 2 (1/m 1 +1/m 2 )). Jednakże, konieczność uwspólnienia wariancji dla dwóch grup próbek (przy założeniu, iż wariancje grup są porównywalne), powoduje zmianę rozkładu statystyki t 0 z rozkładu normalnego do rozkładu t o (m 1 +m 2-2) stopniach swobody. Zauważmy, iż w zależności od wartości średniej wynik działania (µ 1 -µ 2 ) może przyjąć wartość dodatnią (gdy µ 1 > µ 2 ) lub ujemną (gdy µ 1 < µ 2 ). W celu weryfikacji prawdziwości hipotezy zerowej, należy porównać wartość statystyki t 0 z rozkładem t o (m 1 +m 2-2) stopniach swobody i przyjętym poziomem istotności α. 22

Przyjmując hipotezę zerową i alternatywną w formie: Z [ : =! Z :! przeprowadzamy testowanie dwustronnej hipotezy alternatywnej, gdyż będzie ona spełniona jeżeli µ 1 < µ 2 i µ 1 > µ 2. Testowanie hipotezy odbywa się poprzez porównanie wartości obranej statystyki t 0, z wartością krytyczną rozkładu t o (m 1 +m 2-2) stopniach swobody i poziomie istotności równym α/2 (w przypadku dwustronnej hipotezy alternatywnej). Należy zauważyć, iż hipoteza zerowa zostanie przyjęta wówczas, gdy: N [ N a! ; : 9! a odrzucona, jeśli: N [ >N a! ; : 9! Powyższe dwa zapisy wskazują, iż ze względu na możliwe wartości statystyki t 0 istnieje przedział wartości, w obrębie którego hipoteza zerowa jest spełniona. Co więcej, bazując na krzywej rozkładu prawdopodobieństwa dla tejże statystyki, można powiedzieć, dla ustalonego poziomu istotności, np. α = 0,05 (5%), oczekujemy iż 100(1-α) = 95% wartości znajdzie się w tym przedziale. Granice przedziału określają wartości graniczne rozkładu t: N [ c N a! ; : 9!,N a! ; : 9! d N a! ; : 9! N [ N a! ; : 9! Przedział wartości liczbowych dowolnej statystyki, których możemy z określonym prawdopodobieństwem oczekiwać nazywany jest przedziałem jej ufności. Na poniższym rysunku, schematyczne przedstawiono przedział ufności dla statystyki t 0, przyjmując poziom istotności α = 0,05 i liczbę stopni swobody 16. 23

0.4 0.35 0.3 0.25 f(t 0 ) 0.2 0.15 0.1 0.05 Odrzóć jeśli t <-2.131 0 Odrzóć jeśli t 0 >2.131 0-6 -4-2 0 2 4 6 t 0 Rysunek 10 Przedział ufności wokół statystyki t 0 dla poziomu istotności α = 0,05 i liczby stopni swobody 16 W przeciwieństwie do hipotezy dwustronnej, w pewnych przypadkach może istnieć konieczność testowania hipotezy jednostronnej. Podajmy jako przykłady dwa hipotetyczne scenariusze testowania hipotez porównania wartości średnich: kontrolując jakość surowca (rudy żelaza), ze względów ekonomicznych, sprzedawca może być zainteresowany testowaniem jednostronnej hipotezy alternatywnej na okoliczność zawyżonej zawartości żelaza: Z [ : =! Z : >! Hipoteza alternatywna postaci H 1 : µ 1 > µ 2 zostanie odrzucona, gdy: N [ >N a;: 9! kupujący rudę może być zainteresowany testowaniem jednostronnej hipotezy alternatywnej na okoliczność zaniżonej zawartości żelaza: Z [ : =! Z : <! Odrzucenie hipotezy alternatywnej H 1 : µ 1 < µ 2 wymaga spełnienia warunku: 24

N [ < N a;: 9! Schematycznie dwa warianty testu jednostronnego przedstawiono na poniższym rysunku (dla α = 0,025 i N = 16). 0.4 0.4 0.35 0.35 0.3 0.3 0.25 0.25 f(t 0 ) 0.2 f(t 0 ) 0.2 0.15 0.15 0.1 0.1 0.05 Odrzóć jeśli t 0 <-2.131 0.05 Odrzóć jeśli t 0 >2.131 0-6 -4-2 0 2 4 6 t 0 0-6 -4-2 0 2 4 6 t 0 Rysunek 11 Ilustracja dwóch różnych hipotez alternatywnych i warunków ich przyjęcia: po lewej H 1 : µ 1 < µ 2, a po prawej H 1 : µ 1 > µ Przykład 2 Zilustrujmy praktyczne wykorzystanie testu t do rozwiązania realnego problemu analitycznego - porównanie efektywność odzysku pewnego pierwiastka wykorzystując dwie różne metodyki przygotowania próbki. Stosując niezależnie jedną z dwóch metodyk przygotowania próbki, wykonano po 10 niezależnych oznaczeń pierwiastka. Następnie, obliczono dla dwóch zbiorów wartości średnie, wariancje i odchylenia standardowe: metodyka 1: µ 1 = 16,76 σ 1 2 = 0,100 σ 1 = 0,316 m 1 = 10 metodyka 2: µ 2 = 17,04 σ 2 2 = 0,061 σ 1 = 0,248 m 2 = 10 Załóżmy, że chcemy potwierdzić słuszność hipotezy mówiącej, iż dwie metodyki przygotowania próbki nie prowadzą do statystycznie istotnych różnic w odzysku oznaczanego pierwiastka. Krótko, w języku hipotez statystycznych możemy ten problem sformułować w postaci następującej hipotezy zerowej: H 0 : µ 1 = µ 2. W omawianym przypadku, powinniśmy rozważyć testowanie dwustronnej hipotezy alternatywnej H 1 : µ 1 µ 2. Przyjmując poziom istotności testowania hipotezy równy α = 0,05, fakt testowania dwustronnej hipotezy alternatywnej i liczbę stopni swobody równej (m 1 +m 2-2) = 10+10-2 = 18, wartość krytyczna rozkładu t, t (0,025;18), odczytana z tablic statystycznych dla testu jednostronnego wynosi 2,101. 25

Nim ustalimy wartość statystyki t 0 należy obliczyć uwspólnioną wariancję dla dwóch grup wyników. Podstawiając realne wartości, otrzymujemy: /`! = /! 1+/!!! 1 +! 2 = 90,100+90,061 10+10 2 =0,081 Na tej podstawie, wartość statystyki t 0 wynosi:! N [ = _/`!E 1 + 1 = 16,76 17,04 0,28 G _0,081E 1! 10 + 1 = 10 G 0,127 = 2,20 Ponieważ wartość bezwzględna statystyki t 0 jest większa od wartości krytycznej rozkładu t dla t (0,025;18) = 2,101 (wartość krytyczna odczytana z tablic dla testu jednostronnego), możemy stwierdzić iż dwa sposoby przygotowania próbki dają statystycznie istotnie różne wyniki (odrzucona została hipoteza zerowa, a przyjęta hipoteza alternatywna). Inna wersja możliwej odpowiedzi to: z 95% ufnością można twierdzić, iż dwa sposoby przygotowania próbki różnią się od siebie statystycznie istotnie. Podobnych przykładów, jak ten przytoczony powyżej, w chemii analitycznej możemy odszukać wiele. W szczególności, testowanie hipotez statystycznych ma za zadanie wspomóc chemika analityka w podejmowaniu decyzji w sposób obiektywny na podstawie empirycznych przesłanek np. wybór jednej z dwóch możliwych metod analitycznych pod kątem ich efektywności czy ekonomiczności. Zapewne bardziej uważni czytelnicy dostrzegli, iż wybierając tak zdefiniowaną statystykę t 0 przyjęliśmy z góry pewne założenia. Pierwsze z nich zakłada, iż próbki dla których dokonano oznaczeń zostały pobrane w sposób losowy. Drugie założenie postuluje równość wariancji dwóch zbiorów wyników. W praktyce, takie założenia nie muszą być słuszne. Stąd, konieczność potwierdzenia tego faktu. Jednym z narzędzi wspomagającym ocenę słuszności przyjętego rozkładu wyników jest tzw. normalny wykres prawdopodobieństwa. Przedstawia on uszeregowane od najniższej do najwyższej wartości wyniki i odpowiadającej im wartości kumulacyjnej częstości występowania. W przypadku danych, które przyjmują rozkład normalny, punkty na wykresie rozmieszczone są wzdłuż linii prostej. W przypadku, gdy różnice pomiędzy wariancjami dwóch grup wyników znacząco od siebie odbiegają, test t wymaga modyfikacji. Załóżmy, iż hipoteza zerowa i alternatywna są zdefiniowane następująco: 26

Z [ : =! Z :! Statystyka t 0 powinna uwzględniać fakt różnej wariancji grup, estymowanych na podstawie próby losowej, a także ich liczebność: N [ =! h /! + /!!! Rozkład zmodyfikowanej statystyki t 0 nie do końca jest zgodny z rozkładem t. Jego relatywnie dobre przybliżenie można uzyskać poprzez korekcję liczbę stopni swobody, k: & /! + /!!' F=! /! /! 1 +/!! /!!! 1! W przypadku, gdy wariancje grup próbek są znane a priori (to znaczy, nie są estymowane na podstawie małej losowej próby losowanej z rozkładu normalnego), lub liczba próbek jest relatywnie duża, możemy założyć iż rozkład statystyki t 0 przyjmuje rozkład normalny N(0, 1). Dla odróżnienia tego faktu, przyjmijmy nowe oznaczenie statystyki, z 0 : 5 [ =! h /! + /!!! Zakładając test dwustronny (dwustronna hipoteza alternatywna), porównamy wartość statystyki z 0 z wartością krytyczną unormowanego rozkładu normalnego przy zadanym poziomie istotności α, z α. Hipoteza zerowa zostanie odrzucona, jeśli z 0 > z α/2. Porównanie wartości średniej z wartością deklarowaną W niektórych przypadkach, prowadzony eksperyment ma dostarczyć danych w celu potwierdzenia czy średnia uzyskanych wyników statystycznie istotnie odbiega od wartości deklarowanej. Na przykład, wyrywkowo kontrolując partię leku sprawdza się czy zawartość 27

aktywnego składnika nie różni się od wartości deklarowanej przez producenta. Testujemy następujące dwie hipotezy: Z [ : = [ Z : [ gdzie, przez µ 0 oznaczymy wartość deklarowaną przez producenta. Jeżeli rozkład wyników jest w przybliżeniu normalny, lub liczba próbek jest relatywnie duża można posłużyć się wartościami krytycznymi dla unormowanego rozkładu normalnego. Wówczas statystykę z 0 definiujemy następująco: 5 [ = [ // Zatem, w przypadku dwustronnej hipotezy alternatywnej, hipoteza ta zostanie przyjęta jeśli z 0 > z α/2. Korzystając z definicji przedziału ufności, stwierdzamy, czy wartość deklarowana znajduje się w przedziale: 5a [ /! 5a! Alternatywnie, przedział ufności w którym należy oczekiwać wartości deklarowanej (spełnienie hipotezy zerowej) można zapisać jako: [ ±5a! / Jeśli liczba próbek jest relatywnie mała, to należy założyć iż statystyka z 0 nie przyjmuje rozkładu normalnego, a rozkład t. Wówczas, wartość t 0 porównujemy z wartością krytyczną rozkładu t dla zadanego poziomu ufności i przyjętej liczby stopni swobody t (α;k). By zaznaczyć ten fakt, przyjmijmy, że: N [ = [ // 28

Dla dwustronnej hipotezy alternatywnej, hipoteza ta zostanie przyjęta jeśli t 0 > t (α/2;k). Korzystając z definicji przedziału ufności, stwierdzamy, czy wartość deklarowana znajduje się w przedziale: N a E! ;BG [ / N E a! ;BG Alternatywnie, przedział ufności w którym należy oczekiwać wartości deklarowanej (spełnienie hipotezy zerowej) można zapisać jako: [ ±N E a! ;BG / Przykład 3 Podejrzewa się, iż pewna metoda analityczna oparta o miareczkowanie kwasu zasadą wykazuje znaczny pozytywny błąd systematyczny. W celu wykrycia tego faktu, przygotowano roztwór titranta o dokładnym stężeniu 0,1 mol dm -3, który posłużył do miareczkowania 25,00 ml 0,1 mol dm -3 zasady. W kolejnych sześciu miareczkowaniach, zużyto następujące objętości titranta (w ml): 25,06 25,18 24,87 25,51 25,34 25,41 Testujemy zatem hipotezę pozytywnego błędu systematycznego metody, wykorzystując porównanie wartości średniej wyników z wartością deklarowaną. Tak sformułowana hipoteza z góry zakłada jednostronny wariant hipotezy alternatywnej, ponieważ pozytywny błąd systematyczny metody będzie oznaczał, że µ-µ 0 > 0. Z [ : = [ ; Z [ : =25,00 ml Z : > [ ; Z : >25,00 ml Na podstawie serii wyników, wartość średnia i odchylenie standardowe wynoszą odpowiednio 25,228 ml i 0,238 ml. Obliczamy wartość statystyki t 0 jako: N [ = [ // =25,228 25,00 =2,35 0,238/ 6 29

Zakładając poziom istotności jednostronnego testu α = 0,05, wartość krytyczna rozkładu dla (6-1) stopni swobody, t (0,05;5), wynosi 2,02. Przy tak sformułowanych hipotezach, hipoteza zerowa zostanie odrzucona, jeśli t 0 > t (0,05;5). W omawianym przykładzie, wartość bezwzględna t 0 jest większa niż wartość krytyczna, dlatego należy przyjąć hipotezę alternatywną. W wyniku przeprowadzonego testowania możemy z 95% ufnością stwierdzić, że badana metoda analityczna faktycznie jest obarczona dodatnim błędem statystycznym. Rozważmy jeszcze co stałoby się, gdyby zamiast jednostronnego testu zastosować test dwustronny. W takim wypadku, wartość krytyczna rozkładu dla poziomu istotności α = 0,05 wynosi t (0,025;5) = 2,57. W konsekwencji, musielibyśmy przyjąć hipotezę zerową, a nie alternatywną jak to miało miejsce wcześniej. W pierwszej chwili, można mieć wrażenie, iż istnieje tu sprzeczność, jednak powodem takiego wyniku testowania jest niewłaściwe założenie hipotezy alternatywnej. To czy podczas testowania należy użyć jedno- czy dwustronnego testu zależy od wstępnej wiedzy, a w omawianym przykładzie wyraźnie zaznaczono, iż oczekujemy pozytywnej wartości błędu systematycznego, co świadczy o zawyżonej wartości średniej oznaczeń w stosunku do wartości deklarowanej. Przykład 4 Podczas produkcji benzyny 95-oktanowej losowo pobrano 6 próbek paliwa i oznaczono dla nich liczbę oktanową. Wyniki kolejnych oznaczeń są następujące: 94,78 95,01 94,87 95,05 95,07 94,98 Czy możemy z 95% ufnością twierdzić, że paliwo może być sprzedawane jako 95-oktanowe? W tym przypadku, możemy założyć, iż interesuje nas jedynie stwierdzenie faktu istnienia istotności statystycznej różnic, a zatem hipotezy należy zdefiniować następująco (test dwustronny): Z [ : = [ ; Z [ : =95,00 Z : [ ; Z : 95,00 Na podstawie serii wyników, wartość średnia i odchylenie standardowe wynoszą odpowiednio 94,96 i 0,113. Obliczamy wartość statystyki t 0 jako: N [ = [ // =94,96 95,00 = 0,87 0,113/ 6 Zakładając 95% ufność, poziom istotności wynosi α% = (100-95) = 5% czyli α = 0,05. Wartość krytyczna rozkładu dla poziomu istotności α = 0,05 wynosi t (0,025;5) = 2,57 (wartość 30

odczytana z tablic dla testu jednostronnego). Ponieważ t 0 < t (0,025;5) przyjmujemy hipotezę zerową. Zatem, z 95% ufnością możemy twierdzić, iż benzyna spełnia specyfikację 95-oktanowego paliwa. Sparowany test t We wcześniejszej części opracowania przedstawiliśmy sposób porównania dwóch metod na podstawie uzyskanych zbirów wyników powstałych poprzez losowe próbkowanie dwóch niezależnych populacji o rozkładach normalnych. W praktyce, możemy także spotkać podejście zakładające wykonanie pomiaru dwoma niezależnymi technikami czy metodami dla tej samej grupy próbek. Innymi słowy oznacza to, iż ta sama próbka wpierw analizowana jest metodą pierwszą, a potem drugą w konsekwencji uzyskując zbiór par wyników. Ten fakt, znajduje odzwierciedlenie w nazwie testu sparowany test t - który można wykorzystać, aby badać różnice pomiędzy metodami. Test ten zakłada badanie różnic pomiędzy parami wyników, d, i stwierdzenie czy te różnice są statystycznie różne od zera. N [ = l 0 // gdzie, µ d to wartość średnia dla m różnic wyników obliczonych pomiędzy odpowiadającymi sobie próbkami. Z [ : l 0=0 Z : l 0 0 Mając do czynienia z dwustronnym testem, hipotezę zerową przyjmiemy jeśli t 0 > t (α/2;k). Przykład 5 Oznaczano zawartość składnika aktywnego - paracetamolu w tabletkach. W tym celu wykorzystano dwie techniki analityczne. Z 10 różnych partii leku pobrano losowo po jednej tabletce i poddano je analizie. Uzyskano wyniki zamieszczone w poniższej tabeli. Czy te dwie techniki analityczne dają statystycznie istotnie różne wyniki? 31

Tabela 1 Wyniki pomiarów uzyskanych dwoma metodami i wartości ich różnic d Partia Metoda 1 Metoda 2 d 1 84,63 83,15 1,48 2 84,38 83,72 0,66 3 84,08 83,84 0,24 4 84,41 84,2 0,21 5 83,82 83,92-0,1 6 83,55 84,16-0,61 7 83,92 84,02-0,1 8 83,69 83,6 0,09 9 84,06 84,13-0,07 10 84,03 84,24-0,21 Wartość średnia i odchylenie standardowe różnic wynoszą odpowiednio 0,159 i 0,57. Wartość statyki t 0 wynosi: N [ = l 0 // = 0,159 0,57/ 10 =0,88 Zakładając 95% poziom ufności, wartość krytyczna rozkładu t dla (10-1) stopni swobody (odczytana z tablic dla testu jednostronnego), t (0,025;9), wynosi 2,23. Ponieważ t 0 < t (0,025;9) przyjmujemy hipotezę zerową i stwierdzamy z 95% ufnością, że dwie metody dają te same wyniki. Możemy wyobrazić sobie sytuację, w której chemik analityk ma do swojej dyspozycji dwie metody analityczne, różniące się od siebie ze względu np. koszt pomiaru, czas pomiaru, przygotowanie próbki, etc. Naturalnym działaniem jest próba zastępowania metod analitycznych innymi ze względów ekonomicznych. Jednakże, wymaga to obiektywnego potwierdzenia, iż zamiana metody nie powoduje straty w kontekście jakości uzyskanych wyników. Metody wnioskowania statystycznego, dają analitykowi możliwość wiarygodnego i obiektywnego porównania działania metod. Testowanie wariancji test F Wcześniej opisane statystyki umożliwiały wykrycie błędów systematycznych wynikających z różnic pomiędzy średnimi lub średnią, a wartością deklarowaną. Innym ważnym aspektem jest porównanie wariancji dwóch metod, czyli stwierdzenie faktu ich podobnej precyzji. 32

W tym celu można użyć testu F, który zdefiniowany jest jako stosunek wariancji dwóch grup próbek. S [ = /! /!! 1 gdzie, zakładamy, iż /! >/!!. Tak zdefiniowana statystyka F 0 przyjmuje rozkład F o dwóch stopniach swobody wynikających z liczebności grupy pierwszej i drugiej. Wartość krytyczną dla tego rozkładu odczytujemy z tablic wartości krytycznych dla rozkładu dla zadanego poziomu istotności oraz liczby stopni swobody S a;: ; 9 (zob. tabele w dodatku opracowania). Jeżeli wartość statystyki znacząco odbiega od jedności, F 0 > S a;: ; 9, można z pewnością równą (1-α) wnioskować, iż różnice precyzji dwóch metod nie wynikają z przyczyn losowego błędu. Podobnie jak we wcześniej omawianych przypadkach, zdefiniowanie hipotez zerowej i alternatywnej zależy od zamierzonego celu. Stwierdzenie czy istnieją różnice w precyzji dwóch metod analitycznych wymaga rozważenia dwustronnego testu, podczas gdy stwierdzenie, która z metod jest bardziej lub mniej precyzyjna wymaga użycia testu jednostronnego. Przykład 6 Wykorzystano dwie metody analityczne (proponowaną i standardową) pozwalające określić chemiczne zapotrzebowanie na tlen w próbkach ścieków. Wykonano niezależne oznaczenia dla losowo pobranych próbek, po osiem dla każdej metody. Uzyskano następujące wartości średnich i odchyleń standardowych: metoda proponowana (1): µ 1 = 72,00 mg dm -3 ; σ 1 = 3,31 mg dm -3 metoda standardowa (2): µ 2 = 72,00 mg dm -3 ; σ 2 = 1,51 mg dm -3 Czy wariancja proponowanej metody jest istotnie większa niż wariancja metody standardowej? Dla tak postawionego problemu badawczego, wykorzystamy test jednostronny by zbadać słuszność hipotezy zerowej: Z [ : σ! =σ!! Z : σ! >σ!! Należy pamiętać, iż im mniejsza wariancja wyników pomiarów tym większa precyzja metody. Stąd znak nierówności w hipotezie alternatywnej mówi o większej wariancji metody proponowanej od wariancji metody standardowej. 33