ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Podobne dokumenty
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Testowanie hipotez statystycznych.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Przykład 1. (A. Łomnicki)

Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji

Zadania ze statystyki cz.8. Zadanie 1.

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Statystyka i Analiza Danych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez statystycznych.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Analizy wariancji ANOVA (analysis of variance)

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Analiza wariancji. dr Janusz Górczyński

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

PDF created with FinePrint pdffactory Pro trial version

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

STATYSTYKA MATEMATYCZNA

Testowanie hipotez statystycznych cd.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Wykład 3 Hipotezy statystyczne

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

3. Modele tendencji czasowej w prognozowaniu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Testy post-hoc. Wrocław, 6 czerwca 2016

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Analiza i monitoring środowiska

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Żródło:

Estymacja parametrów rozkładu cechy

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

WNIOSKOWANIE STATYSTYCZNE

Analiza składowych głównych. Wprowadzenie

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Definicje PN ISO Definicje PN ISO 3951 interpretacja Zastosowanie normy PN-ISO 3951:1997

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

METODY STATYSTYCZNE W BIOLOGII

Sterowanie jakością badań i analiza statystyczna w laboratorium

Walidacja metod badawczych i szacowanie niepewności pomiaru. Wojciech Hyk

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Weryfikacja hipotez statystycznych

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Rozkłady statystyk z próby

5. WNIOSKOWANIE PSYCHOMETRYCZNE

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

JEDNOCZYNNIKOWA ANOVA

Zmienne zależne i niezależne

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Analiza statystyczna. Microsoft Excel 2010 PL.

Statystyka matematyczna dla leśników

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Chemometria w analityce chemicznej

1 Estymacja przedziałowa

Wprowadzenie do statystyki dla. chemików testowanie hipotez

Metody Statystyczne. Metody Statystyczne

Wprowadzenie do analizy korelacji i regresji

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Testy nieparametryczne

Process Analytical Technology (PAT),

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Elementy statystyki STA - Wykład 5

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Zasady wykonania walidacji metody analitycznej

Transkrypt:

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA dr inż. Aleksander Astel Gdańsk, 22.12.2004

CHEMOMETRIA dziedzina nauki i techniki zajmująca się wydobywaniem użytecznej informacji z wielowymiarowych danych pomiarowych wykorzystująca: matematykę rachunek podobieństwa statystykę metody numeryczne teorię podejmowania decyzji techniki wizualizacji

OBSZARY WYKORZYSTANIA TECHNIK CHEMOMETRYCZNYCH PROBLEM PROJEKTOWANIE DOŚWIADCZENIA WYKONANIE POMIARÓW PRZECHOWYWANIE I ANALIZA WYNIKÓW MODEL ZALEŻNOŚCI ANALIZA WIZUALNA KLASYFIKACJA ANALIZA PODOBIEŃSTWA PROGNOZOWANIE OPTYMALIZACJA KONTROLA

KONTROLA DANYCH wyeliminowanie pomyłek powstałych w trakcie przygotowywania danych, czyli tzw. błędów grubych ; wykrycie w zbiorze danych obiektów różniących się istotnie od innych, czyli tzw. punktów odbiegających; uzyskanie przesłanek do ewentualnej transformacji niektórych zmiennych; określenie jednorodności zbioru danych, czyli potwierdzenia pochodzenia wszystkich danych z tej samej populacji.

KONTROLA DANYCH MINIMUM MAXIMUM MIN/MAX (wartość bezwzględna tego stosunku mniejsza od 0,1 świadczy o braku rozkładu normalnego) ROZSTĘP ROZKŁADU r = MAX - MIN ŚRODEK ROZKŁADU d = (MAX - MIN)/2 WARTOŚĆ ŚREDNIA (powinna znajdować się w środku rozkładu) ODCHYLENIE STANDARDOWE SD SKOŚNOŚĆ ROZKŁADU q (dla rozkładu normalnego wynosi ona 0, im większa wartość tym większa asymetria)

KONTROLA DANYCH PUNKTY ODBIEGAJĄCE TEST Q-DIXONA TEST T-STUDENTA REGUŁA TRZECH SIGM TRANSFORMACJA doprowadzenie rozkładu zmiennej do rozkładu zbliżonego do rozkładu normalnego uzyskanie liniowej zależności pomiędzy zmienną zależną i objaśniającą log(x), log(x+a), log(x-a)

BRAKUJĄCE DANE ZAPLANOWANA PRÓBKA NIE ZOSTAŁA PODDANA ANALIZIE przyczyną może być np. zanieczyszczenie lub zniszczenie próbki o ile to tylko możliwe próbka powinna być pobrana ponownie, jeżeli nie jest to możliwe należy odpowiednio zmodyfikować plan doświadczenia

BRAKUJĄCE DANE - cd WYKONANO OZNACZENIA TYLKO NIEKTÓRYCH ANALITÓW dużo braków => próbkę odrzucić i postępować jak w przypadku braku próbki; braki dotyczą pojedynczych analitów => rozważyć usunięcie z planu doświadczenia analitu, którego braki dotyczą

BRAKUJĄCE DANE - cd STĘŻENIE ANALITÓW MNIEJSZE NIŻ GRANICA OZNACZALNOŚCI STOSOWANEJ METODY ANALITYCZNEJ sytuacja częsta => zastosować inną metodę oznaczeń analitu o niższej granicy oznaczalności sytuacja sporadyczna => przyjmuje się dla brakujących pomiarów wartość równą ½ granicy oznaczalności metody

ANALIZA WARIANCJI (ANOVA) podstawowe narzędzie tzw. statystyki eksperymentalnej; służy do oceny wpływów pewnych kontrolowanych czynników na wynik doświadczenia; statystyczna analiza pozwalająca na ocenę różnic wielu średnich test F-Snedeckora jako kryterium decyzyjne

ANALIZA WARIANCJI (ANOVA) ZMIENNOŚĆ WEWNĄTRZGRUPOWA GRUPA1 ZMIENNOŚĆ MIĘDZYGRUPOWA GRUPA3 GRUPA2

ANALIZA WARIANCJI (ANOVA) przykład Badano zawartość THM [ug/dm 3 ] w wodzie pitnej w trzech źródłach głębinowych w rejonie Trójmiasta. G1 : 35, 40, 32, 40, 41, 39 (średnia = 37,8 ug/dm 3 ) G2 : 35, 48, 42, 48, 45 (średnia = 43,6 ug/dm 3 ) G3 : 32, 39, 42, 32, 35, 40 (średnia = 36,7 ug/dm 3 ) Hipoteza zerowa: nie występują statystycznie istotne różnice w średniej zawartości THM w wodzie pitnej na terenie Trójmiasta.

ANALIZA WARIANCJI (ANOVA) przykład - cd

ANALIZA WARIANCJI (ANOVA) przykład - cd wyznaczono sumę kwadratów oznaczeń wartości stężeń THM dla poszczególnych źródeł oraz pomiędzy nimi wartość F (p=0,05) dla odpowiedniej ilości stopni swobody (f=2) = 3,739 < 3,776 Należy odrzucić hipotezę zerową i przyjąć, że średnie stężenie THM w próbkach wody pitnej różni się w poszczególnych dzielnicach Trójmiasta.

ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) chemometryczna strategia przeznaczona do analizowania wielowymiarowych zbiorów wyników, zmniejszenie liczby zmiennych bez istotnej straty zawartych w nich informacji (funkcja redundacyjna), porządkowanie i klasyfikacja obiektów w ortogonalnych przestrzeniach czynnikowych (funkcja delimitacyjna)

ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) zmienne: I, II, III,... przypadek A x 1, x 2, x 3,..., x n-1, x n, x n+1 przypadek B y 1, y 2, y 3,..., y n-1, y n, y n+1 przypadek C z 1, z 2, z 3,..., z n-1, z n, z n+1

ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) zmienne: I, II, III,... przypadek A x 1, x 2, x 3,..., x n-1, x n, x n+1 przypadek B y 1, y 2, y 3,..., y n-1, y n, y n+1 przypadek C z 1, z 2, z 3,..., z n-1, z n, z n+1

ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) zmienne: I, II, III,... Wartość cechy (wyrażona w odpowiednich przypadek A x 1, x 2, x 3,..., x n-1, x n, x n+1 jednostkach) przypadek B y 1, y 2, y 3,..., y n-1, y n, y n+1 przypadek C z 1, z 2, z 3,..., z n-1, z n, z n+1 Badane obiekty (np. próbki) Nazwa badanej cechy obiektu

ANALIZA GŁÓWNYCH SKŁADOWYCH (PCA) PC3 PC1 PC2

WŁASNOŚCI GŁÓWNYCH SKŁADOWYCH liniowe kombinacje analizowanych zmiennych ortogonalne względem siebie kolejne składowe wyjaśniają malejącą ilość łącznej wariancji zmiennych możliwość interpretacji naukowej (chemicznej, fizycznej lub biologicznej) wyodrębnionych głównych składowych

Jony SO 2-4 pochodzące z emisji tlenków siarki do atmosfery łączą się z jonami K +, Ca i CaSO 4 są deponowane do podłoża wraz z opadami atmosferycznymi ANALIZA, CaGŁÓWNYCH SKŁADOWYCH 2+, Mg 2+ i w postaci K 2 SO 4, MgSO 4 i CaSO (PCA) przykład Liczba czynników % wariancji skumulowanej Liczba czynników % wariancji skumulowanej 5 72,3% 5 77,2% sezon zimowy I I czynnik 27% (ph, L, SO 2-4, Mg 2+, Ca 2+ II czynnik 13,6 % (V, NH 4+ ) III czynnik 13,3% (NH 4+, Cl -, K + ) IV czynnik 10,0% (PO 3-4, F - ) sezon zimowy II 2+ ) I czynnik 32,2% (SO 2-4, Cl -, K +, Mg 2+, Ca 2+ II czynnik 15,6% (V, NO 3-, NH 4+ ) III czynnik 12,5% (PO 3-4, F -, Mg 2+ ) 2+ ) Liczba czynników % wariancji skumulowanej 5 85,3% sezon letni I I czynnik 39,9% (SO 2-4, NH 4+, K +, Mg 2+, Ca 2+ II czynnik 17,5% (ph, PO 3-4, SO 2-4, F - ) II czynnik 11,8% (NO 3-, Cl - ) 2+ )

Przypuszcza się, że współwystępowanie jest spowodowane działalnością produkcyjną Gdańskich Zakładów ANALIZA GŁÓWNYCH SKŁADOWYCH Nawozów Fosforowych Fosfory S.A. (PCA) przykład Liczba czynników % wariancji skumulowanej Liczba czynników % wariancji skumulowanej 5 72,3% 5 77,2% sezon zimowy I I czynnik 27% (ph, L, SO 2-4, Mg 2+, Ca 2+ II czynnik 13,6 % (V, NH 4+ ) III czynnik 13,3% (NH 4+, Cl -, K + ) IV czynnik 10,0% (PO 3-4, F - ) sezon zimowy II 2+ ) I czynnik 32,2% (SO 2-4, Cl -, K +, Mg 2+, Ca 2+ II czynnik 15,6% (V, NO 3-, NH 4+ ) III czynnik 12,5% (PO 3-4, F -, Mg 2+ ) 2+ ) Liczba czynników % wariancji skumulowanej 5 85,3% sezon letni I I czynnik 39,9% (SO 2-4, NH 4+, K +, Mg 2+, Ca 2+ II czynnik 17,5% (ph, PO 3-4, SO 2-4, F - ) II czynnik 11,8% (NO 3-, Cl - ) 2+ )

Ograniczona możliwość uwalniania jonów NH 4+ z próbki wodnej w postaci NH ANALIZA z próbki wodnej GŁÓWNYCH w postaci NHSKŁADOWYCH 3 w sezonie zimowym (PCA) przykład Liczba czynników % wariancji skumulowanej Liczba czynników % wariancji skumulowanej 5 72,3% 5 77,2% sezon zimowy I I czynnik 27% (ph, L, SO 2-4, Mg 2+, Ca 2+ II czynnik 13,6 % (V, NH 4+ ) III czynnik 13,3% (NH 4+, Cl -, K + ) IV czynnik 10,0% (PO 3-4, F - ) sezon zimowy II 2+ ) I czynnik 32,2% (SO 2-4, Cl -, K +, Mg 2+, Ca 2+ II czynnik 15,6% (V, NO 3-, NH 4+ ) III czynnik 12,5% (PO 3-4, F -, Mg 2+ ) 2+ ) Liczba czynników % wariancji skumulowanej 5 85,3% sezon letni I I czynnik 39,9% (SO 2-4, NH 4+, K +, Mg 2+, Ca 2+ II czynnik 17,5% (ph, PO 3-4, SO 2-4, F - ) II czynnik 11,8% (NO 3-, Cl - ) 2+ )

ANALIZA SZEREGÓW CZASOWYCH statystyczna analiza zależności pomiędzy kolejnymi wartościami zmiennej przewidywanie (prognozowanie) przyszłych wartości szeregu czasowego wykrywanie mechanizmów rządzących zmianami obserwowanego zjawiska w czasie (np. identyfikacja oraz określenie długości cyklu zmian określonego zjawiska)

ANALIZA SZEREGÓW CZASOWYCH SZUM

ANALIZA SZEREGÓW CZASOWYCH TRANSFORMACJA FOURIERA DŁUGOŚĆ OKRESU ZMIAN 12 MIESIĘCY

LOGIKA W CHEMOMETRII LOGIKA KLASYCZNA LOGIKA ROZMYTA

PODSUMOWANIE efektywne wykorzystanie zabranych danych pomiarowych w wyniku zwiększenia ilości uzyskiwanych informacji możliwość wnioskowania o problemach w ujęciu wielowymiarowym optymalizacja rachunku ekonomicznego analiz działalnośc prośrodowiskowa (ograniczenie ilości odczynników wprowadzonych do środowiska naturalnego w skali globalnej)