INFORMATYKA W CHEMII Dr Piotr Szczepański

Podobne dokumenty
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

1 Podstawy rachunku prawdopodobieństwa

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Niepewność pomiaru. Wynik pomiaru X jest znany z możliwa do określenia niepewnością. jest bledem bezwzględnym pomiaru

Analiza i monitoring środowiska

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Analiza niepewności pomiarów

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Estymacja parametrów rozkładu cechy

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79

Komputerowa Analiza Danych Doświadczalnych

Estymacja punktowa i przedziałowa

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Weryfikacja hipotez statystycznych

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Analiza statystyczna w naukach przyrodniczych

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Pobieranie prób i rozkład z próby

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

STATYSTYKA MATEMATYCZNA narzędzie do opracowywania i interpretacji wyników pomiarów

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Testowanie hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Wprowadzenie

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Dr hab. Anna M. Nowicka

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Zawartość. Zawartość

Prawdopodobieństwo i rozkład normalny cd.

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Zadania ze statystyki, cz.6

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Komputerowa Analiza Danych Doświadczalnych

LABORATORIUM Z FIZYKI

Pozyskiwanie wiedzy z danych

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Statystyczne Metody Opracowania Wyników Pomiarów

Statystyka matematyczna dla leśników

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Kolokwium ze statystyki matematycznej

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Metody Statystyczne. Metody Statystyczne.

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Laboratorium 3 - statystyka opisowa

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Wnioskowanie statystyczne. Statystyka w 5

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych. Wykład tutora na bazie wykładu prof. Marka Stankiewicza

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Wykład 9. Terminologia i jej znaczenie. Cenzurowanie wyników pomiarów.

Hipotezy statystyczne

Rozkłady statystyk z próby

Adam Zaborski - Statystyka

Próba własności i parametry

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Wykład 3 Hipotezy statystyczne

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Testowanie hipotez statystycznych.

Dokładność pomiaru: Ogólne informacje o błędach pomiaru

Statystyczne Metody Opracowania Wyników Pomiarów

WYKŁAD 5 TEORIA ESTYMACJI II

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Statystyka matematyczna i ekonometria

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

Ćwiczenie 1. Metody określania niepewności pomiaru

Hipotezy statystyczne

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Transkrypt:

INFORMATYKA W CHEMII Dr Piotr Szczepański Katedra Chemii Fizycznej i Fizykochemii Polimerów

WPROWADZENIE DO STATYSTYCZNEJ OCENY WYNIKÓW DOŚWIADCZEŃ 1. BŁĄD I STATYSTYKA błąd systematyczny, błąd przypadkowy, dokładność a precyzja 2. LICZBY ZNACZĄCE 3. STATYSTYCZNA OCENA WYNIKÓW DOŚWIADCZEŃ liczność, średnia, odchylenie standardowe a niepewność standardowa

WPROWADZENIE UWAGA: Zastosowanie komputerów w chemii wymaga pełnego zdefiniowania, analizy i zrozumienia problemu który ma być rozwiązany. Analiza prowadzi do: - zdefiniowania celu i metody, - określenia danych wejściowych oraz pożądanej formy wyniku działania komputera (algorytm)

WPROWADZENIE - ALGORYTM Algorytm jest procedurą (sposobem postępowania), składającym się z dobrze zdefiniowanego i skończonego zestawu jasnych reguł opisujących jednostkowe czynności wykonywane przez komputer. Cechy algorytmów: 1) skończoność, 2) określoność, 3) wejście, 4) wyjście, 5) efektywność. Ocena polega na porównaniu z innymi które zostały stworzone celem rozwiązania tego samego zadania.

RODZAJE BŁĘDÓW POMIARU 1. BŁĄD SYSTEMATYCZNY charakterystyczny dla doświadczeń przeprowadzanych dokładnie w tych samych warunkach, wynika z niedoskonałości przyrządów, błędów popełnianych w trakcie kalibracji, dryfu przyrządu w czasie, paralaxy przyrządów optycznych, niedoskonałości obserwatora, może być korygowany lub eliminowany przez wykonywanie tzw. ślepej próby, poprawną kalibrację i staranne prowadzenie doświadczenia (DOKŁADNOŚĆ jak bliski jest wynik pomiaru wartości rzeczywistej). 2. BŁĄD PRZYPADKOWY małe, niekontrolowane fluktuacje pomiarów doświadczalnych wynikające z niezliczonej ilości przyczyn wpływających na warunki doświadczenia (zmienna przypadkowa) 3. BŁĄD GRUBY (omyłka) związany z nieuwagą eksperymentatora (zły odczyt, uszkodzenie aparatury)

ODRZUCENIE LUB POZOSTAWIENIE WYNIKU WĄTPLIWEGO Wyników wątpliwych nie można odrzucić bez matematycznego uzasadnienia!! Podstawą (kryterium) dla ich odrzucenia są m.in.: Test Dixona (test Q) Test 3d (3 sigma) Test Grubbsa (Każdy z nich ma swoje wady i zalety)

ODRZUCENIE LUB POZOSTAWIENIE WYNIKU WĄTPLIWEGO TEST DIXONA (TEST Q) Sposób postępowania: Uszeregować dane rosnąco: x 1 <x 2 <... <x N. Obliczyć stosunek Q ze wzoru: Q = x wątpliwy-x najbliższy x max -x min Porównać Q z wartością tablicową (krytyczną) Q kr. Jeśli Q> Q kr., wtedy odrzucić punkt. Tabela współczynników Q kr. N 3 4 5 6 7 8 9 10 Q kr. 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41 0.00

PRECYZJA A DOKŁADNOŚĆ PRECYZJA odtwarzalności wyniku w trakcie wielokrotnie powtarzanych doświadczeń- miara rozrzutu. DOKŁADNOŚĆ jak bliski jest wynik pomiaru wartości rzeczywistej. Nieprecyzyjnie i niedokładnie Precyzyjnie ale niedokładnie Nieprecyzyjnie ale dokładnie Precyzyjnie i dokładnie

CYFRY ZNACZĄCE - REGUŁY 1. Zapis liczby zgodny z precyzją wykonania pomiaru PRZYKŁAD: Pewien badacz wykonał kilkaset pomiarów grubości powłoki poliestrowej i uzyskał wynik: 120,342525794323 ± 9,722742949332 µm rozmiar jądra rozmiar atomu rozmiar kwarka

CYFRY ZNACZĄCE - REGUŁY 2. Zapis liczby w postaci tylu znaków jaka wynika z pojęcia tzw. cyfry znaczącej 3. Cyfry znaczące to te, które są znane plus jedna o której wiemy, że jest niedokładna, np.: 6.321 4.345 10-3 0.001307 4. Bardzo ważne pojecie cyfry znaczącej w obliczeniach komputerowych!!! Dodawanie i odejmowanie: wyraz z najmniejszą liczbą miejsc dziesiętnych wskazuje na cyfrę znaczącą wyniku PRZYKŁAD: 7.8 + 0.020 +4.41 = 12.23 zaokrąglone do 12.2 Mnożenie i dzielenie: wynik obliczeń ma tyle cyfr znaczących ile wyraz z najmniejszą liczbą cyfr znaczących (ale nie zawsze) PRZYKŁAD: 24 4.52 / 100.0 = 1.08

CYFRY ZNACZĄCE - REGUŁY Wynik pomiaru Liczba cyfr znaczących Liczba miejsc po przecinku 42.8 3 1 0.345830 6 6 0.543 3 3 0.0038 2 4 0.00028040 5 8

ZAOKRĄGLANIE WYNIKÓW OBLICZEŃ 1. Wartość błędu zaokrąglamy zawsze w górę (najwyżej dwie cyfry znaczące!!!) 2. Jeżeli wartość błędu (po zaokrągleniu) nie wzrośnie więcej niż o 10% można zostawić tylko jedną cyfrę. 3. Wartość pomiaru zaokrąglamy: a) w górę, jeśli ostatnia cyfra jest 6 b) w dół, gdy jest ona 4 c) jeżeli jest równa 5: w górę, jeżeli poprzedzająca cyfra jest nieparzysta; w dół w przeciwnym przypadku s A = 0.0058 g s A = 0.006 g s A = 0.6 10-2 g A= 0.7753 g A= 0.7756 g A= 0.7755 g A= 0.775 g A= 0.776 g A= 0.776 g A= 0.776 ± 0.006 g

UWAGA! POPRAWNIE ZAOKRĄGLONE WARTOŚCI WIELKOŚCI I JEJ NIEPEWNOŚCI MAJĄ TAKĄ SAMĄ ILOŚĆ MIEJSC DZIESIĘTNYCH!

STATYSTYCZNA OCENA BŁĘDU PRZYPADKOWEGO Losowość zjawisk decydujących w dużym stopniu o wynikach pomiaru powoduje, że do analizy błędów i oceny niepewności otrzymywanych wyników wykorzystuje się modele i metody rachunku prawdopodobieństwa i statystyki matematycznej.

POPULACJA (LICZNOŚĆ), ŚREDNIA I ODCHYLENIE STANDARDOWE 1. Wykonujemy serię pomiarów - wyniki (x i ) wykazują rozkład (rozrzut) 2. Pewne wartości x i występują częściej niż inne i mogą być ulokowane w środku przedziału pozostałych wartości x histogram- wykres składający się z szeregu prostokątów umieszczonych na osi współrzędnych, których podstawą są przedziały o długości h ( x) a wysokość określona jest przez liczebność (lub częstość) wyników należących do określonego przedziału klasowego. liczność względna 0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 1 2 3 4 5 6 7 8 9 10 x

POPULACJA (LICZNOŚĆ), ŚREDNIA I ODCHYLENIE STANDARDOWE 3. Jeżeli pomiar powtarzany byłby nieskończoną liczbę razy, to uzyskany rozkład mógłby być przedstawiony w postaci ogólnej krzywej rozkładu funkcja gęstości f(x) 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0-0.05 0 2 4 6 8 10 x rozkład normalny (Gaussa) 4. W rzeczywistym doświadczeniu, wyniki są losowo wybierane z ogólnej populacji (uzyskane wyniki stanowią próbę ich ogólnej populacji) 5. Celem obliczeń statystycznych jest takie wykorzystanie pomiarów i ich wyników aby możliwy był dokładny opis populacji ogólnej 6. Miary: np. wartość przeciętna (średnia), wartość środkowa (mediana), odchylenie standardowe.

CHARAKTERYSTYKI OPISOWE - MIARY MIARY POŁOŻENIA Średnia Mediana Moda (dominanta) MIARY ROZPROSZENIA Rozstęp Wariancja Odchylenie standardowe Współczynnik zmienności MIARY ASYMETRII Skośność MIARY SKUPIENIA Kurtoza

ŚREDNIA, WARIANCJA, ODCHYLENIE STANDARDOWE POPULACJI MIARY POŁOŻENIA I ROZPROSZENIA POPULACJI Średnia ogólna: µ = lim n 1 n i x i Zasięg populacji Wariancja ogólna: σ 2 = 1 lim ( xi µ ) n n i 2 Ogólne odchylenie standardowe: σ = 2 σ

W rzeczywistych doświadczeniach skończona liczba pomiarów (próbek, itp.) uniemożliwia wyznaczenie wartości µ i σ a jedynie oszacowanie z wykorzystaniem wzorów (estymatorów): Średnia: ŚREDNIA, WARIANCJA, ODCHYLENIE STANDARDOWE PRÓBY Wariancja: x = = Odchylenie standardowe: (niepewność standardowa) s 2 1 n i 1 n 1 x i i ( x i x) 2 n-1 liczba stopni swobody (liczba obserwacji (wart. x) pozostających w nadmiarze w stosunku do liczby koniecznej dla wyznaczenia parametrów równania) s = 2 s Średni błąd kwadratowy pojedynczego pomiaru Funkcje w Excelu: =ŚREDNIA(zakres liczb) =WARIANCJA(zakres liczb) =ODCH.STANDARDOWE(zakres liczb)

ŚREDNIA, ODCHYLENIE STANDARDOWE POPULACJI 0.45 gęstość prawdopodobieństwa P(x) 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 σ = 2 σ = 1.5 σ = 1 0 2 4 6 8 10 x gęstość prawdopodobieństwa P(x) 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 σ = 1 3σ 2σ σ µ σ 2σ 3σ x Prawdopodobieństwa, że wynik jest odległy od wartości średniej co najwyżej o σ, 2σ i 3σ wynoszą: µ±σ 68.26% µ±2σ 95.46% µ±3σ 99.73%

ŚREDNIA, WARIANCJA, ODCHYLENIE STANDARDOWE PRÓBY Współczynnik zmienności (względne odchylenie standardowe): ν = 100 x s x Eksperymentatora bardziej interesuje niepewność wyniku czyli wartości średniej: u ( x) = s x = s n = n ( xi x) i= 1 n( n 1) 2 odchylenie standardowe wartości średniej (NIEPEWNOŚĆ STANDARDOWA!!!)

PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ PRÓBY p.u. średniej arytmetycznej próby jest przedziałem symetrycznym w stosunku do średniej z próby, a wartość spodziewana znajduje się w nim z założonym prawdopodobieństwem równym 1 - α. P x t s X µ X n 1, α X x tn 1, α 1 n α - poziom istotności Dla n<30 + s n = α

PRZEDZIAŁ UFNOŚCI A NIEPEWNOŚĆ PRZEDZIAŁ UFNOŚCI: µ = x ± t 1, X n Wartość = średnia arytmetyczna próby ± połowa szerokości przedziału ufności spodziewana Jeżeli powtarzalność pomiarów jest dominującym parametrem wpływającym na szacowanie niepewności, wówczas NIEPEWNOŚĆ ROZSZERZONĄ obliczyć można ze wzoru: α s X n s U = k X = k u(x) n s X odchylenie standardowe, n liczba pomiarów, k współczynnik rozszerzenia k =2 lub 3 odpowiada 95 lub 99% prawdopodobieństwu znalezienia wyniku w danym zakresie

PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ PRÓBY UWAGA: W EXCELU NARZĘDZIA -> ANALIZA DANYCH > STATYSTYKA OPISOWA t s X n n 1, α s X n niepewność standardowa (to błąd standardowy) średni błąd kwadratowy wartości średniej połowa szerokości przedziału ufności to poziom ufności (95.0%)

PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ PRÓBY Tabela współczynników t Studenta (pseudonim matematyka W. Gosseta (1876 1937)). Liczba stopni Poziom ufności swobody 90% 95% 99% 1 2 3 5 7 9 6.31 2.92 2.35 2.02 1.90 1.83 12.7 4.30 3.18 2.57 2.36 2.26 63.7 9.92 5.84 4.03 3.50 3.25 W Excelu funkcja =ROZKŁAD.T.ODW(α, n-1)

NARZĘDZIA -> ANALIZA DANYCH > STATYSTYKA OPISOWA CEL: obliczyć średnią wartość ph (10 pomiarów) oraz przedział ufności. Ostateczny wynik: ph = 6.293±0.018

ŚREDNIA, WARIANCJA, ODCHYLENIE STANDARDOWE (metoda rekurencyjna) 1. Pierwsza próbna wartość średniej jest pierwszą wartością x 1 m 1 = x 1 suma kwadratów odchyleń: q 1 = 0 2. Korzystając ze wzorów rekurencyjnych na wartość średnią (m) i sumę kwadratów odchyleń (q): q k m = k q ( k 1) mk + x k k 1)( xk m + k = 1 k 1 ( k 1 3. Końcowa wartość m k stanowi średnią oznaczoną jako m n. Odchylenie standardowe s obliczyć można ze wzoru: qn s = n 1 k ) 2

PODSUMOWANIE: WYNIKÓW WĄTPLIWYCH NIE MOŻNA ODRZUCIĆ BEZ MATEMATYCZNEGO UZASADNIENIA!! POPRAWNIE ZAOKRĄGLONE WARTOŚCI WIELKOŚCI I JEJ NIEPEWNOŚCI MAJĄ TAKĄ SAMĄ ILOŚĆ MIEJSC DZIESIĘTNYCH PRZEDZIAŁ UFNOŚCI DLA ŚREDNIEJ: x ± t n 1, α s X n NIEPEWNOŚĆ ROZSZERZONA: s U = k X = k u(x) n średnia arytmetyczna próby ± połowa szerokości przedziału ufności