INFORMATYKA W CHEMII Dr Piotr Szczepański Katedra Chemii Fizyczej i Fizykochemii Polimerów
WPROWADZENIE DO STATYSTYCZNEJ OCENY WYNIKÓW DOŚWIADCZEŃ 1. BŁĄD I STATYSTYKA błąd systematyczy, błąd przypadkowy, dokładość a precyzja 2. LICZBY ZNACZĄCE 3. STATYSTYCZNA OCENA WYNIKÓW DOŚWIADCZEŃ liczość, średia, odchyleie stadardowe a iepewość stadardowa
WPROWADZENIE UWAGA: Zastosowaie komputerów w chemii wymaga pełego zdefiiowaia, aalizy i zrozumieia problemu który ma być rozwiązay. Aaliza prowadzi do: - zdefiiowaia celu i metody, - określeia daych wejściowych oraz pożądaej formy wyiku działaia komputera (algorytm)
WPROWADZENIE - ALGORYTM Algorytm jest procedurą (sposobem postępowaia), składającym się z dobrze zdefiiowaego i skończoego zestawu jasych reguł opisujących jedostkowe czyości wykoywae przez komputer. Cechy algorytmów: 1) skończoość, 2) określoość, 3) wejście, 4) wyjście, 5) efektywość. Ocea polega a porówaiu z iymi które zostały stworzoe celem rozwiązaia tego samego zadaia.
RODZAJE BŁĘDÓW POMIARU 1. BŁĄD SYSTEMATYCZNY charakterystyczy dla doświadczeń przeprowadzaych dokładie w tych samych warukach, wyika z iedoskoałości przyrządów, błędów popełiaych w trakcie kalibracji, dryfu przyrządu w czasie, paralaxy przyrządów optyczych, iedoskoałości obserwatora, może być korygoway lub elimioway przez wykoywaie tzw. ślepej próby, poprawą kalibrację i starae prowadzeie doświadczeia (DOKŁADNOŚĆ jak bliski jest wyik pomiaru wartości rzeczywistej). 2. BŁĄD PRZYPADKOWY małe, iekotrolowae fluktuacje pomiarów doświadczalych wyikające z iezliczoej ilości przyczy wpływających a waruki doświadczeia (zmiea przypadkowa) 3. BŁĄD GRUBY (omyłka) związay z ieuwagą eksperymetatora (zły odczyt, uszkodzeie aparatury)
ODRZUCENIE LUB POZOSTAWIENIE WYNIKU WĄTPLIWEGO Wyików wątpliwych ie moża odrzucić bez matematyczego uzasadieia!! Podstawą (kryterium) dla ich odrzuceia są m.i.: Test Dixoa (test Q) Test 3d (3 sigma) Test Grubbsa (Każdy z ich ma swoje wady i zalety)
ODRZUCENIE LUB POZOSTAWIENIE WYNIKU WĄTPLIWEGO TEST DIXONA (TEST Q) Sposób postępowaia: Uszeregować dae rosąco: x 1 <x 2 <... <x N. Obliczyć stosuek Q ze wzoru: Q = x wątpliwy-x ajbliższy x max -x mi Porówać Q z wartością tablicową (krytyczą) Q kr.. Jeśli Q> Q kr., wtedy odrzucić pukt. Tabela współczyików Q kr. N 3 4 5 6 7 8 9 10 Q kr. 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41 0.00
PRECYZJA A DOKŁADNOŚĆ PRECYZJA odtwarzalości wyiku w trakcie wielokrotie powtarzaych doświadczeń- miara rozrzutu. DOKŁADNOŚĆ jak bliski jest wyik pomiaru wartości rzeczywistej. Nieprecyzyjie i iedokładie Precyzyjie ale iedokładie Nieprecyzyjie ale dokładie Precyzyjie i dokładie
CYFRY ZNACZĄCE - REGUŁY Dlaczego ależy zaokrąglać błędy i wyiki końcowe? 1. Zapis liczby zgody z precyzją wykoaia pomiaru PRZYKŁAD: Pewie badacz wykoał kilkaset pomiarów grubości powłoki poliestrowej i uzyskał wyik: 120,342525794323 ± 9,722742949332 µm rozmiar jądra rozmiar atomu rozmiar kwarka
CYFRY ZNACZĄCE - REGUŁY 2. Zapis liczby w postaci tylu zaków jaka wyika z pojęcia tzw. cyfry zaczącej 3. Cyfry zaczące to te, które są zae plus jeda o której wiemy, że jest iedokłada, p.: 6.321 4.345 10-3 0.001307 4. Bardzo waże pojecie cyfry zaczącej w obliczeiach komputerowych!!! Dodawaie i odejmowaie: wyraz z ajmiejszą liczbą miejsc dziesiętych wskazuje a cyfrę zaczącą wyiku PRZYKŁAD: 7.8 + 0.020 +4.41 = 12.23 zaokrągloe do 12.2 Możeie i dzieleie: wyik obliczeń ma tyle cyfr zaczących ile wyraz z ajmiejszą liczbą cyfr zaczących (ale ie zawsze) PRZYKŁAD: 24 4.52 / 100.0 = 1.08
CYFRY ZNACZĄCE - REGUŁY Wyik pomiaru Liczba cyfr zaczących Liczba miejsc po przeciku 42.8 3 1 0.345830 6 6 0.543 3 3 0.0038 2 4 0.00028040 5 8
ZAOKRĄGLANIE WYNIKÓW OBLICZEŃ 1. Wartość błędu zaokrąglamy zawsze w górę (ajwyżej dwie cyfry zaczące!!!) 2. Jeżeli wartość błędu (po zaokrągleiu) ie wzrośie więcej iż o 10% moża zostawić tylko jedą cyfrę. 3. Wartość pomiaru zaokrąglamy: a) w górę, jeśli ostatia cyfra jest 6 b) w dół, gdy jest oa 4 c) jeżeli jest rówa 5: w górę, jeżeli spośród pozostałych odrzucoych cyfr przyajmiej jeda jest róża od zera, lub do ajbliższej cyfry parzystej s A = 0.0058 g s A = 0.006 g s A = 0.6 10-2 g A= 0.7753 g A= 0.7756 g A= 0.775 g A= 0.776 g A= 0.77551 g A= 0.776 g A= 0.7755 g A= 0.776 g A= 0.7765 g A= 0.776 g A= 0.776 ± 0.006 g
ZAOKRĄGLANIE WYNIKÓW OBLICZEŃ < 5 Pierwsza z odrzucaych cyfr jest miejsza od 5 NIE > 5 Pierwsza z odrzucaych cyfr jest większa od 5 TAK TAK Ostatia z pozostawioych cyfr ie ulega zmiaie Do ostatiej z pozostawioych cyfr dodaje się 1 NIE = 5 Czy z pozostałych odrzucoych cyfr przyajmiej jeda jest róża od zera NIE TAK Pozostawioą cyfrę zaokrągla się do ajbliższej cyfry parzystej (zaokrągla się w górę, gdy jest ieparzysta lub pozostawia bez zmiay gdy jest liczbą parzystą)
UWAGA! POPRAWNIE ZAOKRĄGLONE WARTOŚCI WIELKOŚCI I JEJ NIEPEWNOŚCI MAJĄ TAKĄ SAMĄ ILOŚĆ MIEJSC DZIESIĘTNYCH!
STATYSTYCZNA OCENA BŁĘDU PRZYPADKOWEGO Losowość zjawisk decydujących w dużym stopiu o wyikach pomiaru powoduje, że do aalizy błędów i ocey iepewości otrzymywaych wyików wykorzystuje się modele i metody rachuku prawdopodobieństwa i statystyki matematyczej.
POPULACJA (LICZNOŚĆ), ŚREDNIA I ODCHYLENIE STANDARDOWE 1. Wykoujemy serię pomiarów - wyiki (x i ) wykazują rozkład (rozrzut) 2. Pewe wartości x i występują częściej iż ie i mogą być ulokowae w środku przedziału pozostałych wartości x histogram- wykres składający się z szeregu prostokątów umieszczoych a osi współrzędych, których podstawą są przedziały o długości h ( x) a wysokość określoa jest przez liczebość (lub częstość) wyików ależących do określoego przedziału klasowego. liczość względa 0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 1 2 3 4 5 6 7 8 9 10 x
POPULACJA (LICZNOŚĆ), ŚREDNIA I ODCHYLENIE STANDARDOWE 3. Jeżeli pomiar powtarzay byłby ieskończoą liczbę razy, to uzyskay rozkład mógłby być przedstawioy w postaci ogólej krzywej rozkładu fukcja gęstości f(x) 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0-0.05 0 2 4 6 8 10 x rozkład ormaly (Gaussa) 4. W rzeczywistym doświadczeiu, wyiki są losowo wybierae z ogólej populacji (uzyskae wyiki staowią próbę ich ogólej populacji) 5. Celem obliczeń statystyczych jest takie wykorzystaie pomiarów i ich wyików aby możliwy był dokłady opis populacji ogólej 6. Miary: p. wartość przecięta (średia), wartość środkowa (mediaa), odchyleie stadardowe.
CHARAKTERYSTYKI OPISOWE - MIARY MIARY POŁOŻENIA Średia Mediaa Moda (domiata) MIARY ROZPROSZENIA Rozstęp Wariacja Odchyleie stadardowe Współczyik zmieości MIARY ASYMETRII Skośość MIARY SKUPIENIA Kurtoza
ŚREDNIA, WARIANCJA, ODCHYLENIE STANDARDOWE POPULACJI MIARY POŁOŻENIA I ROZPROSZENIA POPULACJI Średia ogóla: µ = lim 1 i x i Zasięg populacji Wariacja ogóla: σ 2 = 1 lim ( xi µ ) i 2 Ogóle odchyleie stadardowe: σ = 2 σ
W rzeczywistych doświadczeiach skończoa liczba pomiarów (próbek, itp.) uiemożliwia wyzaczeie wartości µ i σ a jedyie oszacowaie z wykorzystaiem wzorów (estymatorów): Średia: ŚREDNIA, WARIANCJA, ODCHYLENIE STANDARDOWE PRÓBY Wariacja: x = Odchyleie stadardowe: s 2 = 1 i 1 1 x i i ( x i x) 2-1 liczba stopi swobody (liczba obserwacji (wart. x) pozostających w admiarze w stosuku do liczby koieczej dla wyzaczeia parametrów rówaia) s = 2 s Średi błąd kwadratowy pojedyczego pomiaru Fukcje w Excelu: =ŚREDNIA(zakres liczb) =WARIANCJA(zakres liczb) =ODCH.STANDARDOWE(zakres liczb)
ŚREDNIA, ODCHYLENIE STANDARDOWE POPULACJI 0.45 gęstość prawdopodobieństwa P(x) 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 σ = 2 σ = 1.5 σ = 1 0 2 4 6 8 10 x gęstość prawdopodobieństwa P(x) 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 σ = 1 3σ 2σ σ µ σ 2σ 3σ x Prawdopodobieństwa, że wyik jest odległy od wartości średiej co ajwyżej o σ, 2σ i 3σ wyoszą: µ±σ 68.26% µ±2σ 95.46% µ±3σ 99.73%
ŚREDNIA, WARIANCJA, ODCHYLENIE STANDARDOWE PRÓBY Współczyik zmieości (względe odchyleie stadardowe): ν = 100 x s x Eksperymetatora bardziej iteresuje iepewość wyiku czyli wartości średiej: u ( x) = s x = s = ( xi x) i= 1 ( 1) 2 x ± u(x) odchyleie stadardowe wartości średiej (NIEPEWNOŚĆ STANDARDOWA!!!)
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ PRÓBY p.u. średiej arytmetyczej próby jest przedziałem symetryczym w stosuku do średiej z próby, a wartość spodziewaa zajduje się w im z założoym prawdopodobieństwem rówym 1 - α. P x t s X µ X 1, α X x t 1, α 1 α - poziom istotości Dla <30 + s = α
PRZEDZIAŁ UFNOŚCI A NIEPEWNOŚĆ PRZEDZIAŁ UFNOŚCI: µ = x ± t 1, X Wartość = średia arytmetycza próby ± połowa szerokości przedziału ufości spodziewaa Jeżeli powtarzalość pomiarów jest domiującym parametrem wpływającym a szacowaie iepewości, wówczas NIEPEWNOŚĆ ROZSZERZONĄ obliczyć moża ze wzoru: α s X s U = k X = k u(x) s X odchyleie stadardowe, liczba pomiarów, k współczyik rozszerzeia k = 2 lub 3 odpowiada 95 lub 99% prawdopodobieństwu zalezieia wyiku w daym zakresie
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ PRÓBY UWAGA: W EXCELU NARZĘDZIA > ANALIZA DANYCH > STATYSTYKA OPISOWA DANE >ANALIZA DANYCH > STATYSTYKA OPISOWA t s X 1, α s X iepewość stadardowa (to błąd stadardowy) średi błąd kwadratowy wartości średiej połowa szerokości przedziału ufości to poziom ufości (95.0%)
PRZEDZIAŁ UFNOŚCI ŚREDNIEJ ARYTMETYCZNEJ PRÓBY Tabela współczyików t Studeta (pseudoim matematyka W. Gosseta (1876 1937)). Liczba stopi Poziom ufości swobody 90% 95% 99% 1 2 3 5 7 9 6.31 2.92 2.35 2.02 1.90 1.83 12.7 4.30 3.18 2.57 2.36 2.26 63.7 9.92 5.84 4.03 3.50 3.25 W Excelu fukcja =ROZKŁAD.T.ODW(α, -1)
NARZĘDZIA -> ANALIZA DANYCH > STATYSTYKA OPISOWA CEL: obliczyć średią wartość ph (10 pomiarów) oraz przedział ufości. Ostateczy wyik: ph = 6.293±0.018 ph = 6.293±0.016 ± k u(x)
ŚREDNIA, WARIANCJA, ODCHYLENIE STANDARDOWE (metoda rekurecyja) 1. Pierwsza próba wartość średiej jest pierwszą wartością x 1 m 1 = x 1 suma kwadratów odchyleń: q 1 = 0 2. Korzystając ze wzorów rekurecyjych a wartość średią (m) i sumę kwadratów odchyleń (q): q k m = k q ( k 1) mk + x k k 1)( xk m + k = 1 k 1 ( k 1 3. Końcowa wartość m k staowi średią ozaczoą jako m. Odchyleie stadardowe s obliczyć moża ze wzoru: q s = 1 k ) 2
PODSUMOWANIE: WYNIKÓW WĄTPLIWYCH NIE MOŻNA ODRZUCIĆ BEZ MATEMATYCZNEGO UZASADNIENIA!! POPRAWNIE ZAOKRĄGLONE WARTOŚCI WIELKOŚCI I JEJ NIEPEWNOŚCI MAJĄ TAKĄ SAMĄ ILOŚĆ MIEJSC DZIESIĘTNYCH PRZEDZIAŁ UFNOŚCI DLA ŚREDNIEJ: x ± t 1, α s X NIEPEWNOŚĆ ROZSZERZONA: s U = k X = k u(x) średia arytmetycza próby ± połowa szerokości przedziału ufości
u ( x) = s x = s = i= 1 ( x x) i ( 1) 2 sx U = k = k u(x) NIEPEWNOŚĆ STANDARDOWA NIEPEWNOŚĆ ROZSZERZONA x ± u(x) x± U T= 273,4113 K; u(t)= 1,3456 K T= 373,4 K; u(t)= 1,4 K T= 273,4(1,4) K U(T)= 2,8 K T= 273,4 K; U(T)= 2,8 K T= (273,4 ±2,8) K