Istota planowania eksperymentów

Podobne dokumenty
Planowanie eksperymentu (optymalizacja procesów chemicznych)

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Zmienne zależne i niezależne

Rozdział 8. Regresja. Definiowanie modelu

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Statystyka matematyczna dla leśników

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Weryfikacja hipotez statystycznych

POLITECHNIKA OPOLSKA

Wprowadzenie do analizy korelacji i regresji

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

ANALIZA METROLOGICZNA WYNIKÓW BADAŃ NA PRZYKŁADZIE ŁOŻYSK ŚLIZGOWYCH

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

166 Wstęp do statystyki matematycznej

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Analiza składowych głównych. Wprowadzenie

Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni

WYKŁAD 8 ANALIZA REGRESJI

KORELACJE I REGRESJA LINIOWA

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Aproksymacja funkcji a regresja symboliczna

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Szkice rozwiązań z R:

Analiza współzależności zjawisk

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

JAK PROSTO I SKUTECZNIE WYKORZYSTAĆ ARKUSZ KALKULACYJNY DO OBLICZENIA PARAMETRÓW PROSTEJ METODĄ NAJMNIEJSZYCH KWADRATÓW

KARTA KURSU. Kod Punktacja ECTS* 1

Definicja problemu programowania matematycznego

Analiza i monitoring środowiska

Statystyka i Analiza Danych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA MATEMATYCZNA

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Zawartość. Zawartość

PDF created with FinePrint pdffactory Pro trial version

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

DOKUMENTACJA SYSTEMU ZARZĄDZANIA LABORATORIUM. Procedura szacowania niepewności

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

ZASTOSOWANIE PROGRAMOWANIA LINIOWEGO W ZAGADNIENIACH WSPOMAGANIA PROCESU PODEJMOWANIA DECYZJI

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Wydział Matematyki. Testy zgodności. Wykład 03

Walidacja metod analitycznych Raport z walidacji

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Procedura szacowania niepewności

INSTRUKCJA DO ĆWICZENIA NR 1

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Zad. 3: Układ równań liniowych

Zastosowanie Excela w matematyce

INFORMATYKA W CHEMII Dr Piotr Szczepański

Statystyczne Metody Opracowania Wyników Pomiarów

ZARZĄDZANIE SIECIAMI TELEKOMUNIKACYJNYMI

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Rok akademicki: 2012/2013 Kod: JFM s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Optymalizacja ciągła

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Testowanie hipotez statystycznych

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Funkcje liniowe i wieloliniowe w praktyce szkolnej. Opracowanie : mgr inż. Renata Rzepińska

WYKŁAD 5 TEORIA ESTYMACJI II

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Komputerowa Analiza Danych Doświadczalnych

Ekonometria_FIRJK Arkusz1

EGZAMIN MATURALNY W ROKU SZKOLNYM 2014/2015

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Wysokosprawna chromatografia cieczowa w analizie jakościowej i ilościowej

Z poprzedniego wykładu

Definicje i przykłady

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Transkrypt:

Politechnika Warszawska Wydział Chemiczny LABORATORIM PROCESÓW TECHNOLOGICZNYCH Chemia medyczna Technologia Produktów Farmaceutycznych Istota planowania eksperymentów Ludwik Synoradzki

ISTOTA PLANOWANIA EKSPERYMENTÓW Przedmiot związany: Laboratorium technologiczne, w tym warsztaty Badania i projektowanie PP Co to jest PP? Czego oczekują po wykładzie TPFarma? - Omawianie technologii otrzymywania różnych leków czy produktów farmaceutycznych - Narzędzia i filozofia opracowywania technologii

Dlaczego PLANOWANIE EKSPERYMENTÓW na TPFarma? Kluczowe fragmenty opracowania technologii wybór metody i określenie warunków przeprowadzania procesu. Brak tego przedmiotu w planie studiów. Chemicy niechętnie odnoszą się do obliczeń (matematyki) Pokazać zalety zachęcić do stosowania Zminimalizować trudności Na wykładzie istota/filozofia. Szczegóły na warsztatach z dr Gadomską-Gajadhur.

ZALETY PLANOWANIA EKSPERYMENTÓW Uporządkowany i optymalny sposób badań Analiza i zdefiniowanie zmiennych (stosunek nie ilość) Określenie obszaru zmienności Wybór/określenie wyniku Opis doświadczenia (próby) Standaryzacja warunków Określenie powtarzalności Określenie modelu, w tym współdziałanie zmiennych (szczególnie ważne gdy wiele zmiennych, do sterowania) Możliwość analizy statystycznej/jakości wyników Możliwość analizy po fakcie

PODSTAWY PLANOWANIA EKSPERYMENTÓW WSTĘP Przeciwnicy wykonują badania metodą po jednej zmiennej (ang. onefactor-at-a-time procedure). Bez szczegółowej analizy układu, przystępuje się od razu do eksperymentów, które wydają się najbardziej oczywiste i najłatwiejsze do wykonania np. określenie zależności wydajności od temperatury. Badanie takie powtarza się dla wszystkich zmiennych ( odkrywając niektóre z nich dopiero w trakcie badań), otrzymując kolejne wykresy zależności od poszczególnych zmiennych i na ich podstawie wyciągając wnioski o warunkach realizacji procesu technologicznego. Dla wielu zmiennych postępowanie nieefektywne, wykonuje się dużo doświadczeń, których wyniki nie są wykorzystywane. Możliwe są błędy wynikające z braku informacji o współdziałaniach zmiennych. Nie ma też prostego sposobu prezentacji wyników.

PODSTAWY PLANOWANIA EKSPERYMENTÓW WSTĘP Główny cel PE zaprojektowanie doświadczeń, aby uzyskane wyniki dały odpowiedź na dobrze sformułowane pytanie. Dobrze zaplanowane E lepsze, tańsze i szybsze zbadanie procesu, prostsze przedstawienie wyników. Cel wykładu przybliżenie/zaznajomienie coraz powszechniej stosowanych metod matematycznych do PE i optymalizacji w chemii i technologii chemicznej. Omówiono wpływ PE na uporządkowany i optymalny sposób przeprowadzania badań. Wskazano na błędy często popełniane podczas opracowywania i optymalizacji procesów chemicznych i technologicznych. Pokazano, że planowanie nie musi być skomplikowane, a do obliczeń i opracowania wyników często wystarczy arkusz kalkulacyjny. Im bardziej skomplikowany układ tym bardziej widoczne są zalety planowania eksperymentów.

1. PODSTAWY PLANOWANIA EKSPERYMENTÓW WSTĘP Podstawy teoretyczne PE omawiane są w odpowiednich działach matematyki. Wymagana jest podstawowa znajomość niektórych zagadnień, matematyka podstawy algebry liniowej (rachunek wektorowy, działania na macierzach, odwracanie macierzy) statystyka matematyczna zmienna losowa, rozkład teoretyczny (zwłaszcza normalny), rozkłady t, F i 2, testowanie hipotez.

PODSTAWY PLANOWANIA EKSPERYMENTÓW WSTĘP PE zaczynamy od ustalenia początkowych warunków doświadczeń (np. tzw. środka planu) i ograniczeń fizyko-technicznych (by nie zaplanować doświadczeń, niemożliwych do realizacji). Najpierw analiza literatury dot. tematu, zebranie wszelkich informacji, istotnych dla możliwie dobrego doboru początkowych warunków eksperymentu. Możliwie dokładnie określić cel planowanego eksperymentu. Następnie, wybrać plan eksperymentu osiągnięcie celu badań możliwie małym nakładem pracy i środków. Plan należy zrealizować w maksymalnie ustalonych ( standardowych ) warunkach, aby uniknąć wpływu niekontrolowanych czynników na wyniki doświadczeń. Opracowuje się wyniki doświadczeń i ich statystyczna analizę należy w odpowiednio uzasadniony sposób ocenić wyniki doświadczeń, potwierdzić hipotezy sformułowane wcześniej i podjąć decyzję o kontynuacji lub przerwaniu badań.

PODSTAWY PE POJĘCIA PODSTAWOWE Doświadczenie (próba) (ang. trial) działanie w celu uzyskanie wyniku, y, będącego funkcją k zmiennych niezależnych (ang. independent variable). Punkt w układzie współrzędnych, którego osie (wzajemnie do siebie prostopadłe) to osie zmiennych niezależnych (wejściowych). Doświadczenie dla k zmiennych wejściowych to punkt w k-wymiarowej przestrzeni, określanej jako czynnikowa (ang. factor space) współrzędne tego punktu określają warunki przeprowadzenia doświadczenia. Eksperyment (plan eksperymentu) zbiór zaplanowanych doświadczeń, zbiór punktów w przestrzeni czynnikowej ustala go eksperymentator. Plan eksperymentu zapisuje się w postaci macierzy planowania X. Obszar eksperymentu (przestrzeń planu) (ang. region of experimentation) zbiór wartości zmiennych x i, mieszczący się pomiędzy najmniejszymi i największymi wartościami z planu eksperymentu, x i,min x i x i,max

1.2. PODSTAWY PE POJĘCIA PODSTAWOWE Macierz planu (ang. design matrix) dla k zmiennych niezależnych i N doświadczeń: X = x11 x21 x N1 x x x 12 22 N 2 x x x 1k 2k Nk i-ty wiersz wartości k zmiennych w i-tym doświadczeniu. j-ta kolumna wartości j-tej zmiennej w N doświadczeniach. Symbol x ij oznacza wartość j-tej zmiennej w i-tym doświadczeniu. W macierzy tej niekiedy wprowadza się, jako pierwszą, kolumnę złożoną z wartości +1. Kolumna ta pozwala na obliczanie wyrazu wolnego w wielomianie, a nie tylko współczynników dla k zmiennych niezależnych, które zostałyby obliczone na podstawie macierzy X (wzór 1). Macierz X określana jest jako macierz ortogonalna (kolumny macierzy są ortogonalne), jeżeli spełniony jest warunek: iloczyn dwóch dowolnych kolumn (iloczyn skalarny wektorów i ) jest równy 0: j W przypadku ortogonalnej macierzy X wyznaczone współczynniki równania regresji są niezależne (nie są wzajemnie skorelowane). u N i 1 x ij x iu 0, u j, u, j 0,1, k

1.2. PODSTAWY PE POJĘCIA PODSTAWOWE Efekt współdziałania zmiennych (ang. interaction between the variables), tzn. dla danej zmiennej x i wynik doświadczenia, y, jest np. funkcją f(x i )=a+b x i, w której współczynniki a i b zależą od wartości zmiennej x j =const (jeżeli zależny jest tylko współczynnik a, to mówi się o addytywnym wpływie obu zmiennych). Najczęściej w równaniach regresji (gdy są to wielomiany) efekt współdziałania występuje jako wyraz b ij x i x j. Rzadko rozpatruje się współdziałanie więcej niż dwóch zmiennych. Plany eksperymentów. Najczęściej stosowane plany czynnikowe (ang. factorial design), rozpowszechnione w badaniach chemicznych, m.in. do badania powierzchni odpowiedzi (ang. response surface) funkcji wielu zmiennych. Wprowadzone przez R. A. Fishera do wyznaczania zależności wyników, przy zmianie równocześnie wartości wszystkich badanych zmiennych niezależnych. Najczęściej do wyznaczania równań stosowana jest metoda najmniejszych kwadratów (ang. least squares method). PCz opisuje się liczbami zmiennych niezależnych i poziomów czynników (wartości zmiennych niezależnych, ang. factor level) np. plan dla czterech zmiennych niezależnych i dwóch różnych wartości tych zmiennych określany jest jako plan czynnikowy 2 4 (liczba doświadczeń w tym planie wynosi 16 i są to wszystkie możliwe kombinacje poziomów tych zmiennych). Inne plany: ortogonalne Taguchi, Doehlerta, Placketta-Burmana, Boxa-Behnkena.

1.2. PODSTAWY PE POJĘCIA PODSTAWOWE Parametry niejednoznaczne np. do warunków (dla jakich wartości parametrów, temperatury i ciśnienia osiągamy maks. wydajność?), do wyników (który parametr optymalizujemy?), do współczynników występujących w modelach matematycznych (np. parametry równania linii prostej). Zalecam używać terminów jednoznacznych: zmienne wejściowe, v i, w i, x i, z i ; zmienne wyjściowe (wyniki), y i ; współczynniki modelu (równania regresji), b i. Zmienne wejściowe (zmienne niezależne) (ang. input, independent variable) wszystkie zmienne niezależne, od których zależy wynik procesu. Trzy grupy: Z mierzalne, sterowalne (ang. controllable variable), x i ; Z mierzalne, niesterowalne (ang. uncontrollable variable), v i ; zakłócenia (szum), w i, (ang. noise). Rozróżnia się zmienne ciągłe (ang. continuous) i dyskretne (skokowe) (ang. discrete). Zmienne mierzalne, sterowalne, (procesowe) (ang. operational), x i, z i, można zmierzyć, wartości określa eksperymentator. Część będzie zmieniana zgodnie z planem eksperymentu, a pozostałe ustala się na czas realizacji planu eksperymentu (warunki standardowe). Zmienne stosowane w planie eksperymentu muszą być niezależne (nieskorelowane) (independent, unambiguous).

1.2. PODSTAWY PE POJĘCIA PODSTAWOWE Zmienne mierzalne, niesterowalne, v i, można zmierzyć (i sprawdzić czy w czasie realizacji doświadczeń ich wartość była stała), ale nie zależą od eksperymentatora np. temp. otoczenia (częsty błąd: część doświadczeń planu latem a część zimą), ciśnienie atmosferyczne, promieniowanie tła, skład surowca (zawartość określonych zanieczyszczeń, wilgotność), umiejętności personelu. Wartości tych Z powinny być ustalone np. mieć dostateczną ilość jednorodnego surowca. Eliminuje się możliwość popełnienia błędów systematycznych wynikających z zależności wyniku od takiej zmiennej. Czasem Z niesterowalne staną się sterowalnymi np. wilgotność i temperatura otoczenia, jeżeli doświadczenia wykonamy w komorze klimatyzowanej. Zmienne niemierzalne, niesterowalne (zakłócenia), w i, nie można zmierzyć, wartości nie zależą od eksperymentatora, np. chłodzenie aparatury przez niekontrolowany przepływ powietrza pod wyciągiem, nierównomierny rozkład temperatury w objętości mieszaniny reagującej, różna jakość (umiejętności) pracy personelu. O niektórych Z eksperymentator może wręcz nie wiedzieć. Z te są jedną z przyczyn błędów losowych obciążających wynik doświadczenia (inną przyczyną mogą być błędy ustalenia wartości zmiennych mierzalnych).

1.2. PODSTAWY PE POJĘCIA PODSTAWOWE Zmienne wyjściowe, y i, wyniki, zmienne zależne (ang. result, output, dependent variable). Ważnym jest wybór prawidłowej zmiennej wyjściowej, na podstawie której dokonuje się oceny doświadczeń. Wynik określany jest niekiedy terminem odpowiedź (reakcja, ang. response) badanego układu na zmianę wartości zmiennych wejściowych. Powierzchnia odpowiedzi (ang. response surface) zbiór wyników doświadczeń geometryczny obraz funkcji odpowiedzi y. Jeżeli funkcja odpowiedzi jest nieznana, to po zrealizowaniu odpowiedniego planu doświadczeń można ją przedstawić w postaci wielomianu pierwszego lub drugiego stopnia. Dla planu w k-wymiarowej przestrzeni czynnikowej (k zmiennych wejściowych), powierzchnią odpowiedzi jest powierzchnia w (k+1)-wymiarowej przestrzeni, w której k osi odpowiada k zmiennym niezależnym, a oś k+1 odpowiada wynikom doświadczeń, y. Wyniki mogą być różne: ekonomiczne, technologiczne, psychologiczne, estetyczne. Wynik powinien być prosty, mieć sens fizyczny (chemiczny), być wyrażony liczbą. Do ocen subiektywnych można stosować skalę 1, 2, 3 itd. lub zły, dobry, bardzo dobry. Wyniki (osiągane wartości) mogą być ograniczone, ciągłe, dyskretne. Np. wydajność reakcji może zmieniać się 0 100%, liczba braków to zmienna dyskretna ograniczona od dołu. Proces może być charakteryzowany kilkoma wynikami równocześnie np. wydajność produktu, koszt jednostkowy, zawartość zanieczyszczenia.

1.2. PODSTAWY PE POJĘCIA PODSTAWOWE Zmienne naturalne (ang. uncoded variables), z i zwykle Z mianowane, temperatura, stężenie, ph. Do planowania eksperymentów i obliczeń wygodnie jest stosować bezwymiarowe zmienne kodowane (standaryzowane). Zmienne kodowane (ang. coded variables), x i. W celu uogólnienia sposobu omawiania planów eksperymentu wprowadzono pojęcie zmiennej kodowanej (standaryzowanej). Chodzi o to, aby uniknąć omawiania planów z zastosowaniem zmiennych niezależnych wyrażanych w różnych skalach i dla różnych zakresów ich wartości. Tworzą bezwym. układ współrzędnych. Zalety tworzenia planów w ZK: 1) uproszczenie zasad tworzenia planów i obliczania współczynników regresji, 2) łatwiejsze realizowanie warunków nakładanych przy tworzeniu macierzy planu X (np. ortogonalności lub rotatabilności planu), 3) ułatwienie interpretacji uzyskiwanych równań.

1.2. PODSTAWY PE POJĘCIA PODSTAWOWE Losowe wykonywanie doświadczeń (ang. randomization). Realizując plan należy wykonywać doświadczenia w kolejności przypadkowej, a nie kolejno. Ma to na celu wykluczenie występowania błędów systematycznych, które mogą powstać np. gdy najpierw wykona się doświadczenia dla wybranej wartości zmiennej, a potem dla drugiej wartości, a równocześnie coś się zmieni np. rozkład odczynnika, albo jeśli przy kolejnym wykonywaniu doświadczeń z planu (nie losowo!) wzrasta wprawa eksperymentatora. Adekwatność równania regresji (modelu) (ang. fitting adequacy). Zgodność otrzymanego równania regresji (lub przyjętego modelu) z danymi doświadczalnymi. Stosując testy statystyczne przyjmujemy lub odrzucamy hipotezę o zgodności. Jeżeli hipotezę odrzucono to mówi się o niedopasowaniu (ang. lack of fit) równania (modelu). Poprawność opisu danych doświadczalnych danym równaniem nie oznacza, że równanie opisuje poprawnie rzeczywistą (prawdziwą) zależność między zmiennymi i wynikami. Liczba stopni swobody, φ różnica między liczbą doświadczeń, N, (każde doświadcz. jeden wynik) i liczbą ocenianych współczynników równania regresji p. Jeżeli φ>0 i N>p to plan określa się jako nienasycony (możliwa jest ocena adekwatności równania regresji), jeżeli φ=0 i N=p to plan jest nasycony i jeżeli φ<0 i N<p to plan jest przesycony (w dwóch ostatnich przypadkach ocena adekwatności jest niemożliwa).

1.3. PODSTAWY PE ETAPY BADAŃ (CELE EKSPERYMENTU) Problem określenie zależności wyniku od wielu zmiennych niezależnych. PE wymusza rozpoczęcie badań od szczegółowej analizy układu, nie może jednak przesłaniać znaczenia wiedzy, doświadczenia i intuicji badacza, częste przy posługiwaniu się komputerami i korzystaniu ze schematów obliczeń. Najczęściej PE stosowane jest do rozwiązywania trzech problemów i osiągania trzech celów eksperymentu: czy wynik, y, zależy od pewnych zmiennych niezależnych z wybranej listy? selekcja zmiennych (analiza istotności); jakie równanie najlepiej opisuje zależność, y, od wartości zmiennych niezal.? identyfikacja modelu matematycznego; dla jakich wartości zmiennych niezal. wynik, y, osiąga wartość optymalną? optymalizacja. Rozwiązywanie w różnej kolejności w zal. od wiedzy o procesie, liczby zm. niezależnych oraz od potrzeb. W praktyce (przy mniejszej, dobrze określonej liczbie zm.) często zaczynamy od końca (1) warunki optymalne, (2) równanie dobrze opisujące proces, (3) wpływ zmiennych niezależnych na y.

1.3. PODSTAWY PE ETAPY BADAŃ (CELE EKSPERYMENTU) SELEKCJA ZMIENNYCH IDENTYFIKACJA MODELU OPTYMALIZACJA Problem Czy y zależy od x 1, x 2,..., x i,..., x k? Jak y zależy od x 1, x 2,..., x i,..., x k? Jakie wartości nadać x 1, x 2,..., x i,..., x k, aby uzyskać y opt? Przykłady Badanie, które zmienne, x i, (temp., ciśn., przepływ) mają istotny wpływ na wydajność procesu Określenie modelu matematycz. dla zależności wydajności procesu (jakości produktu), y, od zmiennych wejściowych, x i, (t, p, v). Wyznaczenie wartości, x i, (t, p, v), które zapewniają maks. wydajność (najlepszą jakość produktu). Cel Ocena wpływu poszczególnych zmiennych. Wyselekcjonowanie istotnych zmiennych. Wyznaczenie kształtu powierzchni odpowiedzi: struktury równań, wartości współczynników, punkt stacjonarny Poszukiwanie optimum. Znalezienie ekstremum powierzchni odpowiedzi. Interpretacja graficzna Metody planowania eksperymentów plany Placketta-Burmana, analiza wariancji, czynnikowe plany ułamkowe 2 n k, plany losowe, plany przesycone, plany grupowego eliminowania. plany czynnikowe, plany ortogonalne, plany rotatabilne. metoda simpleksów, metoda największego spadku, metoda badania powierzchni drugiego stopnia.

Organizacja i realizacja eksperymentu W realizacji celów eksperymentu wyróżniamy szereg powtarzających się faz. Podkreślam, że eksperymenty w chemicznych badaniach optymalizacyjnych są bardzo złożone i niekiedy w czasie ich trwania, potrzebna jest korekta ustaleń dokonanych w zrealizowanych już fazach. Nie można traktować problemu faz w sposób absolutny istnieje między nimi wzajemna zależność o charakterze zwrotnym.

Organizacja i realizacja eksperymentu Faza Cel SELEKCJA ZMIENNYCH IDENTYFIKACJA MODELU OPTYMALIZACJA 1 Sformułowanie problemu 2 Wybór, przygotowanie i wykonanie planu eksperymentu 3 Opracowanie wyników planu eksperymentu 4 Ocena uzyskanych wyników 5 Podjęcie decyzji i wyciągnięcie wniosków

Przykład: Optymalizacja syntezy KDBW z konkretnej pracy badawczej, gdzie stosowano planowanie eksperymentów jako narzędzie wspomagające technologa. żeby przybliżyć sposób formułowania tego rodzaju sprawozdań, pokazać jak można opisywać poszczególne fazy badań optymalizacyjnych oraz omówić problemy praktyczne związane ze stosowaniem metod planowania. Częsta sytuacja, kiedy selekcję zmiennych przeprowadzano na podstawie wyczucia badacza, którego interesował zarówno model procesu, jak i warunki optymalne.

Sformułowanie problemu Określenie celu eksperymentu, analiza warunków i środków Znano dwuetapową technologię otrzymywania kwasu KDBW: 1) synteza bezwodnika BDBW, 2) hydroliza BDBW do KDBW Każdy z etapów wydajność >90%, a całkowita wydajność procesu ok. 81%. Zaletą wydzielania BDBW po syntezie, jest oczyszczania go od produktów ubocznych, ale filtracja, przemywanie i przeładunki są przyczyną strat.

Sformułowanie problemu HO HO O OH OH O KW 3 RCOCl Rozp. O RCOO O RCOO O BDBW BDAW + RCOOH + 3 HCl Benzoilowanie dehydratacja H 2 O Hydroliza O R C O O R C O O O H O H O K D B W KDBW

Sformułowanie problemu Określenie celu eksperymentu, analiza warunków i środków Znano dwuetapową technologię otrzymywania kwasu KDBW: 1) synteza bezwodnika BDBW, 2) hydroliza BDBW do KDBW Każdy z etapów wydajność >90%, a całkowita wydajność procesu ok. 81%. Zaletą wydzielania BDBW po syntezie, jest oczyszczania go od produktów ubocznych, ale filtracja, przemywanie i przeładunki są przyczyną strat. Pomysł synteza i bezpośrednio po niej hydroliza BDBW. Wydajność na podstawie masy wydzielanego produktu. Cel eksperymentu identyfikacja modelu matematycznego opisującego proces i jego optymalizacja.

Sformułowanie problemu Struktura układu technol. określenie i klasyfikacja zmiennych Wytypowano zmienne wejściowe aby zbadać ich wpływ na proces: temperatura syntezy, z 1, ilość toluenu do syntezy, z 2, ilość katalizatora, z 3 (zawsze w stosunku do kwasu winowego). Pozostałe zmienne ustalono. Jako zmienne wyjściowe (wyniki) przyjęto: wydajność KDBW, y 1, (+) absorbancja UV ( =600 nm) (stęż. barwnych zesmoleń), y 2, czas wydzielania chlorowodoru, y 3, zawartość KB (czystość produktu), y 4. Strukturę procesu (czarną skrzynkę) przedstawiono pokazując etapy, gdzie oddziałują zm. wejściowe i gdzie pojawia się wynik zm. wyjściowa Kryterium optymalizacji maks. wydajności, y 1, (+) min. zesmoleń, y 2 ): max (y 1 ), min (y 2 ) z 1 z 3 z 1 z 3 (y 3 i y 4, nie były przedmiotem optymalizacji, służyły do zidentyfikowania modeli i oceny wyników w pobliżu optimum im mniejsze tym lepsze.)

Struktura układu technologicznego (czarna skrzynka) Zmienne wejściowe Zmienne wyjściowe zmieniane: z 1, temperatura syntezy z 2, ilość toluenu do syntezy z 3, ilość katalizatora ustalone: patrz tab.5.24 a) SYNTEZA HYDROLIZA KRYSTALIZACJA y 2, absorbancja UV y 3, czas wydzielania HCl ustalone: patrz tabela 5.24 a) FILTRACJA PRZEMYCIE SUSZENIE y 1, wydajność procesu y 4, zawartość KB w KDBW

Określenie ograniczeń i obszar eksperymentu z 1, temperatura reakcji ( C) dwg 40, początek (wydzielania HCl) przy minimalnej ilości katalizatora; gwg 140, wyraźne ściemnienie mieszaniny poreakcyjnej; z 2, ilość toluenu do reakcji (g Tol /g KW ) dwg 0,42, minimalna ilość, żeby mieszanie pod koniec reakcji; gwg 4,0, całkowite rozpuszczenie powstałego kwasu benzoe (w 45 C); z 3, ilość katalizatora (mg Kat /g KW ) dwg 2,5, początek reakcji (wydzielania HCl) w temperaturze 40 C; gwg 50, wyraźne ściemnienie mieszaniny poreakcyjnej. Obszar eksperymentu (zakresy zmienności) maks z i min z i Wybrano maks ( ) i min ( ) wartości zm. nat, z i, i kod, x i, (jądro planu), żeby ewentualne punkty gwiezdne planu rotatabilnego (a=1,682) zmieściły się w obszarze zmienności. Obliczono naturalne współrzędne punktu centralnego (środka planu) i krok zmiennej (wartość z i ).

Sformułowanie problemu Środek planu i kroki zmiennych Środek planu Krok zmiennej maks min maks Zmienna naturalna, z i 0 zi zi zi zi zi zi 2 2 z 1 115 10 z 2 0,90 0,25 z 3 25 10 min Dopuszczalny obszar zmienności, obszar eksperymentu, jądro i środek planu Zmienna naturalna, z i Dolna wartość graniczna Jądro i środek planu oraz obszar eksperymentu a) (zmienna kodowana, x i ) ( 1,682) ( 1) (0) ( 1) ( 1,682) a) dla trzech zmiennych (k=3) wartość ramienia gwiezdnego wynosi a 1,682 Górna wartość graniczna z 1 ( C) 40 98,2 105 115 125 131,8 140 z 2 (gtol/gkw) 0,42 0,48 0,65 0,90 1,15 1,32 4,0 z 3 (mgkat/gkw) 2,5 8,2 15 25 35 41,8 50

Wybór, przygotowanie i wykonanie Planu E Z wybranych trzech zmiennych utworzono i wykonano pełny plan czynnikowy, 2 3, oraz trzy doświadczenia w centrum planu (x 1 =x 2 =x 3 =0) w celu sprawdzenia powtarzalności wyników. Dążąc do wyższej wydajności, zrobiono doświadczenia w pkt. gwiezdnych (dla 3 zm. (k=3) ramię gwiezdne wynosi a=1,682) oraz trzy dodatkowe doświadczenia w centrum planu, tym samym wykonano plan rotatabilny drugiego stopnia. Doświadczenia zawsze wykonywano w kolejności losowej.

Plan czynnikowy 2 3 : macierz eksperymentu a) oraz wyniki, otrzymane i obliczone z modelu liniowego Nr dośw. Zmienne kodowane x 1 x 2 x 3 otrzymane y 1 obliczone ŷ 1 Wyniki otrzymane y 2 obliczone ŷ 2 1 1 1 1 91,0 92,8 0,1569 0,083 2 1 1 1 94,0 93,0 0,1550 0,157 3 1 1 1 88,7 89,6 0,3261 0,318 4 1 1 1 91,4 89,8 0,3110 0,392 5 1 1 1 94,4 92,3 0,1053 0,162 6 1 1 1 91,2 92,5 0,2202 0,236 7 1 1 1 89,6 89,1 0,3712 0,397 8 1 1 1 88,0 89,3 0,5687 0,471 9 0 0 0 90,4 91,0 0,1693 0,277 10 0 0 0 92,1 91,0 0,1677 0,277 11 0 0 0 91,5 91,0 0,1713 0,277 a) Doświadczenia wykonano z tych samych surowców (w tym średnica KW: 0,2 0,8 mm); w skali 31,5 g (0,21 mol) KW; chlorek benzoilu/kw 3,0 mol/mol; szybkość mieszania: benzoilowanie 250 obr/min, hydroliza i krystalizacja 500 obr/min; czas doreagowania 20 min; ilość toluenu do hydrolizy 3,47 g Tol /g KW ; ilość wody do hydrolizy 2 mol woda /mol KW ; temp. i czas hydrolizy 92 C, 30 min; ilość toluenu do krystalizacji 6,34 g Tol /g KW ; czas krystalizacji ok. 2 h; temp. krystalizacji 72 27 C; temp. filtracji 27 C; przemywanie toluenem 1 x 2,05 g Tol /g KW i wodą 2 x 3,18 g woda /g KW ; suszenie 60 C, 5 kpa, 2 h. (%)

Plan czynnikowy 2 3 : macierz eksperymentu a) warunki standardowe a) Doświadczenia wykonano z tych samych surowców (w tym średnica KW: 0,2 0,8 mm); w skali 31,5 g (0,21 mol) KW; chlorek benzoilu/kw 3,0 mol/mol; szybkość mieszania: benzoilowanie 250 min 1, hydroliza i krystalizacja 500 min 1 czas doreagowania 20 min; ilość toluenu do hydrolizy 3,47 g Tol /g KW ; ilość wody do hydrolizy 2 mol woda /mol KW ; temp. i czas hydrolizy 92 C, 30 min; ilość toluenu do krystalizacji 6,34 g Tol /g KW ; temp. i czas krystalizacji 72 27 C; ok. 2 h; temp. filtracji 27 C; przemywanie toluenem 1x 2,05 g Tol /g KW i wodą 2x 3,18 g woda /g KW ; suszenie 60 C, 5 kpa, 2 h.

Plan rotatabilny: macierz eksperymentu a) oraz wyniki, otrzymane i obliczone z modelu drugiego stopnia Nr dośw. Zmienne kodowane x 1 x 2 x 3 otrzym. y 1 oblicz. ŷ 1 otrzym. y 2 Wyniki otrzym. oblicz. ŷ 2 y 3 oblicz. ŷ 3 otrzym. y 4 (%) (min) (%) oblicz. ŷ 4 1 1 1 1 91,0 89,9 0,1569 0,226 110 116 1,63 1,54 2 1 1 94,0 93,6 0,1550 0,268 40 38 1,29 1,7 3 1 1 1 88,7 88,2 0,3261 0,310 160 171 1,23 1,46 4 1 1 1 91,4 92,5 0,3110 0,386 110 98 1,17 1,26 5 1 1 1 94,4 92,6 0,1053 0,049 80 99 2,05 2,03 6 1 1 1 91,2 91,1 0,2202 0,255 40 37 1,00 0,84 7 1 1 1 89,6 89,4 0,3712 0,277 110 119 2,91 2,57 8 1 1 1 88,0 88,5 0,5687 0,517 60 61 0,86 1,02 9 0 0 0 90,4 91,5 0,1693 0,171 100 135 0,95 1,54 10 0 0 0 92,1 91,5 0,1677 0,171 180 135 1,02 1,54 11 0 0 0 91,5 91,5 0,1713 0,171 120 135 1,63 1,54 12 0 0 0 91,5 91,5 0,1711 0,171 120 135 1,74 1,54 13 0 0 0 91,5 91,5 0,1702 0,171 100 135 1,94 1,54 14 0 0 0 92,0 91,5 0,1744 0,171 190 135 1,97 1,54 15 1,68 0 0 90,1 92,0 0,0911 0,158 200 177 3,79 3,96 16 1,68 0 0 95,3 94,3 0,4884 0,396 50 63 3,06 2,80 17 0 1,68 0 90,5 92,2 0,2541 0,168 60 52 0,43 0,39 18 0 1,68 0 89,3 88,5 0,3978 0,459 120 118 0,52 0,47 19 0 0 1,68 89,1 89,3 0,4011 0,267 100 102 1,08 0,74 20 0 0 1,68 87,6 88,3 0,1198 0,228 70 58 0,70 0,95

Opracowanie i ocena wyników Po wykonaniu liniowego planu czynnikowego typu 2 3, stosując równanie macierzowe, metodą najmniejszych kwadratów obliczono współczynniki liniowego równania regresji w zm. kodowanych. Wydajność KDBW, ŷ 1 (%) ŷ 1 = 91,04 +0,11x 1 1,61x 2 0,24x 3 Na podstawie wyników 3 powtórzeń (x 1 =x 2 =x 3 =0) obliczono wariancję powtarzalności, 0,7433, odchylenie standardowe, s powt 0,8622, a na podst. wyników planu odchylenie standardowe współczynników regresji, s b,i 0,3048, oraz wartości t obl,i tabela. 2 s powt Na podst. analizy statystycznej wyników planu czynnikowego, 2 3 i powtórzeń stwierdzono (test t-studenta), że współczynnik przy zmiennej x 2 jest istotny i (test F), że nie ma podstaw do odrzucenia hipotezy o adekwatności modelu liniowego. Porównano uzyskane wyniki, y 1, i wartości obliczone z modelu, ŷ 1.

Wyniki analizy statystycznej równania 2 rzędu, ŷ 1 a) Które współczynniki równania regresji są istotne? (test t-studenta) 2 s powt = 0,7433 s powt = 0,8622 s b,i = 0,3048 t kryt (0,05; 2) = 4,30 i b i t obl,i istotność b i? 0 91,04 298,66 Tak 1 0,11 0,37 Nie 2 1,61 5,29 Tak 3 0,24 0,78 Nie Czy wybrane równanie jest adekwatne? (test F) 2 s reszt = 3,911 F kryt (0,05; 4; 2) = 19,25 stopnie swobody: 4, 2 poziom ufności: 95% F obl = 5,26 Tak b) a) Liczba doświadczeń N=8, liczba współczynników k=4, liczba powtórzeń n=3. b) Nie ma podstaw do odrzucenia hipotezy, że równanie jest adekwatne.

Opracowanie i ocena wyników Wykonano plan czynnikowy 2 3 i poprawiono wydajność procesu (80% 90%). Dążąc do lepszych wyniku i modelu, wykonano jeszcze dośw. w punktach* i trzy powtórzenia, czyli plan rotatabilny drugiego stopnia i obliczono współczynniki kwadratowego równania regresji. Na podstawie 6 powtórzeń (x 1 =x 2 =x 3 =0) obliczono wariancję powtarzalności, 2 s powt 0,364, i odchylenie standardowe, s powt 0,6033, a na podst. planu odchylenia standardowe współczynników regresji, s b,i, i wartości t obl,i. Stwierdzono, (test t-studenta), istotność współczynników przy zmiennych x 1, 2 2 x 2, x 1 x 3, i, ale (test F), model kwadratowy ŷ 1 nie jest adekwatny. x 1 x 3 Bez nieistotnych współczynników (poza kwadratowymi) otrzymano model: ŷ 1 = 91,47 +0,71 x 1 1,09 x 2 1,31 x 1 x 3 +0,59 0,40 0,95 Z porównania wyników, y 1, i wartości wyznaczonych z modeli, ŷ 1 wynika, że model drugiego rzędu (nieadekwatny) lepiej odzwierciedla otrzymane wyniki. Zależność wydajności KDBW, ŷ 1, od ilości toluenu, x 2, i kwasu siarkowego, x 3, w stałej, optymalnej temp., x 1 1,682, (MS Excel, Solver) pokazano na wykresie. 2 x 1 2 x 2 2 x 3

Ocena uzyskanych wyników Które współczynniki równania regresji są istotne? (test t-studenta) 2 s powt 0,3640 s powt 0,6033 t kryt (0,05; 5) 2,57 i b i s b,i t obl,i istotność b i? 0 91,474 0,246 371,75 Tak 1 0,706 0,163 4,33 Tak 2 1,092 0,163 6,69 Tak 3 0,324 0,163 1,98 Nie 12 0,163 0,213 0,76 Nie 13 1,313 0,213 6,15 Tak 23 0,388 0,213 1,82 Nie 11 0,591 0,159 3,72 Tak 22 0,398 0,159 2,51 Nie 33 0,946 0,159 5,96 Tak Czy wybrane równanie jest adekwatne? (test F) 2 sreszt 1,646 ; 2 sad 2,927 F kryt (0,05; 5; 5) 5,05 stopnie swobody: 5, 5 poziom ufności: 95% F obl 8,04 nie b)

Ocena uzyskanych wyników Zależność wydajności KDBW, ŷ 1, od ilości toluenu, x 2 i kwasu siarkowego, x 3. Temp., x 1 1,682.

Ocena uzyskanych wyników Zal. absorbacji UV, ŷ 2, od ilości toluenu, x 2, i kwasu siarkowego, x 3. Temp., x 1 1,682.

Ocena uzyskanych wyników Zal. czasu wydziel. HCl, ŷ 3, od ilości toluenu, x 2, i kwasu siarkowego, x 3.Temp., x 1 1,682

Ocena uzyskanych wyników Zależność zawartości kwasu benzoesowego w KDBW, ŷ 4, od ilości toluenu, x 2, i kwasu siarkowego, x. Temperatura syntezy, x =1,682.

Wyciągnięcie wniosków i podjęcie decyzji Zbadano wpływ temperatury, x 1, oraz ilości toluenu, x 2, i katalizatora, x 3, na wydajność KDBW, y 1. Na podstawie obliczonego modelu stwierdzono, że w zbadanym obszarze wydajność, ŷ 1, rośnie ze wzrostem temperatury, x 1, a maleje ze wzrostem ilości toluenu, x 2, i katalizatora, x 3. Otrzymano KDBW z wydajnością 88 95%. Przyjęto maks temperaturę, (z 1 131,8 C) (punkt * (x 1 1,682). Za pomocą MS Excel, Solver obliczono maksimum modelu wydajności, ŷ 1 96,1%, dla x 2 0,4 i x 3 1,3. Na wykresie widać, że najkorzystniejszy przedział wartości zmiennych wejściowych to: x 2 0,8 0 i x 3 1,6 1,0.

Wyciągnięcie wniosków i podjęcie decyzji Wyniki absorbancji UV, y 2, różnią się istotnie od wartości oblicz. ale minimum na wykresie modelu kwadratowego, ŷ 2, występuje w obszarze maksimum wydajności, ŷ 1. Mało toluenu i katalizatora, x 2, x 3 < 0 mniejsza absorbancja UV, ŷ 2, to mniej zesmoleń, jaśniejszy produkt. Na wykresie czas wydzielania HCl, ŷ 3, od ilości toluenu, x 2, i katalizatora, x 3, widać maksimum, ŷ 3 71,8 min, dla x 2 0,7 i x 3 0,3. Mniej toluenu, x 2, i katalizatora, x 3, w kierunku optimum dla wydajności, ŷ 1, (x 2 0,4, x 3 1,3) skracanie czasu wydzielania HCl, ŷ 3, czyli szybsza reakcja, ale ostrożnie! przy dużej szybkości wydzielania HCl konieczne zapewnienie skutecznej absorpcji.

Wyciągnięcie wniosków i podjęcie decyzji Zaskakująco dobry model dla zanieczyszczenia KDBW kwasem benzoe, ŷ 4. Mogło być trudno zauważyć wpływ warunków syntezy BDBW na zawartość KB w KDBW otrzymywanym na końcu całego procesu. Wykres ŷ 4 jest podobny do wykresu ŷ 1, z maksimum (najgorszy wynik), ŷ 4 3,10%, dla x 2 = 0,4 i x 3 = 1,2. Absorbancja UV, y 2, i czas wydzielania HCl, y 3, zależą od warunków I etapu (temperatura, ilość toluenu i kwasu siarkowego), a na dwie pozostałe, wydajność, y 1, i czystość produktu, y 4, mają wpływ dodatkowo filtracja, przemycie i suszenie KDBW. Mimo standaryzacji II etapu, wyniki tych zmiennych mogą być obarczone większymi błędami.

Wyciągnięcie wniosków i podjęcie decyzji Ustalono optymalne warunki dla maksymalizacji wydajności, ŷ 1 : temperatura syntezy x 1 = 0 +1 z 1 = 125 132 C ilość toluenu x 2 = 0,8 0 z 2 = 0,7 0,9 g Tol /g KW ilość katalizatora x 3 = 1,6 1,0 z 3 = 9 15 mg Kat /g KW Otrzymano KDBW o odpowiedniej czystości, z wyd. 92,5%. Były to wytyczne do powiększania skali, np. w reaktorze 100 L. Warunki optymalne mogą być różne w zal. od skali procesu i rozwiązań technicznych kolbę można zanurzyć do gorącego termostatu, ogrzewanie reaktora trwa dłużej. Dążąc do szybkiego osiągnięcia temperatury, nie przekrocz dopuszcz szybkości wydziel HCl, szczególnie na początku reakcji. Modele matematyczne mogą być różne, ale wykresy podobne co ułatwia przewidywanie zależności procesowych.