MODELOWANIE SKALI ODDZIAŁYWANIA ŹRÓDEŁ ZANIECZYSZCZEŃ ŚRODOWISKA Z WYKORZYSTANIEM ANALIZY GŁÓWNYCH SKŁADOWYCH I REGRESJI LINIOWEJ WIELORAKIEJ
|
|
- Janusz Kowal
- 7 lat temu
- Przeglądów:
Transkrypt
1 MODELOWANIE SKALI ODDZIAŁYWANIA ŹRÓDEŁ ZANIECZYSZCZEŃ ŚRODOWISKA Z WYKORZYSTANIEM ANALIZY GŁÓWNYCH SKŁADOWYCH I REGRESJI LINIOWEJ WIELORAKIEJ Aleksander Astel, Akademia Pomorska w Słupsku, Instytut Biologii i Ochrony Środowiska Jednym z popularnych celów badań analitycznych wybranych komponentów środowiska (np. gleba, woda, osady denne, powietrze) jest identyfikacja źródeł zanieczyszczeń (punktowych, obszarowych bądź liniowych) dla oszacowania skali ich oddziaływania oraz kategoryzacji komponentów środowiskowych na podstawie stopnia ich zanieczyszczenia. Identyfikowanie źródeł zanieczyszczeń docierających do miejsca receptora (lokalizacji, w której realizuje się program pomiarowy) nie jest zadaniem łatwym i wymaga zastosowania różnych metod badawczych. W zakresie analityki środowiskowej wymagane jest wcześniejsze uzyskanie serii czasowych szeregu danych, najczęściej fizykochemicznych, na podstawie których wyznacza się tzw. ślady źródeł (ang. fingerprints) i ocenia ich ładunek, zaś w zakresie opracowania danych pomocne okazuje się zastosowanie modeli statystycznych. Zastosowanie odpowiednich metod modelowania do identyfikacji źródeł emisji pozwala na wyodrębnienie grup (czynników) najbardziej skorelowanych wartości stężeń analitów i wartości parametrów fizycznych, a następnie nadanie im interpretacji merytorycznej i powiązanie z konkretnymi źródłami emisji (np. energetyka, transport, erozja geologiczna, oddziaływanie aerozoli morskich). Dodatkowo techniki modelowania umożliwiają ilościowe Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 27
2 oszacowanie skali oddziaływania zidentyfikowanych źródeł, jak również określenie ładunków różnych substancji docierających do lokalizacji receptora (ang. receptor oriented models) z różnych źródeł. Źródła literaturowe podają wysoką efektywność modeli receptorowych w ocenie ilościowej skali oddziaływania źródeł emisji zanieczyszczeń powietrza atmosferycznego (bezpośrednio [1,2], lub pośrednio na podstawie analizy chemizmu opadów atmosferycznych [3,4]), gleb [5] oraz osadów w zbiornikach wód powierzchniowych [6,7] na terenach narażonych na antropopresję. Z tego względu w niniejszym opracowaniu przedstawiono możliwość zastosowania regresji liniowej wielorakiej (ang. Multiple Linear Regression Analysis, MLRA) opartej na głównych składowych (ang. Principal Components) do identyfikacji i szacowania skali oddziaływania źródeł zanieczyszczeń powietrza (w oparciu o wyniki analiz pyłu atmosferycznego) oraz osadów dennych. Miejscem lokalizacji receptorów w omawianych przypadkach były odpowiednio miasto Triest we Włoszech oraz rzeka Odra. W obliczeniach wykonanych w pakiecie STATISTICA, oprócz wyliczeń udziałów źródeł w zanieczyszczeniu obserwowanym w miejscu receptora, uwzględniono etap wyznaczania masy poszczególnych substancji emitowanych przez źródła w sumarycznej masie zanieczyszczeń pochodzących z tych źródeł. Analiza głównych składowych (ang. Principal Component Analysis, PCA) Analiza głównych składowych to strategia opracowania danych, której celem jest odkrycie wewnętrznej struktury danych pierwotnych i opisanie jej przy pomocy utajonych, abstrakcyjnych czynników, które z tej struktury wynikają. Jeżeli pomiędzy rozważanymi zmiennymi pierwotnymi istnieją zależności korelacyjne, wówczas liczba składowych stosowanych do opisu danych pierwotnych ulega znacznej redukcji w stosunku do liczby zmiennych pierwotnych. Nowe składowe konstruuje się jako kombinacje liniowe skorelowanych zmiennych pierwotnych w taki sposób, aby każda 28 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
3 kolejna składowa opisywała maksymalną wariancję danych i była ortogonalna do poprzedniej. Cechą charakterystyczną składowych jest możliwość ich wyznaczania w kolejności malejącego zasobu zmienności. W technice analizy głównych składowych zakłada się, że zmienność właściwa jest dużo większa od zmienności niepożądanej (wnoszonej przez niepewność pomiarową, szum) i dlatego na etapie interpretacji uwzględnia się najczęściej kilka pierwszych składowych głównych o największych wartościach własnych. Ponieważ wartości własne składowych same w sobie zawierają informację o części zmienności uwzględnionej przez daną składową, tym samym są źródłem danych dla etapu definiowania kryterium ich istotności. Do najbardziej popularnych i najprostszych kryteriów oceny liczby istotnych składowych zalicza się: kryterium poglądowości gdy celem analizy jest graficzna prezentacja wyników, ograniczenie dotyczy maksymalnej liczby wymiarów wykresu; kryterium zasobu zmienności (procent opisanej zmienności) ustala się wartość progową, która musi zostać osiągnięta przez sumę ładunków zmienności wnoszonych przez poszczególne składowe; najczęściej jako wartość progową przyjmuje się wartość 70%-95%; kryterium jedności (kryterium Kaisera) jako istotne uznaje się te składowe, dla których wartość własna jest równa lub wyższa od jedności; kryterium spadku wartości własnej (kryterium Cattella) określa się kształt tzw. wykresu osypiska (osuwiska). W analizie danych bardzo często zdarza się, że jednoznaczne przypisanie głównym składowym określonej interpretacji merytorycznej jest bardzo trudne. Potrzebę uzyskania składowych umożliwiających choćby przybliżoną interpretację merytoryczną w badaniach środowiskowych realizuje się w praktyce dzięki wykonaniu odpowiedniej rotacji wektorów własnych głównych składowych. Celem rotacji jest uzyskanie przejrzystego układu ładunków czynnikowych, czyli takich, które wyróżniają się wysokimi Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 29
4 wartościami przy niektórych zmiennych i niskimi przy innych, przy czym terminem ładunki czynnikowe określamy współczynniki korelacji pomiędzy zmiennymi pierwotnymi a głównymi składowymi. Po zastosowaniu algorytmu rotacji główne składowe mogą już nie spełniać wymogu stanowiącego, że kolejne z nich zawierają w sobie maksymalną możliwą część zmienności. Są jednak w dalszym ciągu wzajemnie ortogonalne. W przypadku badań monitoringowych środowiska analiza PCA umożliwia wyłonienie składowych tworzonych przez skorelowane ze sobą wyniki oznaczeń parametrów fizykochemicznych, w tym poziomów stężeń analitów w określonej matrycy, co najczęściej jest tożsame z identyfikacją źródeł zanieczyszczeń mających istotny wpływ na jakość ekologiczną badanego elementu ekosystemu. Analiza regresji liniowej wielorakiej (ang. Multiple Linear Regression Analysis, MLRA) Ogólnym celem regresji liniowej wielorakiej jest ilościowe ujęcie zależności pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą). Z sytuacją, w której obserwujemy oddziaływanie nie jednej, a kilku zmiennych niezależnych na zmienną zależną, często spotykamy się w naukach biologicznych lub środowiskowych. Warto wtedy podjąć próbę konstrukcji modelu, który pozwoli analizować związki zmiennej zależnej z całym zbiorem innych zmiennych. Model taki nazywamy modelem regresji wielorakiej. Załóżmy, że rozważamy wpływ zbioru n zmiennych X 1, X 2,..., X n, na zmienną Y. Liniowy model regresji wielorakiej jest wówczas określony równaniem: Y X X... X n n e gdzie: i to współczynniki regresji opisujące wpływ i-tej zmiennej niezależnej na zmienną zależną Y, 30 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
5 e składnik losowy. Współczynniki i są wielkościami teoretycznymi, których precyzyjne wyznaczenie wymagałoby nieskończonej liczby obserwacji, zaś w praktyce badawczej najczęściej mamy do czynienia z szacowaniem tych parametrów na podstawie próby o skończonej liczbie elementów. Z powyższych rozważań wynika zatem następujące oszacowanie równania regresji liniowej wielorakiej: Y a o a X 1 1 a 2 X 2... a n X n gdzie Y jest przewidywaną wartością zmiennej Y, zaś współczynniki a i dla i=1,..., n są ocenami parametrów regresji. Współczynniki te szacuje się metodą najmniejszych kwadratów. Model regresji liniowej wielorakiej ma wiele założeń, lecz trzy podstawowe stanowią iż: jest liniowy względem parametrów regresji; liczba obserwacji w próbie musi być większa lub równa liczbie szacowanych parametrów regresji; żadna ze zmiennych niezależnych nie jest kombinacją liniową innych zmiennych niezależnych. Regresja liniowa wieloraka oparta na głównych składowych (PCA-MLRA) Opisane powyżej założenia modelu regresji liniowej wielorakiej sprawiają, że jako zestaw zmiennych niezależnych można w nim z powodzeniem wykorzystać główne składowe z modelu PCA, ponieważ najczęściej wyznacza się ich dużo mniej w porównaniu z liczbą zmiennych, jak również wszystkie główne składowe spełniają warunek Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 31
6 wzajemnej ortogonalności, a więc żadna z nich nie jest kombinacją liniową pozostałych składowych. Źródła literaturowe podają, że ilościowe szacowanie skali oddziaływania źródeł (ang. source apportionment), jak również określanie ładunków różnych substancji docierających do lokalizacji receptora z tychże źródeł można wykonać w oparciu o algorytm zaproponowany przez Thurstona i Spenglera [8]. Autorzy sugerują w nim następujący tok postępowania: 1. standaryzacja zmiennych według równania: Z ki X X s ki i, i gdzie X ik to wartość zmiennej dla danego obiektu, X i to średnia wartość zmiennej w próbie, s i to wartość odchylenia standardowego zmiennej w próbie, k=1,2,...,m to liczba obiektów, zaś i=1,2,..., n to liczba zmiennych, 2. wyznaczenie głównych składowych wraz z macierzami współrzędnych czynnikowych przypadków oraz współczynników wartości czynnikowych, 3. wyznaczenie wartości tzw. przypadku zerowego (ang. zero day): X 0 i ( Z 0 ) i, si 4. wyznaczenie wartości całkowitych współczynników wartości czynnikowych: P n 0 j Bij ( Z0 ) i i 1, gdzie j=1,2,...,p oznacza liczbę zidentyfikowanych źródeł (głównych składowych), zaś B ij to kolejne współczynniki wartości czynnikowych, 32 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
7 5. wyznaczenie macierzy wartości całkowitych współrzędnych czynnikowych przypadków (ang. Absolute Principal Component Scores): [, APCS ] kxj [ P] kxj P0 j 6. wyznaczenie równania regresji liniowej wielorakiej, w której zmienną niezależną stanowi całkowita masa ładunków zanieczyszczeń wyznaczonych w lokalizacji receptora w chwili pomiaru: M k a p a APCS 0 j kj, j 1 gdzie a APCS j kj jest całkowitym ładunkiem zanieczyszczeń wprowadzonym przez zidentyfikowane źródło j. 7. wyznaczenie równania regresji liniowej wielorakiej, w której zmienną niezależną jest ładunek i-tego zanieczyszczenia dla k-tego obiektu, zaś zmienne zależne stanowią ładunki zanieczyszczeń j-tego źródła dla k-tego obiektu: C k b p b S 0 j kj, j 1 gdzie Skj a j APCS kj, S j kj b jest ładunkiem danego zanieczyszczenia wprowadzonym przez zidentyfikowane źródło j. W powyższych wzorach m to liczba obiektów, n to liczba zmiennych, a p to liczba źródeł. Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 33
8 Identyfikacja i szacowanie skali oddziaływania źródeł zanieczyszczeń powietrza na podstawie oznaczania składu chemicznego pyłu atmosferycznego Ilościowe szacowanie skali oddziaływania zidentyfikowanych źródeł oraz ładunków różnych substancji docierających do lokalizacji receptora z tychże źródeł za pomocą regresji liniowej wielorakiej opartej na głównych składowych wykonuje się najczęściej w oparciu o wyniki analiz składu chemicznego pyłu atmosferycznego [1]. Omówienie możliwości zastosowania ww. schematu obliczeń przedstawiono na przykładzie wyników oznaczeń głównych składników jonowych (Cl -, SO 2-4, NO - 3, C 2 O 2-4 ), węgla pierwiastkowego (WE) i organicznego (WO) oraz wielopierścieniowych węglowodorów aromatycznych (WWA, które nie wywołują efektu kancerogennego NR_WWA_suma, BaA (benzo(a)antracen), chryzen, BeP (benzo(e)piren), BbF (benzo(b)fluoranten), BkF (benzo(k)fluoranten), BaP (benzo(a)piren), DBahA (dibenzo(a,h)antracen), BghiP (benzo(g,h,i)perylen), I123P (indeo(1,2,3-c,d)perylen)) w próbkach pyłu o średnicy aerodynamicznej 2,5 μm, który pobierano w dwóch lokalizacjach w Trieście (Włochy) w sezonach letnim i zimowym. Jedna z lokalizacji (Svevo) była narażona na emisję związaną z transportem pojazdów i aktywnością przemysłową (huta żelaza z piecem węglowym), zaś druga (Muggia) byłą lokalizacją położoną na terenie mariny portowej. Na podstawie uzyskanych danych analitycznych utworzono 4 macierze danych pierwotnych o różnej liczbie wierszy dla każdej z lokalizacji z uwzględnieniem podziału sezonowego i 17 kolumnach. Różna liczba wierszy macierzy (od 33 do 35) wynikała z różnej liczby próbek pobranych do analizy w poszczególnych lokalizacjach. Dane autoskalowano, a następnie poddano analizie głównych składowych. Nadanie interpretacji merytorycznej głównym składowym w oparciu o zestawy najwyższych wartości ładunków czynnikowych zmiennych dla poszczególnych składowych pozwoliło zidentyfikować większość źródeł kształtujących ogólny poziom zanieczyszczenia w badanych lokalizacjach: Muggia (lato): aerozole morskie, źródło mieszane (emisja niska i spalanie paliw), transport drogowy, źródło specyficzne, 34 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
9 Muggia (zima): spalanie węgla, źródło mieszane (emisja niska i spalanie paliw), transport drogowy, Svevo (lato): aerozole morskie, spalanie węgla i innych paliw, emisja niska, transport drogowy, Svevo (zima): spalanie węgla, źródło mieszane (emisja niska i spalanie paliw), transport drogowy, źródło specyficzne. Na rys. 1a-d przedstawiono wartości ładunków czynnikowych zmiennych, interpretację głównych składowych oraz procentową ilość wariancji wyjaśnianej przez główne składowe wyznaczone na podstawie wyników oznaczeń składu chemicznego pyłu. Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 35
10 36 Copyright StatSoft Polska 2014,
11 Rys. 1. Wartości ładunków czynnikowych zmiennych oraz procentowa ilość wariancji wyjaśnianej przez główne składowe. Tabela 1. Ilościowy udział źródeł zanieczyszczeń wpływających na profil chemiczny pyłu w Trieście. Muggia Svevo Transport drogowy Emisja niska Spalanie Lato Zima Lato Zima 8% (0,8±0,4 μg m -3 ) 74% (7,8±3,8 μg m -3 ) 16% (2,3±2,0 μg m -3 ) 91% (12,9±5,1 μg m -3 ) 4% (0,5±0,5 μg m -3 ) 45% (5,1±2,8 μg m -3 ) 39% (4,4±2,1 μg m -3 ) Źródło specyficzne Aerozol morski Udział nieznanych źródeł 13% (1,4±0,5 μg m -3 ) 7% (0,7±0,3 μg m -3 ) R 0,96 R 2 0,92 2% (0,3±0,5 μg m -3 ) 69% (10,0±6,8 μg m -3 ) 37% (5,4±3,8 μg m -3 ) 4% (0,6±1,2 μg m -3 ) ,96 0,91 15% (1,7±0,2 μg m -3 ) 0,97 0,94-0,98 0,96 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 37
12 Znajomość całkowitej masy pyłu, macierzy współrzędnych czynnikowych przypadków oraz współczynników wartości czynnikowych umożliwiła wykonanie obliczeń regresji liniowej wielorakiej w oparciu o główne składowe, na podstawie których wyznaczono ilościowy udział zidentyfikowanych źródeł zanieczyszczeń wpływających na profil chemiczny pyłu w Trieście. Odpowiednie dane zestawiono w tabeli 1 (powyżej). Identyfikacja i szacowanie skali oddziaływania źródeł zanieczyszczeń osadów dennych Omówienie możliwości zastosowania regresji liniowej wielorakiej opartej na głównych składowych do identyfikacji i szacowania skali oddziaływania źródeł zanieczyszczeń przedstawiono także na przykładzie wyników oznaczeń Cd, Pb, Cr, Zn, Cu, Mn, Ni i Fe w próbkach osadów dennych pobranych z dwu przeciwległych nabrzeży oraz środka nurtu rzeki Odry na odcinku 75 km w siedmiu różnych lokalizacjach (w jednej lokalizacji próbkę pobrano tylko z brzegu lewego) [6]. Uzyskane wyniki utworzyły macierz danych pierwotnych o 19 wierszach i 8 kolumnach. W tabeli 2 przedstawiono wybrane statystyczne parametry opisowe pomiarów stężeń Cd, Pb, Cr, Zn, Cu, Mn, Ni oraz Fe w próbkach osadów dennych. W związku z tym, że różnice w wyznaczonych wartościach stężeń dla niektórych analitów przekraczały trzy rzędy wielkości, dane poddano standaryzacji, co doprowadziło do ujednolicenia wartości wariancji wszystkich zmiennych do wspólnej wartości równej jeden a następnie wykonano analizę głównych składowych w celu analizy wewnętrznej struktury danych pierwotnych. Uzyskano komplet ośmiu możliwych składowych, a ich wartości własne, skumulowane wartości własne, procentowy udział wyjaśnionej wariancji, jak również skumulowany procent wyjaśnionej wariancji zestawiono w tabeli Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
13 Tabela 2. Wartości wybranych statystycznych parametrów opisowych wyników oznaczeń zawartości Cd, Pb, Cr, Zn, Cu, Mn, Ni oraz Fe w próbkach osadów dennych rzeki Odry. Analit [mg/kg suchej masy] N ważnych Wartość średnia Wartość minimalna Wartość maksymalna Odchylenie standardowe Cd 19 4,09 2,93 7,87 1,05 Pb 19 46,38 21,23 163,35 33,99 Cr 19 9,54 1,57 47,47 13,76 Zn ,03 28,05 471,31 121,04 Cu 19 24,09 11,45 88,31 21,07 Mn ,09 47, ,52 282,15 Ni 19 13,80 5,11 31,03 5,65 Fe , , , ,63 Tabela 3. Wartości własne głównych składowych oraz ich procentowy udział w wyjaśnianiu zmienności pierwotnego zestawu danych. Główna składowa Wartość własna Wyjaśniana wariancja [%] Skumulowana wartość własna Skumulowana wyjaśniana wariancja [%] 1 5,72 71,50 5,72 71,50 2 1,34 16,73 7,06 88,24 3 0,38 4,80 7,44 93,04 4 0,29 3,67 7,74 96,71 5 0,11 1,38 7,85 98,09 6 0,09 1,17 7,94 99,26 7 0,04 0,55 7,98 99,81 8 0,02 0,19 8,00 100,00 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 39
14 Jak wynika z informacji przedstawionych w tabeli 3 osiem głównych składowych wyjaśnia 100% wariancji zestawu danych pierwotnych, przy czym już dwie pierwsze wyjaśniają ponad 85% zmienności. W związku z tym, stosując zarówno kryterium Kaisera, jak i kryterium Cattella za istotne uznano dwie pierwsze składowe. Jak wspominano powyżej, główne składowe są z definicji abstrakcyjnymi tworami matematycznymi i zwykle nie powinno się im nadawać bezpośredniej interpretacji merytorycznej. Można to zrobić po zastosowaniu algorytmu rotacji. W związku z tym układ dwóch głównych składowych poddano rotacji VARIMAX. Na rys. 2 w formie wykresów, na których współrzędne są wartościami ładunków czynnikowych (ang. factor loadings), przedstawiono położenie zmiennych w przestrzeni dwóch głównych składowych przed i po rotacji VARIMAX. a) 40 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
15 b) Rys. 2. Położenie zmiennych w przestrzeni głównych składowych przed (2a) oraz po (2b) rotacji VARIMAX. Pierwszą główną składową uznano za zanieczyszczenia, które mogą przedostawać się do wody rzecznej, a następnie kumulować się w osadach dennych, w procesach emisji wywołanej przetwórstwem metali, rolnictwem czy też w przemyśle okrętowym, a anality tworzące tę grupę określono jako pochodzenia antropogenicznego. Drugą główną składową uznano za zanieczyszczenia, które mogą być wprowadzone do wody rzecznej, a następnie kumulowane w osadach dennych, w procesie płukania filtrów stosowanych przy uzdatnianiu wody głębinowej. Anality tworzące tę grupę określono jako pochodzenia naturalnego. W kolejnym etapie eksploracji danych zastosowano analizę regresji liniowej wielorakiej, w której sumaryczną masę metali oraz rotowane wartości Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 41
16 czynnikowe dwóch głównych składowych wykorzystano do ilościowego oszacowania skali oddziaływania źródła antropogenicznego i naturalnego, jak również określenia ładunków metali wprowadzonych do osadów dennych Odry w efekcie oddziaływania tychże źródeł. Ustalono, że sumarycznej zawartości metali w osadach Odry nie można wyjaśnić całkowicie, bazując jedynie na dwóch zidentyfikowanych źródłach i w równaniu regresji liniowej występuje statystycznie istotny wyraz wolny, który odpowiada za 4,43% całkowitej ilości metali, co stanowi 554,21mg kg -1. Całkowity ładunek metali w osadach oszacowano na 12510,45 mg kg -1, przy czym źródło antropogeniczne odpowiada za 9,04% (1130,94 mg kg -1 ), zaś źródło naturalne za 86,53% (10825,29 mg kg -1 ). W tabeli 4 zestawiono masę każdego z analizowanych metali z uwzględnieniem jego pochodzenia ze źródła antropogenicznego i naturalnego. Tabela 4. Ładunek metali występujących w osadach rzeki Odry z uwzględnieniem źródła ich pochodzenia. Metal Wyraz wolny [%] Źródło antropogeniczne [%] Źródło naturalne [%] Wartość zmierzona [mg kg -1 ] Wartość oszacowana [mg kg -1 ] Cd 10,6 80,1 9,3 7,77 7,82 0,85 Pb 8,4 79,5 12,1 88,11 89,06 0,88 Cr 13,1 66,7 20,2 18,12 17,91 0,83 Zn 8,0 81,6 10,4 224,26 227,77 0,81 Cu 7,8 75,4 16,8 45,77 45,02 0,81 Mn 4,2 8,8 87,1 518,87 521,62 0,84 Ni 9,9 59,8 30,3 26,22 25,55 0,81 Fe 4,3 6,6 89, , ,7 0,84 R 2 Na podstawie analizy wartości procentowych udziału wyrazu wolnego ustalono, że niezidentyfikowane źródła zanieczyszczeń wprowadzają do osadów mniej niż 15% 42 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
17 całkowitej masy metali, przy czym najwyższy procentowy udział wyrazu wolnego uzyskano dla Cr (13,1%), zaś najniższy dla Mn (4,2%) i Fe (4,3%). Oznacza to, że w przypadku Cr ponad 13,1% zawartości tego metalu w osadach nie zostało wyjaśnione przez model regresji liniowej wielorakiej opartej na głównych składowych. Zidentyfikowane źródło antropogeniczne odpowiada za ponad 60% zawartość Cd, Pb, Cr, Zn i Cu w osadach dennych, zaś źródło naturalne wprowadza blisko 90% całkowitej zawartości Mn i Fe. Oznacza to, że stacja uzdatniania wody zlokalizowana w bezpośrednim sąsiedztwie dużego miasta odgrywa ogromną rolę w kształtowaniu całkowitego poziomu zanieczyszczenia osadów dennych w Odrze, przy czym udział emisji związanej z przetwórstwem metali, rolnictwem czy też przemysłem okrętowym jest ponad 10 razy niższy [6]. Wysokie walory szacunkowe modelu potwierdzono na podstawie analizy wartości współczynników determinancji pomiędzy zmierzonymi i oszacowanymi wartościami stężeń metali w osadach. We wszystkich przypadkach współczynnik determinancji przekraczał wartość 0,8, wahając się od 0,81 dla Zn, Cu i Ni do 0,88 dla Pb. Podsumowanie Regresja liniowa wieloraka oparta na głównych składowych umożliwia efektywne szacowanie skali oddziaływania zidentyfikowanych źródeł zanieczyszczeń, jak również określenie ładunków różnych substancji docierających do lokalizacji receptora. Sprawia to, że PCA-MLRA może być uznana za jeden z typów modeli receptorowych, w których, traktując wartości stężeń analitów w miejscu receptora jako dane wejściowe do modelu, dąży się do przypisania części ładunków zanieczyszczeń oznaczonych w miejscu pobierania próbek do różnych rodzajów źródeł. Jak wykazano w niniejszym artykule modele receptorowe opierają się na równaniach masy i są modelami statystycznymi, w tym sensie, że nie zawierają deterministycznego związku między emisjami a stężeniami czy też depozycjami. Czyni to je potężnym narzędziem modelowania w badaniach monitoringowych wybranych komponentów środowiska. Copyright StatSoft Polska 2014, info@danewiedzasukces.pl 43
18 Literatura 1. Astel A., Cozzutto S., Cozzi F., Adami G., Barbieri P., Tsakovski S., Simeonov V., Seasonal apportionment of the sources of ambient air particulates in the city of Trieste, International Journal of Environment and Pollution, 41(1/2), 70-89, (2010). 2. Song Y., Xie S., Zhang Y., Zeng L., Salmon L.G., Zheng M., Source apportionment of PM2.5 in Beijing using principal component analysis/absolute principal component scores and UNMIX, The Science of the Total Environment, 372(1), , (2006). 3. Tiwari S., Kulshrestha U.C., Padmanabhamurty B., Monsoon rain chemistry and source apportionment using receptor modeling in and around National capital Region (NCR) of Delhi, India, Atmospheric Environment, 41, , (2007). 4. Astel A., Walna B., Kurzyca I., Szczepaniak K., Siepak J., Application of chemometry to the comparison of atmospheric precipitation pollution profiles in urban and ecologically protected areas, Chemia analityczna, 51, , (2006). 5. Zuo Q., Duan Y.H., Yang Y., Wang X.J., Tao S., Source apportionment of polycyclic aromatic hydrocarbons in surface soil in Tianjin, China, Environmental Pollution, 147, , (2007). 6. Astel A., Głosińska G., Sobczyński T., Boszke L., Simeonov V., Siepak J., Chemometrics in the assessment of the sustainable development rule implementation, Central European Journal of Chemistry, 4(3), , (2006). 7. Liu Y., Chen L., Huang Q., Li W., Tang Y., Zhao J., Source apportionment of polycyclic aromatic hydrocarbons (PAHs) in surface sediments of the Huangpu River, Shanghai, China, The Science of the Total Environment, 407(8), , (2009). 8. Thurston G.D., Spengler J.D., A quantitative assessment of source contributions to inhalable particulate matter pollution in metropolitan Boston, Atmospheric Environment, 19(1), 9-25, (1985). 44 Copyright StatSoft Polska 2014, info@danewiedzasukces.pl
ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel
ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA dr inż. Aleksander Astel Gdańsk, 22.12.2004 CHEMOMETRIA dziedzina nauki i techniki zajmująca się wydobywaniem użytecznej informacji z wielowymiarowych
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Prawdopodobieństwo i statystyka
Wykład XV: Zagadnienia redukcji wymiaru danych 2 lutego 2015 r. Standaryzacja danych Standaryzacja danych Własności macierzy korelacji Definicja Niech X będzie zmienną losową o skończonym drugim momencie.
Magdalena Jabłońska-Czapla Eligiusz Kowalski Jerzy Mazierski
ROLA ZANIECZYSZCZEŃ PUNKTOWYCH W DYSTRYBUCJI WYBRANYCH METALI W ZBIORNIKU WODOCIĄGOWYM GOCZAŁKOWICE. Magdalena Jabłońska-Czapla Eligiusz Kowalski Jerzy Mazierski Instytut Podstaw Inżynierii Środowiska
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Statystyka i eksploracja danych
Wykład XII: Zagadnienia redukcji wymiaru danych 12 maja 2014 Definicja Niech X będzie zmienną losową o skończonym drugim momencie. Standaryzacją zmiennej X nazywamy zmienną losową Z = X EX Var (X ). Definicja
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
DOKUMENTACJA SYSTEMU ZARZĄDZANIA LABORATORIUM. Procedura szacowania niepewności
DOKUMENTACJA SYSTEMU ZARZĄDZANIA LABORATORIUM Procedura szacowania niepewności Szacowanie niepewności oznaczania / pomiaru zawartości... metodą... Data Imię i Nazwisko Podpis Opracował Sprawdził Zatwierdził
ANALIZA CZYNNIKOWA Przykład 1
ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Procedura szacowania niepewności
DOKUMENTACJA SYSTEMU ZARZĄDZANIA LABORATORIUM Procedura szacowania niepewności Stron 7 Załączniki Nr 1 Nr Nr 3 Stron Symbol procedury PN//xyz Data Imię i Nazwisko Podpis Opracował Sprawdził Zatwierdził
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.
L a b o r a t o r i u m S P S S S t r o n a 1 W zbiorze Pytania zamieszczono odpowiedzi 25 opiekunów dzieci w wieku 8. lat na następujące pytania 1 : P1. Dziecko nie reaguje na bieżące uwagi opiekuna gdy
Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Problemy zanieczyszczenia powietrza w Polsce i innych krajach europejskich
Problemy zanieczyszczenia powietrza w Polsce i innych krajach europejskich Barbara Toczko Departament Monitoringu i Informacji o Środowisku Główny Inspektorat Ochrony Środowiska 15 listopada 2012 r. Wyniki
JAKOŚĆ POWIETRZA W WARSZAWIE
JAKOŚĆ POWIETRZA W WARSZAWIE Badania przeprowadzone w Warszawie wykazały, że w latach 1990-2007 w mieście stołecznym nastąpił wzrost emisji całkowitej gazów cieplarnianych o około 18%, co przekłada się
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Paweł Kapusta Barbara Godzik Grażyna Szarek-Łukaszewska Małgorzata Stanek. Instytut Botaniki im. W. Szafera Polska Akademia Nauk Kraków
Czasowo-przestrzenna zmienność depozycji metali ciężkich w Puszczy Niepołomickiej wyniki długookresowego biomonitoringu z użyciem mchu Pleurozium schreberi Paweł Kapusta Barbara Godzik Grażyna Szarek-Łukaszewska
CELE ANALIZY CZYNNIKOWEJ
ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna
Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna
RAPORT O STANIE SANITARNYM POWIETRZA W WOJEWÓDZTWIE ŚLĄSKIM W 2009 ROKU
WOJEWÓDZKA STACJA SANITARNO-EPIDEMIOLOGICZNA W KATOWICACH 40-957 Katowice, ul. Raciborska 39, tel. (32) 351 23 00, fax. (32) 351 23 18 RAPORT O STANIE SANITARNYM POWIETRZA W WOJEWÓDZTWIE ŚLĄSKIM W 2009
LABORATORIUM Z FIZYKI
LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI I PRACOWNIA FIZYCZNA C w Gliwicach Gliwice, ul. Konarskiego 22, pokoje 52-54 Regulamin pracowni i organizacja zajęć Sprawozdanie (strona tytułowa, karta pomiarowa)
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 950
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 950 wydany przez POLSKIE CENTRUM AKREDYTACJI 01382 Warszawa, ul. Szczotkarska 42 Wydanie nr 5, Data wydania: 21 września 2012 r. Nazwa i adres INSTYTUT
K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.
Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.
Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki
Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 646
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 646 wydany przez POLSKIE CENTRUM AKREDYTACJI 01-382 Warszawa ul. Szczotkarska 42 Wydanie nr 12 Data wydania: 27 maja 2015 r. Nazwa i adres: AB 646 Kod identyfikacji
ANEKS 5 Ocena poprawności analiz próbek wody
ANEKS 5 Ocena poprawności analiz próbek wody Bilans jonów Zasady ogólne Kontroli jakości danych dokonuje się wykonując bilans jonów. Bilans jonów jest podstawowym testem poprawności wyników analiz chemicznych
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Stacja Kompleksowego Monitoringu Środowiska Puszcza Borecka
Stacja Kompleksowego Monitoringu Środowiska Puszcza Borecka IOŚ PIB Raport U Thanta potoczna nazwa dokumentu Rady Ekonomiczno-Społecznej Organizacji Narodów Zjednoczonych pt. The problems of human environment
Rozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Państwowy Monitoring Środowiska. System Monitoringu Jakości Powietrza w Polsce
Państwowy Monitoring Środowiska System Monitoringu Jakości Powietrza w Polsce na przykładzie województwa dolnośląskiego Departamentu Monitoringu Środowiska Głównego Inspektoratu Ochrony Środowiska Uniwersytet
Modelowanie glikemii w procesie insulinoterapii
Dawid Kaliszewski Modelowanie glikemii w procesie insulinoterapii Promotor dr hab. inż. Zenon Gniazdowski Cel pracy Zbudowanie modelu predykcyjnego przyszłych wartości glikemii diabetyka leczonego za pomocą
Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.
Idea (ang. Principal Components Analysis PCA) jest popularnym używanym narzędziem analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości danych. Jest to metoda nieparametryczna,
Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007
, transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R
Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
Regresja i Korelacja
Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane
Obieg węgla w Morzu Bałtyckim
Obieg węgla w Morzu Bałtyckim Karol Kuliński Zakład Chemii i Biochemii Morza Promotor: Prof. dr hab. inż. Janusz Pempkowiak Finansowanie: Działalność statutowa IOPAN, Temat II.2 Grant promotorski MNiSW
Ocena roczna jakości powietrza w województwie pomorskim - stan w 2014 roku
Ocena roczna jakości powietrza w województwie pomorskim - stan w 2014 roku Adam Zarembski Wojewódzki Inspektorat Ochrony Środowiska w Gdańsku WYDZIAŁ MONITORINGU www.gdansk.wios.gov.pl Pomorski Wojewódzki
Analiza głównych składowych- redukcja wymiaru, wykł. 12
Analiza głównych składowych- redukcja wymiaru, wykł. 12 Joanna Jędrzejowicz Instytut Informatyki Konieczność redukcji wymiaru w eksploracji danych bazy danych spotykane w zadaniach eksploracji danych mają
Analiza współzależności zjawisk
Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.
Znaczenie modelowania w ocenie jakości powietrza. EKOMETRIA Sp. z o.o.
Znaczenie modelowania w ocenie jakości powietrza EKOMETRIA Sp. z o.o. Metody oceny wstępnej i bieżą żącej Pomiary (automatyczne, manualne, wskaźnikowe) Modelowanie Obiektywne szacowanie emisji Modelowanie
Prezentacja przygotowana w ramach realizowanego przez Ośrodek Działań Ekologicznych Źródła projektu Oczyść atmosferę dofinansowanego przez Wojewódzki
Prezentacja przygotowana w ramach realizowanego przez Ośrodek Działań Ekologicznych Źródła projektu Oczyść atmosferę dofinansowanego przez Wojewódzki Fundusz Ochrony Środowiska i Gospodarki Wodnej w Krakowie
Lp. STANDARD PODSTAWA PRAWNA
Zestawienie standardów jakości środowiska oraz standardów emisyjnych Lp. STANDARD PODSTAWA PRAWNA STANDARDY JAKOŚCI ŚRODOWISKA (IMISYJNE) [wymagania, które muszą być spełnione w określonym czasie przez
Badania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
INFOBAZY 2014 VII KRAJOWA KONFERENCJA NAUKOWA INSPIRACJA - INTEGRACJA - IMPLEMENTACJA
Centrum Informatyczne TASK Politechnika Gdańska Instytut Oceanologii Polskiej Akademii Nauk (IO PAN) INFOBAZY 2014 VII KRAJOWA KONFERENCJA NAUKOWA INSPIRACJA - INTEGRACJA - IMPLEMENTACJA Gdańsk Sopot,
Analiza i monitoring środowiska
Analiza i monitoring środowiska CHC 017003L (opracował W. Zierkiewicz) Ćwiczenie 1: Analiza statystyczna wyników pomiarów. 1. WSTĘP Otrzymany w wyniku przeprowadzonej analizy ilościowej wynik pomiaru zawartości
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 325
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 325 wydany przez POLSKIE CENTRUM AKREDYTACJI 01-382 Warszawa, ul. Szczotkarska 42 Wydanie nr 14, Data wydania: 24 kwietnia 2015 r. Nazwa i adres: AB 325
Eliminacja smogu przez zastosowanie kotłów i pieców bezpyłowych zintegrowanych z elektrofiltrem
Eliminacja smogu przez zastosowanie kotłów i pieców bezpyłowych zintegrowanych z elektrofiltrem A. Krupa D. Kardaś, M. Klein, M. Lackowski, T. Czech Instytut Maszyn Przepływowych PAN w Gdańsku Stan powietrza
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Metody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Załącznik nr 2 do uchwały nr 94/17 Sejmiku Województwa Mazowieckiego z dnia 20 czerwca 2017 r.
Załącznik nr 2 do uchwały nr 94/17 Sejmiku Województwa Mazowieckiego z dnia 20 czerwca 2017 r. Opis stanu jakości powietrza w strefie miasto Radom dotyczy roku 2015 1. Lista substancji w powietrzu, ze
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmienn
Analiza czynnikowa Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmiennych, które są bezpośrednio obserwowalne
WYKRYWANIE ZANIECZYSZCZEŃ WODY POWIERZA I GLEBY
WYKRYWANIE ZANIECZYSZCZEŃ WODY POWIERZA I GLEBY Instrukcja przygotowana w Pracowni Dydaktyki Chemii Zakładu Fizykochemii Roztworów. 1. Zanieczyszczenie wody. Polska nie należy do krajów posiadających znaczne
2. Struktura Państwowego Monitoringu Środowiska
2. Struktura Państwowego Monitoringu Środowiska Działalność Państwowego Monitoringu Środowiska z mocy art. 24 ustawy z dnia 20 lipca 1991 r. o Inspekcji Ochrony Środowiska ( Dz. U. z 2002 r. Nr 112, poz.
WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno
WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje
Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera
Wybór optymalnej liczby składowych w analizie czynnikowej Test Równolegości Horn a i test MAP Velicera Wielu badaczy podejmuje decyzje o optymalnej liczbie składowych do wyodrębnienia na podstawie arbitralnych
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Zanieczyszczenie środkowej i dolnej Odry wybranymi metalami ciężkimi w latach na podstawie wyników monitoringu geochemicznego osadów dennych
12 Zanieczyszczenie środkowej i dolnej Odry wybranymi metalami ciężkimi w latach 1991 25 na podstawie wyników monitoringu geochemicznego osadów dennych Grażyna Głosińska, Jerzy Siepak Uniwersytet im. A.
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 646
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 646 wydany przez POLSKIE CENTRUM AKREDYTACJI 01-382 Warszawa ul. Szczotkarska 42 Wydanie nr 13 Data wydania: 5 maja 2016 r. Nazwa i adres: AB 646 Kod identyfikacji
Świadomi dla czystego powietrza
Świadomi dla czystego powietrza Szkolenia z zakresu przeciwdziałania niskiej emisji Zanieczyszczenia powietrza w Polsce Zanieczyszczeniem powietrza atmosferycznego jest wprowadzenie do powietrza substancji
parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
Zielona Góra, październik 2015r. Streszczenie Programu ochrony powietrza dla strefy miasto Zielona - arsen w pyle PM10 1
Streszczenie Programu ochrony powietrza dla strefy miasto Zielona Góra wraz z Planem działań krótkoterminowych ze względu na przekroczenie wartości docelowej arsenu w pyle PM10 Zielona Góra, październik
Zakresy analiz WWA w elementach środowiska
Zakresy analiz WWA w elementach środowiska Maria Włodarczyk-Makuła* W 2004 r. w Parlamencie Europejskim przyjęto postanowienia Konwencji Sztokholmskiej z 2001 r. w sprawie trwałych zanieczyszczeń organicznych
Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb
Współzależność Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb (x i, y i ). Geometrycznie taką parę
Modelowanie przestrzennych rozkładów stężeń zanieczyszczeń powietrza wykonywane w Wojewódzkim Inspektoracie Ochrony Środowiska w Warszawie w ramach
Modelowanie przestrzennych rozkładów stężeń zanieczyszczeń powietrza wykonywane w Wojewódzkim Inspektoracie Ochrony Środowiska w Warszawie w ramach rocznych ocen jakości powietrza Informacje o modelu CALMET/CALPUFF
CO TO JEST CHEMIA ANALITYCZNA?
CO TO JEST CHEMIA ANALITYCZNA? AUTOR DEFINICJI Prof. Ch. N. REILLEY University of North Carolina, Chapel HILL, NC, USA Division of Analytical Chemistry American Chemical Society (ACS) Division of Analytical
Powiat starachowicki
Biuro Studiów i Pomiarów Proekologicznych EKOMETRIA Sp. z o.o. 80-299 Gdańsk, ul. Orfeusza 2 tel. (058) 301-42-53, fax (058) 301-42-52 Informacje uzupełniające do PROGRAMÓW OCHRO Y POWIETRZA dla stref
Szukanie struktury skali mierzącej problematyczne zachowania finansowe.
Szukanie struktury skali mierzącej problematyczne zachowania finansowe. Celem poniższej analizy było stworzenie skali mierzącej problematyczne zachowania finansowej. Takie zachowania zdefiniowano jako
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE
JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE 1 Granica wykrywalności i granica oznaczalności Dr inż. Piotr KONIECZKA Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska ul. G. Narutowicza 11/12
RAPORT 0630/2010_LAF. Kanał Elbląski. ECOWAVE BoŜena Skoblińska ul. Kasprzaka 6/ Szczecin. Pierwiastki
Wessling Polska sp. z o.o. ul. Prof. Michała Bobrzyńskiego 14, 30-348 Kraków ECOWAVE BoŜena Skoblińska ul. Kasprzaka 6/10 71-074 Szczecin Kontakt: Numer tel. e-mail: Ewelina Rydzik +48 (0)12 2 974-660
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Analiza Współzależności
Statystyka Opisowa z Demografią oraz Biostatystyka Analiza Współzależności Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka
X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9
Zadanie W celu sprawdzenia, czy pipeta jest obarczona błędem systematycznym stałym lub zmiennym wykonano szereg pomiarów przy różnych ustawieniach pipety. Wyznacz równanie regresji liniowej, które pozwoli
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 336
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 336 wydany przez POLSKIE CENTRUM AKREDYTACJI 01-382 Warszawa ul. Szczotkarska 42 Wydanie nr 15 Data wydania: 25 lutego 2016 r. Nazwa i adres AB 336 Kod
Testowanie hipotez statystycznych cd.
Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:
Analiza składowych głównych
Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi
WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:
WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH: Zasada podstawowa: Wykorzystujemy możliwie najmniej skomplikowaną formę wykresu, jeżeli to możliwe unikamy wykresów 3D (zaciemnianie treści), uwaga na kolory
Roczne oceny jakości powietrza w woj. mazowieckim Wojewódzki Inspektorat Ochrony Środowiska w Warszawie
Roczne oceny jakości powietrza w woj. mazowieckim Wojewódzki Inspektorat Ochrony Środowiska w Warszawie Warszawa 2013 r. Roczna Ocena Jakości Powietrza Cele przeprowadzania rocznej oceny: klasyfikacja
Analiza składowych głównych idea
Analiza składowych głównych idea Analiza składowych głównych jest najczęściej używanym narzędziem eksploracyjnej analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 463
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 463 wydany przez POLSKIE CENTRUM AKREDYTACJI 01-382 Warszawa ul. Szczotkarska 42 Wydanie nr 16 Data wydania: 11 września 2017 r. Nazwa i adres: AB 463 HPC
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 646
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 646 wydany przez POLSKIE CENTRUM AKREDYTACJI 01-382 Warszawa ul. Szczotkarska 42 Wydanie nr 8 Data wydania: 5 września 2011 r. Nazwa i adres: AB 646 INSTYTUT
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 646
ZAKRES AKREDYTACJI LABORATORIUM BADAWCZEGO Nr AB 646 wydany przez POLSKIE CENTRUM AKREDYTACJI 01-382 Warszawa ul. Szczotkarska 42 Wydanie nr 7 Data wydania: 7 września 2010 r. AB 646 Nazwa i adres INSTYTUT
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana
Szczecin, dnia r.
Szczecin, dnia 20.09.2010r. Realizacja projektu pt. REWITALIZACJA KANAŁU ELBLĄSKIEGO NA ODCINKACH: JEZIORO DRUŻNO MIŁOMŁYN, MIŁOMŁYN ZALEWO, MIŁOMŁYN OSTRÓDA STARE JABŁONKI, Przedsięwzięcie: PRZEBUDOWA
Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.
Teoria błędów Wskutek niedoskonałości przyrządów, jak również niedoskonałości organów zmysłów wszystkie pomiary są dokonywane z określonym stopniem dokładności. Nie otrzymujemy prawidłowych wartości mierzonej
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego