KLASYFIKACJA SPEKTRALNA A SKALE POMIARU ZMIENNYCH 1 1. WPROWADZENIE 2. TYPY SKAL POMIAROWYCH I ICH CHARAKTERYSTYKA
|
|
- Edward Łuczak
- 8 lat temu
- Przeglądów:
Transkrypt
1 PRZEGLĄD STATYSTYCZNY R. LIX ZESZYT MAREK WALESIAK KLASYFIKACJA SPEKTRALNA A SKALE POMIARU ZMIENNYCH 1 1. WPROWADZENIE Analiza skupień bazująca na dekompozycji spektralnej (spectral clustering) rozwija się w literaturze poświęconej wielowymiarowej analizie danych od końca XX w. Nazwa metody klasyfikacja spektralna wywodzi się stąd, że w jednym z jej podstawowych kroków wyznacza się spektrum (widmo) macierzy Laplace a. W matematyce zbiór wartości własnych macierzy nazywa się spektrum (widmem) macierzy (zob. np. [7], s. 182). Podstawowy algorytm klasyfikacji spektralnej dla danych metrycznych zaproponowano w pracy [8]. Inne algorytmy klasyfikacji spektralnej scharakteryzowano m.in. w pracach [10] i [14]. W artykule scharakteryzowano metodę klasyfikacji spektralnej z punktu widzenia skal pomiaru zmiennych. Rozpatrzono jej zastosowanie w klasyfikacji danych nominalnych, porządkowych, przedziałowych oraz ilorazowych. W tym celu w procedurze tej metody przy wyznaczaniu macierzy podobieństwa (affinity matrix) zastosowano funkcję (1) z miarami odległości właściwymi dla danych mierzonych na różnych skalach pomiaru. Dzięki takiemu podejściu dla danych niemetrycznych (nominalnych i porządkowych) możliwe jest pośrednie wzmocnienie skali pomiaru zmiennych. Zaproponowana metoda klasyfikacji spektralnej może być z powodzeniem stosowana we wszystkich zagadnieniach klasyfikacyjnych, w tym dotyczących pomiaru, analizy i wizualizacji preferencji. 2. TYPY SKAL POMIAROWYCH I ICH CHARAKTERYSTYKA W teorii pomiaru rozróżnia się cztery podstawowe skale pomiaru, wprowadzone przez Stevensa w pracy [13]. Skale pomiaru są uporządkowane od najsłabszej do najmocniejszej: nominalna, porządkowa, przedziałowa, ilorazowa. Skale przedziałową i ilorazową zalicza się do skal metrycznych, natomiast nominalną i porządkową do niemetrycznych. Podstawowe własności skal pomiaru przedstawia tab Praca naukowa finansowana ze środków na naukę w latach jako projekt badawczy nr N N nt. Pomiar, analiza i wizualizacja preferencji ujawnionych i wyrażonych z wykorzystaniem metod wielowymiarowej analizy statystycznej i programu R.
2 14 Marek Walesiak Typ skali Nominalna Porządkowa Przedziałowa Ilorazowa * Por. [1], s Źródło: [18], s. 15. Podstawowe własności skal pomiaru Dozwolone przekształcenia Dopuszczalne matematyczne relacje z = f (x), f (x) dowolne równości (x przekształcenie wzajemnie A = x B ), jednoznaczne różności (x A x B ) z = f (x), f (x) dowolna ściśle monotonicznie rosnąca funkcja z = bx + a (b > 0), z R dla wszystkich x zawartych w R, wartość zerowa na tej skali jest zwykle przyjmowana arbitralnie lub na podstawie konwencji* z = bx (b > 0), z R + dla wszystkich x zawartych w R +, naturalnym początkiem skali ilorazowej jest wartość zerowa (zero lewostronnie ogranicza zakres skali) powyższe oraz większości (x A > x B ) i mniejszości (x A < x B ) powyższe oraz równości różnic i przedziałów (x A x B = x C x D ) powyższe oraz równości ilorazów ( x A = x C ) x B x D Tabela 1. Dopuszczalne operacje arytmetyczne zliczanie zdarzeń (liczba relacji równości, różności) zliczanie zdarzeń (liczba relacji równości, różności, większości, mniejszości) powyższe oraz dodawanie i odejmowanie powyższe oraz mnożenie i dzielenie Jedna z podstawowych reguł teorii pomiaru mówi, że jedynie rezultaty pomiaru w skali mocniejszej mogą być transformowane na liczby należące do skali słabszej (por. np. [11], s. 17; [12], s. 19; [16], s. 40; [23]; [24]). Bezpośrednia transformacja skal pomiaru zmiennych polegająca na ich wzmacnianiu nie jest możliwa, ponieważ z mniejszej ilości informacji nie można uzyskać większej jej ilości. W klasyfikacji spektralnej możliwe jest pośrednie wzmocnienie skali pomiaru zmiennych. Pierwotna macierz danych, w której zmienne mierzone są na skali nominalnej lub porządkowej zostaje przekształcona w macierz danych, w której zmienne mierzone są na skali przedziałowej. 3. KLASYFIKACJA SPEKTRALNA DLA RÓŻNYCH SKAL POMIARU ZMIENNYCH Rys. 1 przedstawia trzy pierwsze etapy klasyfikacji spektralnej (występujące także w klasycznej analizie skupień), obejmujące ustalenie zbioru obiektów i zmiennych (po zgromadzeniu danych konstruuje się macierz danych, a w przypadku danych metrycznych w następnym kroku znormalizowaną macierz danych), dobór zmiennych oraz wybór miary odległości. Szczegółową charakterystykę tych etapów zaprezentowano m.in. w pracach [17] i [19].
3 Klasyfikacja spektralna a skale pomiaru zmiennych 15 Rysunek 1. Trzy pierwsze etapy w klasyfikacji spektralnej oraz w klasycznej analizie skupień Źródło: Opracowanie własne. Dalsza procedura klasyfikacji spektralnej obejmuje następujące kroki 2 : 4. Obliczenie symetrycznej macierzy podobieństw A = [A ik ] nxn (affinity matrix) między obiektami, dla której A ii = 0 oraz A ik = exp( σ d ik ) dla i k, (1) gdzie: σ parametr skali, d ik miary odległości dla różnych skal pomiaru ujęte w tab. 2, i, k = 1,...,n numery obiektów. W kroku tym można zastosować do obliczenia elementów macierzy podobieństw A ik (i k) estymatory jądrowe (zob. [6], s ; [9]): jądro gaussowskie, jądro wielomianowe, jądro liniowe, jądro w postaci tangensa hiperbolicznego, jądro Bessela, jądro Laplace a, jądro ANOVA, jądro łańcuchowe (dla danych tekstowych). W oryginalnym algorytmie klasyfikacji spektralnej dla danych metrycznych w pracy [8] zastosowano jądro gaussowskie: A ik = exp( d2 ik ) dla i k, (2) 2σ2 2 Jest to algorytm zaproponowany w pracy [8] (por. [20], [21]). W artykule dokonano jego modyfikacji w kroku 4 przy obliczaniu macierzy podobieństw (affinity matrix).
4 16 Marek Walesiak Miary odległości dla różnych skal pomiaru* Nazwa miary odległości Skala pomiaru zmiennych Funkcja (pakiet) programu R Minkowskiego: miejska (Manhattan); euklidesowa; Czebyszewa (maximum) metryczne dist (stats) Canberra ilorazowe dist (stats) Tabela 2. Braya-Curtisa ilorazowe dist.bc (clustersim) GDM1 metryczne dist.gdm (clustersim) GDM2 porządkowe dist.gdm (clustersim) Sokala i Michenera nominalne dist.sm (clustersim) * Formuły odległości zawiera m.in. praca [18]. Źródło: opracowanie własne. m gdzie: d ik = (z ij z kj ) 2, j=1 z ij, (z kj ) znormalizowana wartość j-tej zmiennej dla i-tego (k-tego) obiektu. 5. Konstrukcja znormalizowanej macierzy Laplace a L = D 1/2 AD 1/2 (D diagonalna macierz wag, w której na głównej przekątnej znajdują się sumy każdego wiersza z macierzy A = [A ik ], a poza główną przekątną są zera). W rzeczywistości znormalizowana macierz Laplace a przyjmuje postać: I L. W algorytmie dla uproszczenia analizy pomija się macierz jednostkową I (zob. [8]). Własności tej macierzy przedstawiono m.in. w pracy [15], s Obliczenie wartości własnych i odpowiadających im wektorów własnych (o długości równej jeden) dla macierzy L. Uporządkowanie wektorów własnych według malejących wartości własnych. Pierwsze u wektorów własnych (u liczba klas) tworzy macierz E = [ ] e ij o wymiarach n u. Podobnie jak w przypadku klasycznym analizy skupień zachodzi potrzeba ustalenia optymalnej liczby klas. Odpowiedni algorytm zaproponował Girolami w pracy [4]. Macierz podobieństw (affinity matrix) A = [A ik ] (dla σ = 1) poddawana jest dekompozycji A = U Λ U T, gdzie U jest macierzą wektorów własnych macierzy A składającą się z wektorów u 1, u 2,...,u n,aλjest macierzą diagonalną zawierającą wartości własne λ 1,λ 2,...,λ n. { } Obliczany jest wektor K = (k 1, k 2,...,k n ), gdzie k i = λ i 1 T 2 n u i (1 T n wektor o wymiarach 1 n zawierający wartości 1/n). Wektor K jest porządkowany malejąco, a liczba jego dominujących elementów (wyznaczona np. poprzez kryterium osypiska) wyznacza optymalną liczbę skupień u, na którą algorytm klasyfikacji spektralnej powinien podzielić zbiór badanych obiektów. / u 7. Przeprowadza się normalizację macierzy E zgodnie ze wzorem y ij = e ij (i = 1,...,n numer obiektu, j = 1,...,u numer zmiennej, u liczba klas). Dzięki j=1 e 2 ij
5 Klasyfikacja spektralna a skale pomiaru zmiennych 17 tej normalizacji długość każdego wektora wierszowego macierzy Y = [ y ij ] jest równa jeden. 8. Macierz Y stanowi punkt wyjścia zastosowania klasycznych metod analizy skupień (proponuje się tutaj wykorzystanie metody k-średnich). Rys. 2 pokazuje wybrane kroki postępowania w klasyfikacji spektralnej i odpowiadające im skale pomiaru. Rysunek 2. Wybrane kroki postępowania w klasyfikacji spektralnej i odpowiadające im skale pomiaru Źródło: Opracowanie własne. Jeśli dane pierwotne X = [x ij ] mierzone są na skali niemetrycznej (porządkowej, nominalnej) w wyniku zastosowania funkcji (1) z jedną z odległości właściwych dla tych skal pomiaru (zob. tab. 2) podobieństwa w macierzy A = [A ik ] mierzone są na skali przedziałowej. Ostatecznie w kroku 7 otrzymuje się metryczną macierz danych Y o wymiarach n u. Pozwala ona na zastosowanie dowolnych metod analizy skupień (w tym metod bazujących bezpośrednio na macierzy danych, np. metodę k-średnich). 4. PARAMETR σ W KLASYFIKACJI SPEKTRALNEJ Parametr σ ma fundamentalne znaczenie w klasyfikacji spektralnej. W literaturze zaproponowano wiele heurystycznych sposobów wyznaczania wartości tego parametru (zob. np. [3]; [9]; [25]). W metodach heurystycznych wyznacza się wartość σ na podstawie pewnych statystyk opisowych macierzy odległości [d ik ]. Lepszy sposób wyznaczania parametru σ zaproponował Karatzoglou w pracy [6]. Poszukuje się takiej
6 18 Marek Walesiak wartości parametru σ, która minimalizuje zmienność wewnątrzklasową przy zadanej liczbie klas u. Jest to heurystyczna metoda poszukiwania minimum lokalnego. Zbliżony koncepcyjnie algorytm znajdowania optymalnego parametru σ zaproponowano w pracy [20]: Krok 0. Wybierana jest próba bootstrapowa X składającą się z n obiektów opisanych wszystkimi m zmiennymi (wartość n jest najczęściej tak dobierana, aby 1 2 n n 3 4n). Początkowy przedział przeszukiwania optymalnej wartości parametru σ ustalany jest jako S 0 = [0; D] (gdzie D oznacza sumę odległości w dolnym trójkącie macierzy odległości a dla kwadratu odległości euklidesowej pierwiastek z sumy odległości w dolnym trójkącie macierzy odległości). Krok 1. Przedział S k (gdzie k oznacza numer iteracji; na początku S k = S 0 ) dzielony jest na przedziały jednakowej długości: pr k = [pr k ; pr k ], r = 1,...,R (R liczba przedziałów w każdej iteracji; domyślnie R = 10). Krok 2. Dla każdego przedziału pr k obliczamy jego środek: σr k = pk r +pr k 2. Dla wszystkich wartości σr k przeprowadzana jest klasyfikacja spektralna zbioru X na ustaloną liczbę klas u. Krok 3. Wybierane jest takie σr k, dla którego zmienność wewnątrzklasowa jest minimalna. Krok 4. Z przedziałem zawierającym wybraną wartość σr k w kroku 3 przechodzi się do kroku 1ikontynuuje procedurę do osiągnięcia zadanej liczby iteracji (domyślnie: 3). 5. OPROGRAMOWANIE W ŚRODOWISKU R Klasyfikację spektralną zgodną z algorytmem zmodyfikowanym w artykule przeprowadza się z wykorzystaniem funkcji speccl pakietu clustersim (zob. [22]): speccl(data,nc,distance="gdm1",sigma="automatic", sigma.interval="default",mod.sample=0.75,r=10,iterations=3) Argumenty: data nc distance macierz danych liczba klas miary odległości z tabeli 2 ("seuclidean" kwadrat odległości euklidesowej, "euclidean" odległość euklidesowa, "manhattan" odległość miejska, "maximum" odległość Czebyszewa, "canberra" odległość Canberra, "BC" odległość Braya- Curtisa, "GDM1" odległość GDM dla danych metrycznych, "GDM2" odległość GDM dla danych porządkowych, "SM" odległość Sokala-Michenera dla danych nominalnych)
7 Klasyfikacja spektralna a skale pomiaru zmiennych 19 sigma sigma.interval mod.sample R iterations parametr skali: sigma="automatic" parametr ustalany automatycznie zgodnie z algorytmem z punktu 4 sigma=200 parametr podany przez użytkownika, np. 200 przedział przeszukiwania parametru sigma: sigma.interval="default" przedział wartości od zera do sumy odległości w dolnym trójkącie macierzy odległości (dla kwadratu odległości euklidesowej do pierwiastka z sumy odległości w dolnym trójkącie macierzy odległości) sigma.interval=1000 przedział wartości od zera do wartości podanej przez użytkownika, np proporcja danych stosowanych do estymacji parametru sigma liczba przedziałów w każdej iteracji maksymalna liczba iteracji Graficzną prezentację wybranych kroków klasyfikacji spektralnej dla danych metrycznych przedstawiających strukturę dwóch klas zobrazowano na rys. 3. Do wygenerowania zbioru danych metrycznych wykorzystano funkcję mlbench.spirals pakietu mlbench (zob. rys. 3a). Do klasyfikacji zbioru obiektów zastosowano metodę klasyfikacji spektralnej wyznaczając w kroku 4 macierz podobieństw zgodnie ze wzorem (1) z odległością GDM1. Rys. 3b i 3c prezentują odpowiednio obiekty z macierzy E o wymiarach (krok 6) oraz obiekty ze znormalizowanej macierz Y = [ y ij ] o wymiarach (krok 7). Graficzną prezentację wybranych kroków klasyfikacji spektralnej dla danych porządkowych przedstawiających strukturę trzech klas zobrazowano na rys. 4. Do wygenerowania zbioru danych porządkowych 3 wykorzystano funkcję cluster.gen pakietu clustersim (zob. rys. 4a). Do klasyfikacji zbioru obiektów zastosowano metodę klasyfikacji spektralnej wyznaczając w kroku 4 macierz podobieństw zgodnie ze wzorem (1) z odległością GDM2. Rys. 4b i 4c prezentują odpowiednio obiekty z macierzy E o wymiarach (krok 6) oraz obiekty ze znormalizowanej macierz Y = [ ] y ij o wymiarach (krok 7). 3 Przy tworzeniu wykresu rozrzutu dla danych porządkowych trzeba wziąć pod uwagę częstość występowania identycznych par kategorii. W funkcji plotcategorial znajduje to wyraz w długości promienia koła.
8 20 Marek Walesiak Rysunek 3. Wybrane etapy klasyfikacji spektralnej dla przykładowego zbioru danych metrycznych wygenerowanego z wykorzystaniem funkcji mlbench.spirals pakietu mlbench Źródło: Opracowanie własne.
9 Klasyfikacja spektralna a skale pomiaru zmiennych 21 Rysunek 4. Wybrane etapy klasyfikacji spektralnej dla przykładowego zbioru danych porządkowych wygenerowanego z wykorzystaniem funkcji clustergen pakietu clustersim Źródło: Opracowanie własne.
10 22 Marek Walesiak 6. ANALIZA PORÓWNAWCZA METOD KLASYFIKACJI SPEKTRALNEJ Z METODAMI ANALIZY SKUPIEŃ DLA DANYCH O ZNANEJ STRUKTURZE KLAS Analizę porównawczą metod klasyfikacji spektralnej z metodami analizy skupień, z uwzględnieniem różnych miar odległości, dla danych o znanej strukturze klas przeprowadzono dla trzech typów danych. W eksperymencie pierwszym i trzecim wykorzystano odpowiednio dane metryczne oraz porządkowe o znanej strukturze klas obiektów wygenerowane z wykorzystaniem funkcji cluster.gen pakietu clustersim na podstawie modeli zawartych w tab. 3. Nr modelu Charakterystyka modeli w analizie symulacyjnej Tabela 3. m nk* u lo środki ciężkości klas Macierz kowariancji ks , , 20, 25, 25, , (1,5; 6, 3), (3; 12; 6) (4,5; 18; 9) (5; 5), ( 3; 3), (3; 3), (0; 0), ( 5; 5) ( 4; 5), (5; 14), (14; 5), (5; 4) , 60, 35 (0; 4), (4; 8), (8; 12) σ jj = 1(1 j 3) σ 12 = σ 13 = 0, 9, σ 23 = 0, 9 σ jj = 1, σ jl = 0, 9 2 σ jj = 1, σ jl = 0 3 [ ] 1 0, 9 Σ 1 = 0, 9 1, [ ] , 4 Σ 2 = [ Σ 3 = 1 0, 9 0, 9 1 * tylko dla danych porządkowych; m liczba zmiennych, nk liczba kategorii (jedna liczba oznacza stałą liczbę kategorii); u liczba klas; lo liczba obiektów w klasach (jedna liczba oznacza klasy równoliczne); ks kształt skupień: a) skupienia dobrze separowalne (1 skupienia wydłużone, 3 skupienia normalne), skupienia słabo separowalne (2 skupienia wydłużone, 4 skupienia zróżnicowane dla klas). Źródło: [21]. Na rys. 5 i 6 przedstawiono graficzną prezentację przykładowych zbiorów danych utworzonych z wykorzystaniem funkcji cluster.gen pakietu clustersim dla danych metrycznych (rys. 5) i danych porządkowych (rys. 6). W eksperymencie drugim zbiory danych zawierające 360 obiektów (zob. rys. 7) wygenerowano z wykorzystaniem funkcji pakietów mlbench (mlbench.spirals), geozoo (dini.surface) oraz zbiorów worms [20] i banana [2]. Dla modeli w każdym eksperymencie wygenerowano 40 zbiorów danych, przeprowadzono procedurę klasyfikacyjną i porównano otrzymane rezultaty klasyfikacji ze znaną strukturą klas przy pomocy skorygowanego indeksu Randa (zob. [5]). ] 1
11 Klasyfikacja spektralna a skale pomiaru zmiennych 23 Rysunek 5. Graficzna prezentacja przykładowych zbiorów danych utworzonych z wykorzystaniem funkcji cluster.gen pakietu clustersim (dane metryczne) Źródło: opracowanie własne z wykorzystaniem programu R.
12 24 Marek Walesiak Rysunek 6. Graficzna prezentacja przykładowych zbiorów danych utworzonych z wykorzystaniem funkcji cluster.gen pakietu clustersim (dane porządkowe) Źródło: opracowanie własne z wykorzystaniem programu R.
13 Klasyfikacja spektralna a skale pomiaru zmiennych 25 Rysunek 7. Przykładowe zbiory danych utworzone z wykorzystaniem funkcji pakietów mlbench (mlbench.spirals), geozoo (dini.surface) oraz zbiorów worms i banana Źródło: opracowanie własne z wykorzystaniem programu R.
14 26 Marek Walesiak Dla danych metrycznych (eksperyment 1 i 2)uwzględniono następujące metody klasyfikacji (z odległościami: (1) kwadrat odległości euklidesowej, (2) odległość euklidesowa, (3) odległość miejska, (4) odległość GDM1): 1. speccl klasyfikacja spektralna; 2. pam metoda k-medoidów; 3. complete metoda kompletnego połączenia; 4. average metoda średniej klasowej; 5. ward metoda Warda; 6. centroid metoda środka ciężkości; 7. diana hierarchiczna metoda deglomeracyjna. Ponadto dla celów porównawczych zastosowano dodatkowo metodę k-średnich, która bazuje bezpośrednio na macierzy danych. Dla danych porządkowych (eksperyment 3) uwzględniono w analizie metody klasyfikacji o numerach 1-7 z odległością GDM2. Tab. 4 prezentuje uporządkowanie analizowanych metod klasyfikacji (z 4 odległościami) według średnich wartości skorygowanego indeksu Randa policzonego z 40 symulacji dla danych metrycznych wygenerowanych w pakiecie clustersim. Tabela 4. Uporządkowanie analizowanych metod klasyfikacji według średnich wartości skorygowanego indeksu Randa dla danych metrycznych wygenerowanych w pakiecie clustersim Poz. Metoda średnia* Kształt skupień Liczba zmiennych zakłócających ward(3) 0,753 1,000 0,983 1,000 0,960 0,985 0,701 0,574 2 average(3) 0,746 0,989 0,974 1,000 0,954 0,979 0,695 0,563 3 pam(3) 0,736 0,999 0,992 1,000 0,967 0,989 0,701 0,517 4 speccl(2) 0,723 1,000 0,953 1,000 0,919 0,968 0,780 0,420 5 diana(3) 0,676 0,934 0,758 0,997 0,791 0,870 0,646 0,513 6 speccl(4) 0,670 0,899 0,851 0,898 0,867 0,879 0,695 0,435 7 speccl(1) 0,658 0,900 0,945 0,925 0,848 0,904 0,767 0,303 8 speccl(3) 0,643 0,950 0,948 0,975 0,884 0,939 0,692 0,298 9 complete(3) 0,632 0,751 0,733 1,000 0,921 0,851 0,573 0, average(4) 0,601 0,989 0,982 1,000 0,943 0,978 0,496 0, average(2) 0,599 1,000 0,975 1,000 0,957 0,983 0,495 0, ward(4) 0,594 1,000 0,978 1,000 0,960 0,984 0,478 0, pam(4) 0,591 1,000 0,975 1,000 0,924 0,974 0,482 0, ward(2) 0,590 1,000 0,979 1,000 0,960 0,985 0,471 0, pam(2) 0,582 1,000 0,992 1,000 0,966 0,989 0,455 0, centroid(3) 0,581 0,878 0,906 1,000 0,923 0,927 0,570 0, pam(1) 0,581 1,000 0,992 1,000 0,967 0,989 0,442 0, average(1) 0,577 1,000 0,973 1,000 0,962 0,984 0,463 0, ward(1) 0,575 1,000 0,979 1,000 0,964 0,986 0,446 0, centroid(4) 0,559 0,989 0,980 1,000 0,946 0,979 0,442 0,256
15 Klasyfikacja spektralna a skale pomiaru zmiennych 27 cd. Tabela diana(2) 0,534 0,988 0,757 0,983 0,846 0,894 0,438 0, centroid(1) 0,513 0,989 0,964 1,000 0,959 0,978 0,371 0, kmeans 0,502 0,819 0,839 0,898 0,967 0,881 0,406 0, diana(4) 0,491 0,966 0,762 0,992 0,582 0,826 0,404 0, diana(1) 0,457 0,988 0,735 0,992 0,678 0,848 0,345 0, complete(4) 0,447 0,894 0,912 1,000 0,886 0,923 0,281 0, complete(2) 0,437 0,960 0,869 1,000 0,931 0,940 0,253 0, complete(1) 0,437 0,960 0,869 1,000 0,931 0,940 0,253 0, centroid(2) 0,427 0,989 0,942 1,000 0,926 0,964 0,298 0,019 * (k8+k9+k10)/3, gdzie k8 = (k4+k5+k6+k7)/4 Liczba w nawiasie przy nazwach metod klasyfikacji: (1) kwadrat odległości euklidesowej, (2) odległość euklidesowa, (3) odległość miejska, (4) odległość GDM1. Źródło: obliczenia własne z wykorzystaniem programu R 4. W przypadku typowych zbiorów danych metrycznych metody klasyfikacji spektralnej sprawdzają się dobrze w odkrywaniu rzeczywistej struktury klas (pozycje: 4, 6,7i8 w zestawieniu). W przeprowadzonym eksperymencie najlepiej strukturę klas odkrywały metody klasyczne (ward, average i pam) z odległością miejską. Wśród metod klasyfikacji spektralnej dominuje klasyfikacja spektralna z odległością euklidesową. Nieco gorsze rezultaty otrzymuje się z wykorzystaniem klasyfikacji spektralnej z odległością GDM1 (poz. 6 w zestawieniu). Tab. 5 prezentuje uporządkowanie analizowanych metod klasyfikacji (z 4 odległościami) według średnich wartości skorygowanego indeksu Randa policzonego z 40 symulacji dla nietypowych danych metrycznych wygenerowanych z wykorzystaniem pakietów mlbench (mlbench.spirals), geozoo (dini.surface) oraz zbiorów worms i banana. Dla nietypowych zbiorów danych metody klasyfikacji spektralnej zdecydowanie lepiej od klasycznych metod analizy skupień odkrywają prawidłową strukturę klas. Klasyfikacja spektralna z odległością GDM1 daje rezultaty lepsze od metod klasyfikacji spektralnej z pozostałymi odległościami. Tab. 6 prezentuje uporządkowanie analizowanych metod klasyfikacji według średnich wartości skorygowanego indeksu Randa policzonego z 40 symulacji dla danych porządkowych wygenerowanych w pakiecie clustersim. W przypadku zbiorów danych porządkowych bez zmiennych zakłócających najlepsza jest metoda Warda. Metoda klasyfikacji spektralnej z odległością GDM2 daje gorsze rezultaty od klasycznych metod analizy skupień (za wyjątkiem metody diana). Należy jednak pamiętać, że zbiory tego typu bardzo rzadko występują w rzeczywistych problemach klasyfikacyjnych. Uwzględnienie zmiennych zakłócających pokazuje wyraźną przewagę metody klasyfikacji spektralnej z odległością GDM2. 4 Skrypty do analiz symulacyjnych z punktu 6 są autorstwa dra Andrzeja Dudka.
16 28 Marek Walesiak Tabela 5. Uporządkowanie analizowanych metod klasyfikacji według średnich wartości skorygowanego indeksu Randa dla danych metrycznych otrzymanych z pakietów mlbench (mlbench.spirals), geozoo (dini.surface) oraz zbiorów worms i banana Poz. Metoda średnia* Zbiory danych spirals worms dini banana speccl(4) 0,837 0,961 0,929 0,916 0,544 2 speccl(3) 0,822 0,901 0,959 0,694 0,736 3 speccl(2) 0,779 0,938 0,985 0,563 0,631 4 speccl(1) 0,741 1,000 0,889 0,407 0,671 5 pam(3) 0,259 0,006 0,438 0,274 0,316 6 average(3) 0,251 0,030 0,468 0,221 0,284 7 ward(3) 0,249 0,034 0,474 0,214 0,276 8 pam(2) 0,220 0,025 0,503 0,184 0,169 9 complete(3) 0,216 0,022 0,440 0,206 0, pam(4) 0,214 0,016 0,519 0,172 0, pam(1) 0,214 0,026 0,517 0,175 0, ward(1) 0,213 0,036 0,499 0,170 0, average(2) 0,211 0,039 0,517 0,152 0, diana(2) 0,211 0,040 0,528 0,155 0, diana(4) 0,210 0,037 0,516 0,158 0, diana(3) 0,209-0,001 0,486 0,181 0, complete(2) 0,209 0,033 0,488 0,141 0, complete(1) 0,209 0,033 0,488 0,141 0, ward(2) 0,208 0,053 0,471 0,144 0, average(4) 0,205 0,029 0,471 0,143 0, kmeans 0,205 0,032 0,519 0,159 0, diana(1) 0,204 0,032 0,515 0,159 0, average(1) 0,204 0,034 0,503 0,150 0, ward(4) 0,202 0,046 0,487 0,142 0, centroid(1) 0,197 0,022 0,520 0,141 0, centroid(4) 0,194 0,038 0,478 0,145 0, complete(4) 0,193 0,041 0,464 0,140 0, centroid(3) 0,170 0,006 0,460 0,134 0, centroid(2) 0,167 0,020 0,487 0,083 0,078 * (k4+k5+k6+k7)/4 Liczba w nawiasie przy nazwach metod klasyfikacji: (1) kwadrat odległości euklidesowej, (2) odległość euklidesowa, (3) odległość miejska, (4) odległość GDM1. Źródło: obliczenia własne z wykorzystaniem programu R.
17 Klasyfikacja spektralna a skale pomiaru zmiennych 29 Tabela 6. Uporządkowanie analizowanych metod klasyfikacji według średnich wartości skorygowanego indeksu Randa dla danych porządkowych wygenerowanych w pakiecie clustersim Poz. Metoda średnia* Kształt skupień Liczba zmiennych zakłócających speccl(5) 0,696 0,998 0,951 0,798 0,777 0,881 0,709 0,497 2 average(5) 0,602 1,000 0,968 1,000 0,962 0,982 0,495 0,327 3 pam(5) 0,593 1,000 0,971 1,000 0,934 0,976 0,483 0,321 4 ward(5) 0,591 1,000 0,971 1,000 0,973 0,986 0,471 0,317 5 centroid(5) 0,560 1,000 0,962 1,000 0,965 0,982 0,451 0,248 6 diana(5) 0,493 0,959 0,753 0,998 0,595 0,826 0,388 0,266 7 complete(5) 0,444 0,882 0,885 1,000 0,851 0,904 0,279 0,149 * (k8+k9+k10)/3, gdzie: k8 = (k4+k5+k6+k7)/4 Liczba (5) w nawiasie przy nazwach metod klasyfikacji oznacza odległość GDM2. Źródło: obliczenia własne z wykorzystaniem programu R. 7. PODSUMOWANIE W artykule zaproponowano modyfikację metody klasyfikacji spektralnej umożliwiającą jej zastosowanie w klasyfikacji danych prezentowanych na różnych skalach pomiaru. W procedurze klasyfikacji spektralnej, zaproponowanej przez autorów Ng, Jordan i Weiss [8], wprowadzono modyfikację polegającą na zastosowaniu funkcji (1) z miarami odległości właściwymi dla danych mierzonych na różnych skalach pomiaru. Dodatkowo dzięki takiemu podejściu pośrednio wzmacnia się skale pomiaru zmiennych. Dane niemetryczne zostają przekształcone w dane przedziałowe. Umożliwia to zastosowanie w klasyfikacji zbioru obiektów m.in. metody k-średnich. Scharakteryzowano funkcję speccl pakietu clustersim umożliwiającą klasyfikację spektralną zgodną z algorytmem zmodyfikowanym w artykule. W tym miejscu wskazać trzeba na ograniczenia związane z klasyfikacją spektralną. Efektywne wykorzystanie metod klasyfikacji spektralnej jest uzależnione od prawidłowego doboru parametru skali σ. W części 4 zaprezentowano heurystyczną metodę poszukiwania minimum lokalnego. W części 6 poświęconej analizie porównawczej metod klasyfikacji spektralnej z metodami analizy skupień dla danych o znanej strukturze klas przeprowadzono analizy symulacyjne dla danych metrycznych oraz porządkowych. Nie uwzględniono badań symulacyjnych dotyczących takiego porównania dla danych nominalnych. Wynikało to z braku metod generowania danych nominalnych o znanej strukturze klas. Uniwersytet Ekonomiczny we Wrocławiu
18 30 Marek Walesiak LITERATURA [1] Ackoff R.L. (1969), Decyzje optymalne w badaniach stosowanych, PWN, Warszawa. [2] Dudek A. (2012), A comparison of the performance of clustering methods using spectral approach, W: J. Pociecha, R. Decker (red.), Data analysis methods and its applications, Wydawnictwo C.H. Beck, Warszawa, [3] Fischer I., Poland J. (2004), New methods for spectral clustering, Technical Report No. IDSIA-12-04, Dalle Molle Institute for Artificial Intelligence, Manno-Lugano, Switzerland. [4] Girolami M. (2002), Mercer kernel-based clustering in feature space, IEEE Transactions on Neural Networks, vol. 13, no. 3, [5] Hubert L., Arabie P. (1985), Comparing partitions, Journal of Classification, no. 1, [6] Karatzoglou A. (2006), Kernel methods. Software, algorithms and applications, Rozprawa doktorska, Uniwersytet Techniczny we Wiedniu. [7] Kolupa M. (1976), Elementarny wykład algebry liniowej dla ekonomistów, Państwowe Wydawnictwo Naukowe, Warszawa. [8] Ng A., Jordan M., Weiss Y. (2002), On spectral clustering: analysis and an algorithm, W: T. Dietterich, S. Becker, Z. Ghahramani (red.), Advances in Neural Information Processing Systems 14, Cambridge, MIT Press, [9] Poland J., Zeugmann T. (2006), Clustering the Google distance with eigenvectors and semidefinite programming, Knowledge Media Technologies, First International Core-to-Core Workshop, Dagstuhl, July 23-27, Germany. [10] Shortreed S. (2006), Learning in spectral clustering, Rozprawa doktorska, University of Washington. [11] Steczkowski J., Zeliaś A. (1981), Statystyczne metody analizy cech jakościowych, PWE, Warszawa. [12] Steczkowski J., Zeliaś A. (1997), Metody statystyczne w badaniach cech jakościowych, Wydawnictwo AE, Kraków. [13] Stevens S.S. (1946), On the theory of scales of measurement, Science, Vol. 103, No. 2684, [14] Verma D., Meila M. (2003), A comparison of spectral clustering algorithms. Technical report UW- CSE , University of Washington. [15] von Luxburg U. (2007), A tutorial on spectral clustering, Max Planck Institute for Biological Cybernetics, Technical Report TR-149. [16] Walesiak M. (1990), Syntetyczne badania porównawcze w świetle teorii pomiaru, Przegląd Statystyczny, z. 1-2, [17] Walesiak M. (2005), Rekomendacje w zakresie strategii postępowania w procesie klasyfikacji zbioru obiektów, W: A. Zeliaś (red.), Przestrzenno-czasowe modelowanie i prognozowanie zjawisk gospodarczych, Wydawnictwo AE, Kraków, [18] Walesiak M. (2006), Uogólniona miara odległości w statystycznej analizie wielowymiarowej. Wydanie drugie rozszerzone. Wydawnictwo AE, Wrocław. [19] Walesiak M. (2009), Analiza skupień, W: M. Walesiak, E. Gatnar (red.), Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, [20] Walesiak M., Dudek A. (2009), Odległość GDM dla danych porządkowych a klasyfikacja spektralna, Prace Naukowe UE we Wrocławiu nr 84, [21] Walesiak M., Dudek A. (2010), Klasyfikacja spektralna z wykorzystaniem odległości GDM, W: K. Jajuga, M. Walesiak (red.), Klasyfikacja i analiza danych teoria i zastosowania, Taksonomia 17, Prace Naukowe UE we Wrocławiu nr 107, [22] Walesiak M., Dudek A. (2011), clustersim package, URL [23] Wiśniewski J.W. (1986), Korelacja i regresja w badaniach zjawisk jakościowych na tle teorii pomiaru, Przegląd Statystyczny, z. 3, [24] Wiśniewski J.W. (1987), Teoria pomiaru a teoria błędów w badaniach statystycznych, Wiadomości Statystyczne, nr 11,
19 Klasyfikacja spektralna a skale pomiaru zmiennych 31 [25] Zelnik-Manor L., Perona P. (2004), Self-tuning spectral clustering, W: Proceedings of the 18th Annual Conference on Neural Information Processing Systems (NIPS 04), KLASYFIKACJA SPEKTRALNA A SKALE POMIARU ZMIENNYCH Streszczenie W artykule zaproponowano modyfikację metody klasyfikacji spektralnej (zob. Ng, Jordan i Weiss [2002]) umożliwiającą jej zastosowanie w klasyfikacji danych nominalnych, porządkowych, przedziałowych oraz ilorazowych. W tym celu w procedurze tej metody przy wyznaczaniu macierzy podobieństwa (affinity matrix) zastosowano funkcję A ik = exp( σ d ik )(σ parametr skali) z miarami odległości d ik właściwymi dla danych mierzonych na różnych skalach pomiaru. Takie podejście umożliwia ponadto pośrednie wzmocnienie skali pomiaru zmiennych dla danych niemetrycznych. Zaproponowana metoda klasyfikacji spektralnej może być z powodzeniem stosowana we wszystkich zagadnieniach klasyfikacyjnych, w tym dotyczących pomiaru, analizy i wizualizacji preferencji. Słowa kluczowe: klasyfikacja spektralna, miary odległości, skale pomiaru SPECTRAL CLUSTERING AND MEASUREMENT SCALES OF VARIABLES Abstract In article the proposal of modification of spectral clustering method for nominal, ordinal, interval and ratio data, based on procedure of Ng, Jordan and Weiss [2002], is presented. In construction of affinity matrix we implement function A ik = exp( σ d ik )(σ scale parameter) with distance measures d ik appropriate for different scales of measurement. This approach gives possibility of conversion nonmetric data (nominal, ordinal) into interval data. The proposed method of spectral clustering can be successfully used in all classification problems, including the measurement, analysis and visualization of preferences. Key words: spectral clustering, distance measures, scales of variables
strona 1 / 12 Autor: Walesiak Marek Publikacje:
Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.
strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:
Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii
OCENA WYBRANYCH PROCEDUR ANALIZY SKUPIEŃ DLA DANYCH PORZĄDKOWYCH. 1. Wstęp
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU Nr 47 009 TAKSONOMIA 16 Klasyfikacja i analiza danych teoria i zastosowania Uniwersytet Ekonomiczny we Wrocławiu OCENA WYBRANYCH PROCEDUR ANALIZY SKUPIEŃ
Wykład 10 Skalowanie wielowymiarowe
Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów
Spis treści. Summaries
Spis treści Wstęp... 7 Danuta Strahl: Dwustopniowa klasyfikacja pozycyjna obiektów hierarchicznych ze względu na strukturę obiektów niższego rzędu... 9 Andrzej Dudek: Klasyfikacja spektralna a tradycyjne
Podejścia w skalowaniu wielowymiarowym obiektów symbolicznych
Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Katedra Ekonometrii i Informatyki Podejścia w skalowaniu wielowymiarowym obiektów symbolicznych 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską
Dr Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską 1.
10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH
Transport, studia niestacjonarne I stopnia, semestr I Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Ewa Pabisek Adam Wosatko Postać układu równań liniowych Układ liniowych równań algebraicznych
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
WYKAZ PRAC PUBLIKOWANYCH
Dr hab. Andrzej Bąk Prof. nadzw. AE WYKAZ PRAC PUBLIKOWANYCH I. Publikacje zwarte I.1. KsiąŜki 1. Walesiak M., Bąk A. [1997], Realizacja badań marketingowych metodą conjoint analysis z wykorzystaniem pakietu
Graficzna prezentacja danych statystycznych
Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych Katowice, 12 i 26 czerwca 2014 r. Dopasowanie narzędzia do typu zmiennej Dobór narzędzia do
DOPUSZCZALNE DZIAŁANIA NA LICZBACH W BADANIACH MARKETINGOWYCH Z PUNKTU WIDZENIA SKAL POMIAROWYCH * 1. Rola skal pomiarowych w badaniach marketingowych
PRACE NAUKOWE AKADEMll EKONOMCZNEJ WE WROCŁAWU Nr 718 1996 nł"or:rnatyka i Ekono:rnet:ria 1 Marek Walesiak DOPUSZCZALNE DZAŁANA NA LCZBACH W BADANACH MARKETNGOWYCH Z PUNKTU WDZENA SKAL POMAROWYCH * 1.
OCENA STABILNOŚCI WYNIKÓW KLASYFIKACJI Z WYKORZYSTANIEM ANALIZY REPLIKACJI
Marek Walesiak Akademia Ekonomiczna im Oskara Langego we Wrocławiu OCENA STABILNOŚCI WYNIKÓW KLASYFIKACJI Z WYKORZYSTANIEM ANALIZY REPLIKACJI l Wprowadzenie W typowym studium klasyfikacyjnym wyodrębnia
SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization
Wrocław University of Technology SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization Jakub M. Tomczak Studenckie Koło Naukowe Estymator jakub.tomczak@pwr.wroc.pl 4.1.213 Klasteryzacja Zmienne
ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza
ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskiego 8, 04-703 Warszawa tel. (0)
Metody iteracyjne rozwiązywania układów równań liniowych (5.3) Normy wektorów i macierzy (5.3.1) Niech. x i. i =1
Normy wektorów i macierzy (5.3.1) Niech 1 X =[x x Y y =[y1 x n], oznaczają wektory przestrzeni R n, a yn] niech oznacza liczbę rzeczywistą. Wyrażenie x i p 5.3.1.a X p = p n i =1 nosi nazwę p-tej normy
Ważne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
Matematyka liczby zespolone. Wykład 1
Matematyka liczby zespolone Wykład 1 Siedlce 5.10.015 Liczby rzeczywiste Zbiór N ={0,1,,3,4,5, } nazywamy zbiorem Liczb naturalnych, a zbiór N + ={1,,3,4, } nazywamy zbiorem liczb naturalnych dodatnich.
Wykład ze statystyki. Maciej Wolny
Wykład ze statystyki Maciej Wolny T1: Zajęcia organizacyjne Agenda 1. Program wykładu 2. Cel zajęć 3. Nabyte umiejętności 4. Literatura 5. Warunki zaliczenia Program wykładu T1: Zajęcia organizacyjne T2:
UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH
Transport, studia I stopnia rok akademicki 2011/2012 Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Ewa Pabisek Adam Wosatko Uwagi wstępne Układ liniowych równań algebraicznych można
Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki
Zeszyty Naukowe Wyższej Szkoły Bankowej w Poznaniu Nr / Rafał Czyżycki Uniwersytet Szczeciński Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki Streszczenie,
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
WYBÓR GRUP METOD NORMALIZACJI WARTOŚCI ZMIENNYCH W SKALOWANIU WIELOWYMIAROWYM
PRZEGLĄD STATYSTYCZNY R. LXIII ZESZYT 1 2016 MAREK WALESIAK 1 WYBÓR GRUP METOD NORMALIZACJI WARTOŚCI ZMIENNYCH W SKALOWANIU WIELOWYMIAROWYM 1. WPROWADZENIE Normalizację przeprowadza się dla macierzy danych
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Zastosowania statystyki i matematyki w ekonomii. Marek Walesiak. Akademia Ekonomiczna we Wrocławiu. 1. Wstęp
PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr 1006 2003 Zastosowania statystyki i matematyki w ekonomii Marek Walesiak Akademia Ekonomiczna we Wrocławiu MIARA ODLEGŁOŚCI OBIEKTÓW OPISANYCH ZMIENNYMI
Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis
Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,
dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;
Wykłady 8 i 9 Pojęcia przestrzeni wektorowej i macierzy Układy równań liniowych Elementy algebry macierzy dodawanie, odejmowanie, mnożenie macierzy; macierz odwrotna dr Mariusz Grządziel 15,29 kwietnia
Komputerowa Analiza Danych Doświadczalnych
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd
Skalowanie wielowymiarowe idea
Skalowanie wielowymiarowe idea Jedną z wad metody PCA jest możliwość używania jedynie zmiennych ilościowych, kolejnym konieczność posiadania pełnych danych z doświadczenia(nie da się użyć PCA jeśli mamy
PODSTAWY AUTOMATYKI. MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.
WYDZIAŁ ELEKTROTECHNIKI I AUTOMATYKI Katedra Inżynierii Systemów Sterowania PODSTAWY AUTOMATYKI MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.
LUBELSKA PRÓBA PRZED MATURĄ 09 MARCA Kartoteka testu. Maksymalna liczba punktów. Nr zad. Matematyka dla klasy 3 poziom podstawowy
Matematyka dla klasy poziom podstawowy LUBELSKA PRÓBA PRZED MATURĄ 09 MARCA 06 Kartoteka testu Nr zad Wymaganie ogólne. II. Wykorzystanie i interpretowanie reprezentacji.. II. Wykorzystanie i interpretowanie
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI
14 BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14.1 WSTĘP Ogólne wymagania prawne dotyczące przy pracy określają m.in. przepisy
KADD Minimalizacja funkcji
Minimalizacja funkcji Poszukiwanie minimum funkcji Foma kwadratowa Metody przybliżania minimum minimalizacja Minimalizacja w n wymiarach Metody poszukiwania minimum Otaczanie minimum Podział obszaru zawierającego
Marek Walesiak UOGÓLNIONA MIARA ODLEGŁOŚCI GDM W STATYSTYCZNEJ ANALIZIE WIELOWYMIAROWEJ Z WYKORZYSTANIEM PROGRAMU R
Marek Walesiak UOGÓLNIONA MIARA ODLEGŁOŚCI GDM W STATYSTYCZNEJ ANALIZIE WIELOWYMIAROWEJ Z WYKORZYSTANIEM PROGRAMU R Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2011 Senacka Komisja Wydawnicza
5. Analiza dyskryminacyjna: FLD, LDA, QDA
Algorytmy rozpoznawania obrazów 5. Analiza dyskryminacyjna: FLD, LDA, QDA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Liniowe funkcje dyskryminacyjne Liniowe funkcje dyskryminacyjne mają ogólną
METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH
Marcin Pełka Akademia Ekonomiczna we Wrocławiu METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów symbolicznych, podobnie jak w przypadku
KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4
KARTA KURSU (do zastosowania w roku ak. 2015/16) Nazwa Statystyka 1 Nazwa w j. ang. Statistics 1 Kod Punktacja ECTS* 4 Koordynator Dr hab. Tadeusz Sozański (koordynator, wykłady) Dr Paweł Walawender (ćwiczenia)
Wykład 5. Metoda eliminacji Gaussa
1 Wykład 5 Metoda eliminacji Gaussa Rozwiązywanie układów równań liniowych Układ równań liniowych może mieć dokładnie jedno rozwiązanie, nieskończenie wiele rozwiązań lub nie mieć rozwiązania. Metody dokładne
Algebra WYKŁAD 3 ALGEBRA 1
Algebra WYKŁAD 3 ALGEBRA 1 Liczby zespolone Postać wykładnicza liczby zespolonej Niech e oznacza stałą Eulera Definicja Równość e i cos isin nazywamy wzorem Eulera. ALGEBRA 2 Liczby zespolone Każdą liczbę
WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW
Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1
Tomasz Bartłomowicz Uniwersytet Ekonomiczny we Wrocławiu FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1 Streszczenie. Punktem wyjścia artykułu jest spostrzeżenie,
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Macierze. Rozdział Działania na macierzach
Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i, j) (i 1,..., n; j 1,..., m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F R lub F C, nazywamy macierzą (rzeczywistą, gdy
Met Me ody numer yczne Wykład ykład Dr inż. Mic hał ha Łanc Łan zon Instyt Ins ut Elektr Elektr echn iki echn i Elektrot Elektr echn olo echn
Metody numeryczne Wykład 3 Dr inż. Michał Łanczont Instytut Elektrotechniki i Elektrotechnologii E419, tel. 4293, m.lanczont@pollub.pl, http://m.lanczont.pollub.pl Zakres wykładu Pojęcia podstawowe Algebra
MATLAB Neural Network Toolbox przegląd
MATLAB Neural Network Toolbox przegląd WYKŁAD Piotr Ciskowski Neural Network Toolbox: Neural Network Toolbox - zastosowania: przykłady zastosowań sieci neuronowych: The 1988 DARPA Neural Network Study
Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
NUMERYCZNE ALGORYTMY PRZECHOWYWANIA MACIERZY RZADKICH
Scientific Bulletin of Che lm Section of Mathematics and Computer Science No 1/2008 NUMERYCZNE ALGORYTMY PRZECHOWYWANIA MACIERZY RZADKICH RADOSŁAW MATUSIK Katedra Analizy Matematycznej i Teorii Sterowania,
Dopasowywanie modelu do danych
Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;
Jądrowe klasyfikatory liniowe
Jądrowe klasyfikatory liniowe Waldemar Wołyński Wydział Matematyki i Informatyki UAM Poznań Wisła, 9 grudnia 2009 Waldemar Wołyński () Jądrowe klasyfikatory liniowe Wisła, 9 grudnia 2009 1 / 19 Zagadnienie
WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH
WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH Dobrze przygotowane sprawozdanie powinno zawierać następujące elementy: 1. Krótki wstęp - maksymalnie pół strony. W krótki i zwięzły
Badania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
WYKAZ REFERATÓW WYGŁOSZONYCH NA KONFERENCJACH
Prof. dr hab. Marek Walesiak Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ REFERATÓW WYGŁOSZONYCH NA KONFERENCJACH 1. Walesiak M.
TRANSFORMACJE I JAKOŚĆ DANYCH
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING TRANSFORMACJE I JAKOŚĆ DANYCH Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
macierze jednostkowe (identyczności) macierze diagonalne, które na przekątnej mają same
1 Macierz definicja i zapis Macierzą wymiaru m na n nazywamy tabelę a 11 a 1n A = a m1 a mn złożoną z liczb (rzeczywistych lub zespolonych) o m wierszach i n kolumnach (zamiennie będziemy też czasem mówili,
Wykład 5: Statystyki opisowe (część 2)
Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz
Y = α 1 Z α k Z k + e. (1) (k 1)[ktrA2 (tra) 2 ] (4) d = 1 k. (por. np. Kolupa, 2006). Wówczas jak to wynika ze wzorów (2) i (3) mamy:
PRZEGLĄD STATYSTYCZNY R. LVIII ZESZYT 3-4 2011 MICHAŁ KOLUPA, JOANNA PLEBANIAK KILKA UWAG O WARTOŚCIACH WŁASNYCH MACIERZY KORELACJI W niniejszej pracy, w nawiązaniu do pracy Kolupa, 2006, podajemy konstrukcję
Analiza. danych jakoêciowych i symbolicznych z wykorzystaniem programu R. Eugeniusz Gatnar Marek Walesiak. Redakcja naukowa
Analiza danych jakoêciowych i symbolicznych z wykorzystaniem programu R Redakcja naukowa Eugeniusz Gatnar Marek Walesiak Analiza danych jakoêciowych i symbolicznych z wykorzystaniem programu R Autorzy:
UOGÓLNIONA MIARA ODLEGŁOŚCI -BADANIA SYMULACYJNE 1. l. Wprowadzenie 2
PRCE NUKOWE KDEMII EKONOMICZNEJ WE WROCŁWIU Nr 942 2002 TKSONOMI 9 Klasyfikacja i analiza danych. Teoria i zastosowania Marek Walesiak, ndrzej ąk, Krzysztof Jajuga kademia Ekonomiczna we Wrocławiu UOGÓLNION
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
KRYTERIA OCENIANIA Z MATEMATYKI W OPARCIU O PODSTAWĘ PROGRAMOWĄ I PROGRAM NAUCZANIA MATEMATYKA 2001 DLA KLASY DRUGIEJ
KRYTERIA OCENIANIA Z MATEMATYKI W OPARCIU O PODSTAWĘ PROGRAMOWĄ I PROGRAM NAUCZANIA MATEMATYKA 2001 DLA KLASY DRUGIEJ TREŚCI KSZTAŁCENIA WYMAGANIA PODSTAWOWE WYMAGANIA PONADPODSTAWOWE Liczby wymierne i
WYMAGANIA EDUKACYJNE Z MATEMATYKI KLASA I GIMNAZJUM Małgorzata Janik
WYMAGANIA EDUKACYJNE Z MATEMATYKI KLASA I GIMNAZJUM Małgorzata Janik DOPUSZCZAJĄCY DOSTATECZNY DOBRY BARDZO DOBRY LICZBY I DZIAŁANIA zna pojęcie liczby naturalnej, całkowitej, wymiernej. rozumie rozszerzenie
Taksonomia numeryczna co to jest?
dr Ireneusz R. Moraczewski Zakład Systematyki i Geografii Roślin UW Al. Ujazdowskie 4, 00-478 Warszawa e-mail: moraczew@biol.uw.edu.pl Taksonomia numeryczna co to jest? To dziedzina formalna, leżąca na
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Wymagania edukacyjne z matematyki w klasie III gimnazjum
Wymagania edukacyjne z matematyki w klasie III gimnazjum - nie potrafi konstrukcyjnie podzielić odcinka - nie potrafi konstruować figur jednokładnych - nie zna pojęcia skali - nie rozpoznaje figur jednokładnych
Podstawowe pojęcia statystyczne
Podstawowe pojęcia statystyczne Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny Jean Rigaux Co to jest statystyka? Nauka o metodach ilościowych badania zjawisk
Badania Statystyczne
Statystyka Opisowa z Demografią oraz Biostatystyka Badania Statystyczne Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka
Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.
STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 18 września 2017 1 Wprowadzenie 2 Pojęcia podstawowe 3 Szeregi rozdzielcze Zwykle wyróżnia się dwa podstawowe działy statystyki: statystyka
Ekoenergetyka Matematyka 1. Wykład 3.
Ekoenergetyka Matematyka Wykład 3 MACIERZE Macierzą wymiaru n m, gdzie nm, nazywamy prostokątną tablicę złożoną z n wierszy i m kolumn: a a2 a j am a2 a22 a2 j a2m [ a ] nm A ai ai 2 a aim - i-ty wiersz
Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007
, transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Statystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
ODLEG O GDM2 W ANALIZIE SKUPIE DLA DANYCH PORZ DKOWYCH Z WYKORZYSTANIEM PROGRAMU R
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROC AWIU nr 176 Taksonomia 18. Klasyfacja i analiza danych teoria i zastosowania 2011 Marek Walesiak Uniwersytet Ekonomiczny we Wroc awiu ODLEG O GDM2 W ANALIZIE
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
7. Maszyny wektorów podpierajacych SVMs
Algorytmy rozpoznawania obrazów 7. Maszyny wektorów podpierajacych SVMs dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Maszyny wektorów podpierajacych - SVMs Maszyny wektorów podpierających (ang.
Algebra. macierzy brzegowych z zastosowaniami. Micha Kolupa Zbigniew Âleszyƒski
Algebra macierzy brzegowych z zastosowaniami Micha Kolupa Zbigniew Âleszyƒski Algebra macierzy brzegowych z zastosowaniami Algebra macierzy brzegowych z zastosowaniami Micha Kolupa Zbigniew Âleszyƒski
ALGEBRA LINIOWA. Wykład 2. Analityka gospodarcza, sem. 1. Wydział Zarządzania i Ekonomii Politechnika Gdańska
ALGEBRA LINIOWA Wykład 2 Analityka gospodarcza, sem 1 Wydział Zarządzania i Ekonomii Politechnika Gdańska dr inż Natalia Jarzębkowska, CNMiKnO semzimowy 2018/2019 2/17 Macierze Niech M = {1, 2,, m} i N
Wykład z Technologii Informacyjnych. Piotr Mika
Wykład z Technologii Informacyjnych Piotr Mika Uniwersalna forma graficznego zapisu algorytmów Schemat blokowy zbiór bloków, powiązanych ze sobą liniami zorientowanymi. Jest to rodzaj grafu, którego węzły
FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS
FOLIA UNIVERSITATIS AGRICULTURAE STETINENSIS Folia Univ. Agric. Stetin. 007, Oeconomica 54 (47), 73 80 Mateusz GOC PROGNOZOWANIE ROZKŁADÓW LICZBY BEZROBOTNYCH WEDŁUG MIAST I POWIATÓW FORECASTING THE DISTRIBUTION
5. Rozwiązywanie układów równań liniowych
5. Rozwiązywanie układów równań liniowych Wprowadzenie (5.1) Układ n równań z n niewiadomymi: a 11 +a 12 x 2 +...+a 1n x n =a 10, a 21 +a 22 x 2 +...+a 2n x n =a 20,..., a n1 +a n2 x 2 +...+a nn x n =a
Wymagania z matematyki KLASA VII
Wymagania z matematyki KLASA VII Wymagania na ocenę dopuszczającą: -porównywanie liczb wymiernych (łatwiejsze -zaznaczanie liczb wymiernych na osi liczbowej - zamiana ułamka zwykłego na dziesiętny i odwrotnie
Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -
Nazwa modułu: Statystyka opisowa i ekonomiczna Rok akademicki: 2013/2014 Kod: ZIE-1-205-n Punkty ECTS: 6 Wydział: Zarządzania Kierunek: Informatyka i Ekonometria Specjalność: - Poziom studiów: Studia I
WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY DRUGIEJ LICEUM OGÓLNOKSZTAŁCĄCEGO ZAKRES PODSTAWOWY
WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY DRUGIEJ LICEUM OGÓLNOKSZTAŁCĄCEGO ZAKRES PODSTAWOWY I. Funkcja liniowa dopuszczającą jeżeli: wie, jaką zależność między dwiema wielkościami zmiennymi nazywamy
Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41
Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna
MATEMATYKA WYKAZ UMIEJĘTNOŚCI WYMAGANYCH NA POSZCZEGÓLNE OCENY DLA KLASY DRUGIEJ
MATEMATYKA WYKAZ UMIEJĘTNOŚCI WYMAGANYCH NA POSZCZEGÓLNE OCENY 1. SUMY ALGEBRAICZNE DLA KLASY DRUGIEJ 1. Rozpoznawanie jednomianów i sum algebraicznych Obliczanie wartości liczbowych wyrażeń algebraicznych
WYMAGANIA EDUKACYJNE NIEZBĘDNE DO OTRZYMANIA PRZEZ UCZNIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH Z MATEMATYKI
WYMAGANIA EDUKACYJNE NIEZBĘDNE DO OTRZYMANIA PRZEZ UCZNIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH Z MATEMATYKI (zakres podstawowy) Rok szkolny 2017/2018 - klasa 2a, 2b, 2c 1. Funkcja
Metoda simpleks. Gliwice
Sprowadzenie modelu do postaci bazowej Sprowadzenie modelu do postaci bazowej Przykład 4 Model matematyczny z Przykładu 1 sprowadzić do postaci bazowej. FC: ( ) Z x, x = 6x + 5x MAX 1 2 1 2 O: WB: 1 2
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Kilka uwag o testowaniu istotności współczynnika korelacji
341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
WYKŁAD 8 ANALIZA REGRESJI
WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej
Ważne rozkłady i twierdzenia
Ważne rozkłady i twierdzenia Rozkład dwumianowy i wielomianowy Częstość. Prawo wielkich liczb Rozkład hipergeometryczny Rozkład Poissona Rozkład normalny i rozkład Gaussa Centralne twierdzenie graniczne