ZASTOSOWANIA METOD TAKSONOMICZNYCH W GOSPODARCE

Podobne dokumenty
Zastosowania statystyki i matematyki w ekonomii. Marek Walesiak. Akademia Ekonomiczna we Wrocławiu. 1. Wstęp

STRA TEGIE POSTĘPOWANIA W BADANIACH STATYSTYCZNYCH W PRZYPADKU ZBIORU ZMIENNYCH MIERZONYCH NA SKALACH RÓŻNEGO TYPU**

DOPUSZCZALNE DZIAŁANIA NA LICZBACH W BADANIACH MARKETINGOWYCH Z PUNKTU WIDZENIA SKAL POMIAROWYCH * 1. Rola skal pomiarowych w badaniach marketingowych

strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:

Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis

strona 1 / 12 Autor: Walesiak Marek Publikacje:

Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki

UOGÓLNIONA MIARA ODLEGŁOŚCI -BADANIA SYMULACYJNE 1. l. Wprowadzenie 2

Agnieszka Nowak Brzezińska

Badania eksperymentalne

Wykład ze statystyki. Maciej Wolny

Podstawowe pojęcia statystyczne

Wykład 10 Skalowanie wielowymiarowe

Hierarchiczna analiza skupień

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

ZMODYFIKOWANE KRYTERIUM DOBORU ZMIENNYCH OBJAŚNIAJĄCYCH DO LINIOWEGO MODELU EKONOMETRYCZNEGO

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

analiza rynku prący w Polsce i krajach Unii Europejskiej

Met Me ody numer yczne Wykład ykład Dr inż. Mic hał ha Łanc Łan zon Instyt Ins ut Elektr Elektr echn iki echn i Elektrot Elektr echn olo echn

Graficzna prezentacja danych statystycznych

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Agnieszka Nowak Brzezińska Wykład III

Operacjonalizacja zmiennych

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Przedmiot statystyki. Graficzne przedstawienie danych.

WYKAZ PRAC PUBLIKOWANYCH

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Analiza porównawcza koniunktury gospodarczej w województwie zachodniopomorskim i w Polsce w ujęciu sektorowym

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Marek Walesiak Akademia Ekonomiczna we Wrocławiu. O ZWIĄZKACH MIĘDZY ZRóZNICOWANIEM STRUKTURY FUNKCJONALNEJ GMIN A DOCHODAMI WŁASNYMI ICH BUOZETÓW

Badania Statystyczne

Metody klasyfikacji i klasteryzacji obiektów wielocechowych.

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Programowanie liniowe całkowitoliczbowe. Tadeusz Trzaskalik

Wykład 2 Zmienne losowe i ich rozkłady

BOGDAN ZARĘBSKI ZASTOSOWANIE ZASADY ABSTRAKCJI DO KONSTRUKCJI LICZB CAŁKOWITYCH

Wymagania edukacyjne z matematyki klasa II technikum

STATYSTYKA I DOŚWIADCZALNICTWO

Statystyka w pracy badawczej nauczyciela

Wykład 5. Metoda eliminacji Gaussa

W1. Wprowadzenie. Statystyka opisowa

Układy równań i nierówności liniowych

Eksploracja danych - wykład II

Agnieszka Nowak Brzezińska Wykład III

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO STATYSTYCZNA ANALIZA ZMIAN LICZBY HOTELI W POLSCE W LATACH

Programowanie liniowe

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Zbiory, relacje i funkcje

Metody iteracyjne rozwiązywania układów równań liniowych (5.3) Normy wektorów i macierzy (5.3.1) Niech. x i. i =1

STATYSTYKA I DOŚWIADCZALNICTWO

Spis treści 3 SPIS TREŚCI

Analiza współzależności dwóch cech I

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych. Wykład tutora na bazie wykładu prof. Marka Stankiewicza

POMIAR PODOBIEŃSTWA OBIEKTÓW W ŚWIETLE SKAL POMIARU I WAG ZMIENNYCH l

Testowanie hipotez statystycznych.

Zmienne zależne i niezależne

5. Rozwiązywanie układów równań liniowych

dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Analiza wyników matury 2017 z matematyki. Mieczysław Fałat OKE we Wrocławiu

STATYSTYKA. dr Agnieszka Figaj

Wielokryteriowa optymalizacja liniowa

Informacja o przestrzeniach Hilberta

METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH

RAPORT ZBIORCZY z diagnozy umiejętności matematycznych

OPTYMALIZACJA DYSKRETNA

PRZEWODNIK PO PRZEDMIOCIE

Wykaz publikacji. Pozycje zwarte:

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Wymagania edukacyjne z matematyki w klasie III gimnazjum

WYKORZYSTANIE METODY WZORCA ROZWOJU DO KLASYFIKOWANIA PRZEDSIĘBIORSTW POD WZGLĘDEM POZIOMU ZARZĄDZANIA WIEDZĄ

I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE. Nie dotyczy. podstawowy i kierunkowy

1.1 Definicja. 1.2 Przykład. 1.3 Definicja. Niech G oznacza dowolny, niepusty zbiór.

Aproksymacja funkcji a regresja symboliczna

Kilka uwag o testowaniu istotności współczynnika korelacji

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych. Wykład tutora na bazie wykładu prof. Marka Stankiewicza

PORZĄDKOWANIE LINIOWE BŁĘDY PRZY INTERPRETACJI WYNIKÓW ORAZ SPOSÓB ICH ELIMINACJI

Próbny egzamin z matematyki dla uczniów klas II LO i III Technikum. w roku szkolnym 2012/2013

Analiza autokorelacji

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Prawdopodobieństwo i statystyka

Metodologia badań psychologicznych

Projekt 4: Programowanie w logice

KRYTERIA OCENIANIA Z MATEMATYKI W OPARCIU O PODSTAWĘ PROGRAMOWĄ I PROGRAM NAUCZANIA MATEMATYKA 2001 DLA KLASY DRUGIEJ

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

Część 2. Teoretyczne i praktyczne aspekty wybranych metod analiz ilościowych w ekonomii i zarządzaniu

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.

Metody Ilościowe w Socjologii

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu

Elementy statystyki wielowymiarowej

Prof. dr hab. Józefa Famielec

0 + 0 = 0, = 1, = 1, = 0.

Transkrypt:

SEKCJA KLASYFIKACJI l ANALIZY DANYCH POLSKIEGO TOWARZYSTWA STATYSTYCZNEGO Zeszyt 1 TAKSONOMIA 1994 ZASTOSOWANIA METOD TAKSONOMICZNYCH W GOSPODARCE Jelenia Góra-Wrocław- Kraków

REDAKTORZY NAUKOWI Tadeusz Borp, Marek Waluia.ł REDAKTOR WYDA WNICIWA Andr:uj Szulwrt SKU.D I ŁAMANIE JDn~LrZ ~ki Tytuł sfinansowano ze środków Ministerstwa Edulc:acji Narodowej, Akademii Elconomicznej w Krakowie Alc:ademii Elcooomiczoej we Wrocławiu ISBN 87-7011-138-6 WYDA WNJCfWO AKADEMIJ EKONOMICZNEJ WE WROCŁAWIU Format 85. Ark. wyd. 8,22. Ark. druk. 8,3. Papier ocbel kl. III, 80 g. Zakład Graficzny AE we Wrocławiu. Zam. 97/94.

SPIS 1REŚCI Od redakcji......................................... 5 Tadeusz Borys, Zastosowania metod taksonomicznych................ 7 Zdzisław Heli wig, Taksonornetria w konstrukcjach i ocenach strategii gospodarczych 14 Kazimierz Zając, Michał Woźniak, Zróżnicowanie rozwoju społeczno-ekonomicznego Polski według województw.............................. 32 Krzysztof Jaj uga, Zarys ogólnej koncepcji metod klasyfikacji............. 42 Danuta Strahł, Wykorzystanie wskafnika a-podobieństwa struktur do formułowania ścieżki ttansformacji strukturalnej........................... 49 Tadeusz Grabiński, System podziału terytorialnego krajów Wspólnoty Europejskiej. 57 Tadeusz Grabiński, Wykorzystanie metody ekspertów do regionalizacji Połski w ujęciu województw...................................... 69 Mieczysław Sobczyk, Rozkład przestrzenny zanieczyszczeń powietrza w Połsce... 77 Elżbieta Sobczak, Metody oceny zależności między strukturą gospodarczą a poziomem zjawiska ekonomicznego (na przykładzie struktury handlu zagranicznego i poziomu dochodu narodowego)................................. 88 Marek Walesiak, Pomiar podobieństwa obiektów z punktu widzenia skal pomiaru zmiennych....................................... 95 Andrzej Bąk, Generowanie danych losowych dla celów symulacyjnej optymalizacji wyboru metod wielowymiarowej analizy porównawczej............... l 04 Edward Nowak, Zastosowanie metod taksonomicznych w ocenie zdolności kredytowej przedsiębiorstw..................................... ll3 Józef Dziecbciarz, Grzegorz Kowalewski, O pewnych przekształceniach danych (rodzaje i problemy).................................. 118 Urszula Siedlecka, Juliusz Siedlecki, Taksonometryczna analiza standardów życia w Polsce.......................................... 123

SEKCJA KLASYFIKACJI l ANALIZY DANYCH POLSKIEGO TOWARZYSTWA STATYSTYCZNEGO Zeszyt 1 TAKSONOMIA 1994 Marek Walesiak Akademia Ekoocxniczna we Wrocławiu Wychial Golpodam Regiooalnej i Turystyki w Jeleniej Górze POMIAR PODOBIEŃSTW A OBIEKTÓW Z PUNKTU WIDZENIA SKAL POMIARU ZMIENNYCH Wykorzystanie m.in. takich metod statystycznej analizy wielowymiarowej jak metody klasyfikacji i metody porządkowania liniowego oparte na wzorcu rozwoju wymaga sformalizowania pojęcia.,podobieóstwo obiektów". Stopieó podobieństwa obiektów kwantyfikuje się za pomocą miar podobieństwa, wśród których wyróżnia się miary odległości oraz bliskości (por. [4,17]). Funkcja gdzie: R - zbiór liczb rzeczywistych, d: AxA -+R, A = {A; }7 = {A 1,..., A n } - zbiór obiektów badania. będzie nazywana miarą odległości wtedy i tylko wtedy, gdy spełnione są warunki: l) nieujemności : d (A;, At)~ O dla i, k = l,...,n; 2) zwrotności : d (A;, Ak)= O<=> i =k (i, k = l,..., n); 3) symetryczności : d (A;, A.t) =d ( A.t. A;) dla i, k = l,...,n. Na analogicznych zasadach zostanie określona funkcja bliskości. Funkcja g: AxA -+R będzie nazywana miarą bliskości wtedy i tylko wtedy, gdy spełnione będą warunki: l) g (A;, At) ~O dla i, k = l,..., n; 2) g (A;, At ) < l <=> i ~ k (i, k = l,..., n ), g ( A;, Ak ) = l <=> i = Ie; 3) g (A;, Ak) = g (Ak, A;) (i, k = l,..., n).

96 Miary podobieństwa obiektów A;, At są obliczane na podstawie mormali.zowanych wektorów danych~= [ ZiJ 'l.i2. Zim J i!:j:. = [ ztl z..t2 z..tm J W zwi.ązlru z tym miary te będą oznaczane następująco: d ( A;, At ) = d (!J.,!:J:. ) = da - miary odległości, g (A;, A.t ) =g (!j. fk. ) =g a- miary bliskości. Problematyka poruszana w artykule wymaga wprowadzenia podstawowych pojęć z teońi pomiaru. Przez pomiar rozumie się przyporządkowanie liczb obiektom zgodnie z określonymi regułami w taki sposób, aby liczby odzwierciedlały relacje zachodzące między tymi obiektami [ 13, s. 54; 2, s. 17). W teorii pomiaru rozróżnia się 4 podstawowe skale pomiaru (nominalną. po~ową. przedziałową. ilc:nzową), wprowadzone przez Steven sa [ 16). Definicje skal pomiaru zawierają m.in. prace Walesiaka [18, 19). Z typem skali wiąże się grupa przekształceó, ze względu na które skala zachowuje swe właściwości. Dopuszczalnymi przek:ształcenia są więc te, które nie naruszają zasobu informacji zawartej dla mierzonej zmiennej. Na wartościach poszczególnych skal, ze wzg.lędu na dopuszczalne przekształcenie, można wyznaczać następujące relacje: a) skala nominalna - relacje: równości, różności, b) skala porządkowa- relacje: równości, różności, więkswści, mniejszości, c) skala przedziałowa- relacje: równości, różności, mniejszości, większości, równości różnic i przedziałów, d) skala ilorazowa - relacje: równości, różności, mniejszości, większości, równości różnic i przedziałów, równości stosunków między poszczególnymi wartościami skali. Wykonywanie operacji arylinetycznych dodawania i odejmowania jest dopuszczalne na wartościach skali przedziałowej. Skala ilorazowa dopuszcza ponadto wykonywanie na wartościach skali operacji dzielenia i mnożenia Jedyną dopuszczalną operacją empiryczną na wartościach skali nominalnej i porządkowej jest zliczanie zdarzeń (tzn. tego, ile relacji mniejszości, większości i równości określono na wartościach np. skali porządkowej). Stosowanie konkretnych konstrukcji miar podobieństwa jest uzależnione od skal pomiaru zmiennych. Problem stosowania różnych miar podobieństwa w zasadzie nie występuje wtedy, gdy wszystkie zmienne opisujące badane obiekty są mierzone na skali jednego typu. W literaturze wypracowano wiele propozycji miar podobieństwa znajdujących zastosowanie do zmiennych mierzonych na skali: - ilorazowej, -przedziałowej i (lub) ilorazowej, -nominalnej (w tym dla zmiennych binarnych). Bardzo dobry przegląd różnych typów miar podobieństwa przedstawiono w pracach Corm.acka [3), Gowera [7, 8), Sneatba i Sokala [15), Anderberga [l], Everitta [5), Kaufmana i Rousseeuwa [10). Nie wypracowano dotychczas w literaturze statystycznej miar podobieóstwa obiektów, które można byłoby stosować w sytuacji, gdy w zbiorze są zmienne mierzone tylko na skali porządkowej. Próbę wypełnienia tej luki przedstawiono w pracy Walesiaka [20]. W pracy zostaną zaprezentowane tylko najważniejsze (najczęściej wykorzystywane w praktyce badań ekonomicznych) miary podobieństwa dla poszczególnych grup zmiennych.

97 Podstawową miarą podobieństwa obiektów A;, Ak opisanych za pomocą mt.iennycb mierzonych na skali przedziałowej i (lub) ilorazowej jest odległość Minkowskiego [l]: (l) Są mane trzy typowe odmiany formuły (l), tzn. dla p = l, p = 2 i p -+-oo: a) odległość miejska (p= l) m da= L l Z;j -Ztj l (i, k = l,... n), j=l (2) b) odległość euklidesowa (p = 2) r l (i. h 1... (3) c) odległość Czebyszewa (p ~ oo) da = max lzij - Z.tj l (i, k = l,..., n; j = l,..., m). j (4) Cenną zaletą tych trzech miar odległości jest to, że mają interpretację geometryczną. Niech dane będą trzy obiekty w przestrzeni dwuwymiarowej. Odległość między obiektami A;, At za pomocą wzorów (2)-(4) wyznacza się następująco: odcinek AiA2 - odległość euklidesowa odcinek AiA3 + A3A2 - odległość miejska odcinek AiA3 - odległość Czebyszewa

98 W praktyce bada1\ ekonomicznych wy koczystuje się dwie pierwsze miary, tzn. odległość miejską i euklidesową. W literatw7.e dotyczącej wielowymiarowej analizy statystycmej wypracowano bardzo dużo miar podobiet\stwa obiektów opisanych za pomocą tylko 7llliennych nominalnych binarnych (dwustanowycb). Etapem wstępnym koostrukcji tych miar jest tablica kontyngencji O wymiarach 2 X 2. ObiebAt l ObiebAt l Q b D+b o c d c+d D+C l>+ d gdzie: a (d) -liczba zmiennych, dla klórych obiekty A;, A.t mają zgodne wartości występowania (braku występowania) odpowiedniego wariantu zmiennej- odpowiednio (1,1) i (0,0); b (c) -liczba 7llliennycb, dla których obiekty A;, Ak mają niezgodne wartości zmiennej -odpowiednio (1,0) i (0,1). Najbardziej znaną spośród miarpodobiet\stwa obiektów wyk<nystywaną w przypadku, gdy są one opisane zmiennymi nominalnymi binarnymi, jest współczynnik Sokala i Mi chenera (por. [10, s. 24]): o "" da= b+ c. a+b+c+d (5) Informuje on, jaki jest udział liczby 7llliennych, dla których obiekty A;, Ak mają niezgodne wartości zmiennej- odpowiednio (1,0) i (0,1)- w ogólnej liczbie zmiennych. Miarę podobieństwa obiektów A;, Ak wykorzystywaną w sytuacji, gdy są one opisane za pornocą zmiennych nominalnych wielostanowycb, zaproponowali Sołcal i Mi chener (por. [l O, s. 28]): m-m, da=-m- (6) gdzie: m - liczba zmiennych, m,- liczba zmiennych, dla których między obiektami A;, Ak zachodzi relacja równości. W konstrukcji miary odległości obiektów opisanych mliennymi porządkowymi wykorzystano ideę współczynnika korelacji mriennych porzą:dcowycb -r Keodalla (por. [ 11, s. 19; 19]). Dany jest niepusty zbiór obiektów A opisanych za pomocą m zmiennych porządkowych. Ze względu na to, że na skali porządkowej dopuszczalną operacją empiryczną jest tylko zliczanie zdarzeń (tzn. wyznaczanie liczby relacji większości, mniejszości i równości), proponuje się (por. [20]) konstrukcję miary odległości o postaci (7):

99 l m m n L aikj btij +L L ailj b~clj j=l jzl,..l ł;ci,k d = 2-2[(iałtj+ 1: ia~jl~)lj+ I iblj \11]r j=l j=l,..l ;-t.i-1,..l ~~ ~.k ) l l, jeżeli X;j > Xpj (Xtj > X1j) gdzie: a;pj ( b~ctj ) = O, -1, jeżeli X;j < Xpj (Xkj < Xrj) jeżeli Xij = Xpj (Xkj = X,.j). (7) (8) p = Ie, l; r = i, I; i, k, I= l,..., n - numer obiektu; j =l,..., m- numer zmiennej porządkowej; X;j (X~c.r :cli)- Ha (k-ta, 1-ta) obserwacja naj-tej mtienoej porządkowej; m m 11 La~j +L L cqj - liczba relacji większości i mniejszości określona dla obiektu i, j=l j=l l=l ~i,k m m n Lbtij +L L btlj - liczba relacji większości i mniejszości określona dla obiektu k. j=l j=l 1=1 ~i,k Miara odległości dik przybiera wartości z przedziału [O; 1]. Wartość O oznacza, że dla porównywanych obiektów i, k między odpowiadającymi sobie obserwacjami na zmiennych porządkowych zachodzą tylko relacje równości. Z kolei wartość l przybiera wtedy, gdy dla porównywanych obiektów i, k między odpowiadającymi sobie obserwacjami na zmiennych porządkowych zachodzą tylko relacje większości (mniejszości) lub relacje większości (mniejszości) oraz relacje równości i gdy relacje te są zachowane w stosunku do pozostałych obiektów (a więc obiektów o numerach I = l...., n ; gdzie l~ i, k). Obecnie na przykładzie rynku edytorów tekstu zilustrujemy miarę odległości (7). Edytory tekstu oferowane na rynku polskim ocenili eksperci magazynu komputerowego,.en ter", biorąc pod uwagę 5 zmiennych: l) łatwość instalacji i dokonywania zmian w zainstalowanym pakiecie (setup), 2) zawartość i jakość dokumentacji i suflera programu, 3) łatwość obsługi, 4) funkcjonalność, 5) szybkość działania (m. in. szybkość zapisu plilru. szybkość wczytywania pliku, szybkość wydruku itd.).

100 Oceaa 11 ed)1orów tełstu oa skali ~owej EdytorizmieliDA l 2 3 4 s l AmiPro 2.0 PL s s 4 s s 2 OliWriter 4. 10 4 J J 4 l 3 LeuerPerfect 1.0 3 4 3 4 2 4 PCWritc 3 4 3 3.s s QR-Tek.st 4 4 s 4 3 6 Taa2.10 3 2 4 4 l 7 Poltebt Uniicum s 3 s 4 l 8 Word.S..S s.s s.s s 9 Word for WiDdows 2.0 s s s s s lo WonfPedcct.S. l 3 s 3 s 2 11 WonfPedcct for W"mdo1n.S. l s s s s 2 Tabela l ŹX6dlo:.. Eoter" 1992 nr 10, s. 38~. Oceny punktowe dotyczące 11 edytorów tekstu (w 5-punktowej skali podobieństwa) przedstawia tab. l. Obliczmy za pomocą formuły (7) odległość między obiektami o numerach 2 i 6. Po podstawieniu do wzoru (7) otrzymano: d26 =!- - 3 + 32 = 0,1329. 2 2-./(3 +36X3 + 37) Ze względu na to, że miara (7) przybiera wartości z przedziału [O; l], otrzymany wynik wskazuje na duże podobieństwo edytorów ChiWriter 4.10 i T ag 2.10. W zagadnieniu klasyfikacji w zbiorze mogą być mtienne mierzone na różnych skalach pomiaru; z kolei zagadnienie porządlc:owania liniowego wymaga. aby w zbiorze były mtienne mierzone przynajmniej na skali porządkowej (ze względu na to, że porządkowanie obiektów staje się możliwe, gdy dopuszczalne jest olcreślenie na wartościach zmiennych relacji większości i mniejszości). Problem stosowania konkretnych konstrukcji miar podobieństwa w zagadnieniu klasyfikacji nie występuje wtedy, gdy wszystkie zmiemle są mierzone na skali pomiaru jednego typu. Dla zmiennych mierzonych na skali jednego typu istnieją rozmaite konstrukcje miar podobieństwa (omówiono je wcześniej). Z kolei w zagadnieniu porządkowania liniowego wypracowano wiele konstrukcji syntetycznych miemilców rozwoju w przypadku, gdy w zbiorze majdują się mtienne mierzone ty lico na skali przedziałowej i (lub) ilorazowej. Różne konstrukcje mierników odnoszącycb się do tych grup mtieonych omówił m. in. Walesiak [18]. Sytuacja komplikuje się wtedy, gdy w zbiorze majdują się mtienne mierzone na skalach różnych rodzajów. Na podstawie literatuy przedmiotu (p<x". [10, s. 32-37; 12; 6, s. 25-27; 9; 20]) do rozwiązania tego problemu można wykorzystać następujące sposoby:

---- ---- - ------- -------------- ----- -------------- --- ---- -- ------------ ----------------------------- 101 a) Przeprowadzić klasyfikację i porządkowanie liniowe zbioru obiektów osobno w odniesieniu do każdej grupy zmiennych. Gdy tak otrzymane rezultaty są w miarę zgodne, problemmoillaumaćzarozwiązaoy.sytuacjakomplikujesięwtedy,gdywynikitezoacmie odbiegają od siebie. b) Wykorzystać w analizie tylko zmienne jednego ustalonego typu (dominującego wzbiorzezmiennych)zodrzuceniemzmiennycbinnegotypu.wynikiuzyskaneoapodstawie zbioru zmiennych uzyskanego w takisposób są na ogółbardzozoiekształcone(wskutek: tego, żemusimyzrezygoowaćzczęściinformacji.któreoiosąodrzucooezmienne). c)wpraktya:zaniedbaćto,żezmienoesąmierzooenaskalachróżnycbtypówistosować metodyw~c'zllliennymjedoegctypuzmieonmominalnq,orządkowetraktujesiczazwyczaj takjak przedziałowe i ilorazowe: st~uje się wiecdon id! tecboik:i właściwe tym skalom. Sposób ten, choćatrakcyjny zaplikacyjoegopunk:tu widzenia,jest niedoprzyjecia ze względówmetodologiemych (oastepuje ru bowiem sztuczne wzmocnienie skali paniaru). d) Dokonać transformacji 7lllieonycb tak. by sprowadzić je do skali jednego typu. Podstawowa reguła teorii pomiaru mówi. że jedynie rezultaty pomiaru w skali mocniejszej mogą być transformowane na liczby należące do skali słabszej. Wynika z tego, że wszystkie obserwacje na zmiennych należy przekodować na pomiary na skali najsłabszej. Tej operacji towarzyszy jednak: utrata informacji. Proponowane są również w tym względzie procedury wzmacniania skal pomiaru (por. (l, 14]). Są to aproksymacyjne metody przekształcania skal słabszych w silniejsze. opierające się na pewnych dodatkowych informacjach. Z punktu widzenia teorii pomiaru wmtaenianie skal jest jednak: niemożliwe, ponieważ z mniejszej ilości informacji nie można uzyskać większej ilości informacji. e) Posłużyć się metodami (miarami podobieństwa. konstrukcjami syntetycmych mierników rozwoju) dopuszczającymi wykorzystanie zmiennych mierzonych na różnych skalach. Miarę odległości między obiektami opisanymi zbiorem zmiennych o różnych skalach ich pomiaru zaproponował Gower (M]: m (/) L 8a da:. l da=f. _ m L: o~ j=l (9) Czynnik o~ przybiera WartoŚĆ l, gdy pomiaru na zmiennej j możemy dokonać w odniesieniu do obydwu obiektów: i. k. W innych sytuacjach przybiera wartość O. Dla zmiennej o numerrej zmierzonej na skali nominalnej (w tym binarnych) wielkość o gdy między obiektami dla wyników pomiaru i) = ' na zmiennej j-tej zachodzi relacja równości, ik { gdy między obiektami dla wynikówpomiaru 1 ' na zmiennej j-tej zachodzi relacja różności. (10)

------------------------ ---------- --- -- --- --- ---------------------------- ------- -- 102 Dla mlieonycb o numen.e j mlierzooycb na skali przedziałowej lub ilorazowej d~ jest zdefiniowane wzorem (J) lz - 7~~ dij:= l).. r J,, (l l) gdzie ri- rozstęp wymaczony na podstawie wartościj-tej zmiennej. Miara odległości (9) przybiera wartości z przedziału [O; l]. Kaufmao i Rousseeuw [lo, s. 35-36] zaproponowali ponadto, aby na podstawie wzoru (11) wyliczać odległość dla mlieonycb mierzonych na skali porządkowej (po uprzednim porangowaniu wariantów zmiennej porządkowej). Propozycja ta jest nie do przyjęcia z punktu widzenia teorii pomiaru. albowiem dla wyników pomiaru na skali porządkowej jedyną dopuszczalną operacją empiry C7lląjest zliczanie zdarzeó (tzn. ustalenie, ile relacji mniejsz.oki, większości i równości można określić na wartościacb tej skali). Propozycja odległości Gowera o postaci (9), cboć zachęcająca z empirycznego punktu widzenia, budzi jednak wątpliwości. Wprawdzie odległość ta jest zapisana za pomocąjednego wzoru, jest to jednak faktycmie zabieg sztuczny, ponieważ dla skali nominalnej i przedziałowej oraz ilorazowej wykorzystuje się inne wzory (odpowiednio o numerach (10) i (11)). Dotychczas w empirycmych zastosowaniach zagadnienia Jclasyftkacji i p<>r7ądkowania liniowego, gdy w zbiorze zmiennych występowały mlienne mierzone co najmniej na skali porządkowej, wykorzystywano sposób c, w którym zmienne porządkowe traktowano jaje zmienne pa.edzialowe lub ilorazowe. Zaproponowana w pracy [20] miara odległości obiektów postaci (7) pozwala wyjcenystać - zgodny z!eorią pomiaru - sposób d. w którym obserwacje na zmiennych przedziałowych i ilorazowych zostają przekodowane na pomiary na zmiennych porządkowych. W badaniach ekonomiemych szczególna przydatność miary (7) przejawia się w badaniach marketingowych, w których często w zbiorze zmiennych występują mtienne porządk:owe. LITERA TIJRA [l) Aoderbecg M.R.: C!Mstuanalysuforopplicalions. New Yock, SAn Frauci.sco. Loodoo: Academic Pre.u 1973. (2) OK>yDOwski M.: Pomil:lr w psycltoło8ii. W: Problemy psyc}wlotii ~j. Red. J. Kozielecki. Warszawa: PWN 1971. [3) Cormack R.M.: A r~iewcfc/assijication (with discwssicn).,.journal ofthe RoyaJ St.tist.ical Society" 1971 Sa. A part 3, 321-367. [-4) D~owski M., Laus-M~yńska K. : Mdcdy wysvikiwanio i klasyfikacji in{omtocji. War-suwa: WNT 1978. (5] Everitt B.S.: C/Ms~r analysis. Loodon: Heioem&llll 197-4. [6) Gordon A. D.: Classificatiorr.. Loodon: O!apman ud Hall 1981. [7) Gower J.C.: Discwssiort ort dr Cormod:'s poper.,.1ournal of tbe Royal Statist.ical Society" 197la Ser. A Part 3. 36(}-365. [8) Gower J.C.: A 80U!ral coefficicii of:iimiloriry and s~ c( ijs propuriu..,biometria" 197lb (27). 857-874.

103 [9] Jajuga K.: Podstawowe l'tuiody analizy wielow)miarow~j w pn;ypodbt wysl(powtlltia vniennyclt mien;onyclt 1ID róbrych skalacła. Wrocław : AE 1989. Praca wykooaaa w ramach CPBP 10.09. [l O] Kaufman L, R~uw P J.: Findin1 81T1ł1PS i1t dala: atł inlrodmction 10 chuteranalysis. New Y celt: Wilcy 1990. (l l] Keodall M. G.: RaN: correlalion l'tutitodl. Loodoo: Griffm 1955. [ 12) Kolooko J.: O wyłorzyslai'um w badaniac/t labonomicvtych danyc/t pierwotnychi'piien;orrychiid skalach r6tjse1o lypu. Materiały konfen:ocyjoe at Metody IOłsonomicvte i ich z;asiosowanie w badonioch ddftomicurych. Szldacsb Por~ba 25.10.1979 r. [13] Pawlowslci T.: Metodolo8icvte lijiadnunia łulmanislyll Warszawa: PWN 1969. [ 14] Poc:ieda J.: S/alyslyCVte l'tuiody septenlocji 1')"'kM. Kraków: AE 1986. Zeszyty Naukowe AE w Krakowie. Seria specjalaa: Mooopaf~e..- 71. [15] Sae.atb P.H.A., Sobl R.R.: N~m~eriaU ~ San Francisco: W.H. Frcelll&ll ud Co. 1973. [16] SICYeas S.S.: M«mmsrunt, psyclrcplrysics and llliuiy. W: C. W. 01\K"Chmaa, P. Raloosh (eds): M«m~rmv:nt; tufoti/iau and llleories. New Y ort: Wiley 1~9. [ 17] Walesiak M.: Metody klosyfikdcji w badaniaclt slrllłtllrolnyclt. Wrocław: AE 1985. Rozprawa dolaonb. [ 18] Walesiak M.: SyrtldycUte Mdania po~ w Jwielk teorii porrtiarv... Pru~ Staystyczuy" 1990 z. 1-2. 37-46. [ 19] Walesiak M.: O swuwolnolci miar Jcor~lat:ji w anjiive W)'lił6w porrliarv pon;ądłowe1o. W : Prace Naukowe AE we Wrocławiu..-600 (1991), 13-19. [20] Walesiak M.: Stra1e1ie pos~ w ~Jt stalystycdrych w przypadb zbiorv 1.lflierurych mien;dftych na sł.a/ach rót11e1o typu.,.badania Operacyjae i Oecy7Je" 1993 (w redaltcji).