Symscal: metoda skalowania wielowymiarowego obiektów symbolicznych

Podobne dokumenty
METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH

Podejścia w skalowaniu wielowymiarowym obiektów symbolicznych

Wykład 10 Skalowanie wielowymiarowe

Tabela 1. Macierz preferencji dotycząca pięciu przykładowych produktów (obiektów) i sześciu respondentów

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:

Skalowanie wielowymiarowe idea

WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską

Elementy statystyki wielowymiarowej

strona 1 / 12 Autor: Walesiak Marek Publikacje:

Analiza korespondencji

Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu SIECI NEURONOWE DLA DANYCH SYMBOLICZNYCH: PERCEPTRON WIELOWARSTWOWY

Zastosowania statystyki i matematyki w ekonomii. Marek Walesiak. Akademia Ekonomiczna we Wrocławiu. 1. Wstęp

Eksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1

Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis

Agnieszka Nowak Brzezińska

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW

Hierarchiczna analiza skupień

WYZNACZANIE KOSZTÓW TRANSPORTU Z WYKORZYSTANIEM OCTAVE 3.4.3

Inteligentna analiza danych

Statystyka w pracy badawczej nauczyciela

Zmienne zależne i niezależne

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Metody klasyfikacji i klasteryzacji obiektów wielocechowych.

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Wstęp Podstawowe oznaczenia stosowane w książce... 13

PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Spis treści. Wstęp... 9

Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015

WYBÓR GRUP METOD NORMALIZACJI WARTOŚCI ZMIENNYCH W SKALOWANIU WIELOWYMIAROWYM

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO STATYSTYCZNA ANALIZA ZMIAN LICZBY HOTELI W POLSCE W LATACH

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Analiza danych. TEMATYKA PRZEDMIOTU

ZASTOSOWANIE METODY ANALIZY STATYSTYCZNEJ RYNKU W SZACOWANIU WARTOŚCI TECHNICZNYCH ŚRODKÓW PRODUKCJI NA PRZYKŁADZIE CIĄGNIKA ROLNICZEGO

Grupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Analiza składowych głównych. Wprowadzenie

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

Statystyczna analiza awarii pojazdów samochodowych. Failure analysis of cars

Agnieszka Nowak Brzezińska Wykład III

Sieci Kohonena Grupowanie

ANALIZA ZDOLNOŚCI PROCESU O ZALEŻNYCH CHARAKTERYSTYKACH

Rozdział 6 PROGRAMOWANIE WYPUKŁE I KWADRATOWE

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

Agnieszka Nowak Brzezińska Wykład III

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI

Wprowadzenie do analizy korelacji i regresji

PODEJŚCIE WIELOMODELOWE ANALIZY DANYCH SYMBOLICZNYCH W OCENIE POZYCJI PRODUKTÓW NA RYNKU

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Analiza składowych głównych idea

BADANIA SYMULACYJNE PROCESU HAMOWANIA SAMOCHODU OSOBOWEGO W PROGRAMIE PC-CRASH

10. Redukcja wymiaru - metoda PCA

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

Wykład 5: Statystyki opisowe (część 2)

2. Empiryczna wersja klasyfikatora bayesowskiego

W1. Wprowadzenie. Statystyka opisowa

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych

Idea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

Wektory, układ współrzędnych

DWUKROTNA SYMULACJA MONTE CARLO JAKO METODA ANALIZY RYZYKA NA PRZYKŁADZIE WYCENY OPCJI PRZEŁĄCZANIA FUNKCJI UŻYTKOWEJ NIERUCHOMOŚCI

Pozyskiwanie wiedzy z danych

Przestrzeń algorytmów klastrowania

Podstawowe pojęcia statystyczne

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Etapy modelowania ekonometrycznego

Mathcad c.d. - Macierze, wykresy 3D, rozwiązywanie równań, pochodne i całki, animacje

Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki

Wykład z Technologii Informacyjnych. Piotr Mika

PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI

Rozdział 1 PROGRAMOWANIE LINIOWE

Metody Ilościowe w Socjologii

Anna Osiewalska Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

CECHOWANIE TERMOELEMENTU Fe-Mo I WYZNACZANIE PUNKTU INWERSJI

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH

KLASYFIKACJA. Słownik języka polskiego

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) ,5 6,6

Wdrożenie nowych proinnowacyjnych usług sprzyjających dyfuzji innowacji w sektorze MSP nr umowy: U- POIG /10-00

Zadania ze statystyki, cz.6

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Analiza wielokryterialna wstęp do zagadnienia

Metody systemowe i decyzyjne w informatyce

Analiza składowych głównych

WYBÓR PUNKTÓW POMIAROWYCH

Transkrypt:

Andrzej Dudek, Marcin Pełka Akademia Ekonomiczna we Wrocławiu Symscal: metoda skalowania wielowymiarowego obiektów symbolicznych 1. Wprowadzenie Ideą skalowania wielowymiarowego obiektów symbolicznych jest przedstawienie relacji zachodzących między obiektami traktowanymi w przypadku obiektów symbolicznych jako hiperprostopadłościany w przestrzeni wielowymiarowej. Większość metod skalowania wielowymiarowego obiektów symbolicznych (symbolic multidimensional scaling) wymaga, aby danymi wejściowymi była macierz odległości minimalnych i maksymalnych pomiędzy obiektami symbolicznymi. W artykule zaprezentowano metodę skalowania wielowymiarowego SymScal, którą zaproponowali: Groenen P. J. F., Winsberg S., Rodríguez O., Diday E. (005). W artykule porównano ją z innymi metodami skalowania wielowymiarowego obiektów symbolicznych oraz opisano również problemy, jakie mogą wynikać z zastosowania metody SymScal. Artykuł w części empirycznej prezentuje wyniki skalowania wielowymiarowego uzyskane na przykładzie danych symbolicznych pochodzących z rynku komputerowego.. Typy zmiennych w symbolicznej analizie danych W przypadku obiektów symbolicznych możemy mieć do czynienia z następującymi rodzajami zmiennych [Bock i Diday (000), s. 3]: 1) Ilorazowe, Przedziałowe, Porządkowe, Nominalne. ) Kategorie, czyli dane tekstowe, np. silnik benzynowy, silnik elektryczny. 3) Przedziały liczbowe, które np. temperatury dzienne w pewnym regionie (-10,,5) czy ilość spalanej benzyny na 100km (5 litrów,,8 litrów), co w przypadku spalania benzyny oznacza, że samochód spala 5 litrów w cyklu ekonomicznym poza miastem, a 8 litrów w cyklu miejskim. 4) Lista kategorii, tu przykładem może być oferowany typ nadwozia samochodowego oferowany dla pewnego modelu samochodu (obiektu), określony jako: sedan, hatchback, kombi. 5) Lista kategorii z wagami (prawdopodobieństwami), gdzie oprócz listy kategorii występują wagi, z jakim obiekt posiada wybraną kategorię. 6) Zmienne strukturalne - [Bock i Diday (000), s. 33 37], w literaturze wyróżnia się oprócz wyżej wymienionych typów zmiennych także zmienne strukturalne: 1

a) Zmienne o zależności funkcyjnej, lub logicznej pomiędzy zmiennymi, gdzie a priori ustalono reguły funkcyjne lub logiczne decydujące o tym, jaką wartość przyjmie dana zmienna. b) Zmienne hierarchiczne, w których a priori ustalono warunki, od których zależy czy zmienna dotyczy danego obiektu, czy też nie. c) Zmienne taksonomiczne, w których a priori ustalono systematykę, według której przyjmuje ona swoje realizacje. 3. Metody skalowania wielowymiarowego obiektów symbolicznych W przypadku nieliniowego odwzorowania Sammona danymi wejściowymi są albo obiekty opisywane przez dowolne zmienne symboliczne, albo macierz odległości. Wynikiem interpretacji są obiekty symboliczne traktowane w przestrzeni wielowymiarowej jako punkty. Szczegółowe omówienie tej procedury zwarto w pracy Pełka [007]. Metody Interscal, SymScal, I-Scal oraz 3-Way SymScal wymagają, aby danymi wejściowymi były albo obiekty symboliczne opisywane wyłączne przez przedziały liczbowe (co oznacza znaczne ograniczenie możliwości opisu zjawiska), albo macierz odległości minimalnych i maksymalnych (zwana w metodzie Interscal macierzą delta). Metoda Interscal została omówiona w pracy Pełka (007). Metoda 3-Way SymScal jest modyfikacją metody SymScal zaproponowaną w 006 r. przez zespół pod kierownictwem P. J. F. Groenena. Modyfikacja ta pozwala na wprowadzane wag do skalowania wielowymiarowego oraz proponuje nieznormalizowany miernik oceny dopasowania odwzorowania I-STRESS, który następnie po normalizacji został zaproponowany przez zespól pod kierownictwem P. J. F. Groenena w 007 r. Na rys. 1 dokonano zestawienia metod skalowania wielowymiarowego obiektów symbolicznych.

Obiekty symboliczne Macierz minimalnych i maksymalnych odległości Macierz odległości Ustalenie początkowych koordynatów prostokątów (macierz X) oraz ich środków (macierz R) oraz liczby itaracji t i kryterium stopu Ustalenie początkowych koordynatów prostokątów (macierz X) oraz ich środków (macierz R) oraz liczby itaracji t i kryterium stopu Wyznaczenie zmodyfikowanej macierzy delta Wybór nowej konfiguracji punktów Początkowa konfiguracja punktów w s wymiarach i ustalenie liczby iteracji t Obliczenie odległości między s-wymiarowymi punktami Zmiana początkowej konfiguracji punktów Obliczenie wartości funkcji STRESS-Sym Obliczenie wartości funkcji I-Stress Macierz produktów skalarnych B Nie Czy zmalała wartość funkcji-kryterium? Czy przyrost funkcji STRESS-Sym jest mniejszy od kryterium stopu lub czy osiągnięto założoną liczbę iteracji? Czy przyrost funkcji I-Stress jest mniejszy od kryterium stopu lub czy osiągnięto założoną liczbę iteracji? Obliczenie wektorów własnych i wartości własnych macierzy B Tak Czy osiągnięto założoną liczbę iteracji lub czy funkcja-kryterium jest równa zero? Nie Obliczenie macierzy A S (1), B S (1) oraz macierzy A S (), b S () Zmodyfikowanie macierzy X oraz R Tak Obliczenie macierzy A S (1), B S (1) oraz macierzy A S (), b S () Zmodyfikowanie macierzy X oraz R Tak Wyznaczenie współrzędnych głównych w postaci przedziałów liczbowych Tak Wyniki skalowania wielowymiarowego Wyniki skalowania wielowymiarowego Wyniki skalowania wielowymiarowego Wyniki nieliniowego odwzorowania Sammona Metoda SYMSCAL Metoda I-SCAL Metoda INTERSCAL Nieliniowe odwzorowanie Sammona Rys. 1. Metody skalowania wielowymiarowego obiektów symbolicznych Źródło: opracowanie własne na podstawie Denoeux i Mason [000]; Groenen i in. [005]; Groenen i in. [006]; Sammon [1969]. 3

Wszystkie te metody zakładają, że obiekty w przestrzeni wielowymiarowej są hiperprostopadłościanami, natomiast w przestrzeni o mniejszej liczbie wymiarów s (zazwyczaj s lub s 3) są prostopadłościany (dla s 3) lub prostokąty (dla s ). Jeżeli danymi wejściowymi ma być macierz odległości minimalnych i maksymalnych pomiędzy obiektami, to może być ona uzyskana na podstawie: 1) zmiennych opisujących obiekty. Jeżeli w zbiorze zmiennych opisujących obiekty dominują zmienne w postaci przedziałów liczbowych, to na podstawie propozycji zawartej w metodzie Interscal (por. Lechevallier [001], s. 57, Pełka M. [007], s. 180-181) można obliczyć macierz odległości minimalnych i maksymalnych. Podejście to wydaje się problematyczne w zastosowaniu, jeżeli przedziały liczbowe nie są jedynym typem zmiennej symbolicznych opisujących obiekty. W takim przypadku zastosowanie tego podejścia wymaga usunięcia pozostałych zmiennych i utratę informacji o obiektach. ) wiedzy i opinii ekspertów lub respondentów, którzy oceniają podobieństwo (lub niepodobieństwo) obiektów. Najczęściej ocena taka jest podawana dla poszczególnych par obiektów symbolicznych. Jeżeli mamy do czynienia z wiedzą i opinią ekspertów, lub respondentów, to najczęściej korzystamy z wielu źródeł takich opinii. Oznacza to, że otrzymujemy wiele różnych osądów (ocen) co do wzajemnego podobieństwa obiektów. W tej sytuacji możemy (por. Lechevallier [001], s. 56): a) ustalić na podstawie własnej wiedzy ostateczną macierz odległości minimalnych i maksymalnych między obiektami. b) przyjąć 5% długości przedziału otrzymanych ocen jako odległość minimalną, a 95% długości tego przedziału jako odległość maksymalną, c) przyjąć kwartyl pierwszy ocen ekspertów jako odległość minimalną, a kwartyl trzeci jako odległość maksymalną. Ideą metody SymScal, a także metod 3-Way SymScal, I-Scal, jest majoryzacja funkcji dopasowania odwzorowania. W przypadku metody SymScal miarą dopasowania jest nieznormalizowana funkcja STRESS-Sym, dla metody 3-Way SymScal jest to nieznormalizowany miernik I-STRESS, a dla metody I-Scal jest to znormalizowany w przedziale [0; 1] miernik I- STRESS. Niezależnie od rodzaju funkcji oceniającej dopasowanie kluczowymi krokami są: j ustalenie liczby iteracji t (w literaturze najczęściej proponuje się używanie krotności 100 iteracji) oraz ustalenie macierzy początkowych współrzędnych prostokątów macierz X, macierzy 4

początkowych długości boków tych prostokątów macierz R oraz kryterium stopu (najczęściej proponowaną wartością jest wartość 6 10 ). Elementy macierzy X oraz R można ustalić na podstawie własnej wiedzy, wiedzy i opinii ekspertów, w sposób losowy (np. z rozkładu normalnego). Autorzy metody SymScal i I-Scal proponują także dokonać skalowania metodą Interscal i wykorzystać jej wyniki do budowy macierzy X i R. Kolejnym istotnym krokiem jest obliczenie miary STRESS-Sym: gdzie: STRESS -Sym n n X, R d ( X, R) d ( X, R) i j (3) X, R - macierze początkowych współrzędnych prostokątów, wagi związane ze wzajemnym położeniem i-tego i j-tego obiektu symbolicznego. Najczęściej ustalone wagi są sobie równe,, ( ) odległość maksymalna (odpowiednio odległość minimalna) między i-tym a j-tym obiektem symbolicznym wynikająca z macierzy odległości minimalnych i maksymalnych, d ( R),( d ( X, R)) odległość maksymalna (odpowiednio odległość minimalna) X, między i-tym a j-tym obiektem symbolicznym obliczona na podstawie macierzy X i R (zob. wzór 4 i 5), d d p xis x js ris rjs, ( X, R) (4) s1 p 0, x x r r, ( X, R) max (5) s1 is js is js s 1,, p wymiar przestrzeni w której dokonywana jest reprezentacja obiektów (zazwyczaj s 1 ). Metoda majoryzacji funkcji STRESS-Sym jest przedstawiona w pracy Groenen i in. (006), s. 18-6. Algorytm metody SymScal został oprogramowany przez autorów publikacji w skrypcie dla programu R *. W obecnej wersji pliku macierze X i R są wyznaczane za pomocą procedury sample programu R, liczbę iteracji ustalono na 00, a kryterium stopu ja- 6 ko10. i j 4. Zastosowanie algorytmu SymScal w ocenie rynku monitorów LCD W badaniu poproszono 116 osób zajmujących się sprzedażą i serwisowaniem sprzętu klasy PC o ocenę podobieństwa pomiędzy sześcioma modelami 17 monitorów ciekłokrystalicz- 5

nych (LCD). Eksperci oceniali podobieństwo ofert monitorów poszczególnych firm w skali od 0% (oferty firm X oraz Y są różne) do 100% (oferty firm X i Y są identyczne). W badaniu tym nieznana jest początkowa liczba wymiarów, ponieważ każdy z ekspertów oceniał monitory pod względem innego, subiektywnie dobranego zestawu cech. W typ przypadku 0% oznacza ofertę ubogą, o niewielkim stopniu zróżnicowania, a 100% ofertę bogatą, o znacznym stopniu zróżnicowania. Podobieństwa przekształcono na niepodobieństwa odejmując 100% od otrzymanych ocen. W badaniu przyjęto, że kwartyl pierwszy otrzymanych niepodobieństw stanowi odległości minimalne, a kwartyl trzeci stanowi odległości maksymalne. Do badania wybrano osiem firm o największym udziale w rynku w 006 r.: Samsung, LG, Maxdata, Philips, BenQ, NEC, Neovo (zob. Kuśmierz (006), s. 10). Wyniki skalowania wielowymiarowego przedstawiono na rys.. Miara STRESS-Sym wyniosła w przybliżeniu 41. Ponieważ nie jest to miara znormalizowana, to nie można podać jednoznacznej interpretacji tego wyniku. Autorzy artykułów o metodach skalowania obiektów symbolicznych SymScal, I-Scal oraz Interscal nie podali żadnych wskazówek, co do sposobu interpretacji osi skalowania. W przypadku nieliniowego odwzorowania Sammona zaznaczono, że nie można dokonać w tym przypadku interpretacji osi skalowania. Autorzy niniejszego artykułu posiłkowali się metodami interpretacji osi skalowania znanymi z metod skalowania wielowymiarowego opracowanymi dla Statystycznej Analizy Wielowymiarowej. Metody interpretacji osi można podzielić na: 1) metody obiektywne, polegające na badaniu (najczęściej poprzez współczynniki korelacji) współzależności (relacji) między poziomem zmiennych a wartością wymiarów. Metoda ta nie znajduje zastosowania w przypadku, gdy danymi wejściowymi jest macierz odległości minimalnych i maksymalnych, ) metody subiektywne, polegające na podaniu kryteriów stosowanych przy ocenie niepodobieństwa obiektów przez ekspertów czy respondentów. Kryteria te mogą być także wynikiem oceny dokonanej przez badacza. W tym przypadku wymiar 1 zinterpretowano jako rozwiązania technologiczne, a wymiar jako estetyka produktu. W przypadku, gdy nieznana jest początkowa liczba wymiarów, nie można podać jednoznacznej interpretacji położenia samych obiektów. Identyfikować można natomiast grupy obiektów podobnych (klasy). * Skrypt dostępny jest na stronie Katedry Ekonometrii i Informatyki http://wgrit.ae.jgora.pl/keii/ 6

Rys.. Wyniki skalowania wielowymiarowego metodą SymScal Źródło: opracowanie własne z wykorzystaniem pakietu R. W tym przypadku za marki podobne eksperci ocenili Maxdata 3, NEC 6, Neovo 7 (klasa 1) oraz Samsung 1, BenQ 5, Hyundai 8 oraz Philips 4 (klasa ). 5. Podsumowanie Metody skalowania wielowymiarowego obiektów symbolicznych dążą do przedstawienia zależności zachodzących między obiektami w przestrzeni wielowymiarowej w przestrzeni o mniejszej liczbie wymiarów (zazwyczaj dwu- lub trzywymiarowej) przy jak najmniejszej utracie informacji o zależnościach między tymi obiektami. Obiekty symboliczne w metodach skalowania wielowymiarowego są traktowane nie jako punkty, lecz jako hiperprostopadłościany przestrzeni wielowymiarowej. Dlatego ich graficzną reprezentacją w dwóch wymiarach są prostokąty, a w trzech wymiarach prostopadłościany. Istotną wadą metody SymScal (podobnie jak I-Scal, Interscal) jest ograniczenie opisu obiektów symbolicznych tylko do zmiennych w postaci przedziałów liczbowych. Jedynym sposobem na analizowanie wzajemnych relacji między obiektami opisywanymi przez zmienne różnych typów jest wykorzystanie wiedzy i opinii ekspertów. 7

Do oceny otrzymanych wyników w przypadku metody SymScal autorzy sugerują wykorzystanie nieznormalizowanej miary STRESS-Sym. Lepszym rozwiązaniem z pewnością będzie wykorzystanie znormalizowanej miary I-STRESS. Bardzo istotnym krokiem w algorytmach SymScal, I-Scal oraz 3-Way SymScal jest ustalenie macierzy X i R. Problematyka optymalnego ich ustalenia wymaga dalszych badań. Literatura Bock H.-H., Diday E. (red.) (000), Analysis of symbolic data. Explanatory methods for extracting statistical information from complex data, Springer Verlag, Berlin-Heidelberg. Denoeux T., Masson M. (000), Multidimensional scaling of interval-valued dissimilarity data, Pattern Recognition Letters, vol. 1, issue 1, 83-9. Groenen P. J. F., Winsberg S., Rodríguez O., Diday E. (005), SymScal: Symbolic Multidimensional Scaling of Interval Dissimilarities, Econometric Report EI 005-15, Erasmus University, Rotterdam. Groenen P. J. F., Winsberg S. (006), 3WaySym-Scal: Three-way Symbolic Multidimensional Scaling, Econometric Report EI 006-49, Erasmus University, Rotterdam. Groenen P. J. F., Winsberg S., Rodríguez O., Diday E. (007), I-Scal: Multidimensional scaling of interval dissimilarities, Computational Statistics and Data Analysis, vol. 51, issue 1, 360-378. Kuśmierz M. (006), Monitory ciekłokrystaliczne zdobywają rynek, Gazeta Prawna, nr 164 (178), 10. Lechevallier Y. (red.) (000), Scientific report for unsupervised classification, validation and cluster representation. Analysis System of Symbolic Official Data Technical Report. Raport IST-000-5161 projektu SODAS. Pełka M. (007), Zastosowanie nieliniowego odwzorowania Sammona dla obiektów symbolicznych do wstępnej oceny konkurencyjności, W: Mynarski S. (red.) Badanie konkurencji i konkurencyjności przedsiębiorstw i produktów na rynku, UE Kraków, Kraków, s. 135-14. Pełka M. (007), Metody skalowania wielowymiarowego obiektów symbolicznych, Prace Naukowe AE we Wrocławiu nr 1169, 178-185. Sammon J. W. (1969), A nonlinear mapping for data structure analysis, IEEE Transactions on Computers, vol. C-18, no. 5, 401-409. 8

Andrzej Dudek, Marcin Pełka Akademia Ekonomiczna we Wrocławiu Symscal: metoda skalowania wielowymiarowego obiektów symbolicznych Streszczenie Celem artykułu jest zaprezentowanie idei jednej z metod skalowania wielowymiarowego obiektów symbolicznych, tj. metody SymScal wraz z problemami, jakie pojawiają się przy zastosowaniu tej metody. Dodatkowo artykuł prezentuje porównanie tej metody z pozostałymi metodami skalowania wielowymiarowego obiektów symbolicznych. W artykule zostaną przedstawione wyniki skalowania wielowymiarowego obiektów symbolicznych na przykładzie rynku monitorów LCD uzyskane za pomocą procedury źródłowej dla programu statystycznego R. Symscal: symbolic multidimensional scaling method Summary The aim of this paper is to present one of symbolic multidimensional scaling methods, the SymScal method along with problems, which could be encountered while applying this method. The article compares this method with other multidimensional scaling methods for symbolic objects. The paper presents in the empirical part the symbolic multidimensional scaling results based on LCD monitors market with application of R programme script. 9