PRACE NAUKOWE Unwersytetu Ekonomcznego we Wrocławu RESEARCH PAPERS of Wrocław Unversty of Economcs Nr 327 Taksonoma 22 Klasyfkacja analza danych teora zastosowana Redaktorzy naukow Krzysztof Jajuga, Marek Walesak Wydawnctwo Unwersytetu Ekonomcznego we Wrocławu Wrocław 204
Redaktor Wydawnctwa: Barbara Majewska Redaktor technczny: Barbara Łopusewcz Korektor: Barbara Cbs Łamane: Beata Mazur Projekt okładk: Beata Dębska Publkacja jest dostępna w Internece na stronach: www.buk.pl, www.ebscohost.com, w Dolnośląskej Bblotece Cyfrowej www.dbc.wroc.pl, The Central and Eastern European Onlne Lbrary www.ceeol.com, a także w adnotowanej bblograf zagadneń ekonomcznych BazEkon http://kangur.uek.krakow.pl/bazy_ae/bazekon/nowy/ndex.php Informacje o naborze artykułów zasadach recenzowana znajdują sę na strone nternetowej Wydawnctwa www.wydawnctwo.ue.wroc.pl Tytuł dofnansowany ze środków Narodowego Banku Polskego oraz ze środków Sekcj Klasyfkacj Analzy Danych PTS Kopowane powelane w jakejkolwek forme wymaga psemnej zgody Wydawcy Copyrght by Unwersytet Ekonomczny we Wrocławu Wrocław 204 ISSN 899-392 (Prace Naukowe Unwersytetu Ekonomcznego we Wrocławu) ISSN 505-9332 (Taksonoma) Wersja perwotna: publkacja drukowana Druk: Drukarna TOTEM
Sps treśc Wstęp... 9 Eugenusz Gatnar, Balance of payments statstcs and external compettveness of Poland... 5 Andrzej Sokołowsk, Magdalena Czaja, Efektywność metody k-średnch w zależnośc od separowalnośc grup... 23 Barbara Pawełek, Józef Pocecha, Adam Sagan, Welosektorowa analza ukrytych przejść w modelowanu zagrożena upadłoścą polskch przedsęborstw... 30 Elżbeta Gołata, Zróżncowane procesu starzena struktur demografcznych w Poznanu aglomeracj poznańskej na tle wybranych dużych mast Polsk w latach 2002-20... 39 Aleksandra Łuczak, Felks Wysock, Ustalane systemu wag dla cech w zagadnenach porządkowana lnowego obektów... 49 Marek Walesak, Wzmacnane skal pomaru dla danych porządkowych w statystycznej analze welowymarowej... 60 Paweł Lula, Identyfkacja słów fraz kluczowych w tekstach polskojęzycznych za pomocą algorytmu RAKE... 69 Marusz Kubus, Propozycja modyfkacj metody złagodzonego LASSO... 77 Andrzej Bąk, Tomasz Bartłomowcz, Welomanowe modele logtowe wyborów dyskretnych ch mplementacja w pakece DscreteChoce programu R... 85 Justyna Brzezńska, Wykorzystane model logarytmczno-lnowych do analzy bezroboca w Polsce w latach 2004-202... 95 Andrzej Bąk, Marcn Pełka, Aneta Rybcka, Zastosowane paketu dcmnm programu R w badanach preferencj konsumentów wódk... 04 Barbara Batóg, Jacek Batóg, Analza stablnośc klasyfkacj polskch województw według sektorowej wydajnośc pracy w latach 2002-200... 3 Małgorzata Markowska, Danuta Strahl, Klasyfkacja europejskej przestrzen regonalnej ze względu na flary ntelgentnego rozwoju z wykorzystanem referencyjnego systemu grancznego... 2 Kamla Mgdał-Najman, Krzysztof Najman, Formalna ocena jakośc odwzorowana struktury grupowej na mape Kohonena... 3 Kamla Mgdał-Najman, Krzysztof Najman, Grafczna ocena jakośc odwzorowana struktury grupowej na mape Kohonena... 39 Beata Basura, Anna Czapkewcz, Badane jakośc klasyfkacj szeregów czasowych... 48 Mchał Trzęsok, Wybrane metody dentyfkacj obserwacj oddalonych... 57
6 Sps treśc Grażyna Dehnel, Tomasz Klmanek, Taksonomczne aspekty estymacj pośrednej uwzględnającej autokorelację przestrzenną w statystyce gospodarczej... 67 Mchał Bernard Petrzak, Justyna Wlk, Odległość ekonomczna w modelowanu zjawsk przestrzennych z wykorzystanem modelu grawtacj... 77 Macej Beręsewcz, Próba zastosowana różnych mar odległośc w uogólnonym estymatorze Petersena... 86 Marcn Szymkowak, Tomasz Józefowsk, Konstrukcja praktyczne wykorzystane estymatorów typu SPREE na przykładze dwuwymarowych tabel kontyngencj... 95 Marcn Pełka, Klasyfkacja pojęcowa danych symbolcznych w podejścu welomodelowym... 202 Małgorzata Machowska-Szewczyk, Ocena klas w rozmytej klasyfkacj obektów symbolcznych... 20 Justyna Wlk, Problem wyboru lczby klas w taksonomcznej analze danych symbolcznych... 220 Andrzej Dudek, Metody analzy skupeń w klasyfkacj markerów map Google... 229 Ewa Roszkowska, Ocena ofert negocjacyjnych w słabo ustrukturyzowanych problemach negocjacyjnych z wykorzystanem rozmytej procedury SAW 237 Marcn Szymkowak, Marek Wtkowsk, Zastosowane analzy korespondencj do badana kondycj fnansowej banków spółdzelczych... 248 Bartłomej Jefmańsk, Budowa rozmytych ndeksów satysfakcj klentów z zastosowanem programu R... 257 Karolna Bartos, Odkrywane wzorców zachowań konsumentów za pomocą analzy koszykowej danych transakcyjnych... 266 Joanna Trzęsok, Taksonomczna analza krajów pod względem dzetnośc kobet oraz nnych czynnków demografcznych... 275 Beata Bal-Domańska, Próba dentyfkacj wększych skupsk regonalnych oraz ch konwergencja... 285 Beata Beszk-Stolorz, Iwona Markowcz, Wpływ zasłku na proces poszukwana pracy... 294 Marta Dzechcarz-Duda, Klauda Przybysz, Wykształcene a potrzeby rynku pracy. Klasyfkacja absolwentów wyższych uczeln... 303 Tomasz Klmanek, Problem pomaru procesu dezagraryzacj ws polskej w śwetle welowymarowych metod statystycznych... 33 Małgorzata Sej-Kolasa, Mrosława Sztemberg-Lewandowska, Wybrane metody analzy danych wzdłużnych... 32 Artur Zaborsk, Zastosowane mar odległośc dla danych porządkowych do agregacj preferencj ndywdualnych... 330 Marola Chrzanowska, Nna Drejerska, Iwona Pomanek, Zastosowane analzy korespondencj do badana sytuacj meszkańców strefy podmejskej Warszawy na rynku pracy... 338
7 Sps treśc Katarzyna Wawrzynak, Klasyfkacja województw według stopna realzacj prorytetów Strateg Rozwoju Kraju 2007-205 z wykorzystanem wartośc centrum werszowego... 346 Summares Eugenusz Gatnar, Statystyka blansu płatnczego a konkurencyjność gospodark Polsk... 22 Andrzej Sokołowsk, Magdalena Czaja, Cluster separablty and the effectveness of k-means method... 29 Barbara Pawełek, Józef Pocecha, Adam Sagan, Multsectoral analyss of latent transtons n bankruptcy predcton models... 38 Elżbeta Gołata, Dfferences n the process of agng and demographc structures n Poznań and the agglomeraton compared to selected Polsh ctes n the years 2002-20... 48 Aleksandra Łuczak, Felks Wysock, Determnaton of weghts for features n problems of lnear orderng of objects... 59 Marek Walesak, Renforcng measurement scale for ordnal data n multvarate statstcal analyss... 68 Paweł Lula, Automatc dentfcaton of keywords and keyphrases n documents wrtten n Polsh... 76 Marusz Kubus, The proposton of modfcaton of the relaxed LASSO method... 84 Andrzej Bąk, Tomasz Bartłomowcz, Mcroeconomc multnomal logt models and ther mplementaton n the DscreteChoce R package. 94 Justyna Brzezńska, The analyss of unemployment data n Poland n 2004- -202 wth applcaton of log-lnear models... 03 Andrzej Bąk, Marcn Pełka, Aneta Rybcka, Applcaton of the MMLM package of R software for vodka consumers preference analyss... 2 Barbara Batóg, Jacek Batóg, Analyss of the stablty of classfcaton of Polsh vovodeshps n 2002-200 accordng to the sectoral labour productvty... 20 Małgorzata Markowska, Danuta Strahl, Classfcaton of the European regonal space n terms of smart growth pllars usng the reference lmt system... 30 Kamla Mgdał Najman, Krzysztof Najman, Formal qualty assessment of group structure mappng on the Kohonen s map... 38 Kamla Mgdał Najman, Krzysztof Najman, Graphcal qualty assessment of group structure mappng on the Kohonen s map... 47 Beata Basura, Anna Czapkewcz, Valdaton of tme seres clusterng... 56 Mchał Trzęsok, Selected methods for outler detecton... 66
8 Sps treśc Grażyna Dehnel, Tomasz Klmanek, Taxonomc aspects of ndrect estmaton accountng for spatal correlaton n enterprse statstcs... 76 Mchał Bernard Petrzak, Justyna Wlk, Economc dstance n modelng spatal phenomena wth the applcaton of gravty model... 85 Macej Beręsewcz, An attempt to use dfferent dstance measures n the Generalzed Petersen estmator... 94 Marcn Szymkowak, Tomasz Józefowsk, Constructon and practcal usng of SPREE estmators for two-dmensonal contngency tables... 20 Marcn Pełka, The ensemble conceptual clusterng for symbolc data... 209 Małgorzata Machowska-Szewczyk, Evaluaton of clusters obtaned by fuzzy classfcaton methods for symbolc objects... 29 Justyna Wlk, Problem of determnng the number of clusters n taxonomc analyss of symbolc data... 228 Andrzej Dudek, Clusterng technques for Google maps markers... 236 Ewa Roszkowska, The evaluaton of negotaton offers n ll structure negotaton problems wth the applcaton of fuzzy SAW procedure... 247 Marcn Szymkowak, Marek Wtkowsk, The use of correspondence analyss n analysng the fnancal stuaton of cooperatve banks... 256 Bartłomej Jefmańsk, The constructon of fuzzy customer satsfacton ndexes usng R program... 265 Karolna Bartos, Dscoverng patterns of consumer behavour by market basket analyss of the transactonal data... 274 Joanna Trzęsok, Cluster analyss of countres wth respect to fertlty rate and other demographc factors... 284 Beata Bal-Domańska, An attempt to dentfy major regonal clusters and ther convergence... 293 Beata Beszk-Stolorz, Iwona Markowcz, The nfluence of beneft on the job fndng process... 302 Marta Dzechcarz-Duda, Klauda Przybysz, Educaton and labor market needs. Classfcaton of unversty graduates... 32 Tomasz Klmanek, The problem of measurng deagraransaton process n rural areas n Poland usng multvarate statstcal methods... 320 Małgorzata Sej-Kolasa, Mrosława Sztemberg-Lewandowska, Selected methods for an analyss of longtudnal data... 329 Artur Zaborsk, The applcaton of dstance measures for ordnal data for aggregaton ndvdual preferences... 337 Marola Chrzanowska, Nna Drejerska, Iwona Pomanek, Applcaton of correspondence analyss to examne the stuaton of the nhabtants of Warsaw suburban area n the labour market... 345 Katarzyna Wawrzynak, Classfcaton of vovodeshps accordng to the level of the realzaton of prortes of the Natonal Development Strategy 2007-205 wth usng the values of centrod of the rows... 355
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU nr 207 RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 327 204 Taksonoma 22 ISSN 899-392 Klasyfkacja analza danych teora zastosowana Artur Zaborsk Unwersytet Ekonomczny we Wrocławu ZASTOSOWANIE MIAR ODLEGŁOŚCI DLA DANYCH PORZĄDKOWYCH DO AGREGACJI PREFERENCJI INDYWIDUALNYCH Streszczene: W artykule dokonano klasyfkacj metod agregacj preferencj ndywdualnych oraz przedstawono metody wykorzystujące mary odległośc. Wskazano mary, które mogą być stosowane do pomaru odległośc mędzy relacjam preferencj różnych respondentów. Opsano mary wykorzystujące jedyne rozkłady preferencj dla wszystkch par obektów, mary oparte na rangach oraz marę GDM2, która w swojej konstrukcj wykorzystuje relacje dopuszczalne na skal porządkowej. W częśc emprycznej przedstawono przykład, w którym agregację preferencj ndywdualnych przeprowadzono z wykorzystanem funkcj BruteAggreg programu R. Słowa kluczowe: preferencje ndywdualne, metody agregacj, mary odległośc, środowsko R.. Wstęp Agregacja ndywdualnych ocen preferencj pewnego zboru alternatyw umożlwa porównane ch ze społecznego punktu wdzena, wyboru z tego zboru alternatywy najlepszej lub podzboru najlepszych alternatyw. Do tej pory powstało wele metod agregacj preferencj. Są to główne metody wypracowane w ramach teor wyboru społecznego (metody zwązane z zasadą zwykłej wększośc, metody zwązane z regułą Bordy, metoda Condorceta, metoda optymalnej predykcj n.). Celem pracy jest wskazane możlwośc wykorzystana do agregacj mar odległośc mędzy ocenam preferencj ndywdualnych (np. odległość Spearmana, odległość τ Kendalla) oraz mar stosowanych do pomaru odległośc obektów opsanych zmennym merzonym na skal porządkowej. W częśc emprycznej dokonano agregacj ndywdualnych preferencj ekspertów zajmujących sę sprzedażą detalczną naprawą sprzętu komputerowego względem wybranych marek montorów LCD, za pomocą funkcj BruteAggreg programu R.
Zastosowane mar odległośc dla danych porządkowych 33 2. Preferencje ndywdualne =,,,, m ze względu na preferencje stosuje sę relacje preferencj mocnej ( x x j ), preferencj słabej W celu uporządkowana zboru obektów X { x x x } ( x xj) oraz ndyferencj ( x x j ). Jeżel stneje funkcja, która umożlwa pomar obektów na skal porządkowej, to wymenone relacje można przedstawć jako [por. Bąk 2004, s. 37]: x x ux ( ) > ux ( ), j 2 x x ux ( ) ux ( ), j 2 x x ux ( ) = ux ( ), j 2 gdze funkcja u jest funkcją użytecznośc, porządkującą analzowane obekty zgodne z preferencjam konsumenta. W badanu preferencj ne są stotne wartośc różnc mędzy wartoścam funkcj użytecznośc poszczególnych konsumentów, przez co dozwolonym przekształcenam matematycznym dla obserwacj są ścśle monotonczne funkcje rosnące, które ne zmenają dopuszczalnych relacj, tj. równośc, różnośc, wększośc mnejszośc. Relacje preferencj ndywdualnych pownny spełnać następujące warunk [zob. np. Varan 997, s. 66; Bąk 2004, s. 36]: zwrotnośc jeżel dla każdego x X zachodz relacja x x, tzn. dwa dentyczne obekty ne są rozróżnane na skal preferencj danego konsumenta, spójnośc dla każdej pary obektów x, xj X mus być spełnony przynajmnej jeden z warunków: x xj x xj x xj, przechodnośc jeżel dla każdej trójk obektów x, xj, xk X oceny konsumenta spełnają warunek racjonalnośc, tzn.: x xj xj xk x xk. Oceny formułowane przez konsumentów zazwyczaj spełnają te warunk. Warunek spójnośc może ne być spełnony w przypadku, gdy obekty znaczne różną sę od sebe trudno je umeścć na wspólnej skal, zaś warunek przechodnośc gdy obekty różną sę bardzo mało lub są na tyle złożone, że trudno je porównywać mędzy sobą. Informację o relacj preferencj h-tego respondenta otrzymuje sę, prosząc go o uporządkowane obektów zboru X od najbardzej do najmnej preferowanego. Można też poprosć respondenta o dokonane, zgodne z jego własnym preferencjam, porównań wszystkch par obektów. Ten drug sposób jest jednak bardzo pracochłonny, zwłaszcza przy dużej lczbe obektów. Ponadto w wynku porównań param, można otrzymać relację, która ne spełna warunku przechodnośc.
332 Artur Zaborsk 3. Klasyfkacja metod agregacj preferencj Klasyfkacj metod agregacj preferencj można dokonać na podstawe dwóch kryterów. Perwsze z nch określa, jake są wykorzystywane nformacje o preferencjach ndywdualnych. Według tego kryterum wyróżna sę dwa rodzaje metod: metody bnarne wykorzystujące jedyne rozkłady preferencj dla wszystkch par obektów (np. otrzymanych na podstawe porównań param), metody nebnarne korzystające z pełnejszej nformacj o relacjach preferencj (np. operające sę na uporządkowanach preferencj). Druge kryterum klasyfkacj określa sposób, w jak dokonuje sę agregacj. Według tego kryterum możemy rozróżnć trzy grupy metod: mary tendencj centralnej choć są najczęścej wykorzystywane, to tak sposób agregacj ne zawsze jest właścwy; mmo że preferencje są merzone na skal porządkowej, to stosując te metody, często przyjmuje sę założene, że preferencje konsumentów merzone są co najmnej na skal przedzałowej; metody wypracowane w ramach teor wyboru społecznego można tu wymenć metody zwązane z zasadą zwykłej wększośc (metoda Copelanda, metoda Tody), grupę metod zwązanych z regułą Bordy, metodę Condorceta, metodę optymalnej predykcj n. [zob. Lssowsk 2000]; metody wykorzystujące mary odległośc mędzy ndywdualnym relacjam preferencj. 4. Agregacja preferencj z wykorzystanem wybranych mar odległośc Agregacja preferencj ndywdualnych z wykorzystanem funkcj odległośc polega na znalezenu spośród permutacj uporządkowań należących do zboru Q, takej relacj preferencj R, dla której suma odległośc od wszystkch ndywdualnych uporządkowań preferencj jest najmnejsza, tzn.: n m d( Rh, R ) = mn d( Rh, R) R Q h= h=, () gdze: d( Rh, R ) odległość mędzy relacją preferencj h-tego respondenta ( R h ) a R, Q zbór wszystkch możlwych uporządkowań preferencj m obektów. Poneważ medana jest tą wartoścą, która mnmalzuje sumę odległośc wartośc zmennej od stałej, dlatego R określa sę medaną uporządkowań preferencj. Drugą metodą wyznaczana zagregowanego uporządkowana preferencj jest wybór takego, które mnmalzuje sumę kwadratów odległośc od ndywdualnych uporządkowań, tzn.:
Zastosowane mar odległośc dla danych porządkowych 333 n 2 2 2 d( Rh, R ) = mn d[ ( Rh, R) ]. (2) R Q h= h= Uporządkowane poneważ właśne średna mnmalzuje sumę kwadratów odległośc zmennej od stałej. m 2 R nazywane jest średną uporządkowań ndywdualnych, Mary odległośc mędzy uporządkowanam preferencj można podzelć na te, które wykorzystują bnarne relacje preferencj (tzn. czy respondent przedkłada x nad x j, czy x j nad x, czy też jest wobec nch ndyferentny) oraz mary oparte na rangach, w tym mary stosowane do pomaru odległośc obektów opsanych zmennym merzonym na skal porządkowej. Za najważnejszą bnarną marę odległośc uznaje sę marę Kemeny ego [Kemeny, Snell 962]: d( R, R ) r r, (3) m m g h g h = j j 2 = j= gdze:, j =, 2,, m numer obektu, gh, =, 2,, n numer respondenta, gdy, g( h) x xj rj = dla g-tego (h-tego) respondenta. 0 gdy x xj x xj Odległość Kemeny ego spełna trzy postulaty metryk, a ze względu na swoją konstrukcję nazywana jest odległoścą mejską. Inną marę odległośc mędzy uporządkowanam preferencj wprowadzł Bogart [Bogart 973]: d( Rg, Rh) = A( Rg) A ( Rh), (4) 2 gdze: A perwastek kwadratowy sumy kwadratów elementów macerzy A, A( R ) A ( R ) macerz ocen preferencj g-tego (h-tego) respondenta g ( ) h gdy x xj g( h) o elementach aj = 0 gdy x xj. gdy x xj Ze względu na postać własnośc marę Bogarta określa sę jako marę eukldesową. Spośród mar odległośc typowych dla uporządkowań preferencj opartych na rangach można wymenć odległość Spearmana (Spearman footrule dstance) oraz odległość τ Kendalla [zob. Phur, Datta, Datta 2009].
334 Artur Zaborsk Odległość Spearmana przyjmuje postać: m g h S g h = = d ( R, R ) r ( x ) r ( x ), (5) g h gdze: r ( x ) ( r ( x )) ranga -tego obektu w proflu preferencj g-tego (h-tego) respondenta, Odległość Spearmana może być znormalzowana tak, aby przyjmowała warto- 0;. W tym celu wyrażene (5) należy podzelć przez m 2 /2. śc z przedzału [ ] Odległość τ Kendalla [Kendall 938] oparta jest na lczbe nwersj występujących w danej relacj preferencj w porównanu z nną relacją preferencj. Odległość τ Kendalla wyrażona jest wzorem: m d ( R, R ) = K, (6) K g h j, j= gdze: g g h h g g h h 0 gdy ( r ( x) < r ( xj) r ( x) < r ( xj) ) ( r ( x) > r ( xj) r ( x) > r ( xj) ) Kj =. g g h h g g h h gdy ( r ( x) > r ( xj) r ( x) < r ( xj) ) ( r ( x) < r ( xj) r ( x) > r ( xj) ) Podobne jak dla odległośc Spearmana odległość τ Kendalla można znormalzować tak, aby jej wartośc meścły sę w przedzale [0;]. Normalzacj dokonuje sę przez podzelene wyrażena (6) przez m(m )/2. Do agregacj preferencj ndywdualnych można równeż wykorzystać konstrukcje mar stosowanych do pomaru odległośc obektów opsanych zmennym merzonym na skal porządkowej (zarówno bazujących na rangach, jak mary GDM2, która wykorzystuje dopuszczalne relacje na skal porządkowej). Poneważ dla różnych ndywdualnych relacj preferencj poszczególnym obektom mogą zostać przyporządkowane take same oceny, dlatego możlwe jest stosowane tylko tych mar, które dopuszczają rang powązane. Jedną z takch mar jest odległość Podanego [Podan 999]. Odległość mędzy dwoma relacjam preferencj wyrażonym za pomocą rang przedstawa równane: ( ) ( ) m g h r ( x ) r ( x ) tg /2 th /2 dp( Rg, Rh) =, (7) = R ( t.max ) /2 ( t.mn ) /2 gdze: t g ( t h ) lczba respondentów, którzy przypsal taką samą rangę jak g-ty (h-ty) respondent -temu obektow (łączne z respondentem g (h)), t. max ( t. mn ) lczba respondentów, którzy przypsal maksymalną (mnmalną) rangę -temu obektow, R rozstęp wyznaczony na podstawe porangowanych wartośc dla -tego obektu.
Zastosowane mar odległośc dla danych porządkowych 335 Marą, która w swojej konstrukcj wykorzystuje relacje dopuszczalne na skal porządkowej, tj. równośc, różnośc, wększośc mnejszośc, jest zaproponowana przez Walesaka [Walesak 993, s. 44-45] mara GDM2. Mara GDM2 zastosowana do wyznaczana odległośc mędzy uporządkowanam preferencj przyjme postać: (, ) d R R w g h = 2 m m n a b + a b gh gh gl hl = = l= l gh, m n m n 2 2 2 2 agl bhl = l= = l=, gdze: ( ) ( ) ( ) gdy xg xp xh xs a gp ( bhs ) = 0 gdy xg xp xh xs, dla p= hl, ; s= gl,, gdy xg xp xh xs x x, x ocena preferencj -tego obektu przez g-tego (h-tego, l-tego) ( ) g h l respondenta, ghl,, =,, n numer respondenta, =,, m numer obektu. 5. Agregacja preferencj ndywdualnych w programe R W programe R agregacja preferencj z wykorzystanem mar odległośc jest możlwa za pomocą funkcj BruteAggreg paketu RankAggreg. Pomar odległośc mędzy relacjam preferencj w funkcj BruteAggreg jest dokonywany z wykorzystanem odległośc Spearmana oraz odległośc τ Kendalla. Składnę funkcj oraz jej podstawowe argumenty prezentuje tab.. Tabela. Ops funkcj BruteAggreg w programe R BruteAggreg(x, k, weghts=null, dstance=c("spearman", "Kendall"), mportance=rep(,nrow(x))) x macerz uporządkowanych preferencj k lczba najważnejszych uporządkowań podlegających agregacj weghts wag uporządkowań preferencj podlegających agregacj dstance wykorzystywana mara odległośc mportance wektor wag wskazujący ważność każdego uporządkowana preferencj Źródło: opracowane własne z wykorzystanem dokumentacj programu R.
336 Artur Zaborsk Przykład Wybranym 28 ekspertom zajmującym sę sprzedażą detalczną, serwsowanem naprawą sprzętu komputerowego przedstawono 8 marek montorów LCD (Samsung, LG, Maxdata, Phlps, Benq, NEC, Neovo, Hyunda) z prośbą o uszeregowane swoch preferencj poprzez przyporządkowane poszczególnym markom rang od do 8, przy czym lczba oznaczała markę najbardzej preferowaną. Następne, wykorzystując skrypt, dokonano agregacj ocen preferencj za pomocą funkcj BruteAggreg: Skrypt lbrary(rankaggreg) x<-read.csv2("montory_pref.csv", header=true) lczbaobektow<-ncol(x) x<-as.matrx(x) m<-bruteaggreg(x, lczbaobektow, dstance="kendall") m2<-bruteaggreg(x, lczbaobektow, dstance="spearman") prnt(m, quote=false) prnt(m2, quote=false) plot(m) plot(m2) W wynku zastosowana skryptu otrzymano zagregowane uporządkowane ocen preferencj oddzelne dla odległośc Spearmana oraz odległośc τ Kendalla: Algorthm: BruteForce Dstance: Kendall Score: 6.74286 The optmal lst s: Samsung Phlps LG Benq NEC Hyunda Maxdata Neovo Dstance: Spearman Score:.42857 The optmal lst s: Samsung Phlps LG Benq NEC Hyunda Neovo Maxdata 6. Podsumowane W artykule przedstawono metodę agregacj preferencj ndywdualnych z wykorzystanem mar odległośc. Wskazano mary, które mogą być stosowane do pomaru odległośc mędzy relacjam preferencj różnych respondentów. Przedstawono mary wykorzystujące jedyne rozkłady preferencj dla wszystkch par obektów (np. otrzymanych na podstawe porównań param), mary oparte na rangach oraz marę GDM2, która w swojej konstrukcj wykorzystuje relacje dopuszczalne na skal porządkowej.
Zastosowane mar odległośc dla danych porządkowych 337 W częśc emprycznej przedstawono przykład, w którym agregację preferencj ndywdualnych przeprowadzono z wykorzystanem funkcj BruteAggreg programu R. Pomaru odległośc mędzy relacjam preferencj dokonano za pomocą odległośc Spearmana oraz odległośc τ Kendalla, poneważ jedyne te dwe mary są stosowane w funkcj BruteAggreg. W dalszych pracach zostaną podjęte próby rozszerzena oprogramowana o nne mary odległośc, dzęk czemu możlwa będze równeż agregacja ndyferentnych relacj preferencj. Lteratura Bąk A. (2004), Dekompozycyjne metody pomaru preferencj w badanach marketngowych, Wydawnctwo Akadem Ekonomcznej, Wrocław. Bogart K.J. (973), Preference Structures I: Dstances Between Trastve Asymetrc Relatons, Journal of Mathematcal Socology, no. 3, s. 49-67. Kemeny J.G., Snell L. (962), Mathematcal Models n the Socal Scences, Gnn, Boston, s. 9-23. Kendall M.G. (938), A new measure of rank correlaton, Bometrka, no. 30. Lssowsk G. (2000), Metody agregacj ndywdualnych preferencj, Studa Socjologczne, nr, 2. Phur V., Datta S., Datta S. (2009), RankAggreg, an R package for weghted rank aggregaton, BMC Bonformatcs, http://www.bomedcentral.com/47-205/0/62. Podan J. (999), Extendng gowers general coeffcent of smlarty to ordnal characters, Taxon, no 48. Varan H.R. (997), Mkroekonometra, PWN, Warszawa. Walesak M. (993), Statystyczna analza welowymarowa w badanach marketngowych, Prace Naukowe Akadem Ekonomcznej we Wrocławu nr 654, Monografe Opracowana nr 0, Wydawnctwo Akadem Ekonomcznej, Wrocław. THE APPLICATION OF DISTANCE MEASURES FOR ORDINAL DATA FOR AGGREGATION INDIVIDUAL PREFERENCES Summary: The artcle presents the classfcaton of ndvdual preferences aggregaton methods and shows the methods whch use the dstance measures. Measures whch can be appled to measurng the dstance between dfferent respondents preference relatonshp were dscussed. The artcle descrbes measures whch use preference dstrbutons for all pars of objects (e.g. obtaned from parwse comparsons), measures based on ranks and dstance measure usng permssble transformatons to ordnal scale (GDM2 dstance). In the emprcal part the example of ndvdual preference aggregaton was carred out by BruteAggreg functon of R program. Keywords: ndvdual preferences, aggregaton methods, dstance measures, R software.