KLASYFIKACJA l ANALIZA DANYCH

SEKCJA KLASYFIKACJI l ANALIZY DANYCH POLSKIEGO TOWARZYSTWA STATYSTYCZNEGO Zeszyt 2 TAKSONOMIA 1995 KLASYFIKACJA l ANALIZA DANYCH PROBLEMY TEORETYCZNE Jelenia Góra -Wrcdaw- Kraków

REDAKTORZY NAUKOWI Krzysztof Jajuga, Marek Walasiale REDAKTOR WYDAWNICTWA Jolanta Domaradzlca KOREKTOR Maria WiszffWslca-Sroka Tytuł sfinansowano ze środków Ministerstwa Edukacji Narodowej, Akademii Ekonomicznej w Krakowie i Akademii Ekonomicznej we Wrocławiu Copyright by Akademia Ekonomiczna we Wrocław i u Wrocław 1995 ISBN 83-7011-178-5 WYDAWNICTWO AKADEMII EKONOMICZNEJ WE WROCŁAWIU Format B-5. Ark. wyd. 6,0. Ark. druk. 6,25. Papier offset. kl. III, 80 g. Zakład Graficzny AE we Wrocławiu. Zam. 127/95.

Spis treści Od redakcji................. 5 Zdzisław Heliwig Stabilność i odporność struktur taksonometrycznych................ 7 Krzy s z t o f Jaj u g a - O sieciach neuronowych w klasyfikacji i analizie danych...................... 31 Danuta Strahl - Klasyfikacja macierzy na potrzeby badania struktur gospodarczych.................... 41 Edward Nowak- Klasyflkacja i analiza danych finansowo-księgowych 49 Marek Walesiak - Pomiar postaw nabywców........ 57 Ja n W. O w s i ń ski - Zagadnienie jednoczesnej agregacji i grupowania relacji preferencji: sformułowanie zadania i podstawowe problemy. 65 Grzegorz Kowalewski - Estymatory odporne w regresji liniowej (L-estymatory).................... 81 Mieczysław Sobczyk - Syntetyczny miernik jakości środowiska przyrodniczego.................. 89 Andrzej Sokołowski - Identyfikacja osi w skalowaniu wielowymiarowym 97

SEKC.JA KLASYFIKAC.JI I ANALIZY DANYCH POLSKIEGO TOWARZYSTWA STATYSTYCZNEGO Zeszyt 2 TAKSONOMIA 1995 Marek Walesiak Wydział Akademia Ekonomiczna we Wrocławiu Gospodarki Regionalnej i Turystyki w Jeleniej Górze POMIAR POST A W NABYWCÓW* Marketingowa strategia segmentacji rynku, ocena efektywności kampanii reklamowych czy np. proces wprowadzania nowego produktu na rynek zależą w znacznym stopniu od właściwego zrozumienia postaw nabywców. Pomiar postaw nabywców za pomocą odpowiednich narzędzi odgrywa pierwszoplanową rolę w procesie podejmowania decyzji marketingowych. W wielu przypadkach pomiaru dokonuje się na skali nominalnej i porządkowej. Rzadziej przeprowadza się go na silnych skalach pomiaru, tj. na skali przedziałowej i ilorazowej 1. Skale pomiaru zmiennych mają istotny wpływ na wybór metod analizy danych (por. [10]). Wynika stąd, że wybór skali pomiaru postaw nabywców wpływa na stosowane metody analizy danych. Pomiaru postaw nabywców dokonuje się za pomocą procedur skalowania, wśród których wyróżnia się skalowanie jednowymiarowe i wielowymiarowe. Skalowanie jednowymiarowe, będące przedmiotem opracowania, służy do pomiaru przez respondenta jednej cechy opisującej badane obiekty, natomiast w skalowaniu wielowymiarowym jednoczesnemu pomiarowi przez respondenta poddaje się wiele cech. Pomiaru postaw nabywców dokonuje się na podstawie ich obserwacji oraz bezpośredniej lub pośredniej (listownej, telefonicznej) komunikacji z nimi. Celem procedur skalowania jednowymiarowego jest wyrażenie za pomocą liczb postaw nabywców wobec badanego obiektu, którym może być produkt, producent, sprzedawca, zmienna charakteryzująca produkty, rynek testowy, dom towarowy, koncepcja (idea) produktu, rynek zbytu itd. Pracę wykonano w ramach grantu KBN 1-H02B-016-08 pt. "Komputerowo wspomagane gromadzenie i analiza danych marketingowych". 1 Szczegółowe omówienie problematyki pomiaru i skal pomiarowych przedstawiono w pracy (10]. 57

W literaturze opracowano wiele skal służących do pomiaru postaw nabywców wobec badanych obiektów. Wśród nich wyróżnia się: L Skale podstawowe: a) skalę nominalną. b) skalę pozycyjną (rating scale), c) skalę rangową. d) skalę stałych sum, e) skalę zamiarów zakupu, f) skalę porównywania parami; 2. Skale specyficzne: a) skalę różnicowania słownego (semantyczną), b) skalę Stapela, c) skalę Li.kerta (por. [2, s. 19-21; 4, s. 84-99; 5, s. 245-258; 6, s. 229-237; 7, s. 152-153; 8, s. 354-373]). Skale podstawowe są skalami pojedynczymi, ponieważ odzwierciedlają wartości nadawane przez respondentów ocenianym obiektom. Skala specyficzna jest konstrukcją będącą agregatem wielu skal pojedynczych. Skala nominalna, postawy nabywców klasyfikuje się na niej na dwie lub więcej kategorie, między którymi występują tylko relacje równości i różności. Na przyklad skala nominalna utworzona zostaje z odpowiedzi na pytanie: "Czy jesteś zwolennikiem używania w samochodzie opon radialnych?" - tak, nie, nie mam zdania. Skala pozycyjna (rating scale), respondent wskazuje na niej pozycję badanego obiektu: a) wśród uporządkowanych kategorii - pomiar na skali porządkowej. Dla cechy "zadowolenie respondentów z komfortu jazdy samochodem" można wyróżnić kategorie: bardzo niezadowolony; niezadowolony; ani zadowolony, ani niezadowolony; zadowolony; bardzo zadowolony; b) w pewnym ciągłym przedziale, np. [-20; 20], pomiar taki traktuje się jako przedziałowy 2 Jeśli przedmiotem oceny jest zadowolenie respondentów z komfortu jazdy danego typu samochodem, to wartości ekstremalne oznaczają odpowiednio: bardzo niezadowolony i bardzo zadowolony; c) w zbiorze wartości zawierających się w R+ (istnieje tutaj absolutny - naturalny - punkt zerowy, który oznacza zupełny brak wielkości mierzonej zmiennej) - pomiar na skali ilorazowej. Jeśli przedmiotem oceny jest zadowolenie respondentów z komfortu jazdy danym typem samochodu, to punkt zerowy oznacza: jestem zupełnie niezadowolony, a 100%: jestem całkowicie zadowolony. Skala pozycyjna (rating scale) wykorzystuje oprócz liczbowej i werbalnej (słownej) również graficzną formę prezentacji (por. rys. 1). jednostki. 58 1 Nie jest to pomiar na skali przedziałowej sensu stricto, ponieważ nie można tutaj określić stałej

A 00 @ fłj @ o Bardzo Ani zadowolony, Bardzo B niezadowolony Niezadowolony ani niezadowolony Zadowolony zadowolony c o o o D o -20 o 20 D Jestem zupełnie Jestem niezadowolony 0% 100% całk:owicie zadowolony A - skala graficzna (obrazkowa) - porządkowa; B - sk:ala werbalna - porządkowa; C - sk.ala graficzna (liczbowa) - przedziałowa ; D - skala graficzna (liczbowa) - ilora.zowa. Rys. l. Ocena zadowolenia z komfortu jazdy samochodem Skala rangowa, jest przykładem skali porządkowej, respondenci są proszeni o uszeregowanie na niej obiektów poprzez nadanie im rang, będących kolejnymi liczbami naturalnymi. Uszeregowanie obiektów oddaje preferencje respondenta w stosunku do poszczególnych obiektów. Respondenci są proszeni np. o uporządkowanie 10 soków owocowych pod względem ich słodkości. Skala stałych sum. Respondent jest proszony o dokonanie podziału stałej sumy punktów (najczęściej 100), procentów lub stałej kwoty pieniędzy zgodnie z jego preferencjami wobec badanych obiektów ze względu na badaną cechę (por. np. [7, s. 157]). W pierwszym przypadku pomiar dokonany jest na skali porządkowej, natomiast w pozostałych dwóch sytuacjach - na skali ilorazowej. Na przykład respondent ma do dyspozycji 100 punktów i dzieli je na 7 napojów, biorąc pod uwagę ich dietetyczność, lub ma do dyspozycji 1000 $ dzieli je na 5 organizacji charytatywnych, biorąc pod uwagę dotychczasową ocenę sposobu wykorzystania pieniędzy przez te organizacje. Częściej wykorzystuje się skalę stałych sum do określania relatywnej ważności poszczególnych zmiennych opisujących badane obiekty. Skala zamiarów zakupu. Pytania zadawane nabywcom w sprawie zamiarów zakupu dotyczą zwykle nowych produktów lub usług oraz ich modyfikacji. Zmienna jest mierzona na skali (por. [9, s. 36-38]): a) ilorazowej, gdy respondenci są proszeni o określenie prawdopodobieństw subiektywnych zakupu poszczególnych dóbr lub usług, 59

b) przedziałowej, gdy respondenci są proszeni o ocenę poszczególnych produktów lub usług na skali pozycyjnej 3 (wartości tej skali mogą zawierać się np. w przedziale [O; 20], gdzie wartości ekstremalne oznaczają odpowiednio: z pewnością nie kupię i z pewnością kupię), c) porządkowej, gdy respondenci są proszeni o uszeregowanie produktów lub usług według pewności zakupu, np. l z pewnością kupię, 2 bardzo prawdopodobne, że kupię, 3 prawdopodobnie kupię lub nie kupię, 4 bardzo prawdopodobne, że nie kupię, S z pewnością nie kupię. Skala porównywania parami. Technika ta polega na porównywaniu między sobą. ze względu na jedną cechę, wszystkich par obiektów dla danego zbioru obiektów. Dla n obiektów liczbę wszystkich par wyznacza się ze wzoru ~n(n-l). Wyniki porównywania obiektów parami zestawia się w formie macierzy o wymiarach n x n. Dla pojedynczego respondenta jest to np. macierz (1). A B c D E A l o o B o o o o c o (l) l o D o E o gdzie: "1" - w kolumnie macierzy oznacza dominację tego obiektu nad obiektem będącym w wierszu; "0" - w kolumnie macierzy oznacza dominację obiektu będącego w wierszu nad obiektem będącym w kolumnie. Wyniki uzyskane od wszystkich respondentów podlegają agregacji i zestawia się je w macierz n x n, w której elementy k-tej kolumny (i-tego wiersza) oznaczają odsetek lub liczbę respondentów wskazujących dominację obiektu k-tego (i-tego) nad obiektem i-tym (k-tym). Macierz (2) przedstawia metodę porównywania parami 5 czekolad A, B, C, D i E ze względu na ich twardość. Na podstawie średnich wartości z kolumn macierzy (2) otrzymujemy pomiar twardości czekolad na skali ilorazowej. Czekolada B została uznana przez respondentów za najbardziej twardą. Wartość 0,8275 na skali ilorazowej oznacza,, Jw. 60

A B c D E A 0,89 0,74 0,09 0,30 B 0,11 0,29 0,03 0,26 c 0,26 0,71 0,15 0,34 D 0,91 0,97 0,85 0,52 E 0,70 0,74 0,66 0,48 (2) S red ni a 0,495 0,8275 0,635 0,1875 0,355 że średnio 82,75% respondentów ocenia wyżej twardość czekolady B od wszystkich pozostałych czekolad Średnia ta jest 2,33 razy wyższa od średniej otrzymanej dla czekolady E. Thurstone (por. np. (3, s. 292-298]) zaproponował procedurę pozwalającą przedstawić relację między badanymi obiektami na skali przedziałowej. Podstawowym ograniczeniem tej metody jest liczba badanych obiektów, wraz z jej wzrostem bowiem rośnie gwałtownie liczba porównywanych par obiektów. Macierz będąca wynikiem porównywania obiektów parami ze względu na wiele cech jednocześnie stanowi punkt wyjścia skalowania wielowymiarowego. Skala różnicowania słownego (semantyczna), jej konstrukcja rozpoczyna się od określenia przedmiotu oceny, tj. obiektu badania, którym może być np. firma, produkt, sklep, dom towarowy, reklama. Następnie badacz określa zestaw zmiennych opisujących obiekty badania mierzonych na skali porządkowej (zazwyczaj siedmiostopniowej), dla których określone zostają krańce skal w postaci antonimów, np. tani - drogi, wolny - szybki, przestarzały - nowoczesny itd. Respondenci zgodnie ze swoimi preferencjami oceniają każdy obiekt osobno dla każdej tak wyróżnionej zmiennej porządkowej (por. rys. 2). Sklep A Godny zaufania Miła obsługa Nowoczesny Tani Progresywny X X X X X Niegodny zaufania Niemiła obsługa Staromodny Drogi Regresywny Rys. 2. Przyk.ladowa ocena sklepu A dokonana przez l respondenta Po otrzymaniu wszystkich odpowiedzi od respondentów przyporządkowujemy wyróżnionym kategoriom liczby 7, 6, 5, 4, 3, 2, l lub +3, +2, +l, O, -l, - 2, -3. Następnie dokonujemy agregacji wyników dla każdej skali porządkowej osobno i zestawiamy je w postaci szeregów statystycznych punktowych. Szereg statystyczny punktowy oceny przez 75 respondentów np. lokalizacji banku B według siedmiostopniowej skali przedstawia tabela: 61

Kategoria Liczba obserwacji Wartości skumulowane l 5 5 2 9 14 3 19 33 4 18 51 5 11 62 6 7 69 7 6 75 Dla danych z poszczególnych skal porządkowych wyznaczamy medianę 4 Dla cechy "lokalizacja banku B" medianą jest kategoria 4. Wyznaczenie mediany sprowadza się w tym przypadku do wskazania jednostki środkowej n+l 75+1 38). d. k.. h d. d.... d ( - - = - - = t o czytama ategoru cec y o powta ającej tej Je nostce. 2 2 Tak otrzymane wyniki mogą stanowić punkt wyjścia zastosowania metod statystycznej analizy wielowymiarowej lub mogą być analizowane za pomocą tzw. metody promowej. Analiza profilowa polega na połączeniu za pomocą linii (dla każdego badanego obiektu o innym kształcie, np. linia ciągła, przerywana, kropkowana) median otrzymanych dla każdej zmiennej porządkowej. Rysunek 3 przedstawia przykładową analizę profilową dla dwóch banków ocenianych przez respondentów. Szybka obsługa 7 2 Wolna obsługa Miła obsługa N i em i ła obsługa Szeroki zakres usług Wąski zakres usług Wysoka stopa procentowa Dogodne godziny otwarcia Niska stopa procentowa Niedogodne godziny otwarcia Dobra lokalizacja Zła lokalizacja Bank A - - - Bank B - -------- Rys. 3. Analiza prolilowa oceny dwóch banków 4 W literaturze proponuje się również średnią arytmetyczną ważoną (por. [5, s. 252]). Wymaga to jednak przyjęcia założenia, że wyniki pomiaru pochodzą ze skali co najmniej przedziałowej. 62

Z rysunku 3 widać, że wyżej oceniony przez respondentów jest bank A ze względu na szybką obsługę, szeroki zakres usług, wyższą stopę procentową i lokalizację. Bank B oceniono wyżej tylko ze względu na milą obsługę i dogodne godziny otwarcia. Skala Stapela, jest odmianą skali semantycznej. Stanowi jej uproszczenie w tym sensie, że pokazuje intensywność i kierunek postaw oraz do jej budowy wystarczają tylko nazwy zmiennych porządkowych bez konieczności szukania antonimów. Zmienne porządkowe wyrażane są zazwyczaj na 6-10-stopniowej skali, np. +5, +4, +3, +2, +1, -1, -2, -3, -4, -5. Skala Likerta, jest przykładem skali porządkowej. Na wstępie określa się zestaw (na ogół kilkudziesięciu) stwierdzeń o badanym obiekcie. Oceniając piwo A np. można zaproponować stwierdzenia: l. Piwo A jest drogie, 2 Piwo A jest smaczne, 3. Piwo A jest cierpkie, 4. Piwo A jest klarowne, 5. Piwo A jest estetycznie opakowane. Zadaniem respondentów jest ich ocena na skali porządkowej skonstruowanej następująco: 5 Zgadzam się całkowicie, 4 Zgadzam się, 3 Ani się zgadzam, ani się nie zgadzam, 2 Nie zgadzam się, 1 Całkowicie się nie zgadzam. Wyniki uzyskane ze skali Likerta podlegają agregacji i analizie dla poszczególnych respondentów. Szczegółowy opis zastosowania tej skali przedstawiono m.in. w pracy [3, s. 305-308]. Podczas konstruowania skal pomiaru postaw powstaje wiele problemów. Wśród nich można wyróżnić takie, jak (por. np. [5, s. 247-249]): 1. Liczba kategorii skali. Typowa skala powinna zawierać od 5 do 7 kategorii. Dodatkowa liczba kategorii nie zwiększa na ogół precyzji pomiaru postaw, natomiast decydując się na mniej kategorii, zmniejszamy precyzję pomiaru. 2. Parzysta lub nieparzysta liczba kategorii. W przypadku wyboru nieparzystej liczby kategorii środkowa z nich określa neutralną postawę. Zwolennicy parzystej liczby kategorii uzasadniają, że postawy nie mogą być neutralne, ponieważ są one wygodne dla respondentów, a więc mogą zniekształcić wyniki pomiaru. 3. Skala zrównoważona lub niezrównoważona. Skala zrównoważona ma taką samą liczbę kategorii pozytywnych i negatywnych. Stosowanie skal niezrównoważonych ma swoje uzasadnienie wtedy, gdy w rozkładzie postaw respondentów zdecydowanie dominują oceny, np. pozytywne lub negatywne. 63

4. Skale wymuszające lub niewymuszające. Skale wymuszające żądają od respondentów wskazania konkretnej pozycji na skali. W przypadku, gdy respondenci nie mają własnego zdania lub nie dysponują wiedzą o badanym obiekcie, wprowadza się skale niewymuszające zawierające kategorię neutralną, np. nie wiem lub nie mam zdania. 5. Skale z jednostką odniesienia i skale bez jednostki odniesienia. Na skali z jednostką odniesienia respondenci wyrażają swoją postawę np. wobec produktu X, porównując go z produktem idealnym Y, konkurencyjnym Z lub jakimkolwiek innym produktem P. Na przykład respondenci są proszeni o porównanie słodkości 10 produktów z pewnym produktem A, któremu odpowiada wartość 1 na skali pozycyjnej Niesłodki A o +l +10 Słodk.i 6. Forma prezentacji skali. Skala pomiaru postaw może być prezentowana w formie graficznej, werbalnej, liczbowej lub w sposób kombinowany. Wybór formy prezentacji uzależniony jest od typu respondentów (np. dla dzieci stosuje się skale graficzne obrazkowe) oraz od typu skali pomiaru, który chcemy stosować w konkretnym badaniu (czy to ma być skala nominalna, porządkowa, przedziałowa, czy ilorazowa). LITERATURA [l] Bazarnik J., Grabińsk.i T., Kąciak: E, Mynarski S., Sagan A.: Badania marketingowe. Metody i oprogramowanie komputerowe. Warszawa-Kraków: Canadian Consortium of Management Scbools, Akademia Ekonomiczna w Krakowie 1992. [2] Garbarski L.: Metody badania postaw nabywców. "Reklama" 1989 nr l. [3] Green P. E, Tull D. S., Albaurn G.: Research for marketing decisions. Englewood Cliffs: Prentice-Hall 1988. [4] Kaczmarczyk S.: Badania marketingowe. Metody i techniki. Warszawa: PWE 1991. [5] Kinnear T. C, Taylor J. R. : Marketing research. An applied approach. New York:: McGraw-Hill1991. [6] Kramer J. (red.): Badania rynkowe i marketingowe. Warszawa: PWE 1994. [7] Luck D. J., Rubin R. S.: Marketing research. Englewood CliJTs : Prentice-Hall 1987. [8] McDaniel C., Gates R.: eontemparary marketing research. St. Paul: West Publishing Co. 1991. [9] Vriens M., Wittink: D. R.: eonjoint analysis in marketing. 1994. Maszynopis powielony. [10] Walesiak M.: Statystyczna analiza wielowymiarowa w badaniach marketingowych. Prace Naukowe Akademii Ekonomicznej we Wrocławiu 1993 nr 654. Seria: Monografie i opracowania nr 101.