1. Wprowadzenie do metodologii drzew klasyflkacylnych



Podobne dokumenty
MATA UNIWERSALNA 100x90

Rozmiar M dedykowane modele:

DOBÓR DYSZ. W przypadku uszkodzeń STAG-200 z powodu współpracy z listwami gazowymi o rezystancji 1Ω, reklamacje nie będą uwzględniane.

Przekladnie kierownicze

NADKOLA I OSŁONY POD SILNIK Oferta handlowa firmy PPUH ADMAL

SRL - NAJLEPSZY NA RYNKU STOSUNEK JAKO

NADKOLA Możliwe są dodatkowe rabaty w zależności od zamawianej ilości. AUDI Nr artykułu Numer OE

OBWIESZCZENIE O LICYTACJI RUCHOMOŚCI

HAKI HOLOWNICZE. Rok produkcji. Numer katalogowy A U D I. 1-AUD m ,00 2-AUD m ,00

LP KOD OEM MARKA NAZWA NETTO BRUTTO

Rok prod.: Alfa Romeo Alfa Romeo Alfa Romeo 159 Sedan 05--

Bagażnik dachowy na relingi AERO BASIC ALU 120cm. Bagażnik dachowy na relingi AERO BASIC ALU 120cm. Tytuł główny nagłówka podtytuł nagłówka

Pióro Wycieraczki 48C 475mm ECO Bosch

Aluminiowy Uniwersalny Bagażnik dachowy samochodowy do relingów standardowych.

Tytuł główny nagłówka Bagażnik jacky auto sport Bagażniki Jacky auto sport Bagażnik dachowy na relingi AERO STAR 1 aluminiowy 120cm DANE TECHNICZNE:

PŁYTKI MONTAŻOWE DO LUSTEREK

wyprzedaż do wyczerpania zapasów

RYNEK OPONIARSKI W POLSCE

SZKŁA DO LUSTEREK SAMOCHODY OSOBOWE

Zuordnungliste Schonbezüge

RYNEK SAMOCHODÓW UŻYWANYCH Analiza popytu

Calibra. Combo. Corsa. Meriva. Omega. Signum. Tigra. Vectra. Zafira. FIAT Grande Punto. Kangoo II od 2001' Laguna II od 2001' 4/100

Pióro Wycieraczki 53C 530mm ECO Bosch

PoniŜej zamieszczamy tabelę stawek za 12 miesięczny okres ubezpieczenia ryzyk: Klasa A 6,1 5,8 5,4 5,0 B 5,8 5,2 4,5 4,2 C 5,0 4,5 4,0 3,7

Lista samochodów do których pasuje bagaænik dachowy AGURI Runner 120 cm Silver/Black

Półoś napędowa 945mm CITROEN C4 GRAND PICASSO I, C4 PICASSO I 2.0D

Wycieraczka typu UNI

Altar. Produkcja, sprzedaż i montaż zaczepów kulowych. Zaczepy kulowe (haki holownicze) Katalog 2013

RYNEK SAMOCHODÓW UŻYWANYCH Nasycenie rynku

Opis. 25 g. Masa. Kaseta diagramu. Art Wąż ciśnieniowy SPCS Art Art Art

Uszczelniacze do Przekładni Kierowniczych ze WSPOMAGANIEM

LP KOD OEM MARKA NAZWA NETTO BRUTTO

NOWOŚCI 03/2017 WYDECH

JLK sp. z o.o. sp.k. ul. Zagnańska 12, Kielce, NIP: tel , ,

Akcesoria car audio według marek samochodów

Bagażniki dachoweporadnik. kupujących

Przewidywana do zakupu ilość filtrów (w zalezności od potrzeb warsztatowych Zamawiającego) przykładowy numer katalogowy*

KTM Nazwa Marka Opis techniczny OE # Zdjęcie

LP KOD OEM MARKA NAZWA NETTO BRUTTO

UCHWYT MAIN PASUJE DO SAMOCHODÓW Z PONIŻSZEJ LISTY: ALFA ROMEO >01 może zasłaniać tablicę rejestracyjną lub światła > >04

autotechnik NOWE PRODUKTY ELEKTRONIKA SAMOCHODOWA PoMPA PALIWA do DIESLA, dla: POMPY PALIWA CEWKI ZAPЈONOWE PRZEPЈYWOMIERZE POWIETRZA

Cena : 200,00 zł Nr katalogowy : prestige Dostępność : Dostępny Stan magazynowy : wysoki Średnia ocena : brak recenzji. watermark

Uchwyt rowerowy PADOVA 2. Stabilny bagażnik do transportu rowerów w pozycji stojącej na tylnej klapie w samochodach typu sedan, hatchback oraz kombi.

MAT S.C. P.P.H. PRODUCENT DYWANIKÓW SAMOCHODOWYCH gumowych w kolorze czarnym i popielatym OFERTA 2009/2010 PROWADZIMY SPRZEDAŻ DETALICZNĄ I HURTOWĄ

Interfejsy umożliwiające sterowanie z fabrycznych sterowników w kierownicy

NOWOŚCI 01/2019 WYDECH

Renault 5 GTE 1,7 L 95 KM - pomiar z usuniętym katalizatorem (90 KM i 128 Nm) oraz z zamontowanym środkowym tłumikiem przelotowym (95 KM i 137 Nm)

JLK sp. z o.o. sp.k. ul. Zagnańska 12, Kielce, NIP: tel , ,

Lista marek i modeli:

CENNIK PIPERCROSS. Sportowy stożkowy filtr powietrza Pipercross - UNIWERSALNY, Gąbkowy (wlot fi 70mm) wymiary100x200mm Moc do 210KM

Bagażnik dachowy na relingi Menabo Dozer aluminiowy 120cm

Wykładziny bagażnikowe (duże ranty z dywanikiem w środku ) Bytom ul.rostka 30A ; , , Darek

Nr katalogowy. Miejsce montau. Marka Model Rocznik. Lp.

Cena PLN brutto (23%) Cena PLN netto. Uwagi

RAPORT POLSKI RYNEK MOTORYZACYJNY LIPIEC Mazowsze SAMOCHODY OSOBOWE

Formularz kalkulacji cenowej WYPEŁNIA OFERENT Filtr oleju Orientacyjna ilość Proponowany

BOSCH AEROTWIN AR21U BOSCH AEROTWIN AR21U PASUJE MIĘDZY INNYMI DO:

03.35 tł. końcowy BMW 520i/523i/525i/528i/530i tł. końcowy BMW 520i/523i

NOWE TURBOSPRĘŻARKI W OFERCIE DELPHI

wyszukiwarka spinek tel

Strona 1 Numer Techline 36,00 43,20 6,30 7,90 5,08 9. Renault Laguna 1,9 DTI 101KM Volvo S40 102KM GT1549S 35,20 41,50 7,30 7,90 5,08 9

ZAGROŻENIE KRADZIEŻAMI SAMOCHODÓW W POSZCZEGÓLNYCH WOJEWÓDZTWACH W 2012 R.

znajdziesz filtr do swojego samochodu na:

RAPORT Różnice w cenach

NOWOŚCI ABE ABE Nazwa Zastosowanie C09009ABE SZCZĘKI HAMULCOWE ISUZU D-MAX 2.4I, 3.5I 24V, 2.5TD, 3.0TDI KLOCKI HAMULCOWE PRZÓD

WYKŁADZINY BAGAŻNIKOWE

PIERWSZE REJESTRACJE NOWYCH SAMOCHODÓW OSOBOWYCH I DOSTAWCZYCH DO 3,5T Lip Lip

Bieżnik. Klasa prędkości

NOWOŚCI 11/2016 WYDECH

PIERWSZE REJESTRACJE NOWYCH SAMOCHODÓW OSOBOWYCH I DOSTAWCZYCH DO 3,5T 2013 Lut Lut

Samochody w Polsce posiadanie, plany zakupu

FILTRON - OFERTA HIPOL

Klasyfikacja Generalna Sezonu 2017

ALKANTARA POKROWCE SAMOCHODOWE Certyfikat AirBag! SUPER JAKOŚĆ rozm. A

ALFA ROMEO BRERA Rok: Aktualizacja: CZERWONE NIEBIESKO- CZERWONE ZAP ON NIEBIESKO- CZARNY NIEBIESKO- NIEBIESKO- CZARNY NIEBIESKI

NOWOŚCI 01/2017 WYDECH

AUDI Audi A3 Sportback P (5-drzwiowy)

NAZWA HANDLOWA OPEL zestaw sprężyn układu hamulcowego Opel VAUXHALL CITROEN zestaw sprężyn układu hamulcowego Citroen, Peugeot PEUGEOT

Zestawy naprawcze układu hamulcowego

Fahrzeugliste für TAMI-Hundeboxen

Łańcuchy śniegowe i antypoślizgowe

Nowa funkcja dodana w wersji R3-2011

SZKŁA DO LUSTEREK WSTECZNYCH

Rozszerzenia i zmiany wersji oprogramowania 38

Każda felga posiada kilka cech, które świadczą o możliwości lub niemożliwości zastosowania jej w pojeździe. Wymieńmy te cechy:

MARKI I MODELE SAMOCHODÓW DO KTÓRYCH OFERUJEMY MATY DO BAGAŹNIKA

OFERTA KOŃCÓWEK. Końcówki - pojedyncze i podwójne. Rury montażowe. Końcówki i nakładki dedykowane. ulter.com.pl

DYWANIKI BAGAŻNIKOWE POLIETYLENOWE

PIERWSZE REJESTRACJE NOWYCH SAMOCHODÓW OSOBOWYCH I DOSTAWCZYCH DO 3,5T Maj Maj

Kontrolki i inne informacje

DYWANIKI BAGAŻNIKOWE POLIETYLENOWE z matą antypoślizgową i bez maty antypośligowej

LEXUS 1. Lexus RX, od Lexus NX, od 2014

Cena : 125,00 zł Nr katalogowy : comfort Dostępność : Dostępny Stan magazynowy : bardzo wysoki Średnia ocena : brak recenzji.

Cennik produktów Alfa Romeo 145,Lancia Delta 93-/Dedra 89-94/Fiat Tipo 91-95/Tempra TD

Nazwa produktu Marka Zastosowanie Dodatkowe informacje OES

ZETAWY KKK KP Marka pojazdu: Silnik: Pojemność: Moc: Rok produkcji: Numer części: Numer producenta: Marka pojazdu:

NOWOŚCI 10/2018 KAROSERIA

POMPA PALIWA

AUTA, W KTÓRYCH STWIERDZONO MOŻLIWOŚĆ USZKODZENIA GŁOWICY (ZAWORÓW)

K o m a x. Zakład Elektrotechniki Motoryzacyjnej. Katalog zastosowań produktów według typu pojazdu

Transkrypt:

2002 Mariusz Łapczyński Kat.d,o Analizy Rynku I a.d... Marketllłgowych Badania z drzew 1. Wprowadzenie do metodologii drzew klasyflkacylnych Celem niniejszego artykułu jest rozpoznanie struktury rynku nowych samochodów osobowych w Polsce. W badaniach wykorzystano bazę danych zawierającą ponad 800 dostępn yc h w sprzedaży marek i modeli samochodów wraz z ceną i wyposażeniem. Do klasyfikacji zbioru wykorzystano jed z metod zglębiania danych - CART (C!a.uificlI1ion alld Reg'.I.1iofl Tree.l). Jest to nieparametryczna metoda dyskryminacji zyskująca sobie coraz większą popularność w badaniach marketingowych. Gwałtowny przyrost informacji i objętości baz danych spowodowal równie gwałtowny wzrost potrzeb ich analizowania. Rozwój informatyki i powszechny dostęp do komputerów przyczynił się do powstania takich metod, jak zgłębianie danych (data millillg). Celem tych metod jest grupowanie i podział obiektów pod względem wyróżnionych cech. Umożliwiają one automatyczne wyszukiwanie wzorów i zależności w obszernych zbiorach danych, organizując je w zwięzłe modele. Stąd też techniki zgłębiania danych szybko znalazły zastosowanie w analizie danych marketingowych, m.in. w badaniach segmentacyjnych i badaniach se łektywności rynku. Drzewa klasyfikacyjne to, obok sztucznych sieci neuronowych' (Artificia! Neura! Network - ANN), najpopularniejsza metoda zgłębiania danych. Nazwa klasyfikacyjne wzięła się z angielskiego terminu c1assijicatio/j trees, choć bardziej właściwą bylaby nazwa dyskryminacyjne. Metody klasyfikacji i dyskryminacji wykorzystywane są w analizie struktury zbioru obserwacji,! często spoty kany jest termin sieci neuronowe, który nic jest dn koriea poprawny. ponicwa7. zapożyczony 'l.os rał 'l.c światu organizmów żywyth, przykładow o sieć neuronowa cz łowieka ma IO IU neuronów, a nic sposób przyjąć. r.c s ie ć sztuczna może poxiildać 10 miliardów clcl11coiów.

Marli/s,: l.apc':)'1jski jednak służą do rozwiązywania dwóch odrębnych problemów. Klasyfikacja polega na podziale analizowanego zbioru na K klas, które nie są znane. Dyskryminacja polega natomiast na przydzieleniu zbioru obserwacji do K klas mających własność jednorodności, przy czym charakterystyki tych klas są przynajmniej częściowo znane [Jajuga 1993, s. 1341. Tak jest właśnie w tym przypadku, kiedy analizowana jest struktura rynku samochodów osobowych pod względem cen pojazdu (zmienna ta jest zmienną zależną). Istnieje wiele technik klasyfikacji (dyskryminacji) wykorzystujących procedurę drzew decyzyjnych. Są to m.in.: - CART (Classificatioll and Regressioll Trces), - S- Plus tree (metoda oparta na algorytmie CART) opisana przez L.A. Clark id. Pregibona w 1993 L, - C4.5 - algorytm opisany przez J.R. Quinlana w 1993 L, - CHAID (Chi-Square Automatic IlIteraction Deteetion), - IND - opisany przez W. Buntine w 1992 L, - LMDT - algorytm opisany przez C.E. Brodley i P.E. Utgoff w 1995 L, - QUEST (Quick, Unhiased, EJficiellt Starisrical Trees), - OCI (Ohlique Decision Tree ClassiJier) opisany przez SX. Murthy'ego, S. Kasifa i S. Salzberga w 1994 L [Lim, Loh, Shih 19991. W niniejszej pracy opisano nie parametryczną metodę CART (Classificarion and Regression Trees). Algorytm CART został po raz pierwszy zaprezentowany w 1984 L przez jego twórców: Leo Breimana i współpracowników z Uniwersytetu Berkeley. Metoda ta zdobyla dużą popularność m.in. dzięki następującym cechom: - wykorzystuje każdą kombinację zmiennych ciągłych i kategorialnych (w przeciwieństwie do techniki CHAlO, zmienne ciągłe nie muszą być przekodowane na kategorialne), - obsługuje zbiory obserwacji o złożonej strukturze - w przeciwieństwie do modeli parametrycznych, które są przeznaczone do odkrywania pojedynczych dominujących struktur w zbiorze danych, CART jest zaprojektowany do pracy z danymi, których struktura jest wielowymiarowa, - jest niewrażliwa na występowanie obserwacji nietypowych, co do których istnieje przypuszczenie, że pochodzą z innej populacji, klasyczne statystyczne metody analizy nie są odporne na występowanie takich przypadków (które często występują w badaniach empirycznych), ta zaleta metody jest szczególnie ważna, jeśli wykorzystuje się regresyjne właściwości CART, - może być skutecznie wykorzystywana w zbiorach danych cechujących się licznymi brakami danych w zmiennych niezależnych (predyktorach), - wykorzystuje te same zmienne w różnych częściach drzewa, odkrywając kontekst zależności i interakcji między zmiennymi, - może wykorzystać liniową kombinację zmiennych niekategorialnych w celu określenia dalszego podziału drzewa. Metodologia CART opiera się na binarnym podziale rekursywnym zbioru obserwacji. Proces podziału jest binarny, ponieważ macierzyste punkty węzłowe

Badania drzewa zawsze dzielą się na dwa punkty węzlowe tzw. węzły-potomkowie (child nodes) i rekursywny, ponieważ węzeł-potomek traktowany jest w dalszym podziale jako macierzysty punkt węzłowy. Analiza danych z zastosowaniem CART dzieli się na 3 etapy: - podział każdego węzla w drzewie wedlug z góry ustalonych reguł, - wyznaczenie optymalnych rozmiarów drzewa, czyli zastosowanie odpowiedniego kryterium stopu, - przypisanie węzlów końcowych do klas wyników (lub wartości przewidywanej w przypadku regresji). Dychotomiczny podział każdego punktu węzłowego ma na celu przewidywanie lub wyjaśnienie kształtowania się kategorialnej zmiennej zależnej (dopuszczalna jest większa niż 2 liczba poziomów tej zmiennej) przez zestaw zmiennych niezależnych (zarówno ciąglych,jak i kategorialnych). Algorytm CART wyszukuje wszystkie możliwe podziały w analizowanym zbiorze danych. Rozważ.ając zbiór 803 przypadków (modeli samochodów osobowych) i 15 zmiennych (m.in.: moc silnika, pojemność silnika, wyposażenie w wersji standardowej i in.) można uzyskać 12045 (S03 x 15) możliwych podzialów. Do najczęściej stosowanych reguł binarnego podziału rekursywnego zalicza się regulę Giniego i entropię. O ile w analizie niewielkich zbiorów obserwacji, wybór reguły podziału jest malo istotny (uzyskuje się zbieżne wyniki), o tyle przy dużej liczbie przypadków nie jest on bez znaczenia. Regułę podziału Giniego przedstawiono na rys. I. Poszukuje się tutaj najliczniejszej klasy w zbiorze obserwacji (klasa A) i izoluje się j4 od pozostałych klas (B, C i D). Z uzyskanego w wyniku tego podziału węzła (z klasami B, C i D) wydziela się dwa kolejne, przy tym liczebność jednego z nich (klasa B) stanowija większość w węźle macierzystym. Ten sam algorytm jest stosowany aż do uzyskania drzewa, gdzie każdy z punktów węzłowych stanowi odrębną klasę. Drzewo klasyfikacyjne zilustrowane powyżej (rys. I) jest tylko klasycznym przykladem reguły Giniego - tak czyste węzły końcowe są w badaniach empirycznych rzadko spotykane. Druga reguła podzialu w metodzie CART wykorzystuje miarę nieokreśloności - entropię. Entropia, majqca swe korzenie w termodynamice, znalazła również zastosowanie w cybernetyce, a dokładnie w teorii informacji. Wyraża sięją wprowadzonym przez Hartleya wzorem [Mynarski 1979, s. 156]: h(p,l = log l;; = -logp; Przez P; należy rozumieć prawdopodobieństwo wystqpienia zdarzenia i, a przez h(p,l niepewność co do rezultatu zdarzenia i. Oznacza to, że im zdarzenie jest mniej prawdopodobne, tym większa niepewność co do jego wystąpienia. Jako przykład można tu podać IDO-krotny rzut symetryczną monetą. Prawdopodobieństwo wyrzucenia orla lub reszki jest takie samo, a zatem wartość entropii jest maksymalna. Prawdopodobieństwo wypadnięcia samych

Mariu,~': tylko orłów (lub reszek) jest najmniejsze i jemu przyporządkowana jest najmniejsza, zbliżona do zera, entropia. Gdyby za sukces w jednokrotnym rzucie syme tryczną monetą uznać wypadnięcie orła lub reszki (byloby to zdarzenie pewne, p = I) to ni eoznaczo ność równa bylaby w tym przypadku zero (zgodnie z wymaganiami miary nieokreśl o no ści h( I) = O). TAK kla sa A 40% klasa B 30% klasa C 209,) klasa D 100k I czy wiek klienta> 40 lat NIE I klasa A 40% I klasa B 30% klasa C 20% TAK klasa D 10%, czy miesięczny d(x:hój netto klienta > 1500 z. ł NIE kla sll B )0% klasa C 2()% klasa D lock,, ay khcnl ma wykształcenie TAK wyższe'! NtE kłsa D 10(,70 Rys. J. ReguJa podziału Giniego Żródło : opracowanie wła sne. Regula binarnego podzialu rekursywnego wykorzystująca miernik chaosu. jakim jest entropia. opiera się na wzorze na przeciętną ilość informacji przypadającej na jednostkę [Mynarski 1979, s. 1561: m H= - L.Pilogpi i.- I W przypadku CART obiekt w danym punkcie węzlowym ma jednakow<) szansę (p rawd opodobieńs two) znalezienia się w jednym Z dwóch węzlów -potomków, a zatem PI = /12 = 0,5. Celem tej reguly jest minimalizacja entropii (H = O) poprzez wybór optymalnego podzialu. W każdym węźle, a zatem na każdym etapie podzialu drzewa, wybierana jest pojedyncza zmienna, która

Badania pozwala na wyodrębnienie jednego czystego wę z la końcoweg o charakteryzującego s ię minimalną entropią. W pakiecie STATISTlCA znajduje s ię tylko jedna z wyżej wymienionych reguł podzialu - reguła Giniego. Zaoferowano natomiast podział oparty na statystyce chi-kwadrat (podobnej do chi-kwadrat Bartlella) oraz podział oparty na statystyce G-kwadrat (podobnej do chi-kwadrat najwyższej wiarygodności stosowanej w modelowaniu równali strukturalnych). Kolejnym etapem analizy z wykorzystaniem drzew klasyfikacyjnych jest określenie wielkości drzewa. W niniejszej pracy wykorzystuje się kryteria stopu dostępne w pakiecie STATISTlCA. Kryterium stopu to termin pochodzący m.in. z analizy skupisk [Grabiński 1992]. Pojawiał się on przy okazji problemu podziału dendrogramu. Kryterium stopu opierało s ię na mierniku CJi' którego maksymalna warto ść wyznaczała miejsce o najmniejszej gęstości połączeń gałęzi drzew. Jeśli chodzi o drzewa klasyfikacyjne, to kryterium zakojiczenia dalszego podziału, mo że być uzależni o ne od minimalnej liczebn ośc i w węzłach końcowych bądź też od minimalnych frakcji w tych punktach. W niniejszej pracy zastosowano wszystkie możliwe reguły podziału (Giniego, chi-kwadrat i G-kwadrat) oraz wszystkie kryteria stopu, jakie dostępne są w modułe drzewa klasyfikacyjne pakietu STATłSTlCA. Warto te ż zaz naczyć, że algorytm CART znajduje się w innych programach statystycznych m.in.: CART, SCAN, RECON. 2. Rozpoznani truktury rynku samochodów osobowych w Polsce Struktura rynku samochodów osobowych w Polsce jest uporządkowana już od dawna - istnieje podział na tzw. segmenty (tabela I). Nazwa segment jest niewłaściwa, gdyż podział ten, zaproponowany przez producentów, nie uwzgłędnia wszystkich kryteriów. Pominięte zostały takie zmienne, jak np. cena, wyposażenie, producent itp. Wystarczy spojrzeć na segment samochodów małych, gdzie obok Yugo (17 tys. zł, pojemność silnika 1100 cm 3, moc silnika 60 KM, bez dodatkowego wyposażenia w wersji standardowej) znajduje się Mercedes klasy A (65 tys. zł - czyli znacznie więcej niż wynoszą ceny samochodów z wyższych kłas, pojemność silnika 1600 cm'. moc s iłnika 102 KM, w wersji standardowej brakuje jedynie klimatyzacj i). Segmentacja polega na podziale rynku, na w zg lędnie jednorodne podukłady. charaktery z ujące się zbliżonymi pod względ em formy i tre śc i aktami wyboru [Mynarski 1982, s. 68]. Jeśli chodzi o nabywców samochodów z poszczególnych.. segmentów, to jest wysoce prawdopodobne, że określenie ich względnie jednorodnego profilu jest niemożliwe. Nie sposób bowiem przyjąć, że nabywcy ww. modeli samochodów, tj. Mercedesa klasy A i Yugo są do siebie podobni (chodzi tu oczywiście o cechy psychosocjologiczne, a nie fizjonomię). Stąd też nazwa segment pojawiać się będzie w dalszej części pracy w cudzysłowie.

Mariu,\'7. Tabela I. Segmenty rynku samochodów osobowych w Polsce we dług SAMAR Segment Segment sajlhx'hodów mi ni (Segmefl1 Mini Cors) Segment samochodów mini plus (Segm('nt Milli Plus) Dos1cpnc moliele Daewoo Tico, Fiat t26 EL, Fial Cinquecento, Fiat Scicento Citroen AX, Dae\voo Matiz, Tav rija, Ford Ka, Hyundai A10S, Renau lt Twingo, Scat Arosa, Suzuki Wagon R+ Sc-gmcnl samoc hodów ma ł yc h Citroen SaKO, Yugo. Fial Punto. Fial Uno. Fort! Fiesla, (Segment Smali) Kia Prid~, Lancia Y. Mazda 121, Mercedcs A-Class, Nissan Mina. Opel Corsa. P~ugcOl 106, Peugeot 206, Rcnaull Clio. Re nault Clio 11, Rover 200. Seat Ibil.a, Skoda Fel ic ia. Suzu ki Swift, Toyota Starlct, Toyota Yaris, Volkswagen Polo Segment klas)' niższej średn i ej Alfa Romeo 145, Alfa ROIlll..'(l 146, Audi A3, Citroen (Segmelll l,mw.'r Medium) Xsara, Citroen ZX, Daewoo Lanos, Daewoo Nexia, Polonez, Fiat Brava, Fiat Bravo, Fiat Palio Weekend, Fial Siena. Fo rd Escort, Ford Foc us. Honda Civic, I-Iy undai Acce nt, Kia Sephia, Ł ada 21 10, Ł ada Samara, Mazda 32.1. Mitsubishi Colt. Mitsubishi Lancer, Nissan Almera. Opel Astra, Ope t Astra H, Peugeot 306, Renault Mcganc, Rover 400, Seat Cordoba, Suzuki Balcno, Toyota Corolla, Volkswagen Golf. Vol kswagen Polo, VW Bora, Volkswagen New Beutlc Segment sanhkhndów kla sy Alfa Romeo 156, Audi A4. BM W 3 sedes, Chrys le r w y ż sz ej sn:dn icj Stratus. Citrncn Xantia, Daewoo E s p~ro, Daewoo (Segm(', Uppa Medium) Nubira, Fiat Marca. Ford Mondeo. Honda Accord, Hyundai LlIllra. Ki a Clarus, Mazda 626, Me-rccdes C-Class, Mitsubishi Carisma, Nissan Primera, Opel Vectra, Peuge ol 406, Renault Laguna, Rove r 6fX), Saab 'XIII, Saab 9-3, Scat Toledo, Skoda Octavia, Toyota Avcllsis. Toyot:1 Carina, Volkswagen Passat, Votvo S401V41l Segment samochodów klasy Alfa Romeo 166, Audi A6, BMW S senes, Chrysler. wyzszcj 3tX1M, Daewoo Leganz3. Ford Scorpio. Hyundai (Segment E recurive ) Sonata, Ił yu ndai Sonata Er, Lancia K, Mc rccdcs E Class, Mits ubi shi Ga lant, Ni ssan Maxima, Opel Omega, Peugeot 605, Renault Safrane. Saab 9000, Sailb 9-5, Toyola Camry. Volvo S70n O Segment samochodów Audi AX, Audi 58, BMW 1 senes. Honda Legend, luksusowych Jaguar Daimlcr. Jaguar XJ, Jaguar XK8, Jaguar S Ty pc, (Sl'gme,,' Lllxllry) Jagua r XK R, Mcrcedsc S-Class, Toyota Lcxus, Volvo S80, Volvo 590/90 SegnlCnl samochodów sportowych (Segmet Sport) Al fa Romeo Coupe. BMW Z 3, Ford Pum:l, Mercedes SLK Class, Nissan 200 SX. Opel Tigra, Porsche Box.lcr. Rcnau h Mcganc Coupe Segment wh;ksl.ych Audi n Coupe, BMW 8 senes, Honda Preludc, samoch()(lów sportowych Hyundai Coupe. Mercedes CL~C lass, Mercedes CLK- (Segmt'111 Slll'l'r Sport) Class, Porsc he 9 11, Volvo C70

Badania segmentów rynku molory-;.aqullego... cd. tabeli I Segment Segment małych vanów (Scgmt'1If Mini MPV) Segment vanów (Sl'g l111'iii I'rIPV, Segment małych silmochodów ICrcnowych (Segment Smal! SUV) Segment dui.ych samochodów terenowych (Sl~gmenl Lllrgt' SUV) Dost~pne modele Citroen Berlingo, Fiat Multipla, Mitsubishi Srace Star, Peugeot Partner. Renault Kangoo. Renault Megane Scenie Chrysler Grand Voyagcr. Citroen EVilsinn. Fi.al Ulyssc. Ford Galax y,!-ionda Shulllc. Kia Camival. Mercedes V -Class, Mitsuhishi Sanlamo. Renau lt Espace. Scal Alh'llllbra. Toyota Pienie. Volkswagen Sharan Honda er-y. Jeep Wrangler, bida Niva, Suzu ki Samurai. Suzuki ViIara, Suzuki Jimmy, Toyota RAV4 Daewoo Korando, Daewoo Musso. Damis Aro, Ford Explorer. Honda HR-V. Bundai Galloper. kep Grand Chcrokcc. Kia Sponagc. Land Rover Discoveryl IFreelander/Dcfcndcr, Mercelles G-Class. Mercedes M-CJass, Mit subishi PajeTO. Nissan Pal roi GR. Nissan Tarrano II. O pel Frontera, Ro ver Ran gc Rover, Ssangyong Korando. Ssangyong Musso, Suzuki Grand Vitara, Toyota l... and Cmiser Źr ó dło: opracowanie własne. Do rozpoznania slruktury rynku sa mochodów osobowych w Polsce wykorzystano, jak już wcze ś ni ej wspomniano, m e tod ę drzew klasyfikacyjnych CART. Z mienną za l eżną jest cena samochodu (z 30 września 1999 r.), a zmiennymi niezależnymi, Izw. prcdyktorami : moc si lnika (KM), pojemność silnika (cm J ).liczba drzwi, rodzaj nadwozia (sedun. hatchback, wagon i in.), typ paliwa (benzyna, diesel), kraj producenta' (polska, Włochy, Niemcy, Korca Płd. i in.), wyposażenie w wersji standardowej (ABS, wspomaganie kierownicy, elektryczne szyby, centralny zamek, klimatyzacja. poduszki powietrznej) Kolejno omówione zostaną wyniki analizy z u życie m kilku reguł podzialu (G iniego, chi-kwadrat i G-kwadrat) oraz różnych kryteriów slopu. 2 Pnez kraj pnxjuccnl3 należy TOwmieć ojczyznc; danej marki, trudno bowiem brać pud uwagę fubryki kai.dcgo koncernu motoryzacyj nego, które zlokalizowane są na calym niemal świecie, dla przykładu: Opel produkowany jest w Niemczec h. w Portugalii i w Polsce, a nic można przecież. po wiedzieć. że marka ta pochodzi z Gliwic..\ W przypadku poduszek powietrznych (Air Bag) zwróc.:ono uwagę na fakt wy slc;powania pomijaj'jc ich liczbę.

Mariusz. Lapcz,}',hki 3. Reguła GInlego I kryterium FACT S t os ując regułę Giniego i kryterium stopu FACT otrzymano drzewo przedstawione na rys. 2. I 40-60 tys. r, 562 moc silnika (KM) < 121 241-40- 60 tys. :> IOOtys.,. ~ SEGMENT = minimpv, 125 uppcrmc.lowcrmc. smali 4 5 11 6 60-80 tys. > 100 tys. 115 moc silnika ( KM)~191 6 7 60-80 tys. 100 tys. 10 PRODUCENT = Czechy, Hiszpania, 84 Francja. Niemcy, Korea Płd., Wiochy 31 8 9 60-80 tys. 80-100 tys. Rys. 2. Drlewo klasyfikacyjne CENA,liczba podzia ł ów = 4, Iiczba węz łów końcowych = 5 2roolo: opracowanie wlasoc. Drzewo lo sk łada się z 9 węz ł ów, z czego 4 to macierzyste punkty węz łowe, a 5 to węzły końcowe. Interpretacja węzłów końcowych wygląda na st ępująco: - węzeł nr 2 - to klasa samochodów w cenie 40-60 tys. zł (40; 60 >, są to pojazdy, których moc si łnika nie przekracza 12 1 KM ($ ł21 l, - węzeł nr 5 - to klasa samochodów, których cena przekracza 100 tys. zł, są to pojazdy o mocy silnika przekraczającej 121 KM, nie nale żące do segmentów Mini MPY, Upper Medium, Lower Medium i Smalt,

Badania. rynku nloior)'zacyjnego... - węzeł nr 7 - to klasa samochodów, których cena przekracza 100 tys. zł. s~l to samochody o mocy silnika przekraczającej 191 KM, nie nalei.q one do ww. ~ egmcnlow. - węzeł 8 - to klasa samochodów w cenie 60-80 tys. zl (60: 80 >, są to samochody z segmentów Mini MPY, UPrer Medium, Lowcr Medium i Smali, o mocy silnika nie przekrac zającej (~) 19 1 KM, produkcji czeskiej, hiszpańskiej, francuskiej, niemieckiej, koreańskiej i włoskiej, - węzel nr 9 - to klasa samochodów w cenie 80 - łoo tys. zł (80; 100 >, Sll to samochody z segmentów Mini MPY, Upper Medium. Lower Medium i Smali, o mocy silnika nie przekraczającej (~) 191 KM, wyprodukowane w Japonii lub w Stanach Zjednoczonych. 100 HO 40 20 o - o - ' - ~ ~ ',,' ~ ''.~ ~ ~ ~.-.. ' c.- u '- c c.o.. ' c, ' ~ ~ c _ el u.- t:: E N - 0- 'J o E o ~.- - c «~ ~ &' c c c c.. N E~ - ~ - N.- ' ' & o - c ~ u ~ N E _ - ~ c ' Q. - C 8.~ E u.lś 8..- - - 8. ~' E ' Prcdyktor '8. ~ g Rys. 3. Ranking ważności predyktorów CART-G INI-FACT. Zmienna zależna: CENA ranking w skali od O (niska ważność) do 100 (wysoka wai. nośó) Źródło: opracowanie własne. Na rys. 3 przedstawiono ranking ważności zmiennych niezależnych. Ponieważ CART jest nieparametryczną metodą klasyfikacji (dyskryminacji) zbiorów obserwacji, wi,c ważn ość prcdyktorów wyrażona jest inaczej ni7. w klasycznej analizie regresji wielokrotnej, a mianowicie na skali porządkowej. 100 oznacza wysoką, a O niską ważność predyktora. Wynik a s tąd, 7.e najistotniejs7.'1

Mariusz zmienną objaśniającą cenę samochodu jest moc silnika (100 pkt.). Dalej znajdują się: ex aequo pojemność silnika i przynależność do segmentu (95 pkt.), posiadanie ABS-u (82 pkt.), posiadanie klimatyzacji (57 pkt.), posiadanie wspomagania kierownicy (53 pkt.), kraj producenta (45 pkt.), wersja nadwozia (37 pkt.), posiadanie centralnego zamka i elektrycznie sterowanych szyb (po 35 pkt.) i posiadanie poduszki powietrznej (31 pkt.). Ranking zamyka rodzaj paliwa: benzyna i diesel (po 3 pkt.) - są to zatem najmniej istotne predyktory. W tabeli 2 zamieszczone zostały przypadki błędnie sklasyfikowane. Jest to tzw. macierz błędnych klasyfikacji, którą zestawia się zawsze przy okazji analizy z zastosowaniem drzew klasyfikacyjnych. W wierszach znajdują się klasy oczekiwane, a w kolumnach klasy obserwowane. Widać, że samochody z przedziału cenowego do 20 tys. zł zostały błędnie przypisane do klasy samochodów z przedziału cenowego 40-60 tys. zł (7 przypadków). 169 samochodów z klasy (20; 40 > zostało błędnie zaliczone do klasy (40; 60 >; 9 samochodów z klasy (40; 60 > zaklasyfikowanych zostało do klasy (60; 80> itd. Tabela 2. Macierz blędnych klasyfikacji CART-GINI-FACT Klasa Klasa Klasa Klasa Klasa Klasa do 20 tys, 20-40 tys. 40-1lO tys. 1lO-80 tys. 80- JOO tys. > HXl tys. do 20 tys. O O O O O 20-40 tys. O O O O O 40--1lO tys. 7 169 84 17 13 60-80 tys. O O 9 16 J3 80-100 tys. O O O 4 8 >IOOI)'s. O O O 8 3 Źródło: opracowanie własne. Wynika to z dwóch przyczyn: l. Jako regułę podziału wybrano regułę Giniego, a ta, jak już wcześniej wspomniano, polega na wyodrębnieniu klasy najliczniejszej i oddzieleniu jej od pozostałych klas, w tym przypadku zmienną wykorzystaną w pierwszym punkcie węzłowym była moc silnika, a zatem w węźle końcowym nr 2 znalazły się wszystkie samochody o mocy silnika nie przekraczającej ($) 121 KM, w klasie tej najliczniej reprezentowaną grupą była ta z przedziału cenowego (40; 60> -- stąd więe wzięła się nazwa tej klasy: (40; 60> tys. zł. 2. Jako kryterium stopu wybrano FACT, w tym przypadku drzewo kompletne jest traktowane jako drzewo właściwej wielkości, kryterium to jest oparte na minimalnej frakcji obiektów, oznacza to, że węzłem końcowym (w przypadku nierównych prawdopodobieństw a priori') może zostać węzeł zawierający 4 W badaniach empirycznych, gdzie zmienna zajd.na ma kilka poziomów, występowanie rów~ nego prawdopodobieństwa li priori jest mało prawdopodobne, oznaczałoby to bowiem, że praw-

Badania '... więcej niż. jedn'l klasę i posiadający nic wi~cej przypadków niż. określona frak cja dla jednej lub więcej klas, do zalet tego kryterium zaliczyć Illoi.na niewielkie rozmiary drzewa, co ulatwia graficzną prezentację wyników. 4. Reguła podziału chi-kwadrat I kryterium FACT W drugim przypadku zastosow'1il0 regulę podzialu ;(1 i kryterium stopu FACT. Drzewo uzyskane na tej drodze postępowania zilustrowano na rys. 4. Widać, i.e kształt drzewa uzyskanego tą regulą podziału różni się znacznie od tego na rys. 2. Do 15 wzrosła liczba węzlów drzewa, z czego 7 węzłów to węzły macierzyste, a 8 to kol1cowe punkty węzłowe. Interpretując węzły koilcowe (od najbardziej do najmniej licznego) można zaobserwować następujące cechy wyodrębnionych klas: - klasa samochodów z przedziału cenowego (40; 60 > tys. zł - 459 przypadków należących do segmentów: Mini, Mini Plus, Smali, Lower Medium, Mini MPY lub Mini SUY, - klasa samochodów w cenie przekraczającej 100 tys. zł - 136 przypadków Z segmentów: MPY, Sport, Super Spon, Luxury, Executive lub Upper Medium z poduszką powietrzml w wersji podstawowej modelu oraz z mocą silnika większ'l niż 139,5 KM, - klasa samochodów z przedziału cenowego (60; 80 > tys. zł - 72 przypadki z segmentów: Spon lub Upper Medium o pojemności silnika przekraczającej ł650 cm 3, wyprodukowanych w Hiszpanii, Francji lub w Niemczech, - klasa samochodów z przedziału cenowego (40; 60 > tys. zł - 42 przypadki z segmentów: MPY, Super Sport, Sport, Luxury, Executive lub Upper Medium, posiadających poduszki powietrzne i silniki o mocy nie przekraczającej (::;) \39,5 KM, wyprodukowane w Czechach (Skody), Korei Płd. (Daewoo, Kia, Hyundai) lub we Włoszech (Fiat), - klasa samochodów z przedziału cenowego (80; 100 > tys. zł - 34 przypadki z segmentów: Spon lub Upper Medium z silnikiem, którego pojemno ść przekracza 1650 cm J wyprodukowanych poza Hiszpani'l, Francją bądź Niemcami, - klasa samochodów z przedziału cenowego (60; 80 > tys. zł - 32 przypadki z segmentów: Sport lub Upper Medium z silnikiem, którego pojemność nie przekracza 1650 cm3, - klasa samochodów, których cena jest wyższa niż 100 tys. zł - 22 przypadki z segmentów: MPY, Super Spon, Luxury lub Executive z silnikiem o mocy nic przekraczającej (::;) 139,5 KM, nie wyprodukowane w Czechach, Korci Płd. czy we Włoszech, dopodobicńslwo powstania klasy samochodów z przedziału cenowego do 20 tys. zł (7 przypadków w całym, liczqcym 803 przypadki zbiorze obserwacji) jesl równe prawdopodobień s twu wydzielenia klasy samochodów z przedziału cenowego 40-60 ty s. zł (281 przypadków, el.yh 35(Yv calego zbioru obserwacji ).

40-60 tys. 344 SEGMENT = MPY, supersp, sport, lumry, execuiiv, uppenne 459 > 100 tys. 4Q-.6O tys_ 5 brak poduszek powietrznych 339 20-40 tys. > 100 tvs. 203 moc silnika (KM) < 1395 136 60-80 tys. > 100 tys. 42 P~~UCENT = Czechy, orea Płd., Włochy -,. 161 40-60 tys. 60--80 tys. 139 SEGMENT = sport, upperme -- 77 60-80 tys. > loolys_ 33 CCM < 1650 106 60--80 tys. 60-80 tys.. - - PRODUCENT = Hiszpania, Francja, Niemcy 72 34 60-80 tys. 80-100 tys. -. ~ ~ :: Rys. 4. Drzewo klasyfikacyjne CART X' - FACT. Drzewo klasyfikacyjne CENA liczba podziałów; 7; liczba węzłów końcowych; 8 Źródło: opracowanie własne.

Badall;a - klasa samochodów z przedzialu cenowego (20; 40 > tys. zl - S przypadków z.,segmentów: MPV, Super Sport, Sport, Luxury, Executive lub Upper Medium nie posiadajllcych poduszek powietrznych. Kolejność predyktorów w rankingu wa7.ności jest nieco inna nil. przy regule podzialu Giniego. Za najważniejszy predyklor uznany zostal segment (100 pkt.). Dalej kolejno ść prezentuje się następująco : moc silnika (KM) - 97 pkt., pojemność silnika (cm) - 92 pkt., kraj producenta - 79 pkt., posiadanie ABS-u - 70 pkt posiadanie klimatyzacji - 55 pkt posiadanie poduszki powietrznej - 45 pkt., posiadanie elektrycznie sterowanych szyb - 44 pkt., wersja nadwozia - 41 pkt., posiadanie wspomagania kierownicy - 36 pkt., posiadanie centralnego zamka - 34 pkt., ex aequo rodzaj paliwa: benzynowy i diesel - po 8 pkt. s. Roguła podziału G kwadrat I kryterlulii 'ACT Ostatni przedstawiony w niniejszej pracy wariant analizy 1. użyciem drzew klasyfikacyjnych opiera się na regule podzialu G2 i kryterium stopu FACT. Drzewo uzyskane na tej drodze ilustruje rys. 5. Drzewo to posiada II punktów węzlowych, z czego 5to węzły macierzyste, a 6 węzły końcowe. Interpretacja tych ostatnich (zaczynajc od węzła z największllliczebnością) jest następująca: - klasa samochodów z przedziału cenowego (20; 40 > tys. zł - 315 przypadków nie posiadając ych ABS-u w wersji podstawowej modelu, - klasa samochodów z przedziału cenowego (40; 60 > tys. zł - 252 prlypadki posiadające ABS w wersji standardowej, z silnikiem o mocy nie przekraczającej (!» 117 KM, - klasa samochodów, których cena jest wyższa niż 100 tys. zł - 116 przypadków posiadających ABS w wersji standardowej, z silnikiem o mocy wyższej niż 117 KM, nie należące do segmentów: Mini MPY, Upper Medium, Lower Medium i Smali, - klasa samochodów z przedziału cenowego (60; 80 > tys. zł - 78 przypadków z segmentów: Mini MPV, Upper Medium, Lower Medium lub Smali, posiadających ABS w wersji standardowej, z silnikiem o mocy mieszczącej się w prawostronnie domkniętym przedziale (117; 191 > KM, wyprodukowanych w Czechach, Hiszpanii, Francji, Niemczech, Korei Płd. lub we Włoszech, - klasa samochodów z przedziału cenowego (80; 100> tys. zł - 32 przypadki z segmentów; Mini MPV, Upper Medium, Lower Medium lub Smali, posiadających ABS w wersji standardowej, z silnikiem o mocy mieszczącej się w prawostronnie domkniętym przedziale (117; 19ł > KM, wyprodukowane w Japonii bądź USA, - klasa samochodów, których cena jest wyższa niż 100 tys. zł - \O przypadków z segmentów: Mini MPV, Upper Medium, Lower Medium lub Smali, posiadających ABS w wersji standardowej, Z silnikiem o mocy przekraczającej 191 KM.

315 40-60 Iys. ~łs = brak 20-40Iys. > I O(lIy s. 4S8 2-' )- moc siln ika (KM) ::; 117 236 40-60 tys. > 100 tys. 120 SEGM I~ = minimpv. uppcrmc, Jowcnnc, smali l 16 60-80 tys. > I no tys. 110 _ moc silnika (KM) $ 191 _ lo 6n- 80 tys. > ICKl tys. 78 PRODUCENT = Czc<h y. Hiszpania. Francja, Niemcy, Korca Pld., Wiochy :\2 6O- HO tys. HO- lix) tys. Rys. 5. Drzewo klasyfikacyjne CART-G '-FACf. liczba podzia ł ów = 5. liczba węz łów końcowych = 6 Zród ło: opracowanie własne. Waga poszczególn ych zmiennych o bja ś ni ającyc h jest zbliżona do tej z regu ly podzialu Giniego. Kolejność predyklorów przedslawia się na s lępująco : moc silnika (KM) - 100 pk!.. ex aequo pojemność silnika (cm 3 ) i segment - 97 pk!., posiadanie klimatyzacji - 52 pk!., posiadanie ABS-u - 49 pk!., kraj producenta - 39 pk!., wersja nadwozia - 37 pk!., posiadanie wspomagania kierownicy - 33 pk!., posiadanie elektrycznie Slcrowanych szyb - 3 1 pk!.. posiadanie centralnego zamka - 31 pk!., posiadanie poduszek powietrznych - 19 pkl., ex aequo rodzaj paliwa: benzyna i diesel - 3 pkt. 6. 'odsumowanlo Wykorzystanie drzew klasyfikacyjnych w rozpoznaniu struktury rynku wymaga wicie pracy. Wszystkie dost ępne w pakiecie STATISTICA reguly podzialu i kryteria stopu um oż liwiają utworzenie. z samy m tylko CARl', 9 ró ż-

Badania... rynku molory::.ac)jnego, nych drzew, o różnej liczbie węzłów kolicowych i różnej ważności predyktorów, Nic przesądza to wcale o małej skuteczności tej nieparametrycznej metody dyskryminacji, Wystarczy porównać uzyskane wyniki (tabela 3) i wybrać najlepsze rozwiązanie, Tabela 3, Koszty resubstytucji i liczba węzłów końcowych dla róż.nych regul podziału i różnych kryteriów stopu Krytcrium stopu Reguła podziału Giniego chi-kwadrat G-kwadrat minimalna liczność (5) 0,199253 O,12R269 O,I2R269 16 węzlów 42 węzły 38 węzłów bląd standardowy (I.<li 0,190536 0,1 t:l325 0,1 32(X14 19 węzłów 58 węzłów 48 węzłów FACT 0,437111 0,.l8854.1 0,407221 5 węzłów 8 węzłów 6 węzłów...1 Źródło: opracowanie własnc. Jak widać, spadek kosztu resubstytucji wiąże się ze wzrostcmliczby węzłów kolicowych. Prezentowanc w niniejszej pracy kryterium stopu FACT charakteryzuje się najmniejszą liczbą kolicowych punktów węzłowych, ale za to najwyższym kosztem resubstytucji, Jego niewątpliwą zalctą jest możliwość czytelnej graficznej prezentacji wyników, Z drugiej jednak strony duża liczba błędnych klasyfikacji skłania do wybrania innego kryterium stopu, Jeśli chodzi o ranking ważności predyktorów, to wyniki uzyskane wszystkimi metodami można porównać używając jednego z testów dla skal porządkowych (np, Spearmana lub T Kendalla), Drzewa klasyfikacyjne mają w branży motoryzacyjnej szerokie praktyczne zastosowanie, Z ich użyciem można ocenić wiarygodność kredytobiorcy (własne banki posiadają m.in, Opel, Renault), ocenić skuteczność reklamy pocztowej (mailing) czy przeprowadzić badania segmentacyjne rynku (zmienmj zależną byłby wtedy model samochodu np, Fiesta, Escort, Focus, Mondeo, Explorer, Puma) natomiast deskryptorami cechy demograficzno-ekonomiczne klientów, które, przynajmniej w części, posiada każdy punkt dealerski, Jeśli chodzi o ogólne wnioski z niniejszego opracowania, to trudno je wyci')gnąć, Przyczyn') są przedziały cenowe przyjęte przez autora tej pracy, Nie są satysfakcjonuj')ce dla sprzedawców wszystkich marek, co wynika z grupy docelowej poszczególnych producentów, Inną grup'), a tym samym innym przedziałem cenowym zainteresowany będzie producent Saab-a, a innym producent Daewoo, Powinno się w takich przypadkach ograniczyć analizowany zbiór obserwacji do wyhranego segmentu (np, Upper Medium) oraz przekodować zmienną objaśnianą, czyli cenę,

M ariltjz Literatura Descr iplioll of C/a.uijicarioll Methods, Rllle InduCl ion (CART and FuR ES). www.gepasi.dbs.abcr... c,uk G r a biń s k i T. [19921. Metody raksoflometrii. AE Kra ków. Jajuga K, (1 993]. Statystyczna allaliza wielowymiarowa, Wydawnictwo Na ukowe PWN. Warszawa. Mark W., t,ro(/u f.:rioll To Daw Mil/ing, www.ólic.lodheed.com Mynarski S. [19791. Elemet)' teorii syjtemów i cybernetyki, Wydawnictwo Na ukowe PWN, Warszawa. Mynarski S. [J 9821, Moc/elowanie rynku IV Uj('cill systemowym, PWN, Warszawa. Mynarski S. {1999], Struktury segmentac)jne powiqzmi importowo-eksportowych na rynkach europejskich [w:] Euromarkeling. Koncepcje. Strategie. Metody, pod red. J.W. Wiktora, AE w Krakowie, Kraków. Sagan A. {19981. Badania 11wrkt't illgowc, poc/stawowe kierun ki, AE Kraków. Sagan A. (1999 J, Drzewa klasyfikacyjne. referat z seminarium STATSOFf Marketing i statystyka, Warszawa. T.-S. Lim. W.-y. Loh, v.-s. Shih [1 9991, A Compari.wn oj Predict;oll ACI.:lI rtlcy. Comple.tity, and Training Time oj Thirty-three O/d and N(!w Classiji'cation A/gorithms, KJu wc r Acadcrnic PhI.. Boston. A Study ol Segments ol the Automobile Market Uslng Classlflcatlon and Regres.lon Trees (CART) The aim of Ihis work is 10 iden(ify Ihe Slructure of the market for new passcnger cars in Poland. For the purposes of classifyi ng his observations. (he author employed a Ilon-pararneter based method ot' data analysis - CART (Classification and Regress ion Trees). Alongside artificial neuraj networks. c1assification trees are the most popular method of finding models and rejationships in Jarge data bases. The possibility of introducing inl o the analysis inde pendent variabies localed at alllevels of Ihe measurement rnakes this mclhod very useful when a market is differenti ated, as is Ihe case with Ihe automobile market. Passenger cars posscss bolh quanlilalive fealures (engine power, cngine capacil y. maximum (um ing moment, etc.) and qualilali ve oncs (lype of bodywork. furni shings and fiuings, functionality of Ihe interior). This is why the CART method was used instead of Iradilional discrimination analysis.