EKONOMETRIA ECONOMETRICS 2(44) 2014



Podobne dokumenty
EKONOMETRIA ECONOMETRICS 2(44) 2014

Liczba samochodów osobowych na 1000 ludności

Recykling odpadów opakowaniowych

Frekwencja w wyborach parlamentarnych oraz samorządowych

Narażenie ludności miejskiej na powietrze zanieczyszczone ozonem

Zróżnicowanie regionalne PKB na 1 mieszkańca według PPP na poziomie NTS 3

Mapa Unii Europejskiej

Zrównoważona intensyfikacja rolnictwa jako kombinacja efektywności ekonomicznej i środowiskowej. prof. Andrzej Czyżewski mgr Jakub Staniszewski

Nowe i powstające czynniki ryzyka zawodowego a zarządzanie bezpieczeństwem i higieną pracy. wyniki ogólnoeuropejskiego badania przedsiębiorstw ESENER

Osoby dorosłe uczestniczące w kształceniu i szkoleniu

Sytuacja zawodowa osób z wyższym wykształceniem w Polsce i w krajach Unii Europejskiej w 2012 r.

Komunikat w sprawie pacjentów uprawnionych do świadczeń na podstawie dokumentów wystawionych przez inne kraje UE/EFTA

Odsetek gospodarstw domowych posiadających szerokopasmowy dostęp do Internetu w domu

Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze

STRATEGIA EUROPA 2020 PODSTAWOWE WSKAŹNIKI

solutions for demanding business Zastrzeżenia prawne

48,6% Turystyka w Unii Europejskiej INFORMACJE SYGNALNE r.

Katarzyna Maciejewska. Urząd Statystyczny w Poznaniu Oddział w Kaliszu

TABELA I: FLOTY RYBACKIE PAŃSTW CZŁONKOWSKICH (UE-28) W 2014 R.

Wykorzystanie Internetu przez młodych Europejczyków

(Tekst mający znaczenie dla EOG) (2017/C 162/05)

Obniżenie wieku emerytalnego: Straty dla przyszłych emerytów, pracujących i gospodarki

WSPÓLNA POLITYKA ROLNA W LICZBACH

Ankieta internetowa dla inspektorów

Warszawa, dnia 25 czerwca 2013 r. Poz. 724 ROZPORZĄDZENIE MINISTRA FINANSÓW 1) z dnia 17 czerwca 2013 r.

dr Sławomir Nałęcz Z-ca dyr. Dep. Badań Społecznych i Warunków Życia Główny Urząd Statystyczny

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Urząd Komunikacji Elektronicznej Departament Analiz Rynku Telekomunikacyjnego 1/18

Zakończenie Summary Bibliografia

FORMY PŁATNOŚCI STOSOWANE OBECNIE ORAZ PREFEROWANE

Urząd Komunikacji Elektronicznej Departament Analiz Rynku Telekomunikacyjnego. Warszawa, kwiecień 2008 r. 1/16

Zakupy on-line w europejskich gospodarstwach domowych. dr inż. Marlena Piekut Kolegium Nauk Ekonomicznych i Społecznych Politechnika Warszawska

Zmiany w strukturze wydatków polskich gospodarstw domowych na tle krajów UE w latach

PRAKTYCZNY PRZEWODNIK DLA WNIOSKODAWCÓW PROGRAM LEONARDO DA VINCI KONKURS 2012 PROJEKTY MOBILNOŚCI STAŻE I WYMIANY (IVT, PLM, VETPRO)

Łączność szerokopasmowa: zmniejszają się różnice między europejskimi krajami o najlepszych i najgorszych wynikach

Apteki a wejście do UE

Opóźnienia w płatnościach w transakcjach handlowych

2002L0004 PL

PRAKTYCZNY PRZEWODNIK DLA WNIOSKODAWCÓW

Analiza korespondencji

ZAŁĄCZNIKI. wniosku dotyczącego rozporządzenia Parlamentu Europejskiego i Rady. w sprawie europejskiej inicjatywy obywatelskiej. {SWD(2017) 294 final}

Klastry a międzynarodowa konkurencyjność sektorów rolno-żywnościowych w UE. Szczepan Figiel, Justyna Kufel, Dominika Kuberska

Porównanie wyników klasyfikacji krajów UE ze względu na strukturę zatrudnienia oraz nierówności płacowych kobiet i mężczyzn w różnych branżach*

Wyzwania polityki ludnościowej wobec prognoz demograficznych dla Polski i Europy

Perspektywa europejska rynku energii. Prof. Krzysztof Żmijewski Sekretarz Generalny. Rynek Energii w Polsce r.

Monitor konwergencji nominalnej

Wiek rozpoczynania edukacji obowiązkowej w Europie Opracował Zespół Polskiego Biura Eurydice

Katedra Ekonometrii i Statystyki Szkoła Główna Gospodarstwa Wiejskiego w Warszawie. Aleksandra Matuszewska-Janica

Społeczeństwo informacyjne w Unii Europejskiej

Gradacyjna analiza danych. Instytut Podstaw Informatyki PAN Wiesław Szczesny Emilia Jarochowska

EKSPORT WYROBÓW WYSOKIEJ TECHNIKI W UNII EUROPEJSKIEJ EXPORT OF HIGH TECH IN THE EUROPEAN UNION

KONSULTACJE NA TEMAT RÓŻNORODNOŚCI W MIEJSCU PRACY ORAZ ANTYDYSKRYMINACJI

Konsultacja interesariuszy w zakresie kształtowania polityki wobec małych przedsiębiorstw na szczeblu krajowym i regionalnym

SYTUACJA SPOŁECZNO-GOSPODARCZA W UNII EUROPEJSKIEJ W 2013 R. * Komisji Europejskiej z dn r.

Zmiany bezrobocia w województwie zachodniopomorskim w 2016 roku

OFERTA RAPORTU. Szkolnictwo wyższe analiza porównawcza Polski i wybranych krajów świata. Kraków 2012

PODOBIEŃSTWA RYNKÓW PRACY W GRUPIE KRAJÓW UE-28

Miejsce Polski w handlu zagranicznym produktami rolno-spożywczymi Unii Europejskiej. dr Łukasz Ambroziak mgr Małgorzata Bułkowska

Zmiany bezrobocia w województwie zachodniopomorskim w 2017 roku

EKONOMETRIA ECONOMETRICS 2(44) 2014

Zmiany bezrobocia w województwie zachodniopomorskim w 2015 roku

realizacji inwestycji zagranicznych w gminach woj. małopolskiego

Zmiany bezrobocia w województwie zachodniopomorskim w 2018 roku

WPŁYW INTEGRACJI EUROPEJSKIEJ NA KSZTAŁTOWANIE SIĘ WOLNOŚCI GOSPODARCZEJ

Wyższa Szkoła Ekonomiczna

realizacji inwestycji zagranicznych w gminach woj. Opolskiego

Konwergencja nominalna versus konwergencja realna a przystąpienie. Ewa Stawasz Katedra Międzynarodowych Stosunków Gospodarczych UŁ

LUDNOŚĆ WEDŁUG EKONOMICZNYCH GRUP WIEKU W LATACH

Zmiany bezrobocia w województwie zachodniopomorskim w I półroczu 2015 roku

Monitor Konwergencji Nominalnej

PRODUKT KRAJOWY BRUTTO W WOJEWÓDZTWIE ŚLĄSKIM W 2012 R.

ZRÓWNOWAŻONA INTENSYFIKACJA ROLNICTWA W PAŃSTWACH UNII EUROPEJSKIEJ O ZRÓŻNICOWANEJ STRUKTURZE AGRARNEJ. mgr Jakub Staniszewski

Zmiany bezrobocia w województwie zachodniopomorskim w I półroczu 2014 roku Porównanie grudnia 2013 i czerwca 2014 roku

RYNEK MIĘSA DROBIOWEGO

Wynagrodzenie minimalne w Polsce i w krajach Unii Europejskiej

Agroturystyka w Polsce na tle pozostałych krajów Unii Europejskiej

PŁACA MINIMALNA W KRAJACH UNII EUROPEJSKIEJ

Warszawa, 8 maja 2019 r. BAS- WAPL 859/19. Pan Poseł Jarosław Sachajko Przewodniczący Komisji Rolnictwa i Rozwoju Wsi

Wydatki na ochronę zdrowia w

JAKOŚĆ ŻYCIA W KRAJACH UNII EUROPEJSKIEJ PODSTAWOWE WSKAŹNIKI

Monitor konwergencji nominalnej

1. Mechanizm alokacji kwot

Scenariusze migracji międzynarodowych na lata : wstępne założenia

Statystyka wniosków TOI 2011

Poziom wydatków na edukację w krajach członkowskich Unii Europejskiej

MIKROEKONOMICZNE KORZYŚCI Z KSZTAŁCENIA WYŻSZEGO

Wizualizacja spożycia produktów żywnościowych w Europie przy użyciu programu GradeStat

Działalność innowacyjna przedsiębiorstw w Polsce na tle państw Unii Europejskiej

WSPÓŁCZYNNIK AKTYWNOŚCI ZAWODOWEJ LUDNOŚCI WEDŁUG PŁCI W LATACH

Tablica wyników Unii badań i innowacji z 2014 r.

Ocena efektywności systemu zdrowia publicznego i opieki medycznej w krajach UE

Udział Polski w 7. Programie Ramowym Dane statystyczne po 219 konkursach

Konwergencja nominalna versus konwergencja realna a przystąpienie. Ewa Stawasz Katedra Międzynarodowych Stosunków Gospodarczych UŁ

Konwergencja nominalna versus konwergencja realna a przystąpienie. Ewa Stawasz Katedra Międzynarodowych Stosunków Gospodarczych UŁ

RYNEK MIĘSA DROBIOWEGO

RYNEK MIĘSA DROBIOWEGO

Delegacje otrzymują w załączeniu dokument COM(2017) 112 final - ANNEXES 1-9.

Sytuacja osób po 50 roku życia na śląskim rynku pracy. Konferencja Kariera zaczyna się po 50-tce Katowice 27 stycznia 2012 r.

Polityka zabezpieczenia społecznego w Unii Europejskiej

Zagrożenie zjawiskiem carbon leakage

Transkrypt:

EKONOMETRIA ECONOMETRICS 2(44) 2014 Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2014

Redaktor Wydawnictwa: Joanna Świrska-Korłub Redaktor techniczny: Barbara Łopusiewicz Korektor: Barbara Cibis Łamanie: Małgorzata Czupryńska Projekt okładki: Beata Dębska Publikacja jest dostępna w Internecie na stronach: www.ibuk.pl, www.ebscohost.com, w Dolnośląskiej Bibliotece Cyfrowej www.dbc.wroc.pl, The Central European Journal of Social Sciences and Humanities http://cejsh.icm.edu.pl, The Central and Eastern European Online Library www.ceeol.com, a także w adnotowanej bibliografii zagadnień ekonomicznych BazEkon http://kangur.uek.krakow.pl/ bazy_ae/bazekon/nowy/index.php Informacje o naborze artykułów i zasadach recenzowania znajdują się na stronie internetowej Wydawnictwa www.wydawnictwo.ue.wroc.pl Kopiowanie i powielanie w jakiejkolwiek formie wymaga pisemnej zgody Wydawcy Copyright by Uniwersytet Ekonomiczny we Wrocławiu Wrocław 2014 ISSN 1507-3866 Wersja pierwotna: publikacja drukowana Druk i oprawa: EXPOL, P. Rybiński, J. Dąbek, sp.j. ul. Brzeska 4, 87-800 Włocławek

Spis treści Wstęp... 7 Paweł Baranowski, Jan Jacek Sztaudynger: Wpływ światowych cen ropy naftowej na ceny w Polsce... 9 Dorota Witkowska: Wrażliwość hedonicznych indeksów cen na przykładzie indeksów cen dzieł znanych malarzy polskich... 17 Alicja Grześkowiak: Wykorzystanie wybranych form i technik wizualizacji danych w badaniach struktur społeczno-ekonomicznych... 31 Małgorzata Machowska-Szewczyk, Agnieszka Sompolska-Rzechuła, Grzegorz Spychalski: Analiza powiązań między cechami opisującymi kapitał społeczny w gospodarstwach rolnych z wykorzystaniem wielowymiarowej analizy korespondencji... 45 Antoni Smoluk: Wykres cosinusa jest elipsą... 57 Aleksandra Sabo-Zielonka, Grzegorz Tarczyński: Porównanie czasów kompletacji zamówień dla różnych sposobów wyznaczania trasy magazynierów na przykładzie dużego centrum logistycznego... 62 Jadwiga Sobieska-Karpińska, Marcin Hernes: Istota funkcji odległości w wyznaczaniu consensusu w systemach wspomagania decyzji... 82 Adam Sagan: Recenzja książki Projektowanie badań społeczno-ekonomicznych. Rekomendacje i praktyka badawcza autorstwa Małgorzaty Rószkiewicz, Jolanty Perek-Białas, Doroty Węziak-Białowolskiej i Agnieszki Zięby-Pietrzak... 95 Summaries Paweł Baranowski, Jan Jacek Sztaudynger: World oil price impact on prices in Poland... 16 Dorota Witkowska: Sensitivity of hedonic price indexes on the example of the art price indexes evaluated for well-known Polish painters... 30 Alicja Grześkowiak: Application of selected forms and techniques of data visualization in analyzing socio-economic structures... 44 Małgorzata Machowska-Szewczyk, Agnieszka Sompolska-Rzechuła, Grzegorz Spychalski: Analysis of the relations between social capital features in the farms with the use of multidimensional correspondence analysis... 56 Antoni Smoluk: Graph of the cosine function is an ellipse... 61 Aleksandra Sabo-Zielonka, Grzegorz Tarczyński: Comparison of order-picking times for different routing methods in real large logistics centre... 81 Jadwiga Sobieska-Karpińska, Marcin Hernes: The essence of a distance functions in consensus determining in decision support systems... 94

EKONOMETRIA ECONOMETRICS 2(44) 2014 ISSN 1507-3866 Alicja Grześkowiak Uniwersytet Ekonomiczny we Wrocławiu e-mail: alicja.grzeskowiak@ue.wroc.pl WYKORZYSTANIE WYBRANYCH FORM I TECHNIK WIZUALIZACJI DANYCH W BADANIACH STRUKTUR SPOŁECZNO-EKONOMICZNYCH Streszczenie: W artykule zaprezentowano wybrane metody wizualizacji, które mogą być przydatne podczas przeprowadzania analiz i porównywania struktur społeczno-ekonomicznych. Praca poświęcona jest technikom niewymagającym redukcji wielowymiarowości, której towarzyszy zazwyczaj utrata części informacji zawartych w zbiorze danych. Przedstawiono metody graficznej prezentacji struktur oraz ilustrowania ich podobieństwa i braku podobieństwa, podkreślając wady i zalety poszczególnych rozwiązań. Rozważania przeprowadzono na podstawie danych dotyczących struktury wykształcenia ludności krajów Unii Europejskiej. Słowa kluczowe: analiza struktur społeczno-ekonomicznych, wizualizacja danych, struktura wykształcenia. DOI: 10.15611/ekt.2014.2.03 1. Wstęp Jednym z nurtów badań społeczno-ekonomicznych jest analiza struktur określonych zbiorowości. Struktura jest w tym przypadku traktowana jako specyficzny obiekt złożony, scharakteryzowany nie wartościami różnych cech, lecz ciągiem wskaźników struktury p 1 r, p 2,..., p r takich, że p 1 k = 1 k = [Strahl (red.) 1998, s. 45]. Elementy p k odzwierciedlają względne natężenie cechy w składnikach struktury, pozbawione są więc mian i sumują się do jedności, co pozwala na stosowanie swoistych metod pomiaru podobieństwa i odległości [Strahl (red.) 1998, s. 45]. Wymienione własności decydują również o preferencjach w zakresie graficznego sposobu przedstawiania struktur, które tradycyjnie ilustruje się za pomocą wykresów kołowych oraz skumulowanych wykresów słupkowych bądź kolumnowych. Tego rodzaju ilustracja bardzo dobrze sprawdza się w sytuacjach, w których należy zaprezentować strukturę jednego obiektu lub przeprowadzić analizę porównawczą dla kilku obiek-

32 Alicja Grześkowiak tów, natomiast staje się mniej czytelna, gdy przedmiotem analizy jest ich znaczna liczba. Ponieważ grafika, obok opisu słownego i tabel, stanowi bardzo użyteczny sposób przekazywania informacji statystycznej [Du Toit, Steyn, Stumpf 1986, s. 1], warto rozważyć inne techniki wizualizacji, które mogą mieć zastosowanie wspomagające badanie i porównywanie struktur. Niniejsza praca realizuje dwa cele. Nadrzędnym celem poznawczym o charakterze metodologicznym jest przegląd alternatywnych sposobów graficznej prezentacji obiektów opisanych za pomocą ciągu wskaźników struktury oraz ilustrowania ich podobieństwa lub braku podobieństwa. Tak określonemu celowi zostały podporządkowane cele szczegółowe: wskazanie metod prezentacji elementów składowych struktur, wizualizacja podobieństwa struktur w powiązaniu z zastosowaniem metod grupowania, prezentacja graficzna braku podobieństwa struktur. Realizowanym równolegle celem poznawczym o charakterze merytorycznym jest porównanie państw Unii Europejskiej pod względem struktury wykształcenia, będącej jedną z miar kapitału ludzkiego. Analizę przeprowadzono na podstawie danych Eurostatu 1, zwracając szczególną uwagę na sytuację Polski na tle pozostałych krajów. Zgodnie z przyjętą przez Europejski Urząd Statystyczny metodologią definiuje się trzy zagregowane kategorie wykształcenia, odpowiadające określonym szczeblom edukacyjnym według Międzynarodowej Standardowej Klasyfikacji Wykształcenia (International Standard Classification of Education ISCED 1997), umożliwiającej porównywanie zagadnień z zakresu kształcenia w różnych krajach, a składającej się z siedmiu poziomów: ISCED 0-ISCED 6. Zestawienie agregatów przedstawiono w tab. 1. Tabela 1. Rozpatrywane kategorie wykształcenia a poziomy klasyfikacji ISCED 1997 Nazwa kategorii Niższe średnie Wyższe średnie Wyższe Poziomy ISCED 0: edukacja przedszkolna, osoby bez wykształcenia ISCED 1: szkolnictwo podstawowe ISCED 2: szkolnictwo średnie I stopnia ISCED 3C: szkolnictwo średnie II stopnia o krótkim czasie nauki nieumożliwiające kontynuację edukacji na poziomie ISCED 5 ISCED 3: szkolnictwo średnie II stopnia (z wyjątkiem ISCED 3C o krótkim czasie nauki) ISCED 4: szkolnictwo policealne niezaliczane do szkolnictwa wyższego ISCED 5: szkolnictwo wyższe (pierwszy etap profil akademicki i zawodowy) ISCED 6: szkolnictwo wyższe (drugi etap zdobywanie kwalifikacji naukowych stopień doktorski) Źródło: opracowanie na podstawie [Dorośli w systemie edukacji formalnej... 2011, s. 80] oraz [http:// epp.eurostat.ec.europa.eu/cache/ity_sdds/en/edat_esms.htm]. 1 Dane pochodzą z bazy [Educational attainment and outcomes ].

Wykorzystanie wybranych form i technik wizualizacji danych w badaniach struktur... 33 Należy zwrócić uwagę, że kategorię niższe średnie należy traktować jako co najwyżej ten rodzaj wykształcenia, gdyż zawiera ona osoby całkowicie bez wykształcenia oraz legitymujące się najniższymi jego poziomami, jak podstawowe oraz niższe średnie. Wykorzystane w pracy dane pochodzą z bazy Eurostatu stworzonej na podstawie LFS (Labour Force Survey) z 2012 r. i dotyczą osób w wieku 25-64 lat. 2. Wybrane formy i techniki graficznej prezentacji struktur Wizualizację struktur bardzo często przeprowadza się za pomocą wykresów kołowych, skumulowanych kolumnowych oraz skumulowanych słupkowych. Jak nadmieniono we wstępie, tego rodzaju ujęcie jest odpowiednie i przejrzyste w przypadku ilustrowania jednej struktury bądź kilku struktur. W sytuacji porównywania większej liczby obiektów istnieje możliwość zastosowania zestawu wielu wykresów o tym samym charakterze. Przykładowo na rys. 1 przedstawiono prezentację gra- AT Austria, BE Belgia, BG Bułgaria, CZ Czechy, CY Cypr, DE Niemcy, DK Dania, EE Estonia, ES Hiszpania, FI Finlandia, FR Francja, GR Grecja, HR Chorwacja, HU Węgry, IE Irlandia, IT Włochy, LT Litwa, LU Luksemburg, LV Łotwa, MT Malta, NL Holandia, PL Polska, PT Portugalia, RO Rumunia, SE Szwecja, SI Słowenia, SK Słowacja, UK Wielka Brytania. Rys. 1. Ilustracja struktury ludności w wieku 25-64 lat według wykształcenia w krajach Unii Europejskiej z zastosowaniem zestawu wykresów kołowych Źródło: opracowanie własne na podstawie danych Eurostatu z wykorzystaniem programu STATISTI- CA ver. 10.

34 Alicja Grześkowiak ficzną struktury wykształcenia w krajach Unii Europejskiej za pomocą tzw. wykresu obrazkowego składającego się z zestawu dwudziestu ośmiu wykresów kołowych. Analogicznie można przedstawić dane, używając zbioru wykresów kolumnowych. Niewątpliwie tego rodzaju prezentacja wspomaga przekaz informacji, pozwalając uchwycić kluczowe prawidłowości, które nie byłyby wyraźnie widoczne w przedstawieniu tabelarycznym, ujmującym osiemdziesiąt cztery liczby. Przykładowo, korzystając z rys. 1., łatwo wskazać państwa, w których dominuje jeden z elementów struktury, np. bardzo wysoki odsetek osób z co najwyżej niższym średnim wykształceniem w Portugali i na Malcie, czy znaczna przewaga osób z wykształceniem wyższym średnim w Czechach, Polsce i na Słowacji. Możliwe jest również odszukanie obiektów o najwyższych czy najniższych wartościach danego składnika, choć nie wynika to bezpośrednio z formy wykresu, lecz wymaga porównania ze sobą wszystkich elementów, co przy dużej ich liczbie byłoby bardzo utrudnione. W celu porównania poszczególnych składowych struktur można się posłużyć trellisami, które stanowią grupę narzędzi kompleksowej graficznej prezentacji (...) danych przestrzennych lub wielowymiarowych na jednym diagramie [Suchecki (red.) 2010, s. 54]. Wizualizacja trellisowa przypomina swą konstrukcją prostokątną tabelę, zawierającą zestaw wykresów jednego typu, co umożliwia wyciągnięcie wniosków dotyczących zarówno wierszy, jak i kolumn [Suchecki (red.) 2010, s. 54], co w przypadku analizy struktur oznacza, że można przeprowadzać porównania wartości poszczególnych wskaźników struktury oraz obiektów. Bogate możliwości w zakresie tworzenia trellisów oferuje pakiet lattice dostępny w programie R, a ich obszerną charakterystykę można znaleźć w pracy Sarkara [2008]. Na rysunku 2 przedstawiono struktury będące przedmiotem rozważań za pomocą techniki trellisów z wykorzystaniem wykresów punktowych (dotplot), wzbogaconych o połączenia z punktem zerowym, co jest pomocne przy ocenie wartości relatywnych (por. [Sarkar 2008, s. 57-58]). Ujęcie zaprezentowane na rys. 2 pozwala na szybką ocenę obiektów pod względem wartości wskaźników struktury oraz na wskazanie, jak duże są różnice występujące pomiędzy nimi. Zastosowanie jednakowej skali dla wszystkich wykresów umożliwia identyfikację elementów dominujących w poszczególnych obiektach. Rysunek 2 został sporządzony z zachowaniem porządku alfabetycznego, ale jeśli jest to pożądane ze względów interpretacyjnych, można obiekty uporządkować według wybranej kategorii. Układ punktów na rys. 2 unaocznia, że największe różnice dotyczą osób o najniższym poziomie wykształcenia. Bardzo niski odsetek ludności słabo wyedukowanej występuje na Litwie i w Czechach wobec wyraźnej przewagi tej części struktury w Portugalii i na Malcie. Najmniejsze dysproporcje odnotowano w przypadku osób o wyższym wykształceniu. Rozpatrując sytuację w Polsce, można stwierdzić, że na tle pozostałych państw odsetek osób o wykształceniu co najwyżej niższym średnim jest niewielki, o wyższym średnim relatywnie duży, a o wyższym przeciętny. Wydaje się, że wykresy typu trellis nadają się do badania pozycji jednego obiektu względem pozostałych, natomiast nie odzwierciedlają w bezpośredni

Wykorzystanie wybranych form i technik wizualizacji danych w badaniach struktur... 35 i przejrzysty sposób relacji pomiędzy wszystkimi obiektami ze względu na wszystkie wymiary. Rys. 2. Ilustracja struktury ludności w wieku 25-64 lat według wykształcenia w krajach Unii Europejskiej z zastosowaniem zestawu wykresów typu trellis Źródło: opracowanie własne na podstawie danych Eurostatu z wykorzystaniem programu R. Alternatywnym rozwiązaniem w przypadku badania struktur trójelementowych mogą być wykresy trójkątne (zob. np. [Aitchison 1986, s. 5-7; Friendly 2000, s. 97-98]), bazujące na fakcie, że dla każdego wektora składającego się z trzech nieujemnych elementów (p A, p B, p C ), spełniających warunek p A + p B + p C = 1, istnieje dokładnie jeden punkt należący do trójkąta równobocznego o wysokości 1 odległy od jego boków o p A, p B, p C, co daje jednoznaczne przedstawienie struktur trójele-

36 Alicja Grześkowiak mentowych [Aitchison 1986, s. 6]. Idea tego rodzaju wizualizacji została zaprezentowana na rys. 3. Rys. 3. Zasada konstrukcji wykresu trójkątnego odzwierciedlającego strukturę trójelementową Źródło: opracowanie własne z wykorzystaniem programu R. Obiekty reprezentowane na wykresie trójkątnym mają trzy współrzędne, które mogą być odczytane na podstawie siatki znajdującej wewnątrz trójkąta lub skali zamieszczonej na jego bokach. Im bliżej danego wierzchołka znajduje się punkt, tym udział cechy przypisanej temu wierzchołkowi jest większy. Na rysunku 3 zaznaczono kółkiem przykładowy punkt, którego udziały wynoszą odpowiednio dla A: 0,35, dla B 0,2, dla C 0,45. Odwzorowanie analizowanych struktur odnoszących się do wykształcenia ludności krajów UE za pomocą tego typu wykresu przedstawia rys. 4. Wykres trójkątny umożliwia przegląd konfiguracji wielu obiektów ze względu na ich struktury. Pozwala zidentyfikować grupy obiektów podobnych ze względu na trzy cechy łącznie oraz elementy odstające. Naniesienie siatki z wartościami daje możliwość odczytania (przybliżonych) wartości udziałów i zorientowania się, które obiekty odznaczają się podobnym poziomem danego wskaźnika struktury. Układ punktów na rys. 4 pozwala stwierdzić, że w przeważającej części państw europejskich dominuje ludność o wykształceniu wyższym średnim. Punkty odstające istnieją ze względu na wysokie udziały osób o wykształceniu co najwyżej niższym

Wykorzystanie wybranych form i technik wizualizacji danych w badaniach struktur... 37 * Oznaczenia jak na rys. 1. Rys. 4. Ilustracja struktury ludności w wieku 25-64 lat według wykształcenia w krajach Unii Europejskiej z zastosowaniem wykresu trójkątnego * Źródło: opracowanie własne na podstawie danych Eurostatu z wykorzystaniem programu R średnim, natomiast tego rodzaju dysproporcji nie ma w przypadku wykształcenia wyższego. Wykres trójkątny stanowi przydatne narzędzie wizualizacji danych, ma jednak istotne wady. Po pierwsze, nie sprawdza się w przypadku struktur charakteryzujących się bardzo dużym podobieństwem. Wówczas punkty leżą bardzo blisko siebie lub nakładają się i rozpoznanie poszczególnych obiektów jest znacznie utrudnione. Po drugie, jego zastosowanie jest ograniczone do struktur trójelementowych. W sytuacji dysponowania obiektami opisanymi za pomocą więcej niż trzech wskaźników struktury można zastosować technikę wizualizacji promieniowej (Radial Vizualization RadViz) (zob. [Hoffman i in. 1997]). Jak opisują Dzemyda i in. [Dzemyda, Kurasova, Žilinskas 2012, s. 11], na obwodzie koła umieszcza się w równych odstępach r kotwic (reprezentujących cechy) o współrzędnych Sj = ( sj1, sj2), a współrzędne Yi = ( yi1, yi2) obiektów umieszczonych wewnątrz koła są wyznaczane jako:

38 Alicja Grześkowiak Y i r j= 1 r = = sx j x j 1 ij gdzie x ij oznacza wartość j-tej cechy w obiekcie o numerze i. Rozpatrywany zbiór danych zilustrowany za pomocą narzędzia RadViz przedstawiono na rys. 5. ij, (1) Rys. 5. Ilustracja struktury ludności w wieku 25-64 lat według wykształcenia w krajach Unii Europejskiej z zastosowaniem wykresu RadViz Źródło: opracowanie własne na podstawie danych Eurostatu z wykorzystaniem programu Orange [Demšar i in. 2013]. Obiekty odznaczające się dużym podobieństwem są umiejscowione blisko siebie. Obiekt o równych udziałach byłby położony dokładnie pośrodku koła, natomiast znaczna przewaga danego wskaźnika struktury skutkuje usytuowaniem punktu w bliskim sąsiedztwie odpowiadającej mu kotwicy. Ten sposób graficznej prezentacji danych wielowymiarowych pozwala zauważyć istniejące prawidłowości, określić skupienia obiektów podobnych i wskazać obserwacje nietypowe. Pewną wadą tego rozwiązania jest brak skali na wykresie, stąd też jego zasadnicze zastosowanie to interpretacja konfiguracji punktów względem siebie i względem kotwic. Z kolei niezaprzeczalną zaletą jest możliwość prezentacji struktur o wielu wymiarach.

Wykorzystanie wybranych form i technik wizualizacji danych w badaniach struktur... 39 Porównanie struktur wielowymiarowych można także przeprowadzić, wykorzystując wykres współrzędnych równoległych, na którym uwzględnione zmienne są prezentowane jako równoległe pionowe 2 osie wyskalowane, np. w zakresie od minimalnej do maksymalnej wartości, a poszczególne obiekty są reprezentowane przez łamaną łączącą punkty na osiach [Inselberg 1985]. Zastosowanie tego wykresu przedstawia rys. 6. Rys. 6. Ilustracja struktury ludności w wieku 25-64 lat według wykształcenia w krajach Unii Europejskiej z zastosowaniem współrzędnych równoległych Źródło: opracowanie własne na podstawie danych Eurostatu z wykorzystaniem programu R. Podobnie jak wizualizacja promieniowa, tak i wykres współrzędnych równoległych umożliwia wskazanie obserwacji nietypowych (przebieg linii łamanej odmienny od pozostałych) oraz identyfikację obiektów o podobnych strukturach (analogiczny przebieg linii łamanych). Z kolei układ punktów na osiach pozwala wnioskować o stopniu zróżnicowania poszczególnych elementów struktur. 3. Wizualizacja podobieństwa i braku podobieństwa struktur Oprócz bezpośredniej wizualizacji struktur przedmiotem zainteresowania może być także ich podobieństwo lub jego brak, które może zostać zmierzone za pomocą specyficznych miar wykorzystujących fakt, że suma składników struktury równa się jedności. Zestawienie stosowanych podejść pomiaru zawiera praca Strahl [Strahl (red.) 1998]. Do oceny braku podobieństwa struktur ludności według wykształcenia w krajach Unii Europejskiej zastosowano odległość Canberra [Strahl (red.) 1998, s. 47]: 2 Układ pionowy pierwotnie proponowany przez Inselberga ma także późniejsze modyfikacje, w których osie reprezentujące zmienne przedstawiane są w poziomie.

40 Alicja Grześkowiak d ij 1 r pik - pjk =, (2) k = 1 r pik + pjk gdzie: r liczba elementów struktury, p ik, p wskaźniki struktury k-tej cechy jk w obiektach i oraz j. Obliczając mierniki odległości dla n obiektów, otrzymuje się macierz odległości o wymiarach n n, której percepcja na podstawie liczb nie jest łatwa. Analizę można wspomóc, stosując techniki wizualizacji macierzy oferowane np. w pakiecie corrplot programu R, przeznaczonym wprawdzie przede wszystkim do odzwierciedlania macierzy korelacji, ale umożliwiającym również graficzne ujęcie dowolnej tablicy liczb. Stopień braku podobieństwa lub podobieństwa może zostać przedstawiony za pomocą dwóch elementów łącznie: wielkości różnych symboli i natężenia koloru [Friendly 2002]. Wizualizacja macierzy odległości dla analizowanego zbioru danych z zastosowaniem kół jest przedstawiona na rys. 7. * Oznaczenia jak na rys. 1. Rys. 7. Ilustracja macierzy braku podobieństwa struktur ludności w wieku 25-64 lat według wykształcenia w krajach Unii Europejskiej * Źródło: opracowanie własne na podstawie danych Eurostatu z wykorzystaniem programu R.

Wykorzystanie wybranych form i technik wizualizacji danych w badaniach struktur... 41 Rysunek 7 pozwala łatwo odnaleźć struktury najbardziej niepodobne do pozostałych (Portugalia, Malta, Hiszpania, Czechy) czy porównać strukturę w danym kraju z innymi, np. w porównaniu z Polską najbardziej różni się struktura na Malcie, a do odznaczających się największym podobieństwem zaliczyć można strukturę na Łotwie, Węgrzech, w Słowenii i Niemczech. Chcąc przedstawić podobieństwo struktur, można miary odległości zamienić na współczynniki podobieństwa, np. za pomocą formuły [Brzeziński (red.) 2004, s. 509]: qij = 1 - dij a, (3) gdzie a oznacza maksymalną odległość pomiędzy dwoma różnymi obiektami. Aby przybliżyć możliwości pakietu corrplot na rys. 8 ujęto graficznie macierz podobieństw z zastosowaniem kwadratów, wykresów kołowych, natężenia koloru oraz grupowania obiektów podobnych. Oznaczenia jak na rys. 1* Rys. 8. Ilustracja uporządkowanej macierzy podobieństwa struktur ludności w wieku 25-64 lat według wykształcenia w krajach Unii Europejskiej* Źródło: opracowanie własne na podstawie danych Eurostatu z wykorzystaniem programu R.

42 Alicja Grześkowiak Wielkość kwadratów, stopień wypełnienia wykresów kołowych, nasycenie kolorem oraz grupowanie ułatwiają wizualną ocenę podobieństwa struktur 3. Wizualizacje zaprezentowane na rys. 7 i rys. 8 reprezentują macierz odległości i macierz podobieństwa. Innym podejściem ukazującym graficznie zgodność obiektów pod względem struktur jest połączenie rezultatów wyników grupowania hierarchicznymi procedurami aglomeracyjnymi z przedstawieniem za pomocą kolorów macierzy pierwotnych danych ilustracja typu heatmap (zob. np. [Chen, Haerdle, Unwin 2008, s. 567-568]) zaprezentowana na rys. 9. Dendrogram znajdujący się po lewej stronie rysunku daje możliwość wyodrębnienia klas obiektów podobnych oraz prześledzenia kolejnych etapów procedury aglomeracyjnej. Z kolei natężenie kolorów (w wierszach) pozwala na wgląd w strukturę ludności według wykształcenia w poszczególnych krajach. Rys. 9. Ilustracja grupowania struktury ludności w wieku 25-64 lat według wykształcenia w krajach Unii Europejskiej z zastosowaniem wizualizacji typu heatmap Źródło: opracowanie własne na podstawie danych Eurostatu z wykorzystaniem programu R. 3 Warto nadmienić, że innym sposobem graficznej prezentacji macierzy podobieństw w połączeniu z grupowaniem jest diagram Czekanowskiego, zaproponowany już na początku XX w. (zob. np. [Steczkowski, Zeliaś 1981, s. 29-37]).

Wykorzystanie wybranych form i technik wizualizacji danych w badaniach struktur... 43 Dendrogram na rys. 9 sugeruje podział na pięć lub sześć skupień. Klasę najbardziej niepodobną do pozostałych, przyłączaną w ostatnim etapie aglomeracji stanowią Portugalia, Malta i Hiszpania. W grupie z Polską znajdują się Słowenia, Niemcy, Łotwa, Litwa i Estonia, czyli państwa odznaczające się bardzo wysokim odsetkiem ludności o wykształceniu wyższym średnim i stosunkowo dużym odsetkiem osób najlepiej wykształconych. 4. Podsumowanie Wszystkie przedstawione narzędzia wizualizacji należą do grupy technik niewymagających redukcji wielowymiarowości, która zazwyczaj odbywa się kosztem utraty pewnej ilości informacji. Zastosowania niektórych z form nie ograniczają się jedynie do analiz struktur, choć i w tym obszarze na pewno stanowią cenne uzupełnienie prowadzonych analiz, zgodnie z powiedzeniem: jeden obraz mówi więcej niż tysiąc słów. Można się spodziewać, że wraz ze wzrostem liczby informacji oraz rozwojem oprogramowania, w tym darmowego, znaczenie technik graficznej prezentacji będzie coraz większe. Zaprezentowane metody mogą z powodzeniem zastąpić obszerne tabelaryczne zestawienia danych, zwłaszcza w celu poglądowego przedstawienia relacji pomiędzy strukturami wielu badanych obiektów. Literatura Aitchison J., The Statistical Analysis of Compositional Data, Springer, 1986. Brzeziński J. (red.), Metodologia badań psychologicznych. Wybór tekstów, Wydawnictwo Naukowe PWN, Warszawa 2004. Chen C.H., Haerdle W., Unwin A., Handbook of Data Visualization, Springer-Verlag 2008. Demšar J. i in., Orange: Data mining toolbox in python, Journal of Machine Learning Research 2013, 14(Aug.), s. 2349-2353. Dorośli w systemie edukacji formalnej: polityka i praktyka w Europie, Komisja Europejska, wyd. polskie: Fundacja Rozwoju Systemu Edukacji, Warszawa 2011. Du Toit S.H.C., Steyn A.G.W., Stumpf R.H., Graphical Exploratory Data Analysis, Springer-Verlag, New York 1986. Dzemyda G., Kurasova O., Žilinskas J., Multidimensional Data Visualization: Methods and Applications, Springer, 2012 Educational attainment and outcomes of education (edat), http://epp.eurostat.ec.europa.eu/portal/page/ portal/statistics/search_database [dostęp: 5.03.2014]. Friendly M., Corrgrams: Exploratory displays for correlation matrices, The American Statistician 2002, 56.4, s. 316-324. Friendly M., Visualizing Categorical Data, SAS Institute, 2000. Hoffman P., Grinstein G., Marx K., Grosse I., Stanley E., DNA visual and analytic data mining, [w:] Visualization 97, Proceedings IEEE, 1997, s. 437-441. http://epp.eurostat.ec.europa.eu/cache/ity_sdds/en/edat_esms.htm [dostęp: 15.03.2014]. Inselberg A., The plane with parallel coordinates, The Visual Computer 1985, 1.2, s. 69-91. Sarkar D., Lattice: Multivariate Data Visualization with R, Springer, 2008.

44 Alicja Grześkowiak Steczkowski J., Zeliaś A., Statystyczne metody analizy cech jakościowych, Państwowe Wydawnictwo Ekonomiczne, Warszawa 1981. Strahl D. (red.), Taksonomia struktur w badaniach regionalnych, Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław 1998. Suchecki B. (red.), Ekonometria przestrzenna: metody i modele analizy danych przestrzennych, Wydawnictwo C.H. Beck, Warszawa 2010. APPLICATION OF SELECTED FORMS AND TECHNIQUES OF DATA VISUALIZATION IN ANALYZING SOCIO-ECONOMIC STRUCTURES Summary: The paper presents a selection of visualization methods which may be useful for the analyses and comparisons of socio-economic structures. The work is focused on the techniques that do not require dimensionality reduction, which is usually accompanied by the loss of some information from the dataset. The methods of graphical presentation of structures and illustration of their similarities and dissimilarities are considered as well as strengths and weaknesses of various solutions are outlined. The discussion is based on data concerning the structures of education attainment in the European Union countries. Keywords: analysis of socio-economic structures, data visualization, education attainment structure.