UOGÓLNIONA MIARA ODLEGŁOŚCI -BADANIA SYMULACYJNE 1. l. Wprowadzenie 2

Wielkość: px
Rozpocząć pokaz od strony:

Download "UOGÓLNIONA MIARA ODLEGŁOŚCI -BADANIA SYMULACYJNE 1. l. Wprowadzenie 2"

Transkrypt

1 PRCE NUKOWE KDEMII EKONOMICZNEJ WE WROCŁWIU Nr TKSONOMI 9 Klasyfikacja i analiza danych. Teoria i zastosowania Marek Walesiak, ndrzej ąk, Krzysztof Jajuga kademia Ekonomiczna we Wrocławiu UOGÓLNION MIR ODLEGŁOŚCI -DNI SYMULCYJNE 1 l. Wprowadzenie 2 Wykorzystanie niektórych metod statystycznej analizy wielowymiarowej (metody klasyfikacji, skalowanie wielowymiarowe, metody porządkowania liniowego) wymaga sformalizowania pojęcia odległości obiektów. Funkcja d : x --7 R ( - zbiór obiektów badania, R- zbiór liczb rzeczywistych) jest miarą odległości wtedy i tylko wtedy, gdy spełnione są warunki: -nieujemności: d 1 t ~O dla i, k =l,..., n (numery obiektów); -zwrotności: d 1 t =O<=> i= k dla i, k =l,..., n; -symetryczności: d 1 k =d ki dla i, k =l,..., n. W pracy Walesiaka [2000] zaproponowano uogólnioną miarę odległości, w konstrukcji której wykorzystano ideę uogólnionego współczynnika korelacji r,k obejmującego współczynnik korelacji liniowej Pearsona i współczynnik korelacji tau Kendalla (zob. Kendall i uckland [1986], s. 266; Kendall [1955], s. 19): (l) 1 Pracę wykonano częściowo w ramach projektu badawczego nr finansowanego przez Komitet adań Naukowych w latach Punkt ten opracowano na podstawie prac Walesiaka [1993; 1999; 2000]. 116

2 gdzie: d; 1 (s;t) - miara odległości (podobieństwa), i, k, l =l,..., n- numer obiektu, j = l,..., m- numer zmiennej, xij (xki,xu) -i-ta (k-ta, l-ta) obserwacja naj-tej zmiennej. Stosowanie konkretnych konstrukcji miar odległości jest uzależnione od skal pomiaru zmiennych. W teorii pomiaru rozróżnia się cztery podstawowe skale pomiaru, uporządkowane od najsłabszej do najmocniejszej: nominalna, porządkowa, przedziałowa, ilorazowa. Dla zmiennych mierzonych na skali ilorazowej i (lub) przedziałowej w formule (l) stosowane jest podstawienie: aipj = xij- xpj dla p= k,l (2) b krj- - x kj- x rj dla r = l, l Zasób informacji skali porządkowej jest nieporównanie mniejszy. Jedyną dopuszczalną operacją empiryczną na skali porządkowej jest zliczanie zdarzeń (tzn. wyznaczanie liczby relacji większości, mniejszości i równości). W konstrukcji miernika odległości musi być wykorzystana informacja o relacjach w jakich pozostają porównywane obiekty w stosunku do -!l pozostałych obiektów re zbioru. Dla zmiennych mierzonych na skali porządkowej w formule (l) stosuje się podstawienie (W alesiak [1993], s ): dla xij > xpi ( xki > x,i) aipj(bk,j- O dla xij=xpi (xkj=xj, dlap=k,l;r=i,l; (3) -l dla xij < xpj ( xki < x 1 ) W mianowniku wzoru (l) pierwszy czynnik oznacza liczbę relacji większości i mniejszości określoną dla obiektu i, czynnik drugi zaś liczbę relacji większości i mniejszości określoną dla obiektu k. Miary o postaci (l) nie można jej stosować bezpośrednio, gdy zmienne są mierzone jednocześnie na różnych skalach. Zastosowanie miary (l) z podstawieniem (3) rozwiązuje częściowo ten problem, ale wtedy zostaje osłabiona skala pomiaru dla zmiennych mierzonych na skali przedziałowej i (lub) ilorazowej (przekształcone zostają one w zmienne porządkowe, ponieważ w obliczeniach uwzględniane są tylko relacje większości, mniejszości i równości). Miara odległości dik (zob. Walesiak [1999]): - może być stosowana w sytuacji, gdy obiekty opisane są zmiennymi mierzonymi na skali ilorazowej, przedziałowej lub porządkowej, - przybiera wartości z przedziału [O; 1]. Wartość O oznacza, że dla porównywanych obiektów i, k między odpowiadającymi sobie obserwacjami na zmiennych zachodzą tylko relacje równości. W przypadku podstawienia (3) wartość l oznacza, że gdy dla porównywanych obiektów i, k między odpowiadającymi sobie obserwacjami na zmiennych porządkowych zachodzą tylko relacje większości 117

3 (mniejszości) lub relacje większości (mniejszości) oraz relacje równości jeżeli relacje te są zachowane w stosunku do pozostałych obiektów (a więc obiektów o numerach l = l,..., n ; gdzie l :t i, k); - spełnia warunki: nieujemności d; 1 ~O, zwrotności d;; =O, symetryczności dlk =d/ej (dla wszystkich i, k = 1,..., n), - nie zawsze spełnia warunek nierówności trójkąta (potwierdziły ten wniosek przeprowadzone analizy symulacyjne), - istnieje przynajmniej jedna para obiektów w zbiorze badanych obiektów, dla której obserwacje na zmiennych nie są identyczne (dla uniknięcia zera w mianowniku d; 1 ); - nie zmienia wartości w wyniku transformacji wartości zmiennych za pomocą dozwolonego na danej skali przekształcenia matematycznego (na skali porządkowej: dowolna ściśle monotonicznie rosnąca funkcja; na skali przedziałowej: funkcja liniowa; na skali ilorazowej: funkcja liniowa jednorodna). Uogólniona postać miary odległości, w której uwzględnia się wagi zmiennych, określonajest wzorem (por. Walesiak [1999]): (4) gdzie: w 1 - wagaj-tej zmiennej spełniająca warunki: w 1 e (0; m), [, w 1 =m. m j=l 2. Rezultaty badań symulacyjnycb 3 Obecnie zaprezentowane zostaną rezultaty badań symulacyjnych pozwalające ocenić zachowanie się uogólnionej miary odległości przy różnych strukturach danych. Przeprowadzono 4 typy badań. Zbiory danych zostały wygenerowane za pomocą procedur RNMNGN, RNMNPR i RNECUY zawartych w pracy randta [1998], dostępnych w postaci kodów źródłowych w językach FORTRN 77 i C. W badaniu l do otrzymania 50 i 100 dwuwymiarowych obserwacji zgodnych z rozkładem normalnym wykorzystano procedury RNMNGN i RNMNPR, które generują liczby losowe odpowiednie do zadanych wektorów średnich i macierzy kcwariancji (randt [1998], s ). Przyjęto dla czterech struktur danych ten sam wektor średnich J1 = [o o r oraz zróżnicowane macierze kowariancji: 3 Punkt ten opracowano na podstawie pracy: Jajuga, Walesiak i ąk [2001). 118

4 ~=[~ ~J. ~=[o~s 0 ~ 5 ]. ~=[o~9 ~ 9 ]. ~=[~ ~J. Dla tak wygenerowanych struktur danych (zob. rys. l) wyznaczono macierze odległości za pomocą miar GDMI (dla zmiennych porządkowych), GDM2 (dla zmiennych mierzonych na skali ilorazowej i/lub przedziałowej), LI (odległość miejska), L2 (odległość Euklidesowa) i LN (odległość Czebyszewa). Następnie obliczono wartości współczynników korelacji Pearsona, Kendalla i Spearmana między tak wyznaczonymi macierzami odległości. Odległości obliczone za pomocą miary GDMl dla 4 struktur danych są w kolejności najsilniej skorelowane z odległościami obliczonymi za pomocą miar Ll, L2 i LN. Odległości obliczone za pomocą miary GDM2 dla trzeciej i czwartej struktury danych są w kolejności najsilniej skorelowane z odległościami obliczonymi za pomocą miar L2, L1 i LN. Dla pierwszej struktury danych kolejność jest następująca: L2, LN, LI. Z kolei dla drugiej struktury nadal odległości GDM2 są najsilniej skorelowane z odległościami obliczonymi za pomocą miary L2, natomiast nie możnajednoznacznie ustalić kolejności względem LI i LN. 50 obserwacji 100 obserwacji I struktura danych ~ ~ 3, ~l O ': o l l 2 ~l o l 2 l r----r--"t""" ) 2 l 2.) 2 l o II struktura danych , ~"~--~.. o >l 2 l :,."ł.m ~ '\~ """"" ""Jr.. tt_tif.,. ~"t( 't...,. ~ "ł..) i r ,..---r----1 l 3 2 l 3 2 l o 119

5 III struktura danych l -2 ly,.'jł M M ~ o -l 2 2.J "r-""t"""-~---., , r.j 2 l o T ~ IV struktura danych 3.J 2 l T , ';t o l "'l o > l ~-~--~--~--...-J 5,0 2,5 0,0 2,5 5, ,0 2,5 0,0 Rys. l. 50 i 100 dwuwymiarowych obserwacji dla czterech struktur danych o zadanym J1. i E W badaniu 2 do otrzymania 50 i 100 dwuwymiarowych obserwacji o zadanych kształtach geometrycznych (elipsa, koło, kwadrat, prostokąt) wykorzystano procedurę RNECUY, która generuje ciągi liczb losowych o rozkładzie jednostajnym. Generator ten został opracowany przez P. L'Ecuyera i umożliwia uzyskiwanie liczb losowych z przedziału (0, l) o długim okresie rzędu (randt [1998], s ). Lokalizację losowanych liczb w określonym przedziale wartości (a, b) przeprowadzano na podstawie zależności r (b -a)+ a, gdzie r - wygenerowana liczba losowa (ąk [1999], s. 69). Dla tak wygenerowanych struktur danych (zob. rys. 2) wyznaczono macierze odległości za pomocą miar GDMl, GDM2, Ll, L2 i LN. Następnie obliczono wartości współczynników korelacji Pearsona, Kendalla i Spearmana między tak wyznaczonymi macierzami odległości. Odległości obliczone za pomocą miary GDMI są w kolejności najsilniej skorelowane z odległościami obliczonymi za pomocą miar Ll, L2 i LN (niezależnie od struktury danych). Odległości obliczone za pomocą miary GDM2 dla drugiej i trzeciej struktury danych są w kolejności najsilniej skorelowane z odległościami 2,5 5,0 120

6 obliczonymi za pomocą miar L2, LI i LN. Dla pierwszej i czwartej struktury danych odległości GDM2 są najsilniej skorelowane z odległościami obliczonymi za pomocą miary L2. W badaniu 3 zbiory danych zawierały 50 obserwacji dwuwymiarowych zmiennych porządkowych przyjmujących wartości od l do 50. Rozpatrywano następujące struktury danych dwóch zmiennych porządkowych: a) doskonała zgodność uporządkowań 50 obiektów, b) doskonała niezgodność uporządkowań 50 obiektów, c) 10,20 i 50 losowych zamian obiektów dlajednej zmiennej w zgodnym uporządkowaniu 50 obiektów, d) l O, 20 i 50 losowych zamian obiektów dla jednej zmiennej w niezgodnym uporządkowaniu 50 obiektów, e) 20 losowo wygenerowanych uporządkowań. Do losowej zamiany par realizacji dwóch zmiennych wykorzystano biblioteczny generator liczb losowych pakietu orland C++ uilder (funkcja rand()) generujący liczby losowe z zakresu od O do RND_MX. Generator ten umożliwia uzyskiwanie całkowitych liczb losowych o okresie 2 32 Lokalizację losowanych liczb w określonym przedziale wartości (O, n) przeprowadzano na podstawie zależności r mod n, gdzie: r - wygenerowana liczba losowa, n - liczba obserwacji (ąk [1999], s. 68). Dla wygenerowanych struktur danych wyznaczono macierze odległości za pomocą miar GDMI, GDM 2, LI, L2 i LN. Następnie obliczono wartości współczynników korelacji Pearsona, Kendalla i Spearmana między tak wyznaczonymi macierzami odległości. 50 obserwacji 100 obserwacji Struktura I (elipsa) """ ł. "'.,. 1,.."" Ił" ~l o- l "' ~ ~ ~ 11 l lf. 1 M " ~ "l o i' " """ 2 1.s.) - l " 121

7 ... Struktura II (koło) 1,0 -r ;: , r ,0 o, s J,.1 0,0 ': 1 0,0 la -O, S o, s -0,5 - { M ~ ł ł -1,0 -'r---r----'t' ł -1,0 -'r---.., ~ -1,0 -O, S 0,0 0,5 1,0-1,0 -O,S 0,0 o,s 1,0 V l 2 r-~ ~~~s_tru k~turalll(kwam~a~t)~----~ ~ f 0'r----r----r----r----r--~ 4 O Jt- J ~--~--~--~--..,..--~ o 2 o Struktura IV (prostokąt) 3~ ~~ , 3~~ ~~~~ 2 o). li\,; ło 2 ~ ~l /; ~ 01~----~----r---~----~--~ 0~----~--~----~---T----~ o o Rys i 100 dwuwymiarowych obserwacji o zadanych kształtach geometrycznych 122

8 Dla doskonałej zgodności uporządkowań i doskonałej niezgodności uporządkowań 50 obiektów: a) odległości obliczone za pomocą miary GDMI są ściśle dodatnio skorelowane z odległościami obliczonymi za pomocąmiar LI, L2 i LN, b) współczynniki korelacji (odpowiednio Pearsona, Kendalla, Spearmana) między odległościami obliczonymi za pomocą miary GDM2 a odległościami obliczonymi za pomocąmiar GDMl, L l, L2 i LN przyjmują tę samą wartość. Dla losowej zamiany obiektów dla jednej zmiennej (lo, 20 i 50 zmian) w zgodnym i niezgodnym uporządkowaniu 50 obiektów odległości obliczone za pomocą miary GDMI są w kolejności najsilniej skorelowane z odległościami obliczonymi za pomocą miar LI, L2 i LN. Odległości GDMl są ściśle dodatnio skorelowane z odległościami obliczonymi za pomocą miary LI. Odległości GDM2 są w kolejności najsilniej skorelowane z odległościami obliczonymi za pomocą miar L2, LI i LN. Dla 20 wygenerowanych losowych uporządkowań odległości obliczone za pomocą miary GDMI w 19 przypadkach są w kolejności najsilniej skorelowane z odległościami obliczonymi za pomocą miar LI, L2 i LN. Odległości GDM2 w 18 przypadkach są w kolejności najsilniej skorelowane z odległościami obliczonymi za pomocą miar L2, L l i LN. W badaniu 4 do otrzymania 50 dwuwymiarowych obserwacji zgodnych z rozkładem normalnym i reprezentujących 4 skupienia separowalne wykorzystano procedury RNMNGN i RNMNPR, które generują liczby losowe odpowiednie do zadanych wektorów średnich i macierzy kowariancji (randt [1998], s ). Położenie i jednorodność 4 separowalnych skupień zadawano za pomocą wektorów średnich (środki ciężkości skupień) i macierzy kowariancji (rozproszenie obiektów) (Grabiński, Wydymus i Zeliaś [1989], s ). Dla wygenerowanych 12 struktur danych (zob. rys. 3 i 4) wyznaczono macierze odległości za pomocąmiar GDM1, GDM2, L1, L2 i LN. Następnie przeprowadzono klasyfikację 50 obiektów dla każdej tak wyznaczonej macierzy odległości za pomocą 4 metod klasyfikacji: średniej międzyklasowej (GL), średniej wewnątrzklasowej (WGL), najbliższego sąsiada (NN), najdalszego sąsiada (FN). W dalszej fazie zbadano, które miary odległości w połączeniu z metodą klasyfikacji pozwalają zidentyfikować 4 separowalne skupienia (zob. tab. l i tab. 2). Tabela l. Liczba prawidłowo wyodrębnionych klas GDMl GDM2 Ll L2 LN GL 3 lo WGL NN lo 6 FN Srednia 2,75 9,25 7,00 8,75 6,50 Źródło: Obliczenia własne. 123

9 (a) N >' (c) (e) ~ (b) ~ 6 łt'/'':.łt ~ l III 10 J#, t 4 '* "" 8 'l. r rr l ł.. 5 r f' rr 2 rrl' r r rr lr $ o o o o ( (d) '?;.rr rr r r r rf'łrł 10 M... rrr t l l "' r 4 >' r..- r 11 "' "' '! r r '!l o o o (f) r rr 'tl' 12 9 ~ j! N N 6 5 >' >' 3 Frr "" ~ 9.\'1\ 1.r" l- rr o r r r rrf",_ 'i- 8 a 8 \ l Rys dwuwymiarowych obserwacji reprezentujących 4 skupienia separowalne dla struktur danych (a) - (f) 124

10 (g) (h) rr 18 r r 8 r 'Tfr N >l >l (i) Jll;: 3 l </. "' li ł (a f f~rr f r ~rf r 'rr r r i (j) N >l >l 20 r r 6 (k) e /i ~... z. 10 :).a o.a o (l) ""' \ ( IIII \ ~l 9 " ~ fij ~l '\.Ą r r r,r u ~ łl 13 ".,. Ił ll:fj r r Ił r r r r r łl r r r f.. Ił o -3 o Rys dwuwymiarowych obserwacji reprezentujących 4 skupienia separowalne dla slluktur danych (g)-(l) 125

11 Tabela 2. Średnie podobieństwo z 12 wyników klasyfikacji obliczone za pomocą miernika Randa GDMl GDM2 Ll L2 LN GL 0,925 0,984 0,958 0,971 0,956 WGL 0,920 0,991 0,970 0,994 0,984 NN 0,883 1,000 0,957 0,977 0,934 FN 0,923 0,956 0,953 0,958 0,950 Średnia 0,913 0,983 0,960 0,975 0,956 Źródło : Obliczenia własne. Dla 12 struktur danych i 4 metod klasyfikacji najlepsze rezultaty otrzymano dla miar odległości GDM2 i L2, które dają zbliżone rezultaty w sensie wyodrębnienia separowalnych klas. 3. Uwagi końcowe W artykule zaprezentowano uogólnioną miarę odległości o postaci (l) i (4) oraz scharakteryzowano jej własności. Następnie zaprezentowano rezultaty badań symulacyjnych pozwalających ocenić jej zachowanie przy różnych strukturach danych. Dla oceny uogólnionej miary odległości przeprowadzono 4 typy badań. Dodatkowym rezultatem opracowania jest program komputerowy GDM dla uogólnionej miary odległości o postaci (4) napisany w języku C++, pracujący w systemie operacyjnym Windows 95/98. Program korzysta z danych zapisanych w plikach baz danych standardu DF lub D, natomiast wyniki obliczeń zapisuje w plikach D. W aktualnej wersji program GDM umożliwia realizację następujących zadań obliczeniowych: wyznaczenie macierzy odległości między obiektami (rezultatem jest symetryczna macierz odległości), liniowe uporządkowanie obiektów (rezultatem jest wektor odległości obiektów od wzorca), uwzględnienie skal pomiaru zmiennych (porządkowa, przedziałowa, ilorazowa), normalizację zmiennych dla skali przedziałowej oraz ilorazowej, definiowanie wag zmiennych Uednakowych i zróżnicowanych), definiowanie współrzędnych wzorca (z uwzględnieniem zmiennych o charakterze stymulant, clestymulant i nominant) w przypadku liniowego porządkowania obiektów. Literatura ąk. (1999), Modelowanie symulacyjne wybranych algorytm6w wielowymiarowej analizy porównawczej w języku C++, Wydawnictwo E, Wrocław. 126

12 randt S. (1998), naliza danych. Metody statystyczne i obliczeniowe, PWN, Warszawa. Grabiński T., Wydymus S., Zeliaś. (1989), Metody taksonomii numerycznej w modelowaniu zjawisk społeczno-gospodarczych, Pod redakcją. Zeliasia, PWN, Warszawa. eliwig Z. (1968), Zastosowanie metody taksonomicznej do typologicznego podziału krajów ze względu na poziom ich rozwoju i strukturę wykwalifikowanych kadr, "Przegląd Statystyczny", z. 4, Jajuga K., Walesiak M. (2000), Standardisation oj Data Set under Different Measurement Scales. In: Decker R., Gaul W. (Eds.), Classification and /nformation Processing at the Tum oj the Millennium. Springer-V er lag, erlin, eidelberg, Jajuga K., Walesiak M., ąk. (2001), On the Generalised Distance Measure. Referat na 25 Konferencję Naukową Niemieckiego Towarzystwa Klasyfikacyjnego (Gesellschaft fiir Klassifikation e.v.), Uniwersytet w Monachium, marca Kendall M.G. (1955), Rank Correlation Methods, Griffin, London. Kendall M.G., uckland W.R. (1986), Słownik terminów statystycznych, PWE, Warszawa. Walesiak M. (1993), Statystyczna analiza wielowymiarowa w badaniach marketingowych, Prace Naukowe E we Wrocławiu nr 654, Seria: Monografie i Opracowania nr l O l. Walesiak M. (1996), Metody analizy danych marketingowych, PWN, Warszawa. Walesiak M. (1999), Distance Measure for Ordinal Data. "rgumenta Oeconornica". No 2 (8), Walesiak M. (2000), Propozycja uogólnionej miary odległości w statystycznej analizie wielowymiarowej, Referat na Konferencję Naukową nt. "Statystyka regionalna w służbie samorządu lokalnego i biznesu" (Kiekrz k. Poznania, 5-7 czerwca 2000 r.). TE GENERLISED DISTNCE MESURE - SIMULTION STUDIES Summary In the paper the following problems are discussed: the derivation and the properties o f the generalised distance measw-e distance, the areas of applications of the distance, the results of simulation studies of the behaviour of the distance under clifferent data structures. Keywords. Measurement Scales, Distance Measures, Data nalysis. 127

Zastosowania statystyki i matematyki w ekonomii. Marek Walesiak. Akademia Ekonomiczna we Wrocławiu. 1. Wstęp

Zastosowania statystyki i matematyki w ekonomii. Marek Walesiak. Akademia Ekonomiczna we Wrocławiu. 1. Wstęp PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr 1006 2003 Zastosowania statystyki i matematyki w ekonomii Marek Walesiak Akademia Ekonomiczna we Wrocławiu MIARA ODLEGŁOŚCI OBIEKTÓW OPISANYCH ZMIENNYMI

Bardziej szczegółowo

strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:

strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii

Bardziej szczegółowo

strona 1 / 12 Autor: Walesiak Marek Publikacje:

strona 1 / 12 Autor: Walesiak Marek Publikacje: Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.

Bardziej szczegółowo

PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr l TAKSONOMIA li Klasyfikacja i analiza danych- teoria i zastosowania

PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr l TAKSONOMIA li Klasyfikacja i analiza danych- teoria i zastosowania PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr l 022 2004 TAKSONOMIA li Klasyfikacja i analiza danych- teoria i zastosowania Marek Walesiak Akademia Ekonomiczna we Wrocławiu UOGÓLNIONA MIARA ODLEGLOŚCI

Bardziej szczegółowo

STRA TEGIE POSTĘPOWANIA W BADANIACH STATYSTYCZNYCH W PRZYPADKU ZBIORU ZMIENNYCH MIERZONYCH NA SKALACH RÓŻNEGO TYPU**

STRA TEGIE POSTĘPOWANIA W BADANIACH STATYSTYCZNYCH W PRZYPADKU ZBIORU ZMIENNYCH MIERZONYCH NA SKALACH RÓŻNEGO TYPU** BADANIA OPERACYJNE I DECYZJE Marek WALESIAK* STRA TEGIE POSTĘPOWANIA W BADANIACH STATYSTYCZNYCH W PRZYPADKU ZBIORU ZMIENNYCH MIERZONYCH NA SKALACH RÓŻNEGO TYPU** Omówiono strategie postępowania w badaniach

Bardziej szczegółowo

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka Analiza współzależności zjawisk dr Marta Kuc-Czarnecka Wprowadzenie Prawidłowości statystyczne mają swoje przyczyny, w związku z tym dla poznania całokształtu badanego zjawiska potrzebna jest analiza z

Bardziej szczegółowo

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym

Bardziej szczegółowo

Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki

Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki Zeszyty Naukowe Wyższej Szkoły Bankowej w Poznaniu Nr / Rafał Czyżycki Uniwersytet Szczeciński Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki Streszczenie,

Bardziej szczegółowo

Wykład 10 Skalowanie wielowymiarowe

Wykład 10 Skalowanie wielowymiarowe Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów

Bardziej szczegółowo

KLASYFIKACJA SPEKTRALNA A SKALE POMIARU ZMIENNYCH 1 1. WPROWADZENIE 2. TYPY SKAL POMIAROWYCH I ICH CHARAKTERYSTYKA

KLASYFIKACJA SPEKTRALNA A SKALE POMIARU ZMIENNYCH 1 1. WPROWADZENIE 2. TYPY SKAL POMIAROWYCH I ICH CHARAKTERYSTYKA PRZEGLĄD STATYSTYCZNY R. LIX ZESZYT 1 2012 MAREK WALESIAK KLASYFIKACJA SPEKTRALNA A SKALE POMIARU ZMIENNYCH 1 1. WPROWADZENIE Analiza skupień bazująca na dekompozycji spektralnej (spectral clustering)

Bardziej szczegółowo

L: Wjaikjbkij +L:L: wjaiijbkjj j=1 j=1 1=1

L: Wjaikjbkij +L:L: wjaiijbkjj j=1 j=1 1=1 PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCLAWIU Nr 988 2003 TAKSONOMIA lo Klasyfikacja i analiza danych - teoria i zastosowania Marek Walesiak Akademia Ekonomiczna we Wrocławiu UOGÓLNIONA MIARA ODLEGLOŚCI

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Graficzna prezentacja danych statystycznych

Graficzna prezentacja danych statystycznych Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych Katowice, 12 i 26 czerwca 2014 r. Dopasowanie narzędzia do typu zmiennej Dobór narzędzia do

Bardziej szczegółowo

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski Modelowanie zależności pomiędzy zmiennymi losowymi Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski P Zmienne losowe niezależne - przypomnienie Dwie rzeczywiste zmienne losowe X i Y

Bardziej szczegółowo

OCENA WYBRANYCH PROCEDUR ANALIZY SKUPIEŃ DLA DANYCH PORZĄDKOWYCH. 1. Wstęp

OCENA WYBRANYCH PROCEDUR ANALIZY SKUPIEŃ DLA DANYCH PORZĄDKOWYCH. 1. Wstęp PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU Nr 47 009 TAKSONOMIA 16 Klasyfikacja i analiza danych teoria i zastosowania Uniwersytet Ekonomiczny we Wrocławiu OCENA WYBRANYCH PROCEDUR ANALIZY SKUPIEŃ

Bardziej szczegółowo

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem

Bardziej szczegółowo

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 746 EKONOMICZNE PROBLEMY USŁUG NR 101 2012 RAFAŁ KLÓSKA Uniwersytet Szczeciński REGIONALNE ZRÓŻNICOWANIE POZIOMU ROZWOJU SPOŁECZNO-GOSPODARCZEGO W POLSCE

Bardziej szczegółowo

WYKAZ REFERATÓW WYGŁOSZONYCH NA KONFERENCJACH

WYKAZ REFERATÓW WYGŁOSZONYCH NA KONFERENCJACH Prof. dr hab. Marek Walesiak Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ REFERATÓW WYGŁOSZONYCH NA KONFERENCJACH 1. Walesiak M.

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO

STATYSTYKA I DOŚWIADCZALNICTWO STATYSTYKA I DOŚWIADCZALNICTWO Wykład 9 Analiza skupień wielowymiarowa klasyfikacja obiektów Metoda, a właściwie to zbiór metod pozwalających na grupowanie obiektów pod względem wielu cech jednocześnie.

Bardziej szczegółowo

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem

Bardziej szczegółowo

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 12 listopada 2017 1 Analiza współzależności dwóch cech 2 Jednostka zbiorowości - para (X,Y ). Przy badaniu korelacji nie ma znaczenia, która

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis

Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,

Bardziej szczegółowo

5. Analiza dyskryminacyjna: FLD, LDA, QDA

5. Analiza dyskryminacyjna: FLD, LDA, QDA Algorytmy rozpoznawania obrazów 5. Analiza dyskryminacyjna: FLD, LDA, QDA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Liniowe funkcje dyskryminacyjne Liniowe funkcje dyskryminacyjne mają ogólną

Bardziej szczegółowo

ZMODYFIKOWANE KRYTERIUM DOBORU ZMIENNYCH OBJAŚNIAJĄCYCH DO LINIOWEGO MODELU EKONOMETRYCZNEGO

ZMODYFIKOWANE KRYTERIUM DOBORU ZMIENNYCH OBJAŚNIAJĄCYCH DO LINIOWEGO MODELU EKONOMETRYCZNEGO PRZEGLĄD STATYSTYCZNY R. XXXIV - zeszyt 1-1987 MAREK WALESIAK ZMODYFIKOWANE KRYTERIUM DOBORU ZMIENNYCH OBJAŚNIAJĄCYCH DO LINIOWEGO MODELU EKONOMETRYCZNEGO Celem prezentowanego artykułu jest zaproponowanie

Bardziej szczegółowo

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4 KARTA KURSU (do zastosowania w roku ak. 2015/16) Nazwa Statystyka 1 Nazwa w j. ang. Statistics 1 Kod Punktacja ECTS* 4 Koordynator Dr hab. Tadeusz Sozański (koordynator, wykłady) Dr Paweł Walawender (ćwiczenia)

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane

Bardziej szczegółowo

Analiza. danych jakoêciowych i symbolicznych z wykorzystaniem programu R. Eugeniusz Gatnar Marek Walesiak. Redakcja naukowa

Analiza. danych jakoêciowych i symbolicznych z wykorzystaniem programu R. Eugeniusz Gatnar Marek Walesiak. Redakcja naukowa Analiza danych jakoêciowych i symbolicznych z wykorzystaniem programu R Redakcja naukowa Eugeniusz Gatnar Marek Walesiak Analiza danych jakoêciowych i symbolicznych z wykorzystaniem programu R Autorzy:

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

L Wjailgbkij +I I wjajljbklj j=1 j=i/=]

L Wjailgbkij +I I wjajljbklj j=1 j=i/=] PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCł"AWIU Nr981 ---------------------------------------------- Ekonometria II 2003 Marek Walesiak OBSZARY ZASTOSOWAŃ UOGÓLNIONEJ MIARY ODLEGŁOŚCI GDM W STATYSTYCZNEJ

Bardziej szczegółowo

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących Cezary Dendek Wydział Matematyki i Nauk Informacyjnych PW Plan prezentacji Plan prezentacji Wprowadzenie

Bardziej szczegółowo

DOPUSZCZALNE DZIAŁANIA NA LICZBACH W BADANIACH MARKETINGOWYCH Z PUNKTU WIDZENIA SKAL POMIAROWYCH * 1. Rola skal pomiarowych w badaniach marketingowych

DOPUSZCZALNE DZIAŁANIA NA LICZBACH W BADANIACH MARKETINGOWYCH Z PUNKTU WIDZENIA SKAL POMIAROWYCH * 1. Rola skal pomiarowych w badaniach marketingowych PRACE NAUKOWE AKADEMll EKONOMCZNEJ WE WROCŁAWU Nr 718 1996 nł"or:rnatyka i Ekono:rnet:ria 1 Marek Walesiak DOPUSZCZALNE DZAŁANA NA LCZBACH W BADANACH MARKETNGOWYCH Z PUNKTU WDZENA SKAL POMAROWYCH * 1.

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

W1. Wprowadzenie. Statystyka opisowa

W1. Wprowadzenie. Statystyka opisowa W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład

Bardziej szczegółowo

Podstawowe pojęcia statystyczne

Podstawowe pojęcia statystyczne Podstawowe pojęcia statystyczne Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny Jean Rigaux Co to jest statystyka? Nauka o metodach ilościowych badania zjawisk

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Metody Ilościowe w Socjologii

Metody Ilościowe w Socjologii Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu

Bardziej szczegółowo

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Korelacja krzywoliniowa i współzależność cech niemierzalnych Korelacja krzywoliniowa i współzależność cech niemierzalnych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej

Bardziej szczegółowo

Kilka uwag o testowaniu istotności współczynnika korelacji

Kilka uwag o testowaniu istotności współczynnika korelacji 341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela

Statystyka w pracy badawczej nauczyciela Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Agnieszka Nowak Brzezińska

Agnieszka Nowak Brzezińska Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22 Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach

Bardziej szczegółowo

FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1

FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1 Tomasz Bartłomowicz Uniwersytet Ekonomiczny we Wrocławiu FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1 Streszczenie. Punktem wyjścia artykułu jest spostrzeżenie,

Bardziej szczegółowo

Analiza składowych głównych

Analiza składowych głównych Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi

Bardziej szczegółowo

WYKAZ REFERATÓW WYGŁOSZONYCH NA KONFERENCJACH

WYKAZ REFERATÓW WYGŁOSZONYCH NA KONFERENCJACH Prof. dr hab. Marek Walesiak Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ REFERATÓW WYGŁOSZONYCH NA KONFERENCJACH 1. Walesiak M.

Bardziej szczegółowo

PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS

PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 433 2016 Gospodarka regionalna w teorii i praktyce ISSN 1899-3192 e-issn 2392-0041 Tomasz Bartłomowicz

Bardziej szczegółowo

WYKAZ PRAC PUBLIKOWANYCH

WYKAZ PRAC PUBLIKOWANYCH Dr hab. Andrzej Bąk Prof. nadzw. AE WYKAZ PRAC PUBLIKOWANYCH I. Publikacje zwarte I.1. KsiąŜki 1. Walesiak M., Bąk A. [1997], Realizacja badań marketingowych metodą conjoint analysis z wykorzystaniem pakietu

Bardziej szczegółowo

Elementy statystyki wielowymiarowej

Elementy statystyki wielowymiarowej Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych

Bardziej szczegółowo

Pozyskiwanie wiedzy z danych

Pozyskiwanie wiedzy z danych Pozyskiwanie wiedzy z danych dr Agnieszka Goroncy Wydział Matematyki i Informatyki UMK PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO Pozyskiwanie wiedzy

Bardziej szczegółowo

Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze

Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze Barbara Batóg Jacek Batóg Uniwersytet Szczeciński Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze W 2004 roku planowane

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

WYKŁAD 9 METODY ZMIENNEJ METRYKI

WYKŁAD 9 METODY ZMIENNEJ METRYKI WYKŁAD 9 METODY ZMIENNEJ METRYKI Kierunki sprzężone. Metoda Newtona Raphsona daje dobre przybliżenie najlepszego kierunku poszukiwań, lecz jest to okupione znacznym kosztem obliczeniowym zwykle postać

Bardziej szczegółowo

Tabela 1. Macierz preferencji dotycząca pięciu przykładowych produktów (obiektów) i sześciu respondentów

Tabela 1. Macierz preferencji dotycząca pięciu przykładowych produktów (obiektów) i sześciu respondentów Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Katedra Ekonometrii i Informatyki ZASTOSOWANIE ANALIZY UNFOLDING W OCENIE PREFERENCJI UCZNIÓW SZKOŁY POLICEALNEJ Streszczenie: W artykule przedstawiono

Bardziej szczegółowo

Y = α 1 Z α k Z k + e. (1) (k 1)[ktrA2 (tra) 2 ] (4) d = 1 k. (por. np. Kolupa, 2006). Wówczas jak to wynika ze wzorów (2) i (3) mamy:

Y = α 1 Z α k Z k + e. (1) (k 1)[ktrA2 (tra) 2 ] (4) d = 1 k. (por. np. Kolupa, 2006). Wówczas jak to wynika ze wzorów (2) i (3) mamy: PRZEGLĄD STATYSTYCZNY R. LVIII ZESZYT 3-4 2011 MICHAŁ KOLUPA, JOANNA PLEBANIAK KILKA UWAG O WARTOŚCIACH WŁASNYCH MACIERZY KORELACJI W niniejszej pracy, w nawiązaniu do pracy Kolupa, 2006, podajemy konstrukcję

Bardziej szczegółowo

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH

METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH Marcin Pełka Akademia Ekonomiczna we Wrocławiu METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów symbolicznych, podobnie jak w przypadku

Bardziej szczegółowo

Syntetyczna ocena dystansu Polski od krajów Unii Europejskiej na podstawie wybranych aspektów ochrony środowiska

Syntetyczna ocena dystansu Polski od krajów Unii Europejskiej na podstawie wybranych aspektów ochrony środowiska Katarzyna Warzecha * Syntetyczna ocena dystansu Polski od krajów Unii Europejskiej na podstawie wybranych aspektów ochrony środowiska Wstęp Celem opracowania jest ocena pozycji Polski na tle krajów UE

Bardziej szczegółowo

Funkcje liniowe i wieloliniowe w praktyce szkolnej. Opracowanie : mgr inż. Renata Rzepińska

Funkcje liniowe i wieloliniowe w praktyce szkolnej. Opracowanie : mgr inż. Renata Rzepińska Funkcje liniowe i wieloliniowe w praktyce szkolnej Opracowanie : mgr inż. Renata Rzepińska . Wprowadzenie pojęcia funkcji liniowej w nauczaniu matematyki w gimnazjum. W programie nauczania matematyki w

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L, Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której

Bardziej szczegółowo

Eksploracja danych - wykład II

Eksploracja danych - wykład II - wykład 1/29 wykład - wykład Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Październik 2015 - wykład 2/29 W kontekście odkrywania wiedzy wykład - wykład 3/29 CRISP-DM - standaryzacja

Bardziej szczegółowo

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych

Bardziej szczegółowo

Wykład ze statystyki. Maciej Wolny

Wykład ze statystyki. Maciej Wolny Wykład ze statystyki Maciej Wolny T1: Zajęcia organizacyjne Agenda 1. Program wykładu 2. Cel zajęć 3. Nabyte umiejętności 4. Literatura 5. Warunki zaliczenia Program wykładu T1: Zajęcia organizacyjne T2:

Bardziej szczegółowo

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski Literatura STATYSTYKA OPISOWA A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu

Bardziej szczegółowo

WYKAZ PUBLIKACJI UWAGA! Kolor czerwony oznacza dostępność pełnej wersji publikacji

WYKAZ PUBLIKACJI UWAGA! Kolor czerwony oznacza dostępność pełnej wersji publikacji Prof. dr hab. Marek Walesiak Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ PUBLIKACJI UWAGA! Kolor czerwony oznacza dostępność pełnej

Bardziej szczegółowo

POLITECHNIKA OPOLSKA

POLITECHNIKA OPOLSKA POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych

Bardziej szczegółowo

Opis przedmiotu: Probabilistyka I

Opis przedmiotu: Probabilistyka I Opis : Probabilistyka I Kod Nazwa Wersja TR.SIK303 Probabilistyka I 2012/13 A. Usytuowanie w systemie studiów Poziom Kształcenia Stopień Rodzaj Kierunek studiów Profil studiów Specjalność Jednostka prowadząca

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

f) Różne konstrukcje SMR przedstawiono m. in. w pracach [1], [3], [4], [9], [13].

f) Różne konstrukcje SMR przedstawiono m. in. w pracach [1], [3], [4], [9], [13]. PRZEGLĄD STATYSTYCZNY R. XL - z.eszyl l - 1993 MAREK WALESIAK ZAGADNIENIE OCENY PODOBIEŃSTWA ZBIORU OBIEKTÓW W CZASIE W SYNTETYCZNYCH BADANIACH PORÓWNAWCZYCH Ocenę podobieństwa zbioru obiektów w czasie

Bardziej szczegółowo

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu Kod przedmiotu TR.SIK303 Nazwa przedmiotu Probabilistyka I Wersja przedmiotu 2015/16 A. Usytuowanie przedmiotu w systemie studiów Poziom kształcenia Studia I stopnia Forma i tryb prowadzenia studiów Stacjonarne

Bardziej szczegółowo

Statystyczna analiza poziomu rozwoju społeczno-gospodarczego w Polsce - w ujęciu regionalnym

Statystyczna analiza poziomu rozwoju społeczno-gospodarczego w Polsce - w ujęciu regionalnym Zeszyty Naukowe Wyższej Szkoły Bankowej w Poznaniu Nr 42/2012 Rafał Klóska Uniwersytet Szczeciński Statystyczna analiza poziomu rozwoju społeczno-gospodarczego w Polsce - w ujęciu regionalnym Streszczenie.

Bardziej szczegółowo

Komputerowa Analiza Danych Doświadczalnych

Komputerowa Analiza Danych Doświadczalnych Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd

Bardziej szczegółowo

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN

Bardziej szczegółowo

Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego. Katarzyna Kuziak

Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego. Katarzyna Kuziak Wykorzystanie funkcji powiązań do pomiaru ryzyka rynkowego Katarzyna Kuziak Cel: łączenie różnych rodzajów ryzyka rynkowego za pomocą wielowymiarowej funkcji powiązań 2 Ryzyko rynkowe W pomiarze ryzyka

Bardziej szczegółowo

Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne.

Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne. Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne. pytania teoretyczne:. Co to znaczy, że wektory v, v 2 i v 3

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: Rachunek prawdopodobieństwa Probability theory Kierunek: Rodzaj przedmiotu: obowiązkowy dla wszystkich specjalności Rodzaj zajęć: wykład, ćwiczenia Matematyka Poziom kwalifikacji: I stopnia

Bardziej szczegółowo

1551\1 0324- glrlrs ISSf'J 1501- - 386'

1551\1 0324- glrlrs ISSf'J 1501- - 386' PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr 1100------------------ Ekonometria 16 2006 Marek Walesiak PRZEGLĄD PODSTAWOWYCH ZASTOSOWAŃ METOD STATYSTYCZNEJ ANALIZY WIELOWYMIAROWEJ W BADANIACH MARKETINGOWYCH

Bardziej szczegółowo

Komputerowa Analiza Danych Doświadczalnych

Komputerowa Analiza Danych Doświadczalnych Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11; środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd

Bardziej szczegółowo

Analiza współzależności dwóch cech I

Analiza współzależności dwóch cech I Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych

Bardziej szczegółowo

Czym jest analiza skupień?

Czym jest analiza skupień? Statystyczna analiza danych z pakietem SAS Analiza skupień metody hierarchiczne Czym jest analiza skupień? wielowymiarowa technika pozwalająca wykrywać współzależności między obiektami; ściśle związana

Bardziej szczegółowo

Statystyka SYLABUS A. Informacje ogólne

Statystyka SYLABUS A. Informacje ogólne Statystyka SYLABUS A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej kierunek Nazwa kierunku studiów Poziom kształcenia Profil studiów Forma studiów Kod Język Rodzaj Dziedzina

Bardziej szczegółowo

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej Kod przedmiotu TR.NIK304 Nazwa przedmiotu Probabilistyka I Wersja przedmiotu 2015/16 A. Usytuowanie przedmiotu w systemie studiów Poziom kształcenia Studia I stopnia Forma i tryb prowadzenia studiów Niestacjonarne

Bardziej szczegółowo

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka Wykład XIV: Metody Monte Carlo 19 stycznia 2016 Przybliżone obliczanie całki oznaczonej Rozważmy całkowalną funkcję f : [0, 1] R. Chcemy znaleźć przybliżoną wartość liczbową całki 1 f (x) dx. 0 Jeden ze

Bardziej szczegółowo

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej KATEDRA MATEMATYKI TEMAT PRACY: ROZKŁAD NORMALNY ROZKŁAD GAUSSA AUTOR: BARBARA MARDOSZ Kraków, styczeń 2008 Spis treści 1 Wprowadzenie 2 2 Definicja

Bardziej szczegółowo

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego Metody Analiz Przestrzennych Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego mgr Marcin Semczuk Zakład Przedsiębiorczości i Gospodarki Przestrzennej Instytut

Bardziej szczegółowo

Wielowymiarowa analiza poziomu ubóstwa powiatów województwa podlaskiego Multivariate Analysis of the Poverty of the Podlaskie Province Districts

Wielowymiarowa analiza poziomu ubóstwa powiatów województwa podlaskiego Multivariate Analysis of the Poverty of the Podlaskie Province Districts Wielowymiarowa analiza poziomu ubóstwa powiatów województwa podlaskiego Multivariate Analysis of the Poverty of the Podlaskie Province Districts Katarzyna Dębkowska, Wojciech Zalewski Politechnika Białostocka,

Bardziej szczegółowo

OPIS MODUŁ KSZTAŁCENIA (SYLABUS)

OPIS MODUŁ KSZTAŁCENIA (SYLABUS) OPIS MODUŁ KSZTAŁCENIA (SYLABUS) I. Informacje ogólne: 1 Nazwa modułu Metody opracowania obserwacji 2 Kod modułu 04-A-MOO-60-1L 3 Rodzaj modułu obowiązkowy 4 Kierunek studiów astronomia 5 Poziom studiów

Bardziej szczegółowo

Algorytmy zrandomizowane

Algorytmy zrandomizowane Algorytmy zrandomizowane http://zajecia.jakubw.pl/nai ALGORYTMY ZRANDOMIZOWANE Algorytmy, których działanie uzależnione jest od czynników losowych. Algorytmy typu Monte Carlo: dają (po pewnym czasie) wynik

Bardziej szczegółowo

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu

Bardziej szczegółowo