PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU. Ekonometria 15. Marek Walesiak. 1. Wstęp

Podobne dokumenty
Zastosowania statystyki i matematyki w ekonomii. Marek Walesiak. Akademia Ekonomiczna we Wrocławiu. 1. Wstęp

Podstawowe pojęcia. Próba losowa. Badanie próby losowej

Statystyka Wzory I. Analiza struktury

strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:

Prawdopodobieństwo i statystyka r.

strona 1 / 12 Autor: Walesiak Marek Publikacje:

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

Hierarchiczna analiza skupień

P π n π. Równanie ogólne płaszczyzny w E 3. Dane: n=[a,b,c] Wówczas: P 0 P=[x-x 0,y-y 0,z-z 0 ] Równanie (1) nazywamy równaniem ogólnym płaszczyzny

UOGÓLNIONA MIARA ODLEGŁOŚCI -BADANIA SYMULACYJNE 1. l. Wprowadzenie 2

Wykład 10 Skalowanie wielowymiarowe

Rozkłady statystyk z próby Twierdzenia graniczne

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Agnieszka Nowak Brzezińska

Anna Czapkiewicz Przykłady zależności pomiędzy dochodem a wydatkami na konsumpcję w przypadku losowości zmiennej niezależnej

ANALIZA DRGAŃ POPRZECZNYCH PŁYTY PIERŚCIENIOWEJ O ZŁOŻONYM KSZTAŁCIE Z UWZGLĘDNIENIEM WŁASNOŚCI CYKLICZNEJ SYMETRII UKŁADU

POMIAR PODOBIEŃSTWA OBIEKTÓW W ŚWIETLE SKAL POMIARU I WAG ZMIENNYCH l

Wykład 11. a, b G a b = b a,

Rozkład χ 2 = + 2π 2. Niech zmienna losowa x ma rozkład normalnyn(x; µ,σ). Znajdziemy rozkład zmiennej:

Parametryzacja rozwiązań układu równań

Elementy modelowania matematycznego

FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

χ 2 = + 2π 2 Niech zmienna losowa x ma rozkład normalnyn(x; µ,σ). Znajdziemy rozkład zmiennej: σ

Optymalizacja sieci powiązań układu nadrzędnego grupy kopalń ze względu na koszty transportu

a 11 a a 1n a 21 a a 2n... a m1 a m2... a mn a 1j a 2j R i = , C j =

Pierwiastki z liczby zespolonej. Autorzy: Agnieszka Kowalik

Agnieszka Nowak Brzezińska Wykład III

Kilka uwag o testowaniu istotności współczynnika korelacji

Znajdowanie pozostałych pierwiastków liczby zespolonej, gdy znany jest jeden pierwiastek

D. Miszczyńska, M.Miszczyński KBO UŁ, Badania operacyjne (wykład 6 _ZP) [1] ZAGADNIENIE PRZYDZIAŁU (ZP) (Assignment Problem)

Agnieszka Nowak Brzezińska Wykład III

UOGÓLNIONA MIARA DOPASOWANIA W MODELU LINIOWYM

Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/17

2. Schemat ideowy układu pomiarowego

d wymiarowy wektor losowy Niech (Ω, S, P) przestrzeń probabilistyczna Definicja Odwzorowanie X: Ω R nazywamy 1-wymiarowym wektorem

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Chemia Teoretyczna I (6).

KADD Metoda najmniejszych kwadratów

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Analiza numeryczna Kurs INP002009W. Wykłady 6 i 7 Rozwiązywanie układów równań liniowych. Karol Tarnowski A-1 p.

, gdzie b 4c 0 oraz n, m ( 2). 2 2 b b b b b c b x bx c x x c x x

Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

MATEMATYKA (poziom podstawowy) przykładowy arkusz maturalny wraz ze schematem oceniania dla klasy II Liceum

Jarosław Wróblewski Analiza Matematyczna 1A, zima 2014/15. n = Rozwiązanie: Stosując wzór na wartość współczynnika dwumianowego otrzymujemy

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

MINIMALIZACJA PUSTYCH PRZEBIEGÓW PRZEZ ŚRODKI TRANSPORTU

DOPUSZCZALNE DZIAŁANIA NA LICZBACH W BADANIACH MARKETINGOWYCH Z PUNKTU WIDZENIA SKAL POMIAROWYCH * 1. Rola skal pomiarowych w badaniach marketingowych

Badania eksperymentalne

ZMODYFIKOWANE KRYTERIUM DOBORU ZMIENNYCH OBJAŚNIAJĄCYCH DO LINIOWEGO MODELU EKONOMETRYCZNEGO

Jarosław Wróblewski Analiza Matematyczna 2B, lato 2015/16

PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr l TAKSONOMIA li Klasyfikacja i analiza danych- teoria i zastosowania

f) Różne konstrukcje SMR przedstawiono m. in. w pracach [1], [3], [4], [9], [13].

EKONOMETRIA. Temat wykładu: Co to jest model ekonometryczny? Dobór zmiennych objaśniających w modelu ekonometrycznym CZYM ZAJMUJE SIĘ EKONOMETRIA?

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

6. ZWIĄZKI FIZYCZNE Wstęp

Niezależność zmiennych, funkcje i charakterystyki wektora losowego, centralne twierdzenia graniczne

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Aproksymacja. Plan wykładu. 1. Problem aproksymacji, normy, rodzaje aproksymacji. 2. Aproksymacja średniokwadratowa

Zadania z analizy matematycznej - sem. I Szeregi liczbowe

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/ n 333))

NADUMIERALNOŚĆ MĘŻCZYZN W NADBAŁTYCKICH KRAJACH UNII EUROPEJSKIEJ

BADANIA DOCHODU I RYZYKA INWESTYCJI

Przykładowe zadania dla poziomu rozszerzonego

STATYSTYKA I DOŚWIADCZALNICTWO

Zadania z algebry liniowej - sem. I Liczby zespolone

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

ERRATA 1 = = Wiersz od dołu. Wiersz od góry. Powinno być. Strona. 95 tab. 4.1, poz metody 2 metody metoda 2 metody

x t 1 (x) o 1 : x s 3 (x) Tym samym S(3) = {id 3,o 1,o 2,s 1,s 2,s 3 }. W zbiorze S(n) definiujemy działanie wzorem

Marek Walesiak. MIAR lwrel!cji W AB.lLIZIE 'lfl'nixćw

Elementy nieliniowe w modelach obwodowych oznaczamy przy pomocy symboli graficznych i opisu parametru nieliniowego. C N

Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis

dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;

Zadanie 3. Na jednym z poniższych rysunków przedstawiono fragment wykresu funkcji. Wskaż ten rysunek.

ALGORYTM OPTYMALIZACJI PARAMETRÓW EKSPLOATACYJNYCH ŚRODKÓW TRANSPORTU

O pewnych zastosowaniach rachunku różniczkowego funkcji dwóch zmiennych w ekonomii

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Metody numeryczne Laboratorium 5 Info

OPTYMALIZACJA DYSKRETNA

Stwierdzenie 1. Jeżeli ciąg ma granicę, to jest ona określona jednoznacznie (żaden ciąg nie może mieć dwóch różnych granic).

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Elementy rach. macierzowego Materiały pomocnicze do MES Strona 1 z 7. Elementy rachunku macierzowego

Zeszyty naukowe nr 9

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

Y = α 1 Z α k Z k + e. (1) (k 1)[ktrA2 (tra) 2 ] (4) d = 1 k. (por. np. Kolupa, 2006). Wówczas jak to wynika ze wzorów (2) i (3) mamy:

Instrukcja do ćwiczeń laboratoryjnych z przedmiotu: Badania operacyjne. Temat ćwiczenia: Problemy przydziału

Techniki grupowania danych w środowisku Matlab

L Wjailgbkij +I I wjajljbklj j=1 j=i/=]

O PEWNEJ MOŻLIWOŚCI UWZGLĘDNIENIA SUBSTYTUCJI NAKŁADÓW W MODELACH DEA. 1. Wstęp

Analiza autokorelacji

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Transkrypt:

PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr 1096------------------------------------------------ 2005 Ekooetria 15 Marek Walesiak UOGÓLNIONA MIARA ODLEGŁOŚCI GDM A WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA I COSINUS KĄTA MIĘDZY WEKTORAMI 1. Wstęp Do podstawowych pojęć statystyczej aalizy wielowyiarowej zalicza się pojęcie obiektu i zieej. W artykule przez obiekt rozuie się "aj iejszy eleet podday obserwacji, który dostarcza podstawowej z puktu widzeia sforułowaej hipotezy iforacji" (por. [Steczkowski, Zeliaś 1981, s. 19-20]). Obiekty są rozuiae w sesie zarówo dosłowy, jak i przeośy. Obiekte jest w badaiach określoa rzecz, osoba, kategoria abstrakcyja lub zdarzeie. Kokretyi przykładai obiektów są: kosuet X, produkt Y, respodet R, przedsiębiorstwo F, ryek testowy T, do towarowy D, kocepcja (idea) produktu l, ryek zbytu Z, gospodarstwo doowe G. Zbiór obiektów badaia ozaczay przez A ={A;}~ ={Al> A2,..., A}' Ziea w statystyczej aalizie wielowyiarowej jest charakterystyką opisującą zbiorowość obiektów. W ujęciu foraly ziea ~ to odwzorowaie: ~: A ~ R (J =1,2,..., ). W aalizie statystyczej zajoość zbioru obiektów i zieych pozwala zapisać acierz daych [ xl) XII xi2... Xl].] = x21 x22... x2... xl x2 x [ (1) :: :' gdzie: xi} - wartośći-tej zieej zaobserwowaa w i-ty obiekcie, i =1,2,..., - uer obiektu, i =1,2,..., - uer zieej., SS tv O32..t, - f't '-15 ISSN Ą 50r -?>f66

W artykule zakładay, że ziee opisujące obiekty badaia ierzoe są a skali przedziałowej lub ilorazowej. W celu doprowadzeia zieych do porówywalości zachodzi potrzeba pozbawieia wartości zieych ia i ujedoliceia rzędów wielkości. Operacja ta osi azwę trasforacji oralizacyjej. Zakładay, że oralizację przeprowadzoo z wykorzystaie jedej z foruł: a) stadaryzacja (dla j =1,2,..., ) 19 Xi} -Xj z =--"--"- (2) lj s. } gdzie: zij - zoralizowaa wartość obiekcie, j-tej zieej zaobserwowaa w i-ty b) przekształceie ilorazowe (dla j =1,2,..., ) (3) W artykule, a podstawie wykazaych w literaturze związków istiejących iędzy kwadrate odległości euklidesowej a współczyikie korelacji liiowej Pearsoa i cosiuse kąta iędzy wektorai, wykazae zostaą aalogicze związki dla uogólioej iary odległości ODM (por. [Walesiak 2002]). 2. Kwadrat odległości euklidesowej a współczyik korelacji liiowej Pearsoa i cosius kąta iędzy wektorai Kwadrat odległości"euklidesowej day jest wzore: djk = i:(~ij -Zik)2, (4) gdzie: djk - odległość iędzy j-tą i k-tą zieą, j, k = 1,2,...,. i=1 Na podstawie pracy M.R. Aderberga [1973, s. 113] w pracy K. Jajugi i M. Walesiaka (2004] pokazao, że dla zieych stadaryzowaych zgodie

20 z forułą (2) iędzy kwadrate odległości euklidesowej a współczyikie korelacj i liiowej Pearsoa zachodzi związek: Dowód 1 2 2 djk = L:(Zij -Zik) =2(1-rjk)' (5) i=1 2 2 [Xij - Xj X x]2 djk =L:{Zij -Zik) =L: S. - ik - k = ;=1 ;=1) Sk ~(Xl).. _x).)2 x -X-o ~ X- (X/.k -X-k)2 = L..J - 2I l) ). o'o;k - k +I 2 ;=1 S7 i=1 Sj sk i=1 sk ki{xij -Xj) = ;=1 2 W artykule K. Jajugi im. Walesiaka [2004] pokazao ogólą forułę związku istiejącego iędzy kwadrate etryki Mikowskiego a ogóly współczyikie powiązaia. Szczególy przypadkie tej foruły jest związek iędzy kwadrate odległości euklidesowej a współczyikie korelacj i liiowej Pearsoa określoy we wzorze (5). Jeśli we wzorze (4) przeprowadzoa zostaie oralizacja zgodie z forułą (3), to a podstawie pracy M.R. Aderberga [1973, s. 114] oża wykazać, że iędzy kwadrate odległości euklidesowej a cosiuse kąta iędzy wektorai obserwacjij-tego i k-tego obiektu istieje astępujący związek: (6)

21 Dowód 2 2 [i[i: 1 [ 2 = I " Xi" IJ 2 2 1=1 ~Xij' ~Xik 3. GDM a współczyik korelacji liiowej Pearsoa i cosius kąta iędzy wektorai GDM dla zieych ierzoych a skali przedziałowej określa wzór (por. [Walesiak 2002, s. 36]): i (lub) ilorazowej I{zij -zid(zik -zij)+ II(zij -Zil)(Zik -Zi/) djk ::::(I-Sjk)/2=ł- i =1 i=i/=1 1.' (7) i 2 i 2]2 2 [ ~~(Zij -ZiI) '~~(Zik -za) gdzie djk (Sjk) - iara odległości (podobieństwa: Sjk E[-l; 1]) GDM iędzy j-tą i k-tą zieą. Dla zieych stadaryzowaych zgodie z forułą (2) oża wykazać, że iędzy GDM a współczyikai korelacji liiowej Pearsoa istieje związek:

22-4 + (rik + l) - "Lrjld. -1_ (=! [,1:), k Jr jk - 2 4 [( - ~ rjl H - ~ rkl (8) Dowód 3 Xil-X{.xik -Xk + xil-x{.xii- X{]= s{ sk s{ s{ = "L {=! {*i, k "L{Xij - Xi )(Xik - Xk) i=! "L{xij - Xi )(Xil - X{) "L (Xii - x{ )(Xik - xd 2)xiI - xd(xii - xd -r==i==i====~r=========+-r==i==l====~r======== 2 2 2)Xil - XI) 2)Xil - XI) i=1 i=! i=l i=l = L[rik -rjl-rkt + 1]=(-2)rik - Lrjl- Lrkl +(-2)= 1=1 I*i,k {*i,k I*i,k i=l i=l i=1

23 Po podstawieiu do wzoru (7) otrzyuje się prawą stroę rówaia (8): -2(1 - rld + e - 2)(rlk + 1) - ~>ll - I>kI 1 f-.~l, k I*-l, k ~k=2----------[------------~]~o~'5--~-- 4 f (1 - rj/ ). f (1- rkl) 1 = 2 I>kI -4+(rlk +1)- Z>ll - 1 I*-l,k I*-l,k = 2 Jeśli we wzorze (7) przeprowadzoa zostaie oralizacja zgodie z forułą (3), to iędzy GDM a cosiuse kąta iędzy wektorai istieje astępujący związek: -4 + (cosalk + l) - Lcosajl - Lcosa kl 1=1 I*-l, k 1=1 I*-l, k (9) gdzie cosalk - cosius kąta iędzy wektorai obserwacji aj-tej i k-tej zieej. Dowód 4 2 I{Zij - zik )(Zik - Zij) = - L(Zij - Zik) =-2(1-cosalk) - zob. dowód 2; ;=1 ;=1

24 xij Xii xik Xii L L{zij -ZiI)(Zik -Zi/)= L L = i=1 1=1 i=1 1=1 I*l, k I*l, k Jt.X & Jt. xil Jt. xl Jt. xd =L L i=1 1=1 ""j,k =L 1=1 I*l, k = L[cosalk -cosali -cosaki + 1]= 1=1 I*l, k =(-2)cosalk - Lcosall- Lcosakl + (- 2)= I*l, k I*l, k =(-2)(cosalk +1) Lcosall- Lcosakl; I*l,k {*l,k Po podstawieiu do wzoru (7) otrzyuje się prawą stroę rówaia (9): -2(I-coSajk) +(-2)(coSajk +1)- Lcosajl- Lcosakl 1 I*j, k [*j, k dlk = 2" - ---------------"----:-::-----''"---= 4 ' [t (1 - cos a jl ). t (1 - cos a ki )]0,5

25-4 + (cosa jk + l) - Lcosa jl - Lcosa kl l bt), k 1"# j, k 2 Aby uikąć zera w iaowiku iar (8) i (9), ależy przyjąć założeie, że w zbiorze zieych istieje przyajiej jeda para takich, dla których obserwacje po oralizacji zgodie z forułą (2) lub (3) ie są idetycze. 4. Podsuowaie Na podstawie wykazaych związków iędzy uogólioą iarą odległości GDM a współczyikie korelacji liiowej Pearsoa (cosiuse kąta iędzy wektorai) oża sforułować kilka spostrzeżeń: - zając acierz korelacji (cosiusów kąta iędzy wektorai), oża obliczyć odległości iędzy zieyi, - odległość iędzy zieyi j, k zależy od ich skorelowaia (cosiusa kąta) oraz ich korelacji (cosiusów kątów) z pozostałyi zieyi, - dla zbioru zawierającego dwie ziee d jk = l, jeśli obserwacje po oralizacji ie są idetycze, - rozważaia w artykule dotyczyły odległości iędzy zieyi; aalogicze wzory oża wyzaczyć, gdy przediote badaia są obiekty (por. [Aderberg 1973, s. 113-114]). Wtedy jedak oralizacja daa wzorai (2) i (3) będzie przeprowadzaa według obiektów. Literatura Aderberg M.R. (1973), Cluster Aalysis for Applicatios, Acadeic Press, New York-Sa Fracisco-Lodo. Jajuga K., Walesiak M. (2004), Rearks o the Depedece Measures ad the Distace Measures, [w:] K. Jajuga, M. Walesiak (red.), Klasyfikacja i aaliza daych - teoria i zastosowaia, Prace Naukowe Akadeii Ekooiczej we Wrocławiu r 1022, AE, Wrocław, s. 348-354. Steczkowski J., Zeliaś A. (1981), Statystycze etody aalizy cech jakościowych, PWE, Warszawa. Walesiak M. (2002), Uogólioa iara odległości w statystyczej aalizie wielowyiarowej, AE, Wrocław.

26 THE GENERALISED DIST ANCE MEASURE GDM AND PEARSON CORRELATION COEFFICIENT AND THE COSINE OF THE ANGLE BETWEEN VECTORS Suary The paper gives based o relatio betwee squared Euclidea distace ad Pearso correlatio coefficiet (t he cosie of the agle betwee vectors), siilar proposais for Geeralised Distace Measure GDM. Prof. dr hab. Marek Walesiak jest pracowikie Katedry Ekooetrii i Iforatyki Akadeii Ekooiczej we Wrocławiu.