Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielkość: px
Rozpocząć pokaz od strony:

Download "Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna"

Transkrypt

1 Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

2 Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna zmienna niezależna Zmienna zależna jednowymiarowa oraz wiele zmiennych niezależnych Zmienna zależna wielowymiarowa oraz jedna zmienna niezależna Zmienna zależna wielowymiarowa oraz wiele zmiennych niezależnych. Postać (kształt) zależności może być : liniowy lub nieliniowy.

3 Regresja wieloraka - wielokrotna Celem regresji wielorakiej jest ilościowe ujęcie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (kryterialną, objaśnianą).

4 Przykłady. 1. Wytrzymałość betonu zależy od proporcji w jakiej zastosowano trzy podstawowe składniki. Pytanie: W jakiej proporcji stosować te składniki, by wytrzymałość była największa?

5 Wycena mieszkań powierzchnia, garaż, wiek, ogrzewanie, położenie, piętro,... Cena rynkowa

6 Udzielanie kredytu dochody, zabezpieczenie, wiek, stan cywilny, oszczędności, zatrudnienie... przyznać czy nie przyznać?

7 Porównanie długości życia mieszkańców kilku miast Dochody, Zanieczyszczenia powietrza, Zanieczyszczenia gleby, Nakłady inwestycyjne na ochronę środowiska Powierzchnia lasów Liczba szpitali Długość życia...

8 Liniowy model regresji wielokrotnej Załóżmy, że rozważamy wpływ zbioru k zmiennych X 1, X 2,..., X k, na zmienną Y. Liniowy model regresji jest określony równaniem: Y = b 0 + b 1 X 1 + b 2 X b k X k + e gdzie: b i - parametry modelu (współczynniki regresji) opisujące wpływ i-tej zmiennej e - składnik losowy

9 Modele regresji wielokrotnej Aby model był jak najbardziej wiarygodny należy wprowadzić do modelu jak największą liczbę zmiennych niezależnych. W modelu powinny się znaleźć zmienne silnie skorelowane ze zmienną zależną i jednocześnie jak najsłabiej skorelowane między sobą.

10 Oznaczenia Niech X oznacza (n * (k+1)) wymiarową macierz obserwacji dokonanych w n-elementowej próbie na k+1 zmiennych niezależnych (tzw. objaśniających ) X 1, X 2,... X k, X k+1,, przy czym X k+1 1 (jest to zmienna występująca przy wyrazie wolnym), X x x... x n x x x 1k 2k... nk x x 1k1 2k1... x n

11 y oznacza n-wymiarowy wektor kolumnowy obserwacji dokonanych w n-elementowej próbie na zmiennej zależnej (objaśnianej) Y: y y y y n

12 b oznacza (k+1) wymiarowy wektor kolumnowy parametrów zwanych współczynnikami regresji wielorakiej: b b b b k b k

13 e oznacza n-wymiarowy wektor kolumnowy losowy, którego składowymi są tzw. składniki losowe zwane też zakłóceniami losowymi: e e e e n

14 n nk n1 1 2k 2k k 1k 11 x x... x x x... x x x... x n 2 1 y... y y k1 k b b b b n e e e y = X b + e Założenie liniowości: y=xb+e

15 Zadanie regresji wielokrotnej: Na podstawie wyników próby, tj. macierzy X oraz wektora y należy oszacować wektor b parametrów tego modelu (współczynników regresji) i wariancję składnika losowego 2.

16 Regresja wieloraka Oszacowanie równania regresji na podstawie n- elementowej próby ma postać Y = b 0 + b 1 *X 1 + b 2 *X b p *X p +e czyli dla każdego t (t = 1,..., n) zachodzi równość y t b 1 xt1 b2xt2... b k x tk b x k 1 t( k1) e t

17 Parametry powyższego modelu szacuje się metodą najmniejszych kwadratów tj. tak, aby suma kwadratów zaobserwowanych odchyleń (reszt) od hiperpłaszczyzny regresji była najmniejsza. 2 j j j k kj j j 2 s e y b b x b x min

18 Korelacja cząstkowa. Współczynniki modelu b 1,..., b k nazywane są cząstkowymi współczynnikami regresji. y b b x b x e j j k kj j

19 Korelacja cząstkowa. W równaniu regresji współczynniki regresji (współczynniki b) reprezentują niezależne wkłady każdej ze zmiennych niezależnych do prognozowania zmiennej zależnej.

20 Współczynnik korelacji cząstkowej Korelacja cząstkowa jest korelacją pomiędzy daną zmienną a zmienną zależną z uwzględnieniem jej skorelowania ze wszystkimi pozostałymi zmiennymi..

21 Ujemne wartości współczynników regresji świadczą o ujemnym, a dodatnie o dodatnim, oddziaływaniu poziomu zmiennej niezależnej na zmienną zależną.

22 Interpretacja i-ty, cząstkowy współczynnik regresji opisuje o ile średnio zmieni się wartość zmiennej Y przy wzroście i-tej wartości zmiennej X o jednostkę przy ustalonych wartościach pozostałych zmiennych niezależnych.

23 Korelacja semicząsteczkowa Jest to korelacja danej zmiennej niezależnej z uwzględnieniem powiązań ze wszystkimi pozostałymi zmiennymi i oryginalną (bez uwzględnienia jej korelacji z innymi zmiennymi) zmienną zależną.

24 Współczynnik korelacji wielorakiej Współczynnik korelacji wielorakiej jest miarą współzależności między jedną ze zmiennych a pozostałymi zmiennymi traktowanymi łącznie.

25 Badanie istotności regresji wielokrotnej Hipotezę odrzucamy gdy p< alfa H 0 : b 1 b 2 b k 0 Odrzucenie hipotezy H 0 jest równoznaczne z tym, że co najmniej jeden współczynnik regresji jest różny od zera tzn. istnieje związek funkcyjny liniowy między zmienną zależną a zmiennymi niezależnymi.

26 Weryfikacja hipotez o istotności cząstkowych współczynników regresji Problem sprowadza się do zweryfikowania serii k hipotez zerowych mówiących o tym, że i-ty cząstkowy współczynnik regresji jest równy zero. Hipotezy te mogą być weryfikowane testem t-studenta

27 Istotność zmiennych W przypadku istnienia silnych współzależności między zmiennymi niezależnymi, funkcja regresji wielokrotnej jest istotna statystycznie (test F). Otrzymujemy istotną funkcję regresji ale wszystkie zmienne (analizowane oddzielnie) mogą okazać się nieistotne. W takim przypadku powinny być usunięte z modelu.

28 Predykcja na podstawie modelu regresji. Prognozowanie predykcja dla nowych wartości.

29 Weryfikacja modelu Weryfikacja modelu matematycznego polega na sprawdzeniu, czy spełnione są następujące założenia:

30 1. Założenie liniowości: y=xb+e Założenie to mówi o liniowości związku między obserwacjami w próbie na zmiennych objaśniających i na zmiennej zależnej z dokładnością do składnika losowego czyli dla każdego t (t = 1,..., n) zachodzi równość y t b 1 xt1 b2xt2... b k x tk b x k 1 t( k1) e t

31 Założenie 2. Liczba obserwacji n musi być większa od liczby oszacowanych parametrów, tj. n > k + 1. (liczba n powinna być wielokrotnie większa od liczby oszacowanych parametrów).

32 Założenie 3. Żadna ze zmiennych niezależnych nie jest kombinacją liniową innych zmiennych niezależnych czyli brak jest współliniowości (nadmiarowości).

33 Nadmiarowość

34 Tolerancja dla danej zmiennej Tolerancja równa się 1 - R 2 Im mniejsza jest tolerancja zmiennej tym bardziej nadmiarowy jest jej wkład w równanie regresji. Jeśli tolerancja = 0 - nie można obliczyć współczynników równania regresji. Jeśli tolerancja dla zmiennej spada poniżej 0,1 to wówczas taki model regresji staje się mało przydatny.

35 Wartość R 2 wartość R 2 między daną zmienną a wszystkimi pozostałymi zmiennymi niezależnymi Wskaźnik ten informuje nas, ile zmienności danej zmiennej jest wyjaśnione przez pozostałe zmienne. Im bliżej jedności, tym bardziej nadmiarowa jest zmienna.

36 Czynnik inflacji wariancji (CIW). CIW = 1/(1 - R 2 ). Jeżeli nie ma współliniowości, to CIW jest równe jedności. Jeśli współliniowość występuje, to CIW pokazuje stopień inflacji, czyli - ile razy obliczona wariancja estymatora jest większa od wartości prawdziwej (niezakłóconej współliniowością). Uważa się, że wartość CIW >10 jest świadectwem zakłócającej współliniowości.

37 Założenie 4. Składnik losowy e i ma wartość oczekiwaną równą zeru (E(e i ) = 0 dla wszystkich i = 1, 2,..., n)

38 Założenie 5. Wariancja składnika losowego (reszt e i ) jest taka sama dla wszystkich obserwacji (War(e i ) = s 2 dla wszystkich i = 1, 2,..., n) Takie założenie nosi nazwę homoscedastyczności i mówi, że czynniki ujęte w modelu mają taką samą zmienność (rozrzut) niezależnie od numeru obserwacji. W przeciwnym wypadku mówimy o heteroscedastyczności.

39 Interpretacja Założenie homoscedastyczności jest naruszone jeśli wartości reszt są bardziej zróżnicowane (rozrzucone) dla pewnych wartości przewidywanych niż dla innych lub kiedy wartości wariancji zdają się rosnąć wraz ze wzrostem wartości przewidywanej.

40 Założenie 6. Składniki losowe (reszty) są nieskorelowane czyli e i oraz e j są od siebie niezależne dla wszystkich par i oraz j, gdzie i, j = 1, 2,..., n oraz i różne od j (brak autokorelacji reszt).

41 Założenie 7. Każdy ze składników losowych (reszty) ma rozkład normalny N(0, ) tj. średniej 0 i wariancji 2.

42 Przykład W badaniach lekarskich dotyczących pewnej choroby analizowano czas pobytu w szpitalu w zależności od stężenia we krwi cholesterolu, glukozy i fibrynogenu. Wyniki pomiarów dla 20 losowo wybranych pacjentów podane są w tabeli

43 Przykład Stwierdzono, że długość życia mieszkańców dla poszczególnych województw znacznie się różni. Aby zbadać przyczyny, przeprowadzono analizę statystyczną wg danych GUS.

44 Do analizy wybrano następujące dane: Średni przyrost przeciętnego trwania życia od roku - zmienna zależna Y Przeciętny czas trwania życia w roku bazowym 1990 Średnie nakłady na środki trwałe służące ochronie środowiska + nakłady na gospodarkę wodną w przeliczeniu na 1 mieszkańca Średnie nakłady na środki trwałe służące ochronie środowiska + nakłady na gospodarkę wodną w przeliczeniu na na 1 km 2 powierzchni

45 Przyrost przeciętn ego trwania życia 1990 Nakłady w przeliczeniu na 1 mieszkańca Nakłady /1 km 2 Dolnośląskie Kujawsko-pomorskie Lubelskie Lubuskie Łódzkie Małopolskie Mazowieckie Opolskie Podkarpackie Podlaskie Pomorskie Śląskie Świętokrzyskie Warmińsko-Mazurskie Wielkopolskie Zachodniopomorskie

46 Interesuje nas równanie regresji opisujące zależność przyrostu długości życia (zmienna Y) od roku bazowego oraz wskaźnika 1 i wskaźnika 2 i oceny istotności ich oddziaływania.

47 Najniższy nakład na głowę mieszkańca ma woj.lubelskie (0,137 - przyrost życia 3.4 )i świętokrzyskie (0,137, przyrost życia 4,31) Najniższy przyrost długości życia jest w województwie łódzkim (3,35) przy nakładach Najwyższy przyrost długości życia jest w województwie opolskim (5,63) przy najwyższych nakładach Najwyższe nakłady na 1 km 2 ma woj. Śląskie - przyrost wyniósł 4.89.

48 Regresja wielokrotna Y = X* b + e Y = b 0 + b 1 *Rok b 2 * Wskaźnik 1+ b 3 * Wskaźnik 2 +e

49 8 Wykres rozrzutu Y względem 1990 długość życia wg województw.sta 4v*16c Y = *x Y :Y: r = ; p = ; r 2 =

50 8 Wykres rozrzutu Y względem Wskaźnik 1 długość życia wg województw.sta 4v*16c Y = *x Y Wskaźnik 1:Y: r = ; p = ; r 2 = Wskaźnik 1

51 8 Wykres rozrzutu Y względem Wskaźnik 2 długość życia wg województw.sta 4v*16c Y = *x Y Wskaźnik 2:Y: r = ; p = ; r 2 = Wskaźnik 2

52 Wykres rozrzutu - powierzchniowy Wykres powierzchniowy 3W Y względem Wskaźnik 1 i Wskaźnik 2 Arkusz1 4v*16c Y = Wygładzanie najmniejszych kwadratów ważone odległościami > 6 < 5.5 < 4.5 < 3.5 < 2.5 < 1.5 < 0.5

53 Wykres z punktami danych Wykres powierzchniowy 3W Y względem 1990 i Wskaźnik 1 Arkusz1 4v*16c Y = Sklejana > 6.5 < 6.1 < 5.6 < 5.1 < 4.6 < 4.1 < 3.6

54 Wykres powierzchniowy 3W Y względem 1990 i Wskaźnik 1 Arkusz1 4v*16c Y = *x *y > 5.8 < 5.6 < 5.2 < 4.8 < 4.4 < 4

55

56

57

58 Y= Rok wskaźnik wskaźnik /0.62

59 Dla Roku bazowego 1990 i wskaźnika 2 p > alfa zatem brak jest istotności parametrów dla tych zmiennych. Błąd standardowy oceny wyrazu wolnego w stosunku do jego wartości jest relatywnie duży.

60 Ujemne wartości współczynników regresji świadczą o ujemnym (rok bazowy, wskaźnik 2), a dodatnie o dodatnim, oddziaływaniu poziomu zmiennej niezależnej na zmienną zależną.

61 Współczynnik korelacji wielorakiej informuje, że zmienna zależna skorygowana jest ze wszystkimi zmiennymi niezależnymi. Współczynnik determinacji oznacza, że 35% zmienności zmiennej Y jest wyjaśnione przez model. Skorygowane R 2 stosujemy, jeśli liczba pomiarów jest niewiele większa od liczby wyznaczanych parametrów.

62 Przycisk Wykonaj analizę reszt

63 Założenie 1. Model jest liniowy względem parametrów, tzn. = b 0 + b 1 x 1i + b 2 x 2i b k x ki dla i = 1, 2,..., n. Liniowość sprawdzamy testem F, którego wyniki możemy znaleźć w oknie Regresja wieloraka

64 Weryfikacja liniowości - wykresy rozrzutu reszt Interpretacja. Jeżeli założenie jest spełnione, to reszty układają się w postaci równomiernej chmury Jeżeli zaś założenie nie jest spełnione, to na wykresie mogą się pojawić charakterystyczne układy punktów.

65 Okno - Analiza reszt - Wykr. Rozrzutu.

66 Wykres rozrzutu reszt dla zmiennej Y 1.2 Przewidywane względem wartości resztowych Zmienna zależna: Y Reszty Wart. przewidyw Prz.Ufn.

67 Wartości przewidywane względem obserwowanych 5.8 Wartości przewidywane względem obserwowanych Zmienna zależna: Y Wart. obserw Wart. przewidyw Prz.Ufn.

68 Jeśli nieliniowość jest oczywista, możemy dokonać przekształcenia zmiennych (sprowadzając do liniowości) albo zastosować techniki nieliniowe.

69 Założenie 2. Liczba obserwacji n musi być większa od liczby oszacowanych parametrów, tj. n > k + 1. n = 16, k = 4

70 Założenie 3. Żadna ze zmiennych niezależnych nie jest kombinacją liniową innych zmiennych niezależnych czyli brak jest współliniowości.

71 Statistica Wskaźniki statystyczne do wykrycia współliniowości (nadmiarowości) otrzymujemy po kliknięciu zakładki "Więcej", przycisk Nadmiarowość w oknie "Wyniki regresji"

72 Nadmiarowość

73 Tolerancja dla danej zmiennej Tolerancja równa się 1 - R 2 Im mniejsza jest tolerancja zmiennej tym bardziej nadmiarowy jest jej wkład w równanie regresji. Jeśli tolerancja = 0 - nie można obliczyć współczynników równania regresji. Jeśli tolerancja dla zmiennej spada poniżej 0,1 to wówczas taki model regresji staje się mało przydatny.

74 Wartość R 2 wartość R 2 między daną zmienną a wszystkimi pozostałymi zmiennymi niezależnymi Wskaźnik ten informuje nas, ile zmienności danej zmiennej jest wyjaśnione przez pozostałe zmienne. Im bliżej jedności, tym bardziej nadmiarowa jest zmienna.

75 Czynnik inflacji wariancji (CIW). CIW = 1/(1 - R 2 ). Jeżeli nie ma współliniowości, to CIW jest równe jedności. Jeśli współliniowość występuje, to CIW pokazuje stopień inflacji, czyli - ile razy obliczona wariancja estymatora jest większa od wartości prawdziwej (niezakłóconej współliniowością). Uważa się, że wartość CIW >10 jest świadectwem zakłócającej współliniowości.

76 Korelacja cząstkowa Korelacja cząstkowa jest korelacją pomiędzy daną zmienną a zmienną zależną z uwzględnieniem jej skorelowania ze wszystkimi pozostałymi zmiennymi.

77 Korelacja semicząsteczkowa Jest to korelacja danej zmiennej niezależnej z uwzględnieniem powiązań ze wszystkimi pozostałymi zmiennymi i oryginalną (bez uwzględnienia jej korelacji z innymi zmiennymi) zmienną zależną.

78 Analiza Korelacje wskazują, że zmienna Y nie jest skorelowana ze zmienną 1990.

79 Założenie 4. Składnik losowy e i ma wartość oczekiwaną równą zeru - można utworzyć wykres normalności reszt średnia wartość oraz mediana powinny być równe lub bliskie 0.

80 Wykres normalności reszt 2.0 Wykres normalności reszt Wartość normalna Reszty

81 Założenie 5. Wariancja składnika losowego (reszt e i ) jest taka sama dla wszystkich obserwacji - wykres rozrzutu reszt

82 Sprawdzenie, czy istnieje heteroscedastyczność Heteroscedastyczność (naruszenie założenia) Utworzenie odpowiednich wykresów rozrzutu. wykres rozrzutu reszt względem wartości przewidywanych lub rozrzutu wartości przewidywanych względem kwadratów reszt.

83 Interpretacja Założenie homoscedastyczności jest naruszone jeśli wartości reszt są bardziej zróżnicowane (rozrzucone) dla pewnych wartości przewidywanych niż dla innych lub kiedy wartości wariancji zdają się rosnąć wraz ze wzrostem wartości przewidywanej.

84 1.2 Przewidywane względem wartości resztowych Zmienna zależna: Y Reszty Wart. przewidyw Prz.Ufn.

85 Założenie 6. Badanie autokorelacji reszt. W pakiecie STATISTICA do wykrywania autokorelacji służy test Durbina i Watsona dostępny po kliknięciu przycisku

86 Założenie 7. Każdy ze składników losowych (reszty) ma rozkład normalny.

87 2.0 Wykres normalności reszt Wartość normalna Reszty

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Modelowanie ekonometryczne

Modelowanie ekonometryczne Barbara Gładysz Jacek Mercik Modelowanie ekonometryczne Studium przypadku Wydanie II Oficyna Wydawnicza Politechniki Wrocławskiej Wrocław 007 Recenzent Paweł DITTMANN Opracowanie redakcyjne i korekta Alina

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Brunon R. Górecki. Podstawowy kurs nowoczesnej ekonometrii

Brunon R. Górecki. Podstawowy kurs nowoczesnej ekonometrii Brunon R. Górecki Podstawowy kurs nowoczesnej ekonometrii SPIS TREŚCI Wstęp CZĘŚĆ I. KLASYCZNY MODEL REGRESJI LINIOWEJ.Wprowadzenie.. Czym jest ekonometria?.. Pojęcie modelu ekonometrycznego.3. Dane statystyczne.4.

Bardziej szczegółowo

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1.

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1. Weryfikacja hipotez Każde badanie naukowe rozpoczyna się od sformułowania problemu badawczego oraz najbardziej prawdopodobnego (na gruncie wiedzy badającego) ogólnego rozwiązania, czyli hipotezy badawczej.

Bardziej szczegółowo

WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ

WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ WYCHODZĄC POZA PROSTĄ REGRESJĘ MODELOWANIE STATYSTYCZNE W OBSZARZE UBEZPIECZEŃ Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Wiele zjawisk i procesów występujących w otaczającej nas rzeczywistości ma

Bardziej szczegółowo

Metody analizy i prezentacji danych statystycznych Materiały do wykładu

Metody analizy i prezentacji danych statystycznych Materiały do wykładu Metody analizy i prezentacji danych statystycznych Materiały do wykładu Dr Adam Kucharski Spis treści 1 Podstawowe pojęcia statystyczne 2 1.1 Populacja i zbiorowość................................. 2 1.2

Bardziej szczegółowo

Regresja prosta. Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie

Regresja prosta. Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie ROZDZIAŁ 1 Regresja prosta 15 Sylwia Bedyńska Szkoła Wyższa Psychologii Społecznej w Warszawie Monika Książek Szkoła Główna Handlowa w Warszawie Regresja prosta część i modele regresji rozdział 1 W tym

Bardziej szczegółowo

BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO

BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO AKADEMIA EKONOMICZNA W POZNANIU Krzysztof Cichy BADANIE ZGODNOŚCI ROZKŁADU STÓP ZWROTU NA GPW W WARSZAWIE Z ROZKŁADAMI GAUSSA I CAUCHY EGO PRACA MAGISTERSKA Wydział Zarządzania Kierunek: Zarządzanie i

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Zależności w danych. Korelacja i regresja. Agnieszka Nowak Brzezińska SMAD

Zależności w danych. Korelacja i regresja. Agnieszka Nowak Brzezińska SMAD Zależności w danych. Korelacja i regresja Agnieszka Nowak Brzezińska SMAD Korelacja Zależność korelacyjna pomiędzy cechami X i Y charakteryzuje sie tym, że wartościom jednej cechy są przyporządkowane ściśle

Bardziej szczegółowo

6. PODSTAWY PLANOWANIA EKSPERYMENTU

6. PODSTAWY PLANOWANIA EKSPERYMENTU 6. PODSTAWY PLANOWANIA EKSPERYMENTU 6.. Pojęcie i rola badań doświadczalnych Przez eksperyment rozumiemy badanie jakiegoś zjawiska, polegające na celowym wywoływaniu tego zjawiska lub jego zmian oraz obserwacji

Bardziej szczegółowo

RAPORT V ZRÓŻNICOWANIE WPŁYWU ŚWIATOWEJ KONIUNKTURY GOSPODARCZEJ W UKŁADZIE OBSZARÓW WZROSTU I OBSZARÓW STAGNACJI

RAPORT V ZRÓŻNICOWANIE WPŁYWU ŚWIATOWEJ KONIUNKTURY GOSPODARCZEJ W UKŁADZIE OBSZARÓW WZROSTU I OBSZARÓW STAGNACJI RAPORT V ZRÓŻNICOWANIE WPŁYWU ŚWIATOWEJ KONIUNKTURY GOSPODARCZEJ W UKŁADZIE OBSZARÓW WZROSTU I OBSZARÓW STAGNACJI ZADANIA VII - WYNIKI Badanie wpływu światowej koniunktury gospodarczej (w tym zjawiska

Bardziej szczegółowo

Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych

Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych Uniwersytet Ekonomiczny w Krakowie Praca magisterska Nieparametryczne estymatory jądrowe regresji w zastosowaniach ekonomicznych Anna Węgrzynkiewicz Kierunek: Informatyka i Ekonometria Specjalność: Modelowanie

Bardziej szczegółowo

Janusz Górczyński. Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy.

Janusz Górczyński. Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy. Materiały pomocnicze do e-learningu Prognozowanie i symulacje Janusz Górczyński Moduł 4. Badanie, czy trend zjawiska jest liniowy lub wykładniczy. Wyższa Szkoła Zarządzania i Marketingu Sochaczew 2012

Bardziej szczegółowo

MODEL ARBITRAŻU CENOWEGO - EMPIRYCZNA WERYFIKACJA MODELU W WARUNKACH GIEŁDY PAPIERÓW WARTOŚCIOWYCH W WARSZAWIE

MODEL ARBITRAŻU CENOWEGO - EMPIRYCZNA WERYFIKACJA MODELU W WARUNKACH GIEŁDY PAPIERÓW WARTOŚCIOWYCH W WARSZAWIE MODEL ARBITRAŻU CENOWEGO - EMPIRYCZNA WERYFIKACJA MODELU W WARUNKACH GIEŁDY PAPIERÓW WARTOŚCIOWYCH W WARSZAWIE Anna Adamczak Katedra Ekonometrii, Wydział Zarządzania, Uniwersytet Gdański, Sopot 1 WSTĘP

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

WYKŁAD 1 Inwestycje, środowisko inwestycyjne, proces inwestycyjny

WYKŁAD 1 Inwestycje, środowisko inwestycyjne, proces inwestycyjny WYKŁD 1 Inwestycje, środowisko inwestycyjne, proces inwestycyjny I. Pojęcie i rodzaje inwestycji Istnieje wiele definicji pojęcia inwestycja. Najbardziej ogólna jest następująca definicja: Definicja: inwestycja

Bardziej szczegółowo

Zbiór zadań z rachunku prawdopodobieństwa i statystyki matematycznej

Zbiór zadań z rachunku prawdopodobieństwa i statystyki matematycznej Zbiór zadań z rachunku prawdopodobieństwa i statystyki matematycznej Wojciech Młocek wojciech.mlocek@ur.krakow.pl Kamila Piwowarczyk kamila.piwowarczyk@ur.krakow.pl Agnieszka Rutkowska rmrutkow@cyf-kr.edu.pl

Bardziej szczegółowo

Konstrukcja i własności hedonicznego indeksu cen mieszkań dla Warszawy

Konstrukcja i własności hedonicznego indeksu cen mieszkań dla Warszawy Bank i Kredyt 41 (1), 2010, 99 128 www.bankikredyt.nbp.pl www.bankandcredit.nbp.pl Konstrukcja i własności hedonicznego indeksu cen mieszkań dla Warszawy Emilia Tomczyk*, Marta Widłak # Nadesłany: 22 września

Bardziej szczegółowo

Marta Zalewska Wojciech Zieliński Stanisław Jaworski Konrad Furmańczyk. Zbiór zadań z podstaw statystyki

Marta Zalewska Wojciech Zieliński Stanisław Jaworski Konrad Furmańczyk. Zbiór zadań z podstaw statystyki Marta Zalewska Wojciech Zieliński Stanisław Jaworski Konrad Furmańczyk Zbiór zadań z podstaw statystyki Spis treści Przedmowa 3 1 Analiza danych 4 2 Elementy rachunku prawdopodobieństwa 15 3 Rozkład dwumianowy

Bardziej szczegółowo

Zmienność w procesach

Zmienność w procesach MODUŁ IV Zmienność w procesach i jej odmiany. Podstawy statystycznego nadzorowanie procesów. Zdatność jakościowa procesu. Elementy koncepcji Six Sigma 1 Zmienność w procesach Zmienność jest naturalnym

Bardziej szczegółowo

PROGNOZOWANIE ROZWOJU RYNKU UBEZPIECZEŃ MAJĄTKOWYCH I OSOBOWYCH W POLSCE NA PODSTAWIE ZMIAN W BUDŻETACH GOSPODARSTW DOMOWYCH

PROGNOZOWANIE ROZWOJU RYNKU UBEZPIECZEŃ MAJĄTKOWYCH I OSOBOWYCH W POLSCE NA PODSTAWIE ZMIAN W BUDŻETACH GOSPODARSTW DOMOWYCH PROGNOZOWANIE ROZWOJU RYNKU UBEZPIECZEŃ MAJĄTKOWYCH I OSOBOWYCH W POLSCE NA PODSTAWIE ZMIAN W BUDŻETACH GOSPODARSTW DOMOWYCH Robert Lisowski Katedra Mikroekonomii, Wydział Zarządzania, Akademia Górniczo-Hutnicza

Bardziej szczegółowo

Efektywność funkcjonowania, aktywność inwestycyjna i zdolność konkurencyjna polskich gospodarstw rolnych osób fizycznych

Efektywność funkcjonowania, aktywność inwestycyjna i zdolność konkurencyjna polskich gospodarstw rolnych osób fizycznych Efektywność funkcjonowania, aktywność inwestycyjna i zdolność konkurencyjna polskich gospodarstw rolnych osób fizycznych Efektywność funkcjonowania, aktywność inwestycyjna i zdolność konkurencyjna polskich

Bardziej szczegółowo

ZROZUMIEĆ DANE I WYNIKI (NA PRZYKŁADACH BADAŃ EPIDEMIOLOGICZNYCH)

ZROZUMIEĆ DANE I WYNIKI (NA PRZYKŁADACH BADAŃ EPIDEMIOLOGICZNYCH) ZROZUMIEĆ DANE I WYNIKI (NA PRZYKŁADACH BADAŃ EPIDEMIOLOGICZNYCH) Ewa Kawalec, Zakład Epidemiologii i Badań Populacyjnych, Instytut Zdrowia Publicznego, Wydział Ochrony Zdrowia, Collegium Medicum Uniwersytetu

Bardziej szczegółowo

Wpływ kredytów rolniczych udzielanych przez banki spółdzielcze na rozwój rolnictwa w Polsce

Wpływ kredytów rolniczych udzielanych przez banki spółdzielcze na rozwój rolnictwa w Polsce Tomasz Siudek Katedra Ekonomiki i Organizacji Przedsiębiorstw Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wpływ kredytów rolniczych udzielanych przez banki spółdzielcze na rozwój rolnictwa w Polsce

Bardziej szczegółowo

Metody statystyki medycznej stosowane w badaniach klinicznych

Metody statystyki medycznej stosowane w badaniach klinicznych Metody statystyki medycznej stosowane w badaniach klinicznych Statistics for clinical research & post-marketing surveillance część I Program szkolenia część I Wprowadzenie Podstawowe pojęcia statystyczne

Bardziej szczegółowo

IBM SPSS Statistics Base 22

IBM SPSS Statistics Base 22 IBM SPSS Statistics Base 22 Uwaga Przed skorzystaniem z niniejszych informacji oraz produktu, którego one dotyczą, należy zapoznać się z informacjami zamieszczonymi w sekcji Informacje na stronie 185.

Bardziej szczegółowo

IX Kongres Ekonomistów Polskich

IX Kongres Ekonomistów Polskich Anna Rzeszutko Walenty Poczta Uniwersytet Przyrodniczy w Poznaniu IX Kongres Ekonomistów Polskich ZNACZENIE WSPÓLNEJ POLITYKI ROLNEJ W PROCESIE MODERNIZACJI ROLNICTWA W POLSCE 1 Streszczenie: Przystąpienie

Bardziej szczegółowo