Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielkość: px
Rozpocząć pokaz od strony:

Download "Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna"

Transkrypt

1 Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

2 Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna zmienna niezależna Zmienna zależna jednowymiarowa oraz wiele zmiennych niezależnych Zmienna zależna wielowymiarowa oraz jedna zmienna niezależna Zmienna zależna wielowymiarowa oraz wiele zmiennych niezależnych. Postać (kształt) zależności może być : liniowy lub nieliniowy.

3 Regresja wieloraka - wielokrotna Celem regresji wielorakiej jest ilościowe ujęcie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (kryterialną, objaśnianą).

4 Przykłady. 1. Wytrzymałość betonu zależy od proporcji w jakiej zastosowano trzy podstawowe składniki. Pytanie: W jakiej proporcji stosować te składniki, by wytrzymałość była największa?

5 Wycena mieszkań powierzchnia, garaż, wiek, ogrzewanie, położenie, piętro,... Cena rynkowa

6 Udzielanie kredytu dochody, zabezpieczenie, wiek, stan cywilny, oszczędności, zatrudnienie... przyznać czy nie przyznać?

7 Porównanie długości życia mieszkańców kilku miast Dochody, Zanieczyszczenia powietrza, Zanieczyszczenia gleby, Nakłady inwestycyjne na ochronę środowiska Powierzchnia lasów Liczba szpitali Długość życia...

8 Liniowy model regresji wielokrotnej Załóżmy, że rozważamy wpływ zbioru k zmiennych X 1, X 2,..., X k, na zmienną Y. Liniowy model regresji jest określony równaniem: Y = b 0 + b 1 X 1 + b 2 X b k X k + e gdzie: b i - parametry modelu (współczynniki regresji) opisujące wpływ i-tej zmiennej e - składnik losowy

9 Modele regresji wielokrotnej Aby model był jak najbardziej wiarygodny należy wprowadzić do modelu jak największą liczbę zmiennych niezależnych. W modelu powinny się znaleźć zmienne silnie skorelowane ze zmienną zależną i jednocześnie jak najsłabiej skorelowane między sobą.

10 Oznaczenia Niech X oznacza (n * (k+1)) wymiarową macierz obserwacji dokonanych w n-elementowej próbie na k+1 zmiennych niezależnych (tzw. objaśniających ) X 1, X 2,... X k, X k+1,, przy czym X k+1 1 (jest to zmienna występująca przy wyrazie wolnym), X x x... x n x x x 1k 2k... nk x x 1k1 2k1... x n

11 y oznacza n-wymiarowy wektor kolumnowy obserwacji dokonanych w n-elementowej próbie na zmiennej zależnej (objaśnianej) Y: y y y y n

12 b oznacza (k+1) wymiarowy wektor kolumnowy parametrów zwanych współczynnikami regresji wielorakiej: b b b b k b k

13 e oznacza n-wymiarowy wektor kolumnowy losowy, którego składowymi są tzw. składniki losowe zwane też zakłóceniami losowymi: e e e e n

14 n nk n1 1 2k 2k k 1k 11 x x... x x x... x x x... x n 2 1 y... y y k1 k b b b b n e e e y = X b + e Założenie liniowości: y=xb+e

15 Zadanie regresji wielokrotnej: Na podstawie wyników próby, tj. macierzy X oraz wektora y należy oszacować wektor b parametrów tego modelu (współczynników regresji) i wariancję składnika losowego 2.

16 Regresja wieloraka Oszacowanie równania regresji na podstawie n- elementowej próby ma postać Y = b 0 + b 1 *X 1 + b 2 *X b p *X p +e czyli dla każdego t (t = 1,..., n) zachodzi równość y t b 1 xt1 b2xt2... b k x tk b x k 1 t( k1) e t

17 Parametry powyższego modelu szacuje się metodą najmniejszych kwadratów tj. tak, aby suma kwadratów zaobserwowanych odchyleń (reszt) od hiperpłaszczyzny regresji była najmniejsza. 2 j j j k kj j j 2 s e y b b x b x min

18 Korelacja cząstkowa. Współczynniki modelu b 1,..., b k nazywane są cząstkowymi współczynnikami regresji. y b b x b x e j j k kj j

19 Korelacja cząstkowa. W równaniu regresji współczynniki regresji (współczynniki b) reprezentują niezależne wkłady każdej ze zmiennych niezależnych do prognozowania zmiennej zależnej.

20 Współczynnik korelacji cząstkowej Korelacja cząstkowa jest korelacją pomiędzy daną zmienną a zmienną zależną z uwzględnieniem jej skorelowania ze wszystkimi pozostałymi zmiennymi..

21 Ujemne wartości współczynników regresji świadczą o ujemnym, a dodatnie o dodatnim, oddziaływaniu poziomu zmiennej niezależnej na zmienną zależną.

22 Interpretacja i-ty, cząstkowy współczynnik regresji opisuje o ile średnio zmieni się wartość zmiennej Y przy wzroście i-tej wartości zmiennej X o jednostkę przy ustalonych wartościach pozostałych zmiennych niezależnych.

23 Korelacja semicząsteczkowa Jest to korelacja danej zmiennej niezależnej z uwzględnieniem powiązań ze wszystkimi pozostałymi zmiennymi i oryginalną (bez uwzględnienia jej korelacji z innymi zmiennymi) zmienną zależną.

24 Współczynnik korelacji wielorakiej Współczynnik korelacji wielorakiej jest miarą współzależności między jedną ze zmiennych a pozostałymi zmiennymi traktowanymi łącznie.

25 Badanie istotności regresji wielokrotnej Hipotezę odrzucamy gdy p< alfa H 0 : b 1 b 2 b k 0 Odrzucenie hipotezy H 0 jest równoznaczne z tym, że co najmniej jeden współczynnik regresji jest różny od zera tzn. istnieje związek funkcyjny liniowy między zmienną zależną a zmiennymi niezależnymi.

26 Weryfikacja hipotez o istotności cząstkowych współczynników regresji Problem sprowadza się do zweryfikowania serii k hipotez zerowych mówiących o tym, że i-ty cząstkowy współczynnik regresji jest równy zero. Hipotezy te mogą być weryfikowane testem t-studenta

27 Istotność zmiennych W przypadku istnienia silnych współzależności między zmiennymi niezależnymi, funkcja regresji wielokrotnej jest istotna statystycznie (test F). Otrzymujemy istotną funkcję regresji ale wszystkie zmienne (analizowane oddzielnie) mogą okazać się nieistotne. W takim przypadku powinny być usunięte z modelu.

28 Predykcja na podstawie modelu regresji. Prognozowanie predykcja dla nowych wartości.

29 Weryfikacja modelu Weryfikacja modelu matematycznego polega na sprawdzeniu, czy spełnione są następujące założenia:

30 1. Założenie liniowości: y=xb+e Założenie to mówi o liniowości związku między obserwacjami w próbie na zmiennych objaśniających i na zmiennej zależnej z dokładnością do składnika losowego czyli dla każdego t (t = 1,..., n) zachodzi równość y t b 1 xt1 b2xt2... b k x tk b x k 1 t( k1) e t

31 Założenie 2. Liczba obserwacji n musi być większa od liczby oszacowanych parametrów, tj. n > k + 1. (liczba n powinna być wielokrotnie większa od liczby oszacowanych parametrów).

32 Założenie 3. Żadna ze zmiennych niezależnych nie jest kombinacją liniową innych zmiennych niezależnych czyli brak jest współliniowości (nadmiarowości).

33 Nadmiarowość

34 Tolerancja dla danej zmiennej Tolerancja równa się 1 - R 2 Im mniejsza jest tolerancja zmiennej tym bardziej nadmiarowy jest jej wkład w równanie regresji. Jeśli tolerancja = 0 - nie można obliczyć współczynników równania regresji. Jeśli tolerancja dla zmiennej spada poniżej 0,1 to wówczas taki model regresji staje się mało przydatny.

35 Wartość R 2 wartość R 2 między daną zmienną a wszystkimi pozostałymi zmiennymi niezależnymi Wskaźnik ten informuje nas, ile zmienności danej zmiennej jest wyjaśnione przez pozostałe zmienne. Im bliżej jedności, tym bardziej nadmiarowa jest zmienna.

36 Czynnik inflacji wariancji (CIW). CIW = 1/(1 - R 2 ). Jeżeli nie ma współliniowości, to CIW jest równe jedności. Jeśli współliniowość występuje, to CIW pokazuje stopień inflacji, czyli - ile razy obliczona wariancja estymatora jest większa od wartości prawdziwej (niezakłóconej współliniowością). Uważa się, że wartość CIW >10 jest świadectwem zakłócającej współliniowości.

37 Założenie 4. Składnik losowy e i ma wartość oczekiwaną równą zeru (E(e i ) = 0 dla wszystkich i = 1, 2,..., n)

38 Założenie 5. Wariancja składnika losowego (reszt e i ) jest taka sama dla wszystkich obserwacji (War(e i ) = s 2 dla wszystkich i = 1, 2,..., n) Takie założenie nosi nazwę homoscedastyczności i mówi, że czynniki ujęte w modelu mają taką samą zmienność (rozrzut) niezależnie od numeru obserwacji. W przeciwnym wypadku mówimy o heteroscedastyczności.

39 Interpretacja Założenie homoscedastyczności jest naruszone jeśli wartości reszt są bardziej zróżnicowane (rozrzucone) dla pewnych wartości przewidywanych niż dla innych lub kiedy wartości wariancji zdają się rosnąć wraz ze wzrostem wartości przewidywanej.

40 Założenie 6. Składniki losowe (reszty) są nieskorelowane czyli e i oraz e j są od siebie niezależne dla wszystkich par i oraz j, gdzie i, j = 1, 2,..., n oraz i różne od j (brak autokorelacji reszt).

41 Założenie 7. Każdy ze składników losowych (reszty) ma rozkład normalny N(0, ) tj. średniej 0 i wariancji 2.

42 Przykład W badaniach lekarskich dotyczących pewnej choroby analizowano czas pobytu w szpitalu w zależności od stężenia we krwi cholesterolu, glukozy i fibrynogenu. Wyniki pomiarów dla 20 losowo wybranych pacjentów podane są w tabeli

43 Przykład Stwierdzono, że długość życia mieszkańców dla poszczególnych województw znacznie się różni. Aby zbadać przyczyny, przeprowadzono analizę statystyczną wg danych GUS.

44 Do analizy wybrano następujące dane: Średni przyrost przeciętnego trwania życia od roku - zmienna zależna Y Przeciętny czas trwania życia w roku bazowym 1990 Średnie nakłady na środki trwałe służące ochronie środowiska + nakłady na gospodarkę wodną w przeliczeniu na 1 mieszkańca Średnie nakłady na środki trwałe służące ochronie środowiska + nakłady na gospodarkę wodną w przeliczeniu na na 1 km 2 powierzchni

45 Przyrost przeciętn ego trwania życia 1990 Nakłady w przeliczeniu na 1 mieszkańca Nakłady /1 km 2 Dolnośląskie Kujawsko-pomorskie Lubelskie Lubuskie Łódzkie Małopolskie Mazowieckie Opolskie Podkarpackie Podlaskie Pomorskie Śląskie Świętokrzyskie Warmińsko-Mazurskie Wielkopolskie Zachodniopomorskie

46 Interesuje nas równanie regresji opisujące zależność przyrostu długości życia (zmienna Y) od roku bazowego oraz wskaźnika 1 i wskaźnika 2 i oceny istotności ich oddziaływania.

47 Najniższy nakład na głowę mieszkańca ma woj.lubelskie (0,137 - przyrost życia 3.4 )i świętokrzyskie (0,137, przyrost życia 4,31) Najniższy przyrost długości życia jest w województwie łódzkim (3,35) przy nakładach Najwyższy przyrost długości życia jest w województwie opolskim (5,63) przy najwyższych nakładach Najwyższe nakłady na 1 km 2 ma woj. Śląskie - przyrost wyniósł 4.89.

48 Regresja wielokrotna Y = X* b + e Y = b 0 + b 1 *Rok b 2 * Wskaźnik 1+ b 3 * Wskaźnik 2 +e

49 8 Wykres rozrzutu Y względem 1990 długość życia wg województw.sta 4v*16c Y = *x Y :Y: r = ; p = ; r 2 =

50 8 Wykres rozrzutu Y względem Wskaźnik 1 długość życia wg województw.sta 4v*16c Y = *x Y Wskaźnik 1:Y: r = ; p = ; r 2 = Wskaźnik 1

51 8 Wykres rozrzutu Y względem Wskaźnik 2 długość życia wg województw.sta 4v*16c Y = *x Y Wskaźnik 2:Y: r = ; p = ; r 2 = Wskaźnik 2

52 Wykres rozrzutu - powierzchniowy Wykres powierzchniowy 3W Y względem Wskaźnik 1 i Wskaźnik 2 Arkusz1 4v*16c Y = Wygładzanie najmniejszych kwadratów ważone odległościami > 6 < 5.5 < 4.5 < 3.5 < 2.5 < 1.5 < 0.5

53 Wykres z punktami danych Wykres powierzchniowy 3W Y względem 1990 i Wskaźnik 1 Arkusz1 4v*16c Y = Sklejana > 6.5 < 6.1 < 5.6 < 5.1 < 4.6 < 4.1 < 3.6

54 Wykres powierzchniowy 3W Y względem 1990 i Wskaźnik 1 Arkusz1 4v*16c Y = *x *y > 5.8 < 5.6 < 5.2 < 4.8 < 4.4 < 4

55

56

57

58 Y= Rok wskaźnik wskaźnik /0.62

59 Dla Roku bazowego 1990 i wskaźnika 2 p > alfa zatem brak jest istotności parametrów dla tych zmiennych. Błąd standardowy oceny wyrazu wolnego w stosunku do jego wartości jest relatywnie duży.

60 Ujemne wartości współczynników regresji świadczą o ujemnym (rok bazowy, wskaźnik 2), a dodatnie o dodatnim, oddziaływaniu poziomu zmiennej niezależnej na zmienną zależną.

61 Współczynnik korelacji wielorakiej informuje, że zmienna zależna skorygowana jest ze wszystkimi zmiennymi niezależnymi. Współczynnik determinacji oznacza, że 35% zmienności zmiennej Y jest wyjaśnione przez model. Skorygowane R 2 stosujemy, jeśli liczba pomiarów jest niewiele większa od liczby wyznaczanych parametrów.

62 Przycisk Wykonaj analizę reszt

63 Założenie 1. Model jest liniowy względem parametrów, tzn. = b 0 + b 1 x 1i + b 2 x 2i b k x ki dla i = 1, 2,..., n. Liniowość sprawdzamy testem F, którego wyniki możemy znaleźć w oknie Regresja wieloraka

64 Weryfikacja liniowości - wykresy rozrzutu reszt Interpretacja. Jeżeli założenie jest spełnione, to reszty układają się w postaci równomiernej chmury Jeżeli zaś założenie nie jest spełnione, to na wykresie mogą się pojawić charakterystyczne układy punktów.

65 Okno - Analiza reszt - Wykr. Rozrzutu.

66 Wykres rozrzutu reszt dla zmiennej Y 1.2 Przewidywane względem wartości resztowych Zmienna zależna: Y Reszty Wart. przewidyw Prz.Ufn.

67 Wartości przewidywane względem obserwowanych 5.8 Wartości przewidywane względem obserwowanych Zmienna zależna: Y Wart. obserw Wart. przewidyw Prz.Ufn.

68 Jeśli nieliniowość jest oczywista, możemy dokonać przekształcenia zmiennych (sprowadzając do liniowości) albo zastosować techniki nieliniowe.

69 Założenie 2. Liczba obserwacji n musi być większa od liczby oszacowanych parametrów, tj. n > k + 1. n = 16, k = 4

70 Założenie 3. Żadna ze zmiennych niezależnych nie jest kombinacją liniową innych zmiennych niezależnych czyli brak jest współliniowości.

71 Statistica Wskaźniki statystyczne do wykrycia współliniowości (nadmiarowości) otrzymujemy po kliknięciu zakładki "Więcej", przycisk Nadmiarowość w oknie "Wyniki regresji"

72 Nadmiarowość

73 Tolerancja dla danej zmiennej Tolerancja równa się 1 - R 2 Im mniejsza jest tolerancja zmiennej tym bardziej nadmiarowy jest jej wkład w równanie regresji. Jeśli tolerancja = 0 - nie można obliczyć współczynników równania regresji. Jeśli tolerancja dla zmiennej spada poniżej 0,1 to wówczas taki model regresji staje się mało przydatny.

74 Wartość R 2 wartość R 2 między daną zmienną a wszystkimi pozostałymi zmiennymi niezależnymi Wskaźnik ten informuje nas, ile zmienności danej zmiennej jest wyjaśnione przez pozostałe zmienne. Im bliżej jedności, tym bardziej nadmiarowa jest zmienna.

75 Czynnik inflacji wariancji (CIW). CIW = 1/(1 - R 2 ). Jeżeli nie ma współliniowości, to CIW jest równe jedności. Jeśli współliniowość występuje, to CIW pokazuje stopień inflacji, czyli - ile razy obliczona wariancja estymatora jest większa od wartości prawdziwej (niezakłóconej współliniowością). Uważa się, że wartość CIW >10 jest świadectwem zakłócającej współliniowości.

76 Korelacja cząstkowa Korelacja cząstkowa jest korelacją pomiędzy daną zmienną a zmienną zależną z uwzględnieniem jej skorelowania ze wszystkimi pozostałymi zmiennymi.

77 Korelacja semicząsteczkowa Jest to korelacja danej zmiennej niezależnej z uwzględnieniem powiązań ze wszystkimi pozostałymi zmiennymi i oryginalną (bez uwzględnienia jej korelacji z innymi zmiennymi) zmienną zależną.

78 Analiza Korelacje wskazują, że zmienna Y nie jest skorelowana ze zmienną 1990.

79 Założenie 4. Składnik losowy e i ma wartość oczekiwaną równą zeru - można utworzyć wykres normalności reszt średnia wartość oraz mediana powinny być równe lub bliskie 0.

80 Wykres normalności reszt 2.0 Wykres normalności reszt Wartość normalna Reszty

81 Założenie 5. Wariancja składnika losowego (reszt e i ) jest taka sama dla wszystkich obserwacji - wykres rozrzutu reszt

82 Sprawdzenie, czy istnieje heteroscedastyczność Heteroscedastyczność (naruszenie założenia) Utworzenie odpowiednich wykresów rozrzutu. wykres rozrzutu reszt względem wartości przewidywanych lub rozrzutu wartości przewidywanych względem kwadratów reszt.

83 Interpretacja Założenie homoscedastyczności jest naruszone jeśli wartości reszt są bardziej zróżnicowane (rozrzucone) dla pewnych wartości przewidywanych niż dla innych lub kiedy wartości wariancji zdają się rosnąć wraz ze wzrostem wartości przewidywanej.

84 1.2 Przewidywane względem wartości resztowych Zmienna zależna: Y Reszty Wart. przewidyw Prz.Ufn.

85 Założenie 6. Badanie autokorelacji reszt. W pakiecie STATISTICA do wykrywania autokorelacji służy test Durbina i Watsona dostępny po kliknięciu przycisku

86 Założenie 7. Każdy ze składników losowych (reszty) ma rozkład normalny.

87 2.0 Wykres normalności reszt Wartość normalna Reszty

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Analiza współzależności zjawisk

Analiza współzależności zjawisk Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

ANALIZA REGRESJI SPSS

ANALIZA REGRESJI SPSS NLIZ REGRESJI SPSS Metody badań geografii społeczno-ekonomicznej KORELCJ REGRESJ O ile celem korelacji jest zmierzenie siły związku liniowego między (najczęściej dwoma) zmiennymi, o tyle w regresji związek

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje

Bardziej szczegółowo

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Bardziej szczegółowo

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +

Bardziej szczegółowo

Analiza regresji część II. Agnieszka Nowak - Brzezińska

Analiza regresji część II. Agnieszka Nowak - Brzezińska Analiza regresji część II Agnieszka Nowak - Brzezińska Niebezpieczeństwo ekstrapolacji Analitycy powinni ograniczyć predykcję i estymację, które są wykonywane za pomocą równania regresji dla wartości objaśniającej

Bardziej szczegółowo

POLITECHNIKA OPOLSKA

POLITECHNIKA OPOLSKA POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych 3.1. Estymacja parametrów i ocena dopasowania modeli z jedną zmienną 23. Właściciel komisu w celu zbadania

Bardziej szczegółowo

Ekonometria Ćwiczenia 19/01/05

Ekonometria Ćwiczenia 19/01/05 Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna 1 Laboratorium VIII: Analiza kanoniczna Spis treści Laboratorium VIII: Analiza kanoniczna... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 Przykład... 2 Podstawowe pojęcia... 2 Założenia analizy

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Regresja i Korelacja

Regresja i Korelacja Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8 ANALIZA REGRESJI WIELOKROTNEJ Zastosowanie statystyki w bioinżynierii Ćwiczenia 8 ZADANIE 1A 1. Irysy: Sprawdź zależność długości płatków korony od ich szerokości Utwórz wykres punktowy Wyznacz współczynnik

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 1 9 8 7 procent uczniów 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 liczba punktów - wyniki niskie - wyniki średnie - wyniki wysokie Parametry

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34 Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 15 13.5 12 1.5 procent uczniów 9 7.5 6 4.5 3 1.5 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 - wyniki niskie - wyniki średnie - wyniki wysokie liczba punktów Parametry

Bardziej szczegółowo

Ekonometria egzamin 07/03/2018

Ekonometria egzamin 07/03/2018 imię, nazwisko, nr indeksu: Ekonometria egzamin 07/03/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Korelacja krzywoliniowa i współzależność cech niemierzalnych Korelacja krzywoliniowa i współzależność cech niemierzalnych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY Będziemy zapisywać wektory w postaci (,, ) albo traktując go jak macierz jednokolumnową (dzięki temu nie będzie kontrowersji przy transponowaniu wektora ) Model

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 1 9 8 7 procent uczniów 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 25 26 27 28 29 3 31 32 33 34 35 36 37 38 39 4 41 42 43 44 45 46 47 48 49

Bardziej szczegółowo

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY WYKORZYSTANIU METOD STATYSTYCZNYCH mgr Małgorzata Pelczar 6 Wprowadzenie Reforma służby zdrowia uwypukliła problem optymalnego ustalania kosztów usług zdrowotnych.

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem. Teoria błędów Wskutek niedoskonałości przyrządów, jak również niedoskonałości organów zmysłów wszystkie pomiary są dokonywane z określonym stopniem dokładności. Nie otrzymujemy prawidłowych wartości mierzonej

Bardziej szczegółowo

Analiza współzależności dwóch cech I

Analiza współzależności dwóch cech I Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0 Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8 Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 5 4.5 4 3.5 procent uczniów 3 2.5 2 1.5 1.5 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 25 26 27 28 29 3 31 32 liczba punktów - wyniki niskie - wyniki średnie

Bardziej szczegółowo

Metody Ilościowe w Socjologii

Metody Ilościowe w Socjologii Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu

Bardziej szczegółowo

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Stanisław Cichocki Natalia Nehrebecka 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 1 9 8 7 procent uczniów 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 25 26 - wyniki niskie - wyniki średnie - wyniki wysokie liczba punktów Parametry

Bardziej szczegółowo

Analiza Współzależności

Analiza Współzależności Statystyka Opisowa z Demografią oraz Biostatystyka Analiza Współzależności Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka

Bardziej szczegółowo

Analiza składowych głównych

Analiza składowych głównych Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze

Bardziej szczegółowo

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący

Bardziej szczegółowo

Klasówka po szkole podstawowej Historia. Edycja 2006/2007. Raport zbiorczy

Klasówka po szkole podstawowej Historia. Edycja 2006/2007. Raport zbiorczy Klasówka po szkole podstawowej Historia Edycja 2006/2007 Raport zbiorczy Opracowano w: Gdańskiej Fundacji Rozwoju im. Adama Mysiora Informacje ogólne... 3 Raport szczegółowy... 3 Tabela 1. Podział liczby

Bardziej szczegółowo

Ćwiczenia IV

Ćwiczenia IV Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 5 4.5 4 3.5 procent uczniów 3 2.5 2 1.5 1.5 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 25 26 27 28 29 3 liczba punktów - wyniki niskie - wyniki średnie

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Średnia wielkość powierzchni gruntów rolnych w gospodarstwie za rok 2006 (w hektarach) Jednostka podziału administracyjnego kraju

Średnia wielkość powierzchni gruntów rolnych w gospodarstwie za rok 2006 (w hektarach) Jednostka podziału administracyjnego kraju ROLNYCH W GOSPODARSTWIE W KRAJU ZA 2006 ROK w gospodarstwie za rok 2006 (w hektarach) Województwo dolnośląskie 14,63 Województwo kujawsko-pomorskie 14,47 Województwo lubelskie 7,15 Województwo lubuskie

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9 Zadanie W celu sprawdzenia, czy pipeta jest obarczona błędem systematycznym stałym lub zmiennym wykonano szereg pomiarów przy różnych ustawieniach pipety. Wyznacz równanie regresji liniowej, które pozwoli

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12 Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Szymon Bargłowski, sb39345 MODEL. 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1

Szymon Bargłowski, sb39345 MODEL. 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1 Szymon Bargłowski, sb39345 MODEL 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1 2 C t = b 1 b 2 PKB t b 3 Invest t 1 b 4 G t 2 3 Invest t = d 1 d 2 C t d 3 R t 3 gdzie: G - wydatki

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

4. Średnia i autoregresja zmiennej prognozowanej

4. Średnia i autoregresja zmiennej prognozowanej 4. Średnia i autoregresja zmiennej prognozowanej 1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.)

Bardziej szczegółowo

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. imię, nazwisko, nr indeksu: Ekonometria egzamin 06/03/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 2 18 16 14 procent uczniów 12 1 8 6 4 2 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 25 26 27 liczba punktów - wyniki niskie - wyniki średnie - wyniki wysokie

Bardziej szczegółowo

Proces modelowania zjawiska handlu zagranicznego towarami

Proces modelowania zjawiska handlu zagranicznego towarami Załącznik nr 1 do raportu końcowego z wykonania pracy badawczej pt. Handel zagraniczny w województwach (NTS2) realizowanej przez Centrum Badań i Edukacji Statystycznej z siedzibą w Jachrance na podstawie

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007 , transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 1 9 8 7 procent uczniów 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 25 26 - wyniki niskie - wyniki średnie - wyniki wysokie liczba punktów Parametry

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

Przykład 2. Stopa bezrobocia

Przykład 2. Stopa bezrobocia Przykład 2 Stopa bezrobocia Stopa bezrobocia. Komentarz: model ekonometryczny stopy bezrobocia w Polsce jest modelem nieliniowym autoregresyjnym. Podobnie jak model podaŝy pieniądza zbudowany został w

Bardziej szczegółowo

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo