Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Wielkość: px
Rozpocząć pokaz od strony:

Download "Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna"

Transkrypt

1 Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

2 Badanie współzależności zmiennych Uwzględniając ilość zmiennych otrzymamy 4 odmiany zależności: Zmienna zależna jednowymiarowa oraz jedna zmienna niezależna Zmienna zależna jednowymiarowa oraz wiele zmiennych niezależnych Zmienna zależna wielowymiarowa oraz jedna zmienna niezależna Zmienna zależna wielowymiarowa oraz wiele zmiennych niezależnych. Postać (kształt) zależności może być : liniowy lub nieliniowy.

3 Regresja wieloraka - wielokrotna Celem regresji wielorakiej jest ilościowe ujęcie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (kryterialną, objaśnianą).

4 Przykłady. 1. Wytrzymałość betonu zależy od proporcji w jakiej zastosowano trzy podstawowe składniki. Pytanie: W jakiej proporcji stosować te składniki, by wytrzymałość była największa?

5 Wycena mieszkań powierzchnia, garaż, wiek, ogrzewanie, położenie, piętro,... Cena rynkowa

6 Udzielanie kredytu dochody, zabezpieczenie, wiek, stan cywilny, oszczędności, zatrudnienie... przyznać czy nie przyznać?

7 Porównanie długości życia mieszkańców kilku miast Dochody, Zanieczyszczenia powietrza, Zanieczyszczenia gleby, Nakłady inwestycyjne na ochronę środowiska Powierzchnia lasów Liczba szpitali Długość życia...

8 Liniowy model regresji wielokrotnej Załóżmy, że rozważamy wpływ zbioru k zmiennych X 1, X 2,..., X k, na zmienną Y. Liniowy model regresji jest określony równaniem: Y = b 0 + b 1 X 1 + b 2 X b k X k + e gdzie: b i - parametry modelu (współczynniki regresji) opisujące wpływ i-tej zmiennej e - składnik losowy

9 Modele regresji wielokrotnej Aby model był jak najbardziej wiarygodny należy wprowadzić do modelu jak największą liczbę zmiennych niezależnych. W modelu powinny się znaleźć zmienne silnie skorelowane ze zmienną zależną i jednocześnie jak najsłabiej skorelowane między sobą.

10 Oznaczenia Niech X oznacza (n * (k+1)) wymiarową macierz obserwacji dokonanych w n-elementowej próbie na k+1 zmiennych niezależnych (tzw. objaśniających ) X 1, X 2,... X k, X k+1,, przy czym X k+1 1 (jest to zmienna występująca przy wyrazie wolnym), X x x... x n x x x 1k 2k... nk x x 1k1 2k1... x n

11 y oznacza n-wymiarowy wektor kolumnowy obserwacji dokonanych w n-elementowej próbie na zmiennej zależnej (objaśnianej) Y: y y y y n

12 b oznacza (k+1) wymiarowy wektor kolumnowy parametrów zwanych współczynnikami regresji wielorakiej: b b b b k b k

13 e oznacza n-wymiarowy wektor kolumnowy losowy, którego składowymi są tzw. składniki losowe zwane też zakłóceniami losowymi: e e e e n

14 n nk n1 1 2k 2k k 1k 11 x x... x x x... x x x... x n 2 1 y... y y k1 k b b b b n e e e y = X b + e Założenie liniowości: y=xb+e

15 Zadanie regresji wielokrotnej: Na podstawie wyników próby, tj. macierzy X oraz wektora y należy oszacować wektor b parametrów tego modelu (współczynników regresji) i wariancję składnika losowego 2.

16 Regresja wieloraka Oszacowanie równania regresji na podstawie n- elementowej próby ma postać Y = b 0 + b 1 *X 1 + b 2 *X b p *X p +e czyli dla każdego t (t = 1,..., n) zachodzi równość y t b 1 xt1 b2xt2... b k x tk b x k 1 t( k1) e t

17 Parametry powyższego modelu szacuje się metodą najmniejszych kwadratów tj. tak, aby suma kwadratów zaobserwowanych odchyleń (reszt) od hiperpłaszczyzny regresji była najmniejsza. 2 j j j k kj j j 2 s e y b b x b x min

18 Korelacja cząstkowa. Współczynniki modelu b 1,..., b k nazywane są cząstkowymi współczynnikami regresji. y b b x b x e j j k kj j

19 Korelacja cząstkowa. W równaniu regresji współczynniki regresji (współczynniki b) reprezentują niezależne wkłady każdej ze zmiennych niezależnych do prognozowania zmiennej zależnej.

20 Współczynnik korelacji cząstkowej Korelacja cząstkowa jest korelacją pomiędzy daną zmienną a zmienną zależną z uwzględnieniem jej skorelowania ze wszystkimi pozostałymi zmiennymi..

21 Ujemne wartości współczynników regresji świadczą o ujemnym, a dodatnie o dodatnim, oddziaływaniu poziomu zmiennej niezależnej na zmienną zależną.

22 Interpretacja i-ty, cząstkowy współczynnik regresji opisuje o ile średnio zmieni się wartość zmiennej Y przy wzroście i-tej wartości zmiennej X o jednostkę przy ustalonych wartościach pozostałych zmiennych niezależnych.

23 Korelacja semicząsteczkowa Jest to korelacja danej zmiennej niezależnej z uwzględnieniem powiązań ze wszystkimi pozostałymi zmiennymi i oryginalną (bez uwzględnienia jej korelacji z innymi zmiennymi) zmienną zależną.

24 Współczynnik korelacji wielorakiej Współczynnik korelacji wielorakiej jest miarą współzależności między jedną ze zmiennych a pozostałymi zmiennymi traktowanymi łącznie.

25 Badanie istotności regresji wielokrotnej Hipotezę odrzucamy gdy p< alfa H 0 : b 1 b 2 b k 0 Odrzucenie hipotezy H 0 jest równoznaczne z tym, że co najmniej jeden współczynnik regresji jest różny od zera tzn. istnieje związek funkcyjny liniowy między zmienną zależną a zmiennymi niezależnymi.

26 Weryfikacja hipotez o istotności cząstkowych współczynników regresji Problem sprowadza się do zweryfikowania serii k hipotez zerowych mówiących o tym, że i-ty cząstkowy współczynnik regresji jest równy zero. Hipotezy te mogą być weryfikowane testem t-studenta

27 Istotność zmiennych W przypadku istnienia silnych współzależności między zmiennymi niezależnymi, funkcja regresji wielokrotnej jest istotna statystycznie (test F). Otrzymujemy istotną funkcję regresji ale wszystkie zmienne (analizowane oddzielnie) mogą okazać się nieistotne. W takim przypadku powinny być usunięte z modelu.

28 Predykcja na podstawie modelu regresji. Prognozowanie predykcja dla nowych wartości.

29 Weryfikacja modelu Weryfikacja modelu matematycznego polega na sprawdzeniu, czy spełnione są następujące założenia:

30 1. Założenie liniowości: y=xb+e Założenie to mówi o liniowości związku między obserwacjami w próbie na zmiennych objaśniających i na zmiennej zależnej z dokładnością do składnika losowego czyli dla każdego t (t = 1,..., n) zachodzi równość y t b 1 xt1 b2xt2... b k x tk b x k 1 t( k1) e t

31 Założenie 2. Liczba obserwacji n musi być większa od liczby oszacowanych parametrów, tj. n > k + 1. (liczba n powinna być wielokrotnie większa od liczby oszacowanych parametrów).

32 Założenie 3. Żadna ze zmiennych niezależnych nie jest kombinacją liniową innych zmiennych niezależnych czyli brak jest współliniowości (nadmiarowości).

33 Nadmiarowość

34 Tolerancja dla danej zmiennej Tolerancja równa się 1 - R 2 Im mniejsza jest tolerancja zmiennej tym bardziej nadmiarowy jest jej wkład w równanie regresji. Jeśli tolerancja = 0 - nie można obliczyć współczynników równania regresji. Jeśli tolerancja dla zmiennej spada poniżej 0,1 to wówczas taki model regresji staje się mało przydatny.

35 Wartość R 2 wartość R 2 między daną zmienną a wszystkimi pozostałymi zmiennymi niezależnymi Wskaźnik ten informuje nas, ile zmienności danej zmiennej jest wyjaśnione przez pozostałe zmienne. Im bliżej jedności, tym bardziej nadmiarowa jest zmienna.

36 Czynnik inflacji wariancji (CIW). CIW = 1/(1 - R 2 ). Jeżeli nie ma współliniowości, to CIW jest równe jedności. Jeśli współliniowość występuje, to CIW pokazuje stopień inflacji, czyli - ile razy obliczona wariancja estymatora jest większa od wartości prawdziwej (niezakłóconej współliniowością). Uważa się, że wartość CIW >10 jest świadectwem zakłócającej współliniowości.

37 Założenie 4. Składnik losowy e i ma wartość oczekiwaną równą zeru (E(e i ) = 0 dla wszystkich i = 1, 2,..., n)

38 Założenie 5. Wariancja składnika losowego (reszt e i ) jest taka sama dla wszystkich obserwacji (War(e i ) = s 2 dla wszystkich i = 1, 2,..., n) Takie założenie nosi nazwę homoscedastyczności i mówi, że czynniki ujęte w modelu mają taką samą zmienność (rozrzut) niezależnie od numeru obserwacji. W przeciwnym wypadku mówimy o heteroscedastyczności.

39 Interpretacja Założenie homoscedastyczności jest naruszone jeśli wartości reszt są bardziej zróżnicowane (rozrzucone) dla pewnych wartości przewidywanych niż dla innych lub kiedy wartości wariancji zdają się rosnąć wraz ze wzrostem wartości przewidywanej.

40 Założenie 6. Składniki losowe (reszty) są nieskorelowane czyli e i oraz e j są od siebie niezależne dla wszystkich par i oraz j, gdzie i, j = 1, 2,..., n oraz i różne od j (brak autokorelacji reszt).

41 Założenie 7. Każdy ze składników losowych (reszty) ma rozkład normalny N(0, ) tj. średniej 0 i wariancji 2.

42 Przykład W badaniach lekarskich dotyczących pewnej choroby analizowano czas pobytu w szpitalu w zależności od stężenia we krwi cholesterolu, glukozy i fibrynogenu. Wyniki pomiarów dla 20 losowo wybranych pacjentów podane są w tabeli

43 Przykład Stwierdzono, że długość życia mieszkańców dla poszczególnych województw znacznie się różni. Aby zbadać przyczyny, przeprowadzono analizę statystyczną wg danych GUS.

44 Do analizy wybrano następujące dane: Średni przyrost przeciętnego trwania życia od roku - zmienna zależna Y Przeciętny czas trwania życia w roku bazowym 1990 Średnie nakłady na środki trwałe służące ochronie środowiska + nakłady na gospodarkę wodną w przeliczeniu na 1 mieszkańca Średnie nakłady na środki trwałe służące ochronie środowiska + nakłady na gospodarkę wodną w przeliczeniu na na 1 km 2 powierzchni

45 Przyrost przeciętn ego trwania życia 1990 Nakłady w przeliczeniu na 1 mieszkańca Nakłady /1 km 2 Dolnośląskie Kujawsko-pomorskie Lubelskie Lubuskie Łódzkie Małopolskie Mazowieckie Opolskie Podkarpackie Podlaskie Pomorskie Śląskie Świętokrzyskie Warmińsko-Mazurskie Wielkopolskie Zachodniopomorskie

46 Interesuje nas równanie regresji opisujące zależność przyrostu długości życia (zmienna Y) od roku bazowego oraz wskaźnika 1 i wskaźnika 2 i oceny istotności ich oddziaływania.

47 Najniższy nakład na głowę mieszkańca ma woj.lubelskie (0,137 - przyrost życia 3.4 )i świętokrzyskie (0,137, przyrost życia 4,31) Najniższy przyrost długości życia jest w województwie łódzkim (3,35) przy nakładach Najwyższy przyrost długości życia jest w województwie opolskim (5,63) przy najwyższych nakładach Najwyższe nakłady na 1 km 2 ma woj. Śląskie - przyrost wyniósł 4.89.

48 Regresja wielokrotna Y = X* b + e Y = b 0 + b 1 *Rok b 2 * Wskaźnik 1+ b 3 * Wskaźnik 2 +e

49 8 Wykres rozrzutu Y względem 1990 długość życia wg województw.sta 4v*16c Y = *x Y :Y: r = ; p = ; r 2 =

50 8 Wykres rozrzutu Y względem Wskaźnik 1 długość życia wg województw.sta 4v*16c Y = *x Y Wskaźnik 1:Y: r = ; p = ; r 2 = Wskaźnik 1

51 8 Wykres rozrzutu Y względem Wskaźnik 2 długość życia wg województw.sta 4v*16c Y = *x Y Wskaźnik 2:Y: r = ; p = ; r 2 = Wskaźnik 2

52 Wykres rozrzutu - powierzchniowy Wykres powierzchniowy 3W Y względem Wskaźnik 1 i Wskaźnik 2 Arkusz1 4v*16c Y = Wygładzanie najmniejszych kwadratów ważone odległościami > 6 < 5.5 < 4.5 < 3.5 < 2.5 < 1.5 < 0.5

53 Wykres z punktami danych Wykres powierzchniowy 3W Y względem 1990 i Wskaźnik 1 Arkusz1 4v*16c Y = Sklejana > 6.5 < 6.1 < 5.6 < 5.1 < 4.6 < 4.1 < 3.6

54 Wykres powierzchniowy 3W Y względem 1990 i Wskaźnik 1 Arkusz1 4v*16c Y = *x *y > 5.8 < 5.6 < 5.2 < 4.8 < 4.4 < 4

55

56

57

58 Y= Rok wskaźnik wskaźnik /0.62

59 Dla Roku bazowego 1990 i wskaźnika 2 p > alfa zatem brak jest istotności parametrów dla tych zmiennych. Błąd standardowy oceny wyrazu wolnego w stosunku do jego wartości jest relatywnie duży.

60 Ujemne wartości współczynników regresji świadczą o ujemnym (rok bazowy, wskaźnik 2), a dodatnie o dodatnim, oddziaływaniu poziomu zmiennej niezależnej na zmienną zależną.

61 Współczynnik korelacji wielorakiej informuje, że zmienna zależna skorygowana jest ze wszystkimi zmiennymi niezależnymi. Współczynnik determinacji oznacza, że 35% zmienności zmiennej Y jest wyjaśnione przez model. Skorygowane R 2 stosujemy, jeśli liczba pomiarów jest niewiele większa od liczby wyznaczanych parametrów.

62 Przycisk Wykonaj analizę reszt

63 Założenie 1. Model jest liniowy względem parametrów, tzn. = b 0 + b 1 x 1i + b 2 x 2i b k x ki dla i = 1, 2,..., n. Liniowość sprawdzamy testem F, którego wyniki możemy znaleźć w oknie Regresja wieloraka

64 Weryfikacja liniowości - wykresy rozrzutu reszt Interpretacja. Jeżeli założenie jest spełnione, to reszty układają się w postaci równomiernej chmury Jeżeli zaś założenie nie jest spełnione, to na wykresie mogą się pojawić charakterystyczne układy punktów.

65 Okno - Analiza reszt - Wykr. Rozrzutu.

66 Wykres rozrzutu reszt dla zmiennej Y 1.2 Przewidywane względem wartości resztowych Zmienna zależna: Y Reszty Wart. przewidyw Prz.Ufn.

67 Wartości przewidywane względem obserwowanych 5.8 Wartości przewidywane względem obserwowanych Zmienna zależna: Y Wart. obserw Wart. przewidyw Prz.Ufn.

68 Jeśli nieliniowość jest oczywista, możemy dokonać przekształcenia zmiennych (sprowadzając do liniowości) albo zastosować techniki nieliniowe.

69 Założenie 2. Liczba obserwacji n musi być większa od liczby oszacowanych parametrów, tj. n > k + 1. n = 16, k = 4

70 Założenie 3. Żadna ze zmiennych niezależnych nie jest kombinacją liniową innych zmiennych niezależnych czyli brak jest współliniowości.

71 Statistica Wskaźniki statystyczne do wykrycia współliniowości (nadmiarowości) otrzymujemy po kliknięciu zakładki "Więcej", przycisk Nadmiarowość w oknie "Wyniki regresji"

72 Nadmiarowość

73 Tolerancja dla danej zmiennej Tolerancja równa się 1 - R 2 Im mniejsza jest tolerancja zmiennej tym bardziej nadmiarowy jest jej wkład w równanie regresji. Jeśli tolerancja = 0 - nie można obliczyć współczynników równania regresji. Jeśli tolerancja dla zmiennej spada poniżej 0,1 to wówczas taki model regresji staje się mało przydatny.

74 Wartość R 2 wartość R 2 między daną zmienną a wszystkimi pozostałymi zmiennymi niezależnymi Wskaźnik ten informuje nas, ile zmienności danej zmiennej jest wyjaśnione przez pozostałe zmienne. Im bliżej jedności, tym bardziej nadmiarowa jest zmienna.

75 Czynnik inflacji wariancji (CIW). CIW = 1/(1 - R 2 ). Jeżeli nie ma współliniowości, to CIW jest równe jedności. Jeśli współliniowość występuje, to CIW pokazuje stopień inflacji, czyli - ile razy obliczona wariancja estymatora jest większa od wartości prawdziwej (niezakłóconej współliniowością). Uważa się, że wartość CIW >10 jest świadectwem zakłócającej współliniowości.

76 Korelacja cząstkowa Korelacja cząstkowa jest korelacją pomiędzy daną zmienną a zmienną zależną z uwzględnieniem jej skorelowania ze wszystkimi pozostałymi zmiennymi.

77 Korelacja semicząsteczkowa Jest to korelacja danej zmiennej niezależnej z uwzględnieniem powiązań ze wszystkimi pozostałymi zmiennymi i oryginalną (bez uwzględnienia jej korelacji z innymi zmiennymi) zmienną zależną.

78 Analiza Korelacje wskazują, że zmienna Y nie jest skorelowana ze zmienną 1990.

79 Założenie 4. Składnik losowy e i ma wartość oczekiwaną równą zeru - można utworzyć wykres normalności reszt średnia wartość oraz mediana powinny być równe lub bliskie 0.

80 Wykres normalności reszt 2.0 Wykres normalności reszt Wartość normalna Reszty

81 Założenie 5. Wariancja składnika losowego (reszt e i ) jest taka sama dla wszystkich obserwacji - wykres rozrzutu reszt

82 Sprawdzenie, czy istnieje heteroscedastyczność Heteroscedastyczność (naruszenie założenia) Utworzenie odpowiednich wykresów rozrzutu. wykres rozrzutu reszt względem wartości przewidywanych lub rozrzutu wartości przewidywanych względem kwadratów reszt.

83 Interpretacja Założenie homoscedastyczności jest naruszone jeśli wartości reszt są bardziej zróżnicowane (rozrzucone) dla pewnych wartości przewidywanych niż dla innych lub kiedy wartości wariancji zdają się rosnąć wraz ze wzrostem wartości przewidywanej.

84 1.2 Przewidywane względem wartości resztowych Zmienna zależna: Y Reszty Wart. przewidyw Prz.Ufn.

85 Założenie 6. Badanie autokorelacji reszt. W pakiecie STATISTICA do wykrywania autokorelacji służy test Durbina i Watsona dostępny po kliknięciu przycisku

86 Założenie 7. Każdy ze składników losowych (reszty) ma rozkład normalny.

87 2.0 Wykres normalności reszt Wartość normalna Reszty

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Analiza regresji część II. Agnieszka Nowak - Brzezińska

Analiza regresji część II. Agnieszka Nowak - Brzezińska Analiza regresji część II Agnieszka Nowak - Brzezińska Niebezpieczeństwo ekstrapolacji Analitycy powinni ograniczyć predykcję i estymację, które są wykonywane za pomocą równania regresji dla wartości objaśniającej

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 Zadanie 1 a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1 b) W naszym przypadku populacja są inżynierowie w Tajlandii. Czy można jednak przypuszczać, że na zarobki kobiet-inżynierów

Bardziej szczegółowo

Proces modelowania zjawiska handlu zagranicznego towarami

Proces modelowania zjawiska handlu zagranicznego towarami Załącznik nr 1 do raportu końcowego z wykonania pracy badawczej pt. Handel zagraniczny w województwach (NTS2) realizowanej przez Centrum Badań i Edukacji Statystycznej z siedzibą w Jachrance na podstawie

Bardziej szczegółowo

Klasówka po szkole podstawowej Historia. Edycja 2006/2007. Raport zbiorczy

Klasówka po szkole podstawowej Historia. Edycja 2006/2007. Raport zbiorczy Klasówka po szkole podstawowej Historia Edycja 2006/2007 Raport zbiorczy Opracowano w: Gdańskiej Fundacji Rozwoju im. Adama Mysiora Informacje ogólne... 3 Raport szczegółowy... 3 Tabela 1. Podział liczby

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Analiza Współzależności

Analiza Współzależności Statystyka Opisowa z Demografią oraz Biostatystyka Analiza Współzależności Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka

Bardziej szczegółowo

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze

Bardziej szczegółowo

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007 Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

1. Analiza wskaźnikowa... 3 1.1. Wskaźniki szczegółowe... 3 1.2. Wskaźniki syntetyczne... 53 1.2.1.

1. Analiza wskaźnikowa... 3 1.1. Wskaźniki szczegółowe... 3 1.2. Wskaźniki syntetyczne... 53 1.2.1. Spis treści 1. Analiza wskaźnikowa... 3 1.1. Wskaźniki szczegółowe... 3 1.2. Wskaźniki syntetyczne... 53 1.2.1. Zastosowana metodologia rangowania obiektów wielocechowych... 53 1.2.2. Potencjał innowacyjny

Bardziej szczegółowo

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 1 LaboratoriumV: Podstawy korelacji i regresji Spis treści Laboratorium V: Podstawy korelacji i regresji...1 Wiadomości ogólne...2 1. Wstęp teoretyczny....2 1.1 Korelacja....2 1.2 Funkcja regresji....5

Bardziej szczegółowo

Wyniki analizy statystycznej opartej na metodzie modelowania miękkiego

Wyniki analizy statystycznej opartej na metodzie modelowania miękkiego Wyniki analizy statystycznej opartej na metodzie modelowania miękkiego Dorota Perło Uniwersytet w Białymstoku Wydział Ekonomii i Zarządzania Plan prezentacji. Założenia metodologiczne 2. Specyfikacja modelu

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 5 4.5 4 3.5 procent uczniów 3 2.5 2 1.5 1.5 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 25 26 27 28 29 3 31 32 33 liczba punktów - wyniki niskie - wyniki

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota Ekonometria ćwiczenia 3 Prowadzący: Sebastian Czarnota Strona - niezbędnik http://sebastianczarnota.com/sgh/ Normalność rozkładu składnika losowego Brak normalności rozkładu nie odbija się na jakości otrzymywanych

Bardziej szczegółowo

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6 Zad. 1. Zbadano wydajność odmiany pomidorów na 100 poletkach doświadczalnych. W wyniku przeliczeń otrzymano przeciętną wydajność na w tonach na hektar x=30 i s 2 x =7. Przyjmując, że rozkład plonów pomidora

Bardziej szczegółowo

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi. ANALIZA KORELACJI Większość zjawisk w otaczającym nas świecie występuje nie samotnie a w różnorodnych związkach. Odnosi się to również do zjawisk biologiczno-medycznych. O powiązaniach między nimi mówią

Bardziej szczegółowo

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA Na poprzednich zajęciach omawialiśmy testy dla weryfikacji hipotez, że dwie populacje o rozkładach normalnych mają jednakowe wartości średnie. Co jednak

Bardziej szczegółowo

Analiza zdarzeń Event studies

Analiza zdarzeń Event studies Analiza zdarzeń Event studies Dobromił Serwa akson.sgh.waw.pl/~dserwa/ef.htm Leratura Campbell J., Lo A., MacKinlay A.C.(997) he Econometrics of Financial Markets. Princeton Universy Press, Rozdział 4.

Bardziej szczegółowo

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Jednym z elementów walidacji metod pomiarowych jest sprawdzenie liniowości

Bardziej szczegółowo

Sytuacja młodych na rynku pracy

Sytuacja młodych na rynku pracy Sytuacja młodych na rynku pracy Plan prezentacji Zamiany w modelu: w obrębie każdego z obszarów oraz zastosowanych wskaźników cząstkowych w metodologii obliczeń wskaźników syntetycznych w obrębie syntetycznego

Bardziej szczegółowo

Analiza statystyczna trudności tekstu

Analiza statystyczna trudności tekstu Analiza statystyczna trudności tekstu Łukasz Dębowski ldebowsk@ipipan.waw.pl Problem badawczy Chcielibyśmy mieć wzór matematyczny,...... który dla dowolnego tekstu...... na podstawie pewnych statystyk......

Bardziej szczegółowo

Przykład 1 ceny mieszkań

Przykład 1 ceny mieszkań Przykład ceny mieszkań Przykład ceny mieszkań Model ekonometryczny zaleŝności ceny mieszkań od metraŝu - naleŝy do klasy modeli nieliniowych. - weryfikację empiryczną modelu przeprowadzono na przykładzie

Bardziej szczegółowo

zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE

zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka Przebieg regresji liniowej: 1. Znaleźć funkcję y=f(x) (dopasowanie modelu) 2. Sprawdzić: a) Wsp. determinacji R 2 b) Test istotności

Bardziej szczegółowo

Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu:

Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu: Zadanie 1. Oszacowano model ekonometryczny liczby narodzin dzieci (w tys.) w Polsce w latach 2000 2010 w zależnosci od średniego rocznego wynagrodzenia (w ujęciu realnym, PLN), stopy bezrobocia (w punktach

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

Rozkład wyników ogólnopolskich

Rozkład wyników ogólnopolskich Rozkład wyników ogólnopolskich 1 9 8 7 procent uczniów 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 17 18 19 2 21 22 23 24 25 26 27 liczba punktów - wyniki niskie - wyniki średnie - wyniki wysokie

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

EKONOMETRIA PRZESTRZENNA

EKONOMETRIA PRZESTRZENNA EKONOMETRIA PRZESTRZENNA Wstęp podstawy ekonometrii Uniwersytet Ekonomiczny w Krakowie, 2012 1 EKONOMETRIA wybrane definicje (Osińska) Ekonometria dziedzina ekonomii wykorzystująca modele i sposoby wnioskowania

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way

Bardziej szczegółowo

Co to jest analiza regresji?

Co to jest analiza regresji? Co to jest analiza regresji? Celem analizy regresji jest badanie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą), która musi mieć charakter liczbowy. W

Bardziej szczegółowo

Klasyfikacja województw według ich konkurencyjności przy pomocy metod taksonomicznych oraz sieci neuronowych.

Klasyfikacja województw według ich konkurencyjności przy pomocy metod taksonomicznych oraz sieci neuronowych. Klasyfikacja województw według ich konkurencyjności przy pomocy metod taksonomicznych oraz sieci neuronowych. Krzysztof Karpio, Piotr Łukasiewicz, rkadiusz Orłowski, rkadiusz Gralak Katedra Ekonometrii

Bardziej szczegółowo

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA

WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA Janusz Wątroba i Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Zakres zastosowań analizy danych w różnych dziedzinach działalności biznesowej i

Bardziej szczegółowo

Metoda Johansena objaśnienia i przykłady

Metoda Johansena objaśnienia i przykłady Metoda Johansena objaśnienia i przykłady Model wektorowej autoregresji rzędu p, VAR(p), ma postad gdzie oznacza wektor zmiennych endogenicznych modelu. Model VAR jest stabilny, jeżeli dla, tzn. wielomian

Bardziej szczegółowo

DZIAŁALNOŚĆ GOSPODARCZA PRZEDSIĘBIORSTW O LICZBIE PRACUJĄCYCH DO 9 OSÓB W 2008 R.

DZIAŁALNOŚĆ GOSPODARCZA PRZEDSIĘBIORSTW O LICZBIE PRACUJĄCYCH DO 9 OSÓB W 2008 R. Warszawa, 2009.10.16 DZIAŁALNOŚĆ GOSPODARCZA PRZEDSIĘBIORSTW O LICZBIE PRACUJĄCYCH DO 9 OSÓB W 2008 R. W Polsce w 2008 r. prowadziło działalność 1780 tys. przedsiębiorstw o liczbie pracujących do 9 osób

Bardziej szczegółowo

estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń

estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń estymacja wskaźnika bardzo niskiej intensywności pracy z wykorzystaniem modelu faya-herriota i jego rozszerzeń Łukasz Wawrowski, Maciej Beręsewicz 12.06.2015 Urząd Statystyczny w Poznaniu, Uniwersytet

Bardziej szczegółowo

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym. REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym. Zadanie 1 W celu ustalenia zależności między liczbą braków a wielkością produkcji części

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Ćwiczenia 10. Analiza regresji. Część I.

Ćwiczenia 10. Analiza regresji. Część I. Ćwiczenia 10. Analiza regresji. Część I. Zadania obowiązkowe UWAGA! Elementy zadań oznaczone kolorem czerwonym należy przygotować lub wypełnić. Zadanie 10.1. (R/STATISTICA) Twoim zadaniem jest możliwie

Bardziej szczegółowo

Test lewostronny dla hipotezy zerowej:

Test lewostronny dla hipotezy zerowej: Poznajemy testowanie hipotez statystycznych w środowisku R Zajęcia z dnia 11 maja 2011 roku Najpierw teoria TESTY ISTOTNOŚCI WARTOŚCI ŚREDNIEJ W POPULACJI GENERALNEJ gdy znana jest wariancja!!! Test prawostronny

Bardziej szczegółowo

Ekonometria. Weryfikacja modelu. Paweł Cibis pcibis@o2.pl. 6 kwietnia 2006

Ekonometria. Weryfikacja modelu. Paweł Cibis pcibis@o2.pl. 6 kwietnia 2006 Weryfikacja modelu Paweł Cibis pcibis@o2.pl 6 kwietnia 2006 1 Badanie istotności parametrów strukturalnych modelu Testy Pakiet Analiza Danych Uwagi 2 Test dla małej próby Test dla dużej próby 3 Test Durbina-Watsona

Bardziej szczegółowo

Modelowanie Ekonometryczne i Prognozowanie

Modelowanie Ekonometryczne i Prognozowanie Modelowanie Ekonometryczne i Prognozowanie David Ramsey e-mail: david.ramsey@pwr.edu.pl strona domowa: www.ioz.pwr.edu.pl/pracownicy/ramsey 27 lutego 2015 1 / 77 Opis Kursu 1. Podstawy oraz Cele Modelowania

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40 Statystyka dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl wersja 20.01.2013/13:40 Tematyka wykładów 1. Definicja statystyki 2. Populacja, próba 3. Skale pomiarowe 4. Miary położenia (klasyczne i pozycyjne)

Bardziej szczegółowo

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Paweł Cibis pawel@cibis.pl 23 lutego 2007 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

Podstawowe informacje o orzecznictwie sądów powszechnych w sprawach o rozwód

Podstawowe informacje o orzecznictwie sądów powszechnych w sprawach o rozwód Marlena Gilewicz Naczelnik Wydziału Statystyki w Departamencie Organizacyjnym w Ministerstwie Sprawiedliwości Podstawowe informacje o orzecznictwie sądów powszechnych w sprawach o rozwód W latach 2000

Bardziej szczegółowo

Żłobki i kluby dziecięce w 2013 r.

Żłobki i kluby dziecięce w 2013 r. Materiał na konferencję prasową w dniu 3 maja 214 r. GŁÓWNY URZĄD STATYSTYCZNY Departament Badań Społecznych i Warunków Życia Notatka informacyjna Żłobki i kluby dziecięce w 213 r. W pierwszym kwartale

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

Walidacja metod analitycznych Raport z walidacji

Walidacja metod analitycznych Raport z walidacji Walidacja metod analitycznych Raport z walidacji Małgorzata Jakubowska Katedra Chemii Analitycznej WIMiC AGH Walidacja metod analitycznych (według ISO) to proces ustalania parametrów charakteryzujących

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin. Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Zadania analityczne (1) Analiza przewiduje badanie podobieństw

Bardziej szczegółowo

Ścieżki dostępu do STATISTICA

Ścieżki dostępu do STATISTICA Ścieżki dostępu do STATISTICA Spis treści Sprawdzanie zgodności z rozkładem normalnym test Shapiro-Wilka:... 2 Test t-studenta w modelu zmiennych niezależnych:... 3 Test t-studenta w modelu zmiennych powiązanych...

Bardziej szczegółowo

Budownictwo mieszkaniowe a) w okresie I-XII 2013 r.

Budownictwo mieszkaniowe a) w okresie I-XII 2013 r. Warszawa, 17.1.214 r. Budownictwo mieszkaniowe a) w okresie I-XII 213 r. Według wstępnych danych, w okresie styczeń-grudzień 213 r. oddano do użytkowania 146122 mieszkania, tj. o 4,4% mniej niż w 212 r.

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF 120 I. Ogólne informacje o przedmiocie Cel przedmiotu: Opanowanie podstaw teoretycznych, poznanie przykładów zastosowań metod statystycznych.

Bardziej szczegółowo

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona Nieparametryczne odpowiedniki testów T-Studenta stosujemy gdy zmienne mierzone są na skalach porządkowych (nie można liczyć średniej) lub kiedy mierzone są na skalach ilościowych, a nie są spełnione wymagania

Bardziej szczegółowo

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych Przykłady: Błąd pomiarowy Wzrost, wydajność Temperatura ciała Zawartość różnych składników we

Bardziej szczegółowo

Narodowy Fundusz Ochrony Środowiska i Gospodarki Wodnej

Narodowy Fundusz Ochrony Środowiska i Gospodarki Wodnej Narodowy Fundusz Ochrony Środowiska i Gospodarki Wodnej I N F O R M A C J A o gospodarowaniu środkami w wojewódzkich funduszach ochrony środowiska i gospodarki wodnej w roku 27 Warszawa, maj 28 SPIS TREŚCI:

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Żłobki i kluby dziecięce w 2012 r.

Żłobki i kluby dziecięce w 2012 r. Materiał na konferencję prasową w dniu 29 maja 213 r. GŁÓWNY URZĄD STATYSTYCZNY Departament Badań Społecznych i Warunków Życia Notatka informacyjna Żłobki i kluby dziecięce w 212 r. W pierwszym kwartale

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

KREATOR REGRESJI LOGISTYCZNEJ

KREATOR REGRESJI LOGISTYCZNEJ KREATOR REGRESJI LOGISTYCZNEJ Grzegorz Migut, StatSoft Polska Sp. z o.o. W niniejszym opracowaniu zaprezentowany zostanie przykład budowy modelu regresji logistycznej za pomocą Kreatora Regresji Logistycznej.

Bardziej szczegółowo

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Dopasowanie rozkładów Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2

Bardziej szczegółowo

Materiał dla studentów

Materiał dla studentów Materiał dla studentów Metoda zmiennych instrumentalnych Nazwa przedmiotu: metody ekonometryczne, ekonometria stosowana Kierunek studiów: Metody Ilościowe w ekonomii i systemy informacyjne Studia I stopnia/studia

Bardziej szczegółowo

Etapy modelowania ekonometrycznego

Etapy modelowania ekonometrycznego Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,

Bardziej szczegółowo

Raport Testy Trenerskie. Kadr Makroregionalnych Polskiego Związku Podnoszenia Ciężarów

Raport Testy Trenerskie. Kadr Makroregionalnych Polskiego Związku Podnoszenia Ciężarów Raport Testy Trenerskie Kadr Makroregionalnych Polskiego Związku Podnoszenia Ciężarów W trakcie zgrupowań Kadr Makroregionalnych Polskiego Związku Podnoszenia Ciężarów, poddano zawodników Testom Trenerskim.

Bardziej szczegółowo

Metody statystyki medycznej stosowane w badaniach klinicznych

Metody statystyki medycznej stosowane w badaniach klinicznych Metody statystyki medycznej stosowane w badaniach klinicznych Statistics for clinical research & post-marketing surveillance część III Program szkolenia część III Model regresji liniowej Współczynnik korelacji

Bardziej szczegółowo

ANALIZY WIELOZMIENNOWE

ANALIZY WIELOZMIENNOWE ANALIZY WIELOZMIENNOWE ANALIZA REGRESJI Charakterystyka: Rozszerzenie analizy korelacji o badanie zależności pomiędzy wieloma zmiennymi jednocześnie; Podstawowe zastosowanie (ale przez nas w tym momencie

Bardziej szczegółowo

KONKURS MAESTRO 3 STATYSTYKI

KONKURS MAESTRO 3 STATYSTYKI KONKURS MAESTRO 3 STATYSTYKI Rozstrzygnięcie: styczeń 2013 r. 15 czerwca 2012 roku Narodowe Centrum Nauki po raz trzeci ogłosiło konkurs MAESTRO przeznaczony dla doświadczonych naukowców na projekty badawcze

Bardziej szczegółowo

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2 Instytut Matematyczny Uniwersytet Wrocławski Zakres egzaminu magisterskiego Wybrane rozdziały anazlizy i topologii 1 i 2 Pojęcia, fakty: Definicje i pojęcia: metryka, iloczyn skalarny, norma supremum,

Bardziej szczegółowo

Analiza wpływu zmian poziomu wody gruntowej na stabilność anteny stacji permanentnej Wrocław

Analiza wpływu zmian poziomu wody gruntowej na stabilność anteny stacji permanentnej Wrocław XX JUBILEUSZOWA JESIENNA SZKOŁA GEODEZJI im. Jacka Rejmana WSPÓŁCZESNE METODY POZYSKIWANIA I MODELOWANIA GEODANYCH Analiza wpływu zmian poziomu wody gruntowej na stabilność anteny stacji permanentnej Wrocław

Bardziej szczegółowo

Nakłady na środki trwałe służące ochronie środowiska i gospodarce wodnej w Polsce w 2012 r.

Nakłady na środki trwałe służące ochronie środowiska i gospodarce wodnej w Polsce w 2012 r. mld zł GŁÓWNY URZĄD STATYSTYCZNY Departament Badań Regionalnych i Środowiska Notatka informacyjna WYNIKI BADAŃ GUS Nakłady na środki trwałe służące ochronie środowiska i gospodarce wodnej w Polsce w 2012

Bardziej szczegółowo

RAPORT: PODSUMOWANIE ROZTRZYGNIĘTYCH PRZETARGÓW Z BRANŻY MEDYCZNEJ W IV KWARTALE 2012 ROKU. Kraków, 25.02.2013

RAPORT: PODSUMOWANIE ROZTRZYGNIĘTYCH PRZETARGÓW Z BRANŻY MEDYCZNEJ W IV KWARTALE 2012 ROKU. Kraków, 25.02.2013 Strona1 RAPORT: PODSUMOWANIE ROZTRZYGNIĘTYCH PRZETARGÓW Z BRANŻY MEDYCZNEJ W IV KWARTALE 2012 ROKU. Kraków, 25.02.2013 Strona2 Serwis Inwestycyjno - Przetargowy www.pressinfo.pl we współpracy z Grupą Marketingową

Bardziej szczegółowo

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III ZALICZENIA W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III 1 Wariant I. PROBLEM WŁASNY Sformułować własne zadanie statystyczne związane z własną pracą badawczą

Bardziej szczegółowo

POMELO DO CELO. Analiza skuteczności internetowej kampanii reklamowej. Czas analizy: 25.06.2004-31.08.2004

POMELO DO CELO. Analiza skuteczności internetowej kampanii reklamowej. Czas analizy: 25.06.2004-31.08.2004 POMELO DO CELO Analiza skuteczności internetowej kampanii reklamowej Czas analizy: 25.06.2004-31.08.2004 1 Spis treści SPIS TREśCI... 2 WSTęP... 4 Cele badania... 4 Metodologia badania... 4 Opis kampanii

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Gdy: badana cecha jest mierzalna (ewentualnie policzalna); dysponujemy dwoma próbami; chcemy porównać, czy wariancje w tych próbach

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

Działalność badawcza i rozwojowa w Polsce w 2013 r. Główne wnioski

Działalność badawcza i rozwojowa w Polsce w 2013 r. Główne wnioski GŁÓWNY URZĄD STATYSTYCZNY Urząd Statystyczny w Szczecinie Warszawa, listopad 2014 r. Informacja sygnalna WYNIKI BADAŃ GUS Główne wnioski Wartość nakładów wewnętrznych 1 ogółem na działalność badawczo-rozwojową

Bardziej szczegółowo

Wpływ wsparcia unijnego na regionalne zróŝnicowanie dochodów w w rolnictwie

Wpływ wsparcia unijnego na regionalne zróŝnicowanie dochodów w w rolnictwie Instytucje w procesie przemian strukturalnych i społeczno eczno-ekonomicznych ekonomicznych na polskiej wsi i w rolnictwie w świetle wsparcia unijnego Kraków,10 czerwca 2012 r. Wpływ wsparcia unijnego

Bardziej szczegółowo

Wykr. 1. RELACJA MIĘDZY POTRZEBAMI REGIONÓW W ZAKRESIE ZASOBÓW LUDZKICH (oś rzędnych odległości euklidesowe) A DOFINANSOWANIEM UE PRZEZNACZONYM NA ROZWÓJ ZASOBÓW LUDZKICH (oś odciętych) Relacja 1,00 0,75

Bardziej szczegółowo

II. BUDOWNICTWO MIESZKANIOWE

II. BUDOWNICTWO MIESZKANIOWE II. BUDOWNICTWO MIESZKANIOWE 1. Mieszkania oddane do eksploatacji w 2007 r. 1 Według danych Głównego Urzędu Statystycznego, w Polsce w 2007 r. oddano do użytku 133,8 tys. mieszkań, tj. o około 16% więcej

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo