Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski



Podobne dokumenty
Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Analiza wariancji jednej zmiennej (UNIANOVA)

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Rozdział 8. Regresja. Definiowanie modelu

Ćwiczenie komputerowe 2 testy t-studenta. Program Statistica

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

STATYSTYKA MATEMATYCZNA

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Wprowadzenie do analizy korelacji i regresji

STATYSTYKA MATEMATYCZNA, LISTA 3

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

KORELACJE I REGRESJA LINIOWA

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Prognoza sprawozdania finansowego Bilans

1 Podstawy rachunku prawdopodobieństwa

Ćwiczenia 10. Analiza regresji. Część I.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

5. Model sezonowości i autoregresji zmiennej prognozowanej

Kolokwium ze statystyki matematycznej

Oszacowanie i rozkład t

Regresja logistyczna (LOGISTIC)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

4. Średnia i autoregresja zmiennej prognozowanej

Analizy wariancji ANOVA (analysis of variance)

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Wykład 5: Statystyki opisowe (część 2)

METODY STATYSTYCZNE W BIOLOGII

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

ANALIZA REGRESJI SPSS

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wykład 9 Wnioskowanie o średnich

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

PDF created with FinePrint pdffactory Pro trial version

7.4 Automatyczne stawianie prognoz

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Statystyki opisowe i szeregi rozdzielcze

Jednoczynnikowa analiza wariancji

CZĘŚĆ I: ISTOTNE STATYSTYKI DOTYCZĄCE STATYSTYKI

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Statystyka matematyczna i ekonometria

Badanie zależności skala nominalna

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Statystyka matematyczna i ekonometria

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Podstawy statystyki - ćwiczenia r.

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Własności statystyczne regresji liniowej. Wykład 4

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

STATYSTYKA MATEMATYCZNA

S t a t y s t y k a, część 3. Michał Żmihorski

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Wykład 3 Hipotezy statystyczne

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

MODELE LINIOWE. Dr Wioleta Drobik

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

3. Analiza własności szeregu czasowego i wybór typu modelu

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Testy nieparametryczne

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

laboratoria 24 zaliczenie z oceną

STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych

czerwiec 2013 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90

Transkrypt:

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem Procen Procen N t N t N Procent 230 70,1% 98 29,9% 328 100,0% 230 70,1% 98 29,9% 328 100,0% Statystyki opisowe (DESCRIPTIVES) Statystyka Średnia 40,19 95% przedział Dolna granica 36,25 ufności dla Górna granica 44,13 średniej 5% średnia obcięta 37,00 Mediana 30,00 Wariancja 920,196 Odchylenie standardowe 30,335 Minimum 2 Maksimum 300 Rozstęp 298 Rozstęp ćwiartkowy 26 Skośność 3,954 Kurtoza 26,373

Średnia 38,85 95% przedział Dolna granica 34,83 ufności dla Górna granica 42,87 średniej 5% średnia obcięta 35,63 Mediana 30,00 Wariancja 958,458 Odchylenie standardowe 30,959 Minimum 2 Maksimum 300 Rozstęp 298 Rozstęp ćwiartkowy 30 Skośność 3,583 Kurtoza 22,979 Statystyki opisowe (DESCRIPTIVES) Błąd standardo wy Średnia 2,000 95% przedział ufności dla średniej Dolna granica Górna granica 5% średnia obcięta Mediana Wariancja Odchylenie standardowe Minimum Maksimum Rozstęp Rozstęp ćwiartkowy Skośność,160 Kurtoza,320

Średnia 2,041 95% przedział Dolna granica ufności dla Górna granica średniej 5% średnia obcięta Mediana Wariancja Odchylenie standardowe Minimum Maksimum Rozstęp Rozstęp ćwiartkowy Skośność,160 Kurtoza,320 Obie próby są do siebie podobne. Średnia wynosi około 40. Mediana wynosi 30 dla każdej zmiennej. Wartości minimum i maksimum wynoszą tyle samo 2 i 300. Odchylenie standardowe około 30 dla obu zmiennych. Próba jest duża. Uwzględniono 230 obserwacji.

Przeciętne ważone (Definicja 1) Zawiasy Tukey'a Percentyle Percentyle 5 10 25 50 10,00 17,10 23,75 30,00 10,00 10,50 20,00 30,00 24,00 30,00 20,00 30,00 Przeciętne ważone (Definicja 1) Zawiasy Tukey'a Percentyle Percentyle 75 90 95 50,00 69,00 100,00 50,00 70,00 100,00 50,00 50,00

Zadanie 2 Test T (T-TEST) W pliku Dane_wzrost_cen.sav próba jest duża nie ma, więc konieczności sprawdzania normalności rozkładu. H0: Oprocentowanie 12-miesięcznych lokat jest równe 3-krotnej inflacji. H1: Oprocentowanie 12-miesięcznych lokat jest inne niż 3-krotna inflacja. Statystyki dla jednej próby N Średni a Odchyleni e standardo we Błąd standardo wy średniej 12 miesięczne oprocentowania zł na lokacie 217 40,66 18,878 1,282 Test dla jednej próby Wartość testowana = 30 Istotność t df (dwustron na) Różnica średnich 12 miesięczne oprocentowania zł na lokacie 8,321 216,000 10,664

Test dla jednej próby Wartość testowana = 30 95% przedział ufności dla różnicy średnich Dolna granica Górna granica 12 miesięczne oprocentowania zł na lokacie 8,14 13,19 Istotność jest mniejsza niż 0,05 -> H0 odrzucamy i przyjmujemy H1.

Zadanie 3 Test T (T-TEST) W pliku Dane_wzrost_cen.sav próba jest duża nie ma, więc konieczności sprawdzania normalności rozkładu. H0: Zmienne mają jednakowe średnie. H1: Zmienne mają różne średnie. Para 1 Statystyki dla prób zależnych Błąd Średnia N Odchylenie standardow e standardo wy średniej 40,19 230 30,335 2,000 38,85 230 30,959 2,041 Para 1 Korelacje dla prób zależnych N Korelacja Istotność 230,885,000 & Wzrost cen w najbliższych 12

Para 1 Para 1 Test dla prób zależnych Różnice w próbach zależnych Błąd Średni a Odchylenie standardowe standardowy średniej 1,335 14,738,972 - Wzrost cen w najbliższych 12 Test dla prób zależnych Różnice w próbach zależnych 95% przedział ufności dla różnicy średnich Dolna granica Górna granica t df -,580 3,250 1,374 229 - Wzrost cen w najbliższych 12 Para 1 Test dla prób zależnych Istotność (dwustron na),171 - Wzrost cen w najbliższych 12 Otrzymaliśmy istotność większą niż 0,05 -> Nie ma podstaw do odrzucenia H0.

Zadanie 4 Dopasowanie krzywej (CURVEFIT) Opis modelu Nazwa modelu MOD_1 Zmienna zależna 1 ciągu ostatnich 12 Równanie 1 Liniowy Zmienna niezależna Stała Uwzględnione Zmienna opisująca obserwacje Nieokreślone na wykresach Informacja o analizowanych danych Liczebno ść Ogółem 328 obserwacji Obserwacje 98 wykluczone a Obserwacje 0 prognozowane Nowoutworzone 0 obserwacje a. Obserwacje z brakami danych w dowolnej ze zmiennych są wykluczane z analizy.

Podsumowanie przetwarzanych zmiennych Zmienne Niezależn Zależna a Wzrost cen w ciągu ostatnich 12 Wzrost cen w najbliższy ch 12 miesiącac h Liczba dodatnich wartości 266 241 Liczba zer 0 0 Liczba ujemnych wartości 0 0 Liczba braków Brak danych 62 87 danych zdefiniowany przez użytkownika Systemowy brak danych 0 0 Podsumowanie modelu i oszacowań parametrów Zmienna zależna: Oceny Model - Podsumowanie parametrów Równa nie R-kwad rat F df1 df2 Istotno ść Stała b1 Liniowy,782 820,08 1 228,000 6,513,867 5 Zmienną niezależną jest. R^2 = 0,782 co oznacza, że w 78% różnice w prognozie dają się wytłumaczyć różnicami w zauważonym przez respondentów wzroście cen w ubiegłym okresie. R=0,884 co świadczy o dodatniej korelacji miedzy prognozą cen i ubiegłym okresem.

Równanie prostej regresji ma postać y = 0,867 * x + 6,513.

Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem N Procent N Procent N Procent 230 70,1% 98 29,9% 328 100,0% 230 70,1% 98 29,9% 328 100,0%

Wykresy skrzynkowe ujawniły przypadki odstające dla zmiennych wzrost_wstecz i wzrost_prognoza. Jest 24 takich obserwacji, wartości usuwamy z pliku i powtarzamy analizę. Dopasowanie krzywej (CURVEFIT) Opis modelu Nazwa modelu MOD_2 Zmienna zależna 1 ciągu ostatnich 12 Równanie 1 Liniowy Zmienna niezależna Stała Uwzględnione Zmienna opisująca obserwacje Nieokreślone na wykresach Informacja o analizowanych danych Liczebno ść Ogółem 304 obserwacji Obserwacje 94 wykluczone a Obserwacje 0 prognozowane Nowoutworzone 0 obserwacje

Informacja o analizowanych danych Liczebno ść Ogółem 304 obserwacji Obserwacje 94 wykluczone a Obserwacje 0 prognozowane Nowoutworzone 0 obserwacje a. Obserwacje z brakami danych w dowolnej ze zmiennych są wykluczane z analizy. Podsumowanie przetwarzanych zmiennych Zmienne Niezależn Zależna a Wzrost cen w ciągu ostatnich 12 Wzrost cen w najbliższy ch 12 miesiącac h Liczba dodatnich wartości 243 220 Liczba zer 0 0 Liczba ujemnych wartości 0 0 Liczba braków Brak danych 61 84 danych zdefiniowany przez użytkownika Systemowy brak danych 0 0

Podsumowanie modelu i oszacowań parametrów Zmienna zależna: Oceny Model - Podsumowanie parametrów Równa nie R-kwad rat F df1 df2 Istotno ść Stała b1 Liniowy,585 293,06 1 208,000 10,984,706 0 Zmienną niezależną jest. R^2 = 0,585 co oznacza, że w 59% różnice w prognozie dają się wytłumaczyć różnicami w zauważonym przez respondentów wzroście cen w ubiegłym okresie. R=0,765 co świadczy o dodatniej korelacji miedzy prognozą cen i ubiegłym okresem.

Równanie prostej regresji ma postać y = 0,706 * x + 10,984. Równanie może być używane do przewidywania odpowiedzi na drugie pytanie na podstawie odpowiedzi na pierwsze, ponieważ R=0,765 co świadczy o dodatniej korelacji miedzy prognozą cen i ubiegłym okresem.