Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki



Podobne dokumenty
Przedmiot statystyki. Graficzne przedstawienie danych.

Wykład 10: Elementy statystyki

Wykład 13. Zmienne losowe typu ciągłego

Wykłady 14 i 15. Zmienne losowe typu ciągłego

Statystyka matematyczna i ekonometria

Wykład ze statystyki. Maciej Wolny

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Analiza danych. TEMATYKA PRZEDMIOTU

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

MATEMATYKA3 Mathematics3. Elektrotechnika. I stopień ogólnoakademicki. studia stacjonarne. Katedra Matematyki dr Zdzisław Piasta

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

3. Podstawowe pojęcia statystyki matematycznej i rachunku prawdopodobieństwa wykład z Populacja i próba

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Z-0033z Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki. Stacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Przedmiot statystyki. Graficzne przedstawienie danych.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Z-LOGN1-006 Statystyka Statistics

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Z-LOG-033I Statystyka Statistics

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Dyskretne zmienne losowe

Sposoby prezentacji problemów w statystyce

Zbiory liczbowe i funkcje wykład 1

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Wprowadzenie do analizy korelacji i regresji

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; Weryfikacja założenia o normalności rozkładu populacji

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

STATYSTYKA MATEMATYCZNA

Estymacja parametrów w modelu normalnym

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Pojęcie funkcji. Funkcja liniowa

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Środowisko R wprowadzenie c.d. Wykład R2; Struktury danych w R c.d.

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

W1. Wprowadzenie. Statystyka opisowa

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Testy post-hoc. Wrocław, 6 czerwca 2016

KARTA KURSU. Kod Punktacja ECTS* 1

PDF created with FinePrint pdffactory Pro trial version

Biostatystyka, # 1 /Weterynaria I/

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

MODELE LINIOWE. Dr Wioleta Drobik

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

Statystyka matematyczna dla leśników

PRZEWODNIK PO PRZEDMIOCIE

KONSPEKT FUNKCJE cz. 1.

OPIS MODUŁ KSZTAŁCENIA (SYLABUS)

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

Literatura. Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2010.

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Wykład: 20 godz., ćwiczenia: 20 godz. Zasady zaliczenia: zaliczenie ćwiczeń na ocenę, zaliczenie wykładu - egzamin (pisemne).

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Statystyczne metody analizy danych

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Wydział Matematyki. Testy zgodności. Wykład 03

6.4 Podstawowe metody statystyczne

Statystyka Matematyczna Anna Janicka

Kilka uwag o testowaniu istotności współczynnika korelacji

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

1.1 Wstęp Literatura... 1

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Rachunku prawdopodobieństwa: rys historyczny, aksjomatyka, prawdopodobieństwo warunkowe,

Statystyka w pracy badawczej nauczyciela

studia stacjonarne w/ćw zajęcia zorganizowane: 30/15 3,0 praca własna studenta: 55 Godziny kontaktowe z nauczycielem akademickim: udział w wykładach

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Analiza korespondencji

Statystyka opisowa- cd.

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

CZEŚĆ PIERWSZA. Wymagania na poszczególne oceny,,matematyka wokół nas Klasa III I. POTĘGI

Podstawowe pojęcia statystyczne

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

Przykład 1. (A. Łomnicki)

Transkrypt:

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych); -wyciąganie wniosków na podstawie danych (wnioskowanie statystyczne). 1

Statystyka i gospodarka przestrzenna Ceny mieszkań używanych we Wrocławiu (ceny proponowane przez sprzedających): Ceny mieszkań w dzielnicy A (miasta Wrocławia): 65,80,139,180,355,158,240,205,265,305,200,155,209, 310,149,254,188,265,275,200,184,130,260,250,195 Ceny mieszkań w dzielnicy B (miasta Wrocławia): 420,350,275,277,327,223,198,275,350,327,260,306,270,295,270,220,299 Średnia cena w dzielnicy A: 208,8;średnia cena w dzielnicy B: 290,71. Czy ceny mieszkań w dzielnicy B są wyższe niż w dzielnicy A? 2

Analiza zależości cech Powierzchnia (w metrach kwadratowych) mieszkań w dzielnicy B: 94,73,75,80,74,60,50,63,74,74,56,85,80,80,80,75,60 Dane nt. mieszkań z dzielnicy B można przedstawić jako tzw. szereg dwucechowy: (94; 420), (73, 35),..., (60; 299). 3

Wykres rozproszenia Dane te można przedstawić przy pomocy wykresu rozproszenia: cena 200 250 300 350 400 50 60 70 80 90 powierzchnia (metry kw.) Rysunek 1: Wykres rozproszenia dla danych: powierzchnia i ceny mieszkań w dzielnicy B 4

Wykres rozproszenia+prosta MNK Do chmury punktów na wykresie rozproszenia można dopasować prostą w następujący sposób. Oznaczmy dane ( szereg dwucechowy ) przez (x 1, y 1 ),..., (x n, y n ) Chcemy znaleźć prostą y = b 0 + b 1 x taką,że S(b 0, b 1 ) = n (y i b 1 x i b 0 ) 2 suma kwadratów odchyleń k=1 przyjmuje wartość minimalną (jeśli nie wszystkie wsółrzędne x-owe są równe jednej liczbie, to istnieje dokładnie jedna para liczb, dla których krytetium S przyjmuje wartość minimalną). Otrzymana prosta MNK (od Metody Najmniejszych Kwadratów)- odpowiada minmalnej wartości funkcji S(b 0, b 1 ); wielkość y i b 1 x i b 0 można interpretować jako odchyelenie i tej obserwacji y i od wartości przewidywanej b 1 x i + b 0 5

Dla danych nt. mieszkań w dzielnicy B prosta ta dana jest równaniem: y = 74,78729 + 2,97698x 6

Wykres rozproszenia+prosta MNK cena (tys. z³) 200 300 400 50 60 70 80 90 powierzchnia (metry kw.) Rysunek 2: Wykres rozproszenia dla danych: powierzchnia i ceny mieszkań w dzielnicy B+prosta MNK 7

Problem: czy rozważana zależność liniowa między zmiennymi jest w jakimś sensie istotna statystycznie? adekwatna? 8

Wstępna analiza danych i wnioskowanie statystyczne Schemat postępowania: dla posiadanego zbioru danych wykonujemy wstępną analizę: obliczamy wskaźniki sumaryczne (średnią itd.) oraz sporządzamy odpowiednie wykresy statystyczne; następnie przeprowadzamy odpowiednie analizy statystyczne (testujemy odpowiednie hipotezy itd.) 9

Cechy ilościowe i jakościowe Cena mieszkań w dzielnicy B- przykład cechy ilościowej (mamy tu do czynienia z liczbami odpowiadającymi wartościom mierzonych wielkości); -cechy jakościowe: płeć; typ schorzenia; 10

Histogram i szereg rozdzielczy Dla zbioru danych liczbowych y 1, y 2..., y n niech: MIN1 oznacza liczbę mniejszą od najmniejszej z liczb y 1, y 2..., y n ; MAX1 oznacza liczbę większą lub równą od największej z liczb y 1, y 2..., y n ; MIN1 < MIN i MAX1 MAX mogą być odpowiednimi zaokrągleniami wartości, odpowiednio, minimalnej i maksymalnej naszego zbioru danych. Podzielmy odcinek (MIN1, MAX1] na k przedziałów (zwanych klasami) o równej długości: (x 0, x 1 ], (x 1, x 2 ],..., (x k 1, x k ], gdzie x 0 = MIN1, x k = MAX1. Funkcję przyporządkowującą poszczególnym przedziałom liczbę elementów naszego zbioru danych do nich należących będziemy nazywać szeregiem rozdzielczym. 11

Ustalenie liczby klas w szeregu rozdzielczym Istnieje kilka reguł ustalania liczby klas k szeregu rozdzielczego w zależności od liczby obserwacji n. Oto niektóre z nich: k log 2 n + 1; k n. 12

Szereg rozdzielczy dla danych: ceny mieszkań w B Dla danych: ceny mieszkań w B : 420, 350, 275, 277, 327, 223, 198, 275, 350, 327, 260, 306, 270, 295, 270, 220, 299 znajdujemy: MIN = 198, MAX = 420. Przyjmujemy: MIN1 = 150; MAX1 = 450 oraz k = 5. Otrzymujemy szereg rozdzielczy, przedstawiony w postaci tabeli: klasa (150,210] (210,270] (270,330] (330,390] (390,450] liczebność 1 5 8 2 1 13

Histogram liczebności dla danych ceny mieszkań w B 0 2 4 6 8 150 200 250 300 350 400 450 14

Histogram częstości Jeśliby histogram liczebności przeskalować w ten sposób, że wysokości słupków odpowiadałyby ilorazom liczebości klas i liczby wszystkich obserwacji n, wtedy otrzymalibyśmy histogram częstości. Wysokości słupków tego histogramu byłyby równe: 1 17 0,06; 5 17 0,29 itd. 15

Histogram probabilistyczny Jeśliby histogram przeskalować tak, aby suma pól wszystkich prostkątów ( słupków ) była równa 1, otrzymamy tzw. histogram probabilistyczny (od probability (ang.) - prawdopodobieństwo). Histogram probabilistyczny: oszacowanie rozkładu jedności prawdopodobieństwa dla danej cechy. Jeśli funkcja h-funkcja, odpowiadająca histogramowi probabilistycznemu, to prawdopodobieństwo, że wartość danej cechy X będzie się mieściła w [a, b] : P (a < X < b) b a h(x)dx 16

Histogram probabilistyczny dla cen mieszkań w B 0.000 0.002 0.004 0.006 0.008 150 200 250 300 350 400 450 17

Wielobok częstości Oznaczmy długość klasy histogramu przez H. Jeżeli połączymy odcinakmi: punkt (MIN1 H/2, 0); środki boków słupków histogramu probabilistycznego leżących na przeciw podstaw tych słupków; punkt (MAX1 + H/2, 0); otrzymamy tzw. probabilistyczny wielobok częstości (por. Rys. 3) 18

0.000 0.002 0.004 0.006 0.008 100 200 300 400 500 Rysunek 3: Histogram probabilistyczny+probabilistyczny wielobok częstości dla danych ceny mieszkań w B 19

Literatura [1] Bednarski, T. Elementy matematyki w naukach ekonomicznych. Oficyna ekonomiczna. Kraków 2004. [2] Komsta, Ł, Wprowadzenie do środowiska R. Strona WWW http://r.meteo.uni.wroc.pl/doc/contrib/komsta-wprowadzenie.pdf [3] Koronacki, J., Mielniczuk, J. Statystyka dla studentów kierunków technicznych i przyrodniczych. WNT. Warszawa 2001. [4] Łomnicki, A., Wprowadznie do statystyki dla przyrodników. PWN. Warszawa 2003. [5] Ostasiewicz, S., Rusnak, Z., Siedlecka, U. Statystyka. Elementy teorii i zadania. Wyd. Akadamii Ekonomicznej we Wrocławiu, 1999 [6] The R Project for Statistical Computing. Strona WWW http://www.r-project.org/ 20

[7] Verzani, J. simpler-using R for Introductory Statistics. http://r.meteo.uni.wroc.pl/doc/contrib/verzani-simpler.pdf 21