Statystyka Wykład 1 Magdalena Alama-Bućko 20 lutego 2017 Magdalena Alama-Bućko Statystyka 20 lutego 2017 1 / 19
Wykład : 30h Laboratoria : 30h (grupa B : 14:00, grupa C : 10:30, grupa E : 12:15) obowiazek uczestniczenia w wykładach dla studentów 1 roku liczba dopuszczalnych nieobecności na wykładzie : 2 / semestr egzamin w sesji letniej kontakt mailowy: mbucko@utp.edu.pl konsultacje : w trakcie ustalania (poniżej plan) poniedziałki - WZ środa 7:30-8:15 aula 1B Auditorium Novum na Kaliskiego Magdalena Alama-Bućko Statystyka 20 lutego 2017 2 / 19
Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia miary zmienności miary asymetrii miary koncentracji. Analiza współzależności zjawisk. Analiza dynamiki zjawisk. Magdalena Alama-Bućko Statystyka 20 lutego 2017 3 / 19
Literatura Amir D. Aczel, Statystyka w zarzadzaniu Wydawnictwo Naukowe PWN 2007 Janina Jóźwiak, Jarosław Podgórski, Statystyka od podstaw Wydawnictwo: PWE Wydanie VI zmienione 2006 Jerzy Greń, Statystyka matematyczna modele i zadania, PWN 1980 Podgórski J., Statystyka dla studiów licencjackich, Warszawa 2001 Roszkiewicz M., Statystyka: kurs podstawowy, Warszawa 2002 Sobczyk M., Statystyka, Warszawa 2000 Magdalena Alama-Bućko Statystyka 20 lutego 2017 4 / 19
Statystyka jest nauka zajmujac a się zbieraniem danych opisujacych zjawiska masowe (tzn. zjawiska o dużej liczebności obserwacji) i wydobywaniem informacji zawartej w tych danych. Statystykę można podzielić na dwie części: statystykę opisowa, statystykę matematyczna Statystyka opisowa zajmuje się opracowaniem zebranych informacji (danych) posługujac się głównie metodami opisowymi. Statystyka matematyczna: zajmuje się teoria, opisem i analiza zjawisk masowych (zjawisk o dużej liczebności) głównie przy użyciu metod matematycznych, a szczególnie rachunku prawdopodobieństwa. Magdalena Alama-Bućko Statystyka 20 lutego 2017 5 / 19
Podstawowe pojęcia eksperymentu zbiorowość statystyczna (populacja generalna): zbiór elementów określony co do przestrzeni oraz czasu, podlegajacych badaniu lub obserwacji np. studenci pewnej uczelni, studenci pewnego rocznika, produkty wyprodukowane w danym roku, rozmowy telefoniczne itp. jednostka statystyczna: najmniejszy element podlegajacy obserwacji lub badaniu, np. student, produkt, jedna rozmowa telefoniczna itp cecha statystyczna: właściwość ze względu na która prowadzi się badanie; np. wzrost, waga, kolor oczu, czas do pierwszego popsucia, liczba sprzedanych produktów... Magdalena Alama-Bućko Statystyka 20 lutego 2017 6 / 19
Cechy statystyczne dziela się na: ilościowe czyli mierzalne (przedstawiane liczbowo) w tym: skokowe (przyjmuja wartości z pewnego zbioru możliwych wartości) ciagłe (przyjmuja wartości rzeczywiste z pewnego przedziału) np. ilość, liczba, czas, długość jakościowe czyli niemierzalne (przedstawiane za pomoca opisu werbalnego) np. płeć, wykształcenie, kolor, miejsce zamieszkania,... Magdalena Alama-Bućko Statystyka 20 lutego 2017 7 / 19
W wyniku przeprowadzenia doświadczenia otrzymujemy pewien wynik zwany próbka. Próba losowa (próbka) to pewien podzbiór populacji generalnej i ma on postać x 1, x 2,..., x n Za pomoca tej próby chcemy wyciagn ać wnioski dotyczace całej populacji. Jeżeli próba była wybrana w sposób reprezentatywny - na podstawie tej próby można wyciagać wnioski dotyczace całej populacji. Próba uważana jest za próbę reprezentatywna wtedy i tylko wtedy jeśli została wybrana w sposób losowy i jest dostatecznie liczna. Magdalena Alama-Bućko Statystyka 20 lutego 2017 8 / 19
Przykład Studenci 1 roku FIR, UTP moga być badani ze względu wiek - cecha ilościowa, 19,20,... płeć - cecha jakościowa, K,M wzrost - cecha ilościowa (ciagła) kolor oczu - cecha jakościowa, niebieskie, piwne, zielone, itp. ilość rodzeństwa - cecha ilościowa (skokowa), 0, 1, 2,... Magdalena Alama-Bućko Statystyka 20 lutego 2017 9 / 19
Załóżmy, że mamy dane podane następujaco {x 1, x 2,..., x n }, czyli w postaci pewnego ciagu liczb. n zazwyczaj jest duże (nawet bardzo duże!!!) Pytanie Jak można te dane podać w bardziej przystępny sposób? dane można zapisać w postaci szeregów statystycznych Magdalena Alama-Bućko Statystyka 20 lutego 2017 10 / 19
Szereg szczegółowy (albo prosty) to uporzadkowany rosnaco ciag wartości badanej cechy, czyli próbę (x 1, x 2,..., x n ) porzadkujemy od najmniejszej do największej i otrzymujemy (x (1), x (2),..., x (n) ) czyli x (1) x (2)... x (n) x (j) to wartość na j tej pozycji w takim uporzadkowanym ciagu liczb x (1) to wartość najmniejsza x (n) - wartość największa Przykład Próba podstawowa: Po uporzadkowaniu otrzymujemy: (1, 3, 2, 1, 1, 2, 5). (1, 1, 1, 2, 2, 3, 5). Magdalena Alama-Bućko Statystyka 20 lutego 2017 11 / 19
Szereg rozdzielczy punktowy Jeżeli po uporzadkowaniu obserwacji wiele z nich się powtarza (i w rezultacie w ciagu n obserwacji mamy N różnych wartości), to dane te można zapisać w postaci zbiorczej tabeli. dla każdej z występujacych wartości x j zliczamy ilość jej wystapień n j i zapisujemy x j n j x 1 n 1 x 2 n 2...... x N n N oczywiście n 1 + n 2 +... + n N = n Magdalena Alama-Bućko Statystyka 20 lutego 2017 12 / 19
Przykład Uporzadkowana próba: (1, 1, 1, 2, 2, 3, 5) x j n j 1 3 2 2 3 1 5 1 W przypadku dużej liczby obserwacji i niewielkiej liczby kategorii szereg rozdzielczy punktowy jest bardzo przejrzystym podsumowaniem danych. Magdalena Alama-Bućko Statystyka 20 lutego 2017 13 / 19
Przykład Zapytano 1000 studentów pewnej uczelni o liczbę posiadanego rodzeństwa. 350 osób nie ma wcale rodzeństwa, 330 - ma 1, 209-2, 100-3, 10-4 a 1 badany ma 6 rodzeństwa. Szereg rozdzielczy punktowy dla takiej próby ma postać: x j n j 0 350 1 330 2 209 3 100 4 10 6 1 Magdalena Alama-Bućko Statystyka 20 lutego 2017 14 / 19
W przypadku dużej liczby obserwacji i dość dużej liczby kategorii szereg rozdzielczy punktowy nie jest "przejrzysty". Przykład : 1000 obserwacji ale aż 150 kategorii. Wówczas należy połaczyć w grupy kilka kategorii, by otrzymać ich mniej. Magdalena Alama-Bućko Statystyka 20 lutego 2017 15 / 19
Szereg rozdzielczy przedziałowy Stosowany w przypadku dość dużej liczby kategorii albo gdy cecha jest ciagła. Wyznacza się liczbę klas, a następnie zlicza liczbę obserwacji należacych do danej klasy (przedziału). rozstęp z próby : R = x max x min = x (n) = x (1) w literaturze jest wiele propozycji wyznaczania liczby klas (k) i postaci przedziału poczatkowego liczba klas: k = n długość pojedynczej klasy: l = R k przedział n j [x min, x min + l] n 1 (x min + l, x min + 2l] n 2...... (x max l, x max ] n k Magdalena Alama-Bućko Statystyka 20 lutego 2017 16 / 19
Przykład W celu scharakteryzowania rozkładu wysokości drzew pewnego drzewostanu dokonano pomiaru 69 drzew, uzyskujac następujace wyniki w metrach. (tutaj już dane uporzadkowane) 4,12 4,25 4,36 4,45 4,50 4,53 4,68 4,70 4,79 4,82 4,90 4,93 5,03 5,06 5,18 5,21 5,29 5,35 5,36 5,40 5,41 5,43 5,49 5,50 5,53 5,59 5,60 5,64 5,70 5,72 5,75 5,76 5,80 5,81 5,89 5,90 5,90 5,92 5,93 6,00 6,05 6,18 6,20 6,25 6,27 6,30 6,35 6,42 6,45 6,49 6,50 6,55 6,60 6,61 6,75 6,78 6,81 6,85 6,91 7,00 7,05 7,21 7,24 7,30 7,35 7,36 7,41 7,46 7,50 x min = 4.12, x max = 7.50, R = 3.38 69 = 8, 3, zatem k = 8 l = R k = 3.38 8 = 0.43 Magdalena Alama-Bućko Statystyka 20 lutego 2017 17 / 19
przedział n j [4.12, 4.12 + 0.43] = [4.12, 4.55] 6 (4.55, 4.55 + 0.43] = (4.55, 4.98] 6 (4.98, 4.98 + 0.43] = (4.98, 5.41] 9 (5.41, 5.41 + 0.43] = (5.41, 5.84] 13 (5.84, 5.84 + 0.43] = (5.84, 6.27] 11 (6.27, 6.27 + 0.43] = (6.27, 6.7] 9 (6.7, 6.7 + 0.43] = (6.7, 7.13] 7 (7.13, 7.13 + 0.43] = (7.13, 7.56] 8 n =69 4,12 4,25 4,36 4,45 4,50 4,53 4,68 4,70 4,79 4,82 4,90 4,93 5,03 5,06 5,18 5,21 5,29 5,35 5,36 5,40 5,41 5,43 5,49 5,50 5,53 5,59 5,60 5,64 5,70 5,72 5,75 5,76 5,80 5,81 5,89 5,90 5,90 5,92 5,93 6,00 6,05 6,18 6,20 6,25 6,27 6,30 6,35 6,42 6,45 6,49 6,50 6,55 6,60 6,61 6,75 6,78 6,81 6,85 6,91 7,00 7,05 7,21 7,24 7,30 7,35 7,36 7,41 7,46 7,50 Magdalena Alama-Bućko Statystyka 20 lutego 2017 18 / 19
Dziękuję za uwagę! Magdalena Alama-Bućko Statystyka 20 lutego 2017 19 / 19