Statystyczne metody analizy danych
|
|
- Agata Król
- 8 lat temu
- Przeglądów:
Transkrypt
1 Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezioska
2 Podstawowe pojęcia STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych. BADANIE STATYSTYCZNE - ogół prac mających na celu poznanie struktury określonej zbiorowości statystycznej. ZBIOROWOŚD (POPULACJA) STATYSTYCZNA zbiór dowolnych elementów (osób, przedmiotów, faktów) podobnych pod względem określonych cech (ale nie identycznych) poddanych badaniu statystycznemu. JEDNOSTKA STATYSTYCZNA - składowe (elementy) zbiorowości (obiekty badania), które podlegają bezpośredniej obserwacji lub pomiarowi.
3 n - oznaczenie liczby jednostek statystycznych w populacji ZBIOROWOŚD (POPULACJA) GENERALNA wszystkie elementy będące przedmiotem badania, co do których chcemy formułowad wnioski ogólne. ZBIOROWOŚD PRÓBNA (PRÓBA) - podzbiór populacji generalnej; wyniki badao próby są uogólniane na zbiorowośd generalną. Próba musi byd reprezentatywna. Reprezentatywnośd zależy od: sposobu wyboru jednostek (celowy, losowy) oraz liczebności próby. n>30 - duża próba n 30 - mała próba
4 Populacja a próba Z oczywistych powodów nie jesteśmy w stanie opisad całej tej populacji. Musimy się zatem posłużyd podzbiorem populacji generalnej - pobraną wcześniej próbą. Na podstawie analizy tej próby będziemy jednak chcieli wyciągad wnioski na temat całej populacji. Aby to było możliwe należało na wstępie zadbad aby pobrana populacja w sposób możliwie reprezentatywny opisywała populację generalną.
5 Populacja a próba Do oceny i opisu populacji próby można posłużyd się samymi danymi ale jest to niewygodne. Z reguły badacz wykorzystuje różnorodne syntetyczne wskaźniki (statystyki) mające ilustrowad badaną populację. Gdy opisujemy jakąś skooczoną populację np. wzrost uczniów z klasy IIA (populacja generalna o skooczonej liczbie elementów) mówimy o statystykach z populacji. W przypadku gdy opisujemy jedynie wycinek jakiejś większej, najczęściej niepoliczalnej populacji generalnej, mówimy o statystyce z próby.
6 Estymacja, estymator Chcemy zatem wyznaczyd wartośd pewnej charakterystyki danych populacji na podstawie próby. Wyniki obliczane na próbie chcemy rozciągnąd na populację i wnioskowad o populacji. Opisywana zależnośd nosi nazwę estymacji. Poszczególne statystyki obliczane z próby takie jak np. średnia arytmetyczna z próby jest więc tylko przybliżeniem wartości przeciętnej z populacji m. W związku z tym są nazywane estymatorami.
7
8 SZEREGI STATYSTYCZNE SZEREGI STATYSTYCZNE odpowiednio usystematyzowany i uporządkowany surowy materiał statystyczny. Szeregi statystyczne dzielimy na szeregi: szczegółowe rozdzielcze (punktowe, przedziałowe) czasowe (momentów, okresów)
9 PRZYKŁAD 1 (szereg szczegółowy i szereg rozdzielczy)
10 SZEREG ROZDZIELCZY PUNKTOWY
11 WSKAŹNIK STRUKTURY (w i ) Wskaźnik struktury (inaczej częstośd) nazywany jest też: liczebnością względną, frakcją, odsetkiem. Wylicza się go następująco: Kolumna liczb { wi } nazywana jest rozkładem empirycznym (liczby usterek).
12 SKUMULOWANY WSKAŹNIK STRUKTURY (w i sk ) Skumulowany wskaźnik struktury (inaczej: częstośd skumulowana). Wylicza się go następująco: Kolumna liczb { w i sk } nazywana jest dystrybuantą empiryczną (liczby usterek).
13 ZALECENIA przy grupowaniu w szereg rozdzielczy przedziałowy
14 szereg rozdzielczy przedziałowy - przykład Przedmiotem badania jest czas dojazdu do pracy w dwóch firmach: X i Y.
15 Czas dojazdu pracowników firmy X [w minutach]
16 Czas dojazdu pracowników firmy Y [w minutach]
17 Pogrupuj dane w szeregi rozdzielcze następującej postaci : X Y
18 WSKAŹNIK PODOBIEOSTWA STRUKTUR Wskaźnik podobieostwa struktur (w p ) jest najprostszą miarą statystyczną pozwalającą ocenid podobieostwo kształtowania się badanej cechy w dwóch różnych zbiorowościach. Wyliczamy go następująco:
19 X Y
20 PREZENTACJA GRAFICZNA SZEREGOW STATYSTYCZNYCH HISTOGRAM - wykres słupkowy DIAGRAM - wykres liniowy Oba typy wykresów mogą byd sporządzane w wariantach dla: liczebności liczebności skumulowanej częstości częstości skumulowanej
21 Dla wzrokowego porównania rozkładu badanej cechy w dwóch (lub więcej) zbiorowościach używamy wyłącznie wykresów częstościowych. Dla firmy X wykonad je samodzielnie w domu. O innych typach wykresów poczytad samodzielnie we wskazanych wcześniej rozdziałach.
22 Histogram i diagram częstości dla czasu dojazdu pracowników firmy Y
23 Histogram i diagram częstości skumulowanej dla czasu dojazdu pracowników firmy Y
24 Diagramy częstości dla czasu dojazdu pracowników firm X i Y X Y
25 Statystyka opisowa to: Miary można podzielid na kilka podstawowych kategorii: miary położenia, np. kwantyl oraz miary tendencji centralnej (np. średnia arytmetyczna, średnia geometryczna, średnia harmoniczna, średnia kwadratowa, mediana, moda ) miary zróżnicowania np. (odchylenie standardowe, wariancja, rozstęp, rozstęp dwiartkowy, średnie odchylenie bezwzględne, odchylenie dwiartkowe, współczynnik zmienności ) miary asymetrii (np. współczynnik skośności, współczynnik asymetrii, trzeci moment centralny ) miary koncentracji (np. współczynnik Giniego, kurtoza )
26 Średnia arytmetyczna Średnią arytmetyczną - definiuje się jako sumę wartości cechy mierzalnej podzieloną przez liczbę jednostek skooczonej zbiorowości statystycznej. gdzie: n - liczebnośd zbiorowości próbnej (próby), x i - wariant cechy.
27
28
29
30 Y Należy pamiętad, że przy pogrupowaniu danych źródłowych w szereg rozdzielczy przedziałowy następuje pewna utrata informacji. Jeżeli policzymy średnią dla szeregu szczegółowego lub szeregu rozdzielczego punktowego, to wynik będzie dokładny i taki sam. Dla danych w postaci szeregu rozdzielczego przedziałowego średnia będzie już przybliżeniem. Tym większym, im szersze są przedziały klasowe, im jest ich mniej, itd.
31
32 Ważniejsze własności ŚREDNIEJ arytmetycznej
33 Moda Modalna (dominanta D, moda, wartość najczęstsza) - jest to wartośd cechy statystycznej, która w danym rozdziale empirycznym występuje najczęściej. Dla szeregów szczegółowych oraz szeregów rozdzielczych punktowych modalna odpowiada wartości cechy o największej liczebności (częstości). W szeregach rozdzielczych z przedziałami klasowymi bezpośrednio można określid tylko przedział, w którym modalna występuje, jej przybliżoną wartośd wyznacza się graficznie z histogramu liczebności (częstości) lub ze wzoru interpolacyjnego: gdzie: m - numer przedziału (klasy), w którym występuje modalna, - dolna granica przedziału, w którym występuje modalna, n m - liczebność przedziału modalnej, tzn. klasy o numerze m, n m-1 ; n m+1 - liczebność klas poprzedzającej i następnej, o numerach m -1 i m + 1, h m - rozpiętość przedziału klasowego, w którym występuje modalna.
34 Modalna (Mo) zwana też dominantą (D) jest to wartośd cechy, która występuje najczęściej w badanej zbiorowości.
35 Y Y
36 Y Y
37 Y
38 Modalna możemy wyznaczyd graficznie tak jak to pokazano na rysunku
39 Modalną wyznaczamy i sensownie interpretujemy tylko wtedy, gdy dane są pogrupowane w szereg rozdzielczy (punktowy lub przedziałowy). 2. Liczebnośd populacji powinna byd dostatecznie duża. 3. Diagram lub histogram liczebności (częstości) ma wyraźnie zaznaczone jedno maksimum (rozkład jednomodalny). 4. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy modalna nie występuje w skrajnych przedziałach (pierwszym lub ostatnim) - przypadek skrajnej asymetrii. Nie da się w takim przypadku analitycznie wyznaczyd modalnej. 5. Dla danych pogrupowanych w szereg rozdzielczy przedziałowy przedział modalnej oraz dwa sąsiednie przedziały (poprzedzający i następujący po przedziale modalnej) powinny mied taką samą rozpiętośd.
40 Miary pozycyjne Kwantyle - definiuje się jako wartości cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowośd na określone części pod względem liczby jednostek, części te pozostają do siebie w określonych proporcjach. Kwartyl pierwszy Q 1 dzieli zbiorowośd na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q 1, a 75% równe bądź wyższe od tego kwartyla. Kwartyl drugi (mediana Me) dzieli zbiorowośd na dwie równe części; połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od Me; stąd nazwa wartość środkowa. Kwartyl trzeci Q 3 dzieli zbiorowośd na dwie części w ten sposób, że 75% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q 3, a 25% równe bądź wyższe od tego kwartyla. Decyle np. decyl pierwszy oznacza, że 10% jednostek ma wartości cechy mniejsze bądź równe od decyla pierwszego, a 90% jednostek wartości cechy równe lub większe od decyla pierwszego.
41 Kwartyle to takie wartości cechy X, które dzielą zbiorowośd na cztery równe części pod względem liczebności (lub częstości). Części te pozostają w określonych proporcjach do siebie. Aby dokonywad takiego podziału zbiorowośd musi byd uporządkowana według rosnących wartości cechy X. Każdy kwartyl dzieli zbiorowośd na dwie części, które pozostają do siebie w następujących proporcjach. I tak: kwartyl 1 (QI) - 25% z lewej i 75% populacji z prawej strony kwartyla, kwartyl 2 (QII) - 50% z lewej i 50% populacji z prawej strony kwartyla, kwartyl 3 (QIII) - 75% z lewej i 25% populacji z prawej strony kwartyla.
42 Mediana Mediana (Me) - wartośd środkowa, inaczej: kwartyl 2 (QII). Jest to taka wartośd cechy X, która dzieli zbiorowośd na dwie równe części, tj. połowa zbiorowości charakteryzuje się wartością cechy X mniejszą lub równą medianie, a druga połowa większą lub równą. Mediana dla szeregu szczegółowego Szereg musi byd posortowany rosnąco!!! Wartośd mediany wyznacza się inaczej gdy liczebnośd populacji (n) jest nieparzysta, a inaczej gdy jest parzysta.
43
44
45
46
47 Y Y
48 Y Y
49 Kwartyl pierwszy i trzeci Dla szeregu szczegółowego kwartyl pierwszy i trzeci wyznacza się w ten sposób, że w dwóch częściach zbiorowości, które powstały po wyznaczeniu mediany, ponownie wyznacza się medianę; mediana w pierwszej części odpowiada kwartylowi pierwszemu, a w drugiej kwartylowi trzeciemu. Dla szeregu rozdzielczego wyznaczenie kwartyli poprzedza się ustaleniem ich pozycji:
50 gdzie: m - numer przedziału (klasy), w którym występuje odpowiadający mu kwartyl, - dolna granica tego przedziału, n m - liczebnośd przedziału, w którym występuje odpowiedni kwartyl, - liczebnośd skumulowana do przedziału poprzedzającego kwartyl, h m - rozpiętośd przedziału klasowego, w którym jest odpowiedni kwartyl.
51 Miary zmienności (rozproszenia, dyspersji) Miary klasyczne wariancja odchylenie standardowe odchylenie przeciętne współczynnik zmienności Miary pozycyjne rozstęp odchylenie dwiartkowe współczynnik zmienności
52 Miary KLASYCZNE Wariancja, odchylenie standardowe, odchylenie przeciętne, współczynnik zmienności (klasyczny) Wariancję (s 2 ) definiuje się jako średnią arytmetyczną kwadratów odchyleo wartości cechy od średniej arytmetycznej zbiorowości. Wariancja jest wielkością mianowaną w kwadracie miana badanej cechy i nie interpretujemy jej. Odchylenie standardowe (s) jest pierwiastkiem kwadratowym z wariancji. Jest ono wielkością mianowaną tak samo jak badana cecha. Odchylenie standardowe określa przeciętne zróżnicowanie badanej cechy od średniej arytmetycznej. Odchylenie przeciętne (d) jest średnią arytmetyczną bezwzględnych odchyleo wartości cechy od jej średniej arytmetycznej. Jest ono wielkością mianowaną tak samo jak badana cecha. Odchylenie przeciętne interpretujemy podobnie jak odchylenie standardowe. Współczynnik zmienności (klasyczny) (Vs lub Vd) jest to iloraz odchylenia standardowego (lub przeciętnego) przez średnia arytmetyczną. Jest to wielkośd niemianowana. Używamy go do porównao zmienności w dwu lub więcej zbiorowościach.
53 Ocena rozproszenia na podstawie obserwacji diagramów Na rysunku pokazano dwa diagramy częstości (1) i (2). Dla uproszczenia miary położenia (średnia, mediana i modalna) są sobie równe i identyczne dla obu zbiorowości. Mniejsze rozproszenie wokół średniej występuje w zbiorowości (1). Diagram jest smuklejszy i wyższy. Większe rozproszenie wokół średniej występuje w zbiorowości (2). Diagram jest bardziej rozłożysty i niższy. Odchylenie standardowe w zbiorowości (1) jest mniejsze niż w zbiorowości (2) s1 < s2
54 Przedział TYPOWYCH wartości cechy (miary klasyczne) Przedział taki ma tą własnośd, że około70% jednostek badanej zbiorowości charakteryzuje się wartością cechy należącą do tego przedziału.
55 Reguła 3 sigma
56 Dla szeregów szczegółowych
57 przykład Weźmy dane o liczbie braków: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4 Jak pamiętamy: n=50
58
59 Dla szeregów rozdzielczych punktowych
60
61 Dla szeregów rozdzielczych przedziałowych
62 czas dojazdu pracowników firmy Y
63 Rozstęp Najprostszą i najbardziej intuicyjną miarą zmienności przypadków w populacji próby jest rozstęp. Rozstęp - różnica pomiędzy wartością maksymalną, a minimalną cechy - jest miarą charakteryzującą empiryczny obszar zmienności badanej cechy. W związku z tym, że przy jego obliczeniu ignoruje się wszystkie dane (za wyjątkiem dwóch wartości - minimalnej i maksymalnej), nie daje on jednak informacji o zróżnicowaniu poszczególnych wartości cechy w zbiorowości.
64 Dla szeregów szczegółowych Weźmy dane z (liczba braków): 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,2, 2, 2, 2, 3, 3, 3, 3, 4, 4
65 Inny przykład Weźmy dane z innego przykładu 10, 10, 10, 12, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 15, 15, 15
66 Dla szeregów rozdzielczych punktowych
67 Dla szeregów rozdzielczych przedziałowych
68 Wariancja Rozstęp możemy uznad jedynie za wstępną miarę zmienności w populacji próby. Zresztą przyjrzyjmy się takiemu przykładowi: Dwa obszary charakteryzują się identycznymi wartościami średnimi badanego parametru i identycznymi wartościami minimalnymi i maksymalnymi, a co za tym idzie identycznymi rozstępami. Jednak już na pierwszy rzut oka widad, że rozrzuty danych wokół wartości przeciętnej w obu przypadkach są skrajnie różne. W obszarze A dane są znacznie bardziej skumulowane przy wartości średniej niż w obszarze B.
69 Wariancja Wariancja - jest to średnia arytmetyczna kwadratów odchyleo poszczególnych wartości cechy od średniej arytmetycznej zbiorowości. szereg szczegółowy szereg rozdzielczy punktowy szereg rozdzielczy z przedziałami klasowymi Wykonując proste przekształcenia algebraiczne, otrzymamy: szereg szczegółowy szereg rozdzielczy
70 Odchylenie standardowe Odchylenie standardowe s - jest to pierwiastek kwadratowy z wariancji. Stanowi miarę zróżnicowania o mianie zgodnym z mianem badanej cechy, określa przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej. Typowy obszar zmienności cechy - około 2/3 wszystkich jednostek badanej zbiorowości statystycznej posiada wartości cechy w tym przedziale:
71 Odchylenie przeciętne Odchylenie przeciętne d - jest to średnia arytmetyczna bezwzględnych odchyleo wartości cechy od średniej arytmetycznej. Określa o ile jednostki danej zbiorowości różnią się średnio, ze względu na wartośd cechy, od średniej arytmetycznej. Pomiędzy odchyleniem przeciętnym i standardowym, dla tego samego szeregu, zachodzi relacja: d < s.
72 Odchylenie ćwiartkowe Q jest to parametr określający odchylenie wartości cechy od mediany. Mierzy poziom zróżnicowania tylko części jednostek; po odrzuceniu 25% jednostek o wartościach najmniejszych i 25% jednostek o wartościach największych. Typowy obszar zmienności cechy:
73 Miary asymetrii wskaźnik skośności współczynnik skośności
74 Rozkłady różnią się między sobą kierunkiem i siła asymetrii (miary klasyczne): dla szeregów symetrycznych jeżeli asymetria prawostronna jeżeli asymetria lewostronna. Wskaźnik skośności - jest to wielkośd bezwzględna wyrażona jako różnica między średnią arytmetyczną, a modalną.
75 Współczynniki skośności (asymetrii) są stosowane w porównaniach, do określenia siły oraz kierunku asymetrii, są to liczby niemianowane, im większa ich wartośd tym silniejsza asymetria. Pozycyjny współczynnik asymetrii określa kierunek i siłę asymetrii jednostek znajdujących się miedzy pierwszym z trzecim kwartylem.
76 Miary koncentracji współczynnik skupienia (koncentracji)(kurtoza) współczynnik koncentracji Lorenza
77 kurtoza Współczynnik skupienia (koncentracji) (kurtoza) K- jest miarą skupienia poszczególnych obserwacji wokół średniej. Im wyższa wartośd współczynnika tym bardziej wysmukła krzywa liczebności, większa koncentracja wartości cech wokół średniej.
78 Jeżeli przyjmiemy, że zbiorowośd ma: rozkład normalny, to: K = 3, rozkład bardziej spłaszczony od normalnego, to: K < 3, rozkład bardziej wysmukły od normalnego, to: K > 3. Stąd:
79 Analiza korelacji
80 Zależności korelacyjne Badając różnego rodzaju zjawiska, np. społeczne, ekonomiczne, psychologiczne, przyrodniczne itp. stwierdzamy niemal zawsze, że każde z nich jest uwarunkowane działaniem innych zjawisk Istnienie związków pomiędzy zjawiskami charakteryzującymi badane zbiorowości bywa często przedmiotem dociekao i eksperymentów naukowych. Przykład: David Buss w publikacji z 2001 roku pt. Psychologia ewolucyjna. Jak wytłumaczyd społeczne zachowania człowieka?, opisał badanie, w którym sprawdzał, czy istnieje związek między szybkością chodzenia a pozycją społeczną. Okazało się, że związek ten jest dośd wyraźny wśród mężczyzn, natomiast w mniejszym stopniu wśród kobiet.
81 Inny przykład: Allison i Cicchetti w pracy Sleep in mammals (Science, 194, 1976) opisali badania przeprowadzone wśród przedstawicieli 62 gatunkach ssaków. Przedmiotem obserwacji (pomiarów) były m.in. następujące charakterystyki: długośd snu w ciągu doby (godz/dobę), maksymalna długości życia (lata), masa ciała (kg), masa mózgu (g), czas trwania ciąży (dni). Cel badania: Ustalenie, czy istnieją jakiekolwiek zależności pomiędzy wymienionymi charakterystykami, a jeśli tak, to jaka jest siła tych zależności.
82 Kolejny przykład: Związek pomiędzy wagą a wzrostem człowieka próbuje się wyrazid za pomocą tzw. wskaźnika BMI (Body Mass Index): Przyjmuje się, że wartośd BMI dla osób z prawidłową masą ciała zawiera się mniej więcej w przedziale 18; 5 BMI < 25. Jednak BMI kształtuje się na poziomie indywidualnym dla konkretnych osób i może znacznie przekraczad wartośd 25. Przykład ten wskazuje, że zależnośd między wagą a wzrostem nie jest ściśle funkcyjna. Podana formuła opisuje tylko w przybliżeniu te zależności.
83 Przy analizie współzależności pomiędzy wzrostem i wagą, nie oczekujemy, aby zależnośd ta była ściśle funkcyjna, tzn. aby istniała jednoznacznie określona funkcja matematyczna y = f (x), podająca wagę y konkretnej osoby z ustalonym wzrostem x. Mimo tego wydaje się, że jakaś zależnośd pomiędzy wagą i wzrostem istnieje. Obserwując obie cechy w dużej zbiorowości osób, dojdziemy do przekonania, że średnia waga jest większa w grupie osób wyższych i na odwrót. Związek między wagą i wzrostem jest przykładem tzw. związku korelacyjnego, w skrócie korelacji. Z korelacją mamy do czynienia wtedy, gdy wraz ze zmianą wartości jednej cechy zmienia się średnia wartośd drugiej cechy.
84
85
86
87 Związek korelacyjny można odkryd obserwując dużą liczbę przypadków. Nie ujawnia się w pojedynczych obserwacjach. Zależnośd korelacyjna może byd prostoliniowa (w skrócie liniowa) lub krzywoliniowa, silna lub słaba. Na podstawie obserwacji wykresu rozproszenia możemy w przybliżeniu ocenid charakter zależności i jej siłę. Potrzebujemy miary, która pomogłaby wyrazid siłę zależności w sposób liczbowy.
88 Załóżmy, że między cechami X i Y występuje zależnośd korelacyjna o charakterze liniowym. Współczynnikiem służącym do pomiaru siły tego związku jest współczynnik korelacji liniowej Pearsona określony wzorem gdzie x; y oznaczają średnie arytmetyczne, natomiast sx ; sy odchylenia standardowe zmiennych odpowiednio X i Y.
89 Współczynnik r korelacji liniowej Pearsona Współczynnik r korelacji liniowej Pearsona przyjmuje zawsze wartości z przedziału [-1; 1]. Znak współczynnika informuje o kierunku korelacji (liniowa ujemna lub liniowa dodatnia). Wartośd bezwzględna r informuje o sile korelacji liniowej. W szczególnym przypadku, gdy r =1, wówczas mamy do czynienia z korelacją funkcyjną (tzn. zależnośd Y od X można wyrazid za pomocą funkcji Y = ax + b, gdzie a; b są pewnymi stałymi). Współczynnik r mierzy tylko korelację o charakterze prostoliniowym. Gdy r = 0, wówczas mówimy, że nie ma korelacji liniowej (ale może byd krzywoliniowa).
90
91 Wyniki badao ssaków Kilka wybranych uwag podsumowania: wszystkie cechy są ze sobą wzajemnie powiązane (w mniejszym lub większym stopniu), można zauważyd silną, dodatnią korelację liniową między masą mózgu i ciała, umiarkowana, ujemna korelacja liniowa między czasem snu a czasem życia, dośd silna korelacja (dodatnia lub ujemna) czasu ciąży z innymi zmiennymi, Pytanie: Jak opisad zależnośd np. czasu ciąży od wszystkich pozostałych zmiennych jednocześnie? Odpowiedzi dostarcza analiza regresji.
92 współczynnik korelacji rang Spearmana Jednym ze współczynników korelacji obliczanych dla danych rangowych jest, określony wzorem gdzie Własności: Współczynnik r S przyjmuje wartości z przedziału [-1; 1]. Wartośd r S = 1 oznacza, że istnieje całkowita zgodnośd uporządkowao wg rang a i i b i. Wartośd r S = -1 oznacza z kolei pełną przeciwstawnośd uporządkowao między rangami. Wartośd r S = 0 oznacza brak korelacji rang.
93 przykład Przypuśdmy, że porządkujemy 4 studentów w zależności od stopnia ich zdolności matematycznych, zaczynając od studenta najlepszego, któremu przydzielamy numer 1, a koocząc na studencie najsłabszym, któremu przydzielamy numer 4 (ocenę zdolności powierzamy np. ekspertowi) Mówimy wówczas, że studenci zostali uporządkowani w kolejności rang, a numer studenta jest jego rangą. Oznaczmy rangi poszczególnych studentów przez a i. Przykładowo, niech: a1 = 4; a2 = 2; a3 = 3; a4 = 1; co oznacza, że w badanej grupie, ustawionej w kolejności alfabetycznej, pierwszy student (oznaczmy go umownie literą A) jest najsłabszy, student B dobry, student C słaby, a student D najlepszy.
94 Załóżmy, że w podobny sposób uporządkowaliśmy tych samych studentów z punktu widzenia ich zdolności muzycznych. Niech b i będą rangami poszczególnych studentów: b1 = 2; b2 = 1; b3 = 3; b4 = 4 W ten sposób każdemu studentowi przyporządkowaliśmy po dwie rangi a i oraz b i. Pytanie: Jak na tej podstawie możemy ocenid, czy istnieje zależnośd między zdolnościami matematycznymi oraz muzycznymi w badanej grupie. Innymi słowy, jak ocenid stopie o zgodności (lub niezgodności) rang a i ; b i? Uwaga: W przypadku danych rangowych nie możemy zastosowad współczynnika korelacji Pearsona
95
96 korelacyjny wykres rozrzutu (korelogram) rodzaje zależności (brak, nieliniowa, liniowa) pomiar siły zależności liniowej (współczynnik korelacji Pearsona, współczynnik korelacji rang Spearmana) liniowa funkcja regresji
97 Badamy jednostki statystyczne pod katem dwóch różnych cech - cechy X oraz cechy Y. Pytanie jakie sobie stawiamy to: czy istnieje zależnośd pomiędzy cecha X i cecha Y? Jeżeli taka zależnośd istnieje, to poszukujemy odpowiedzi na kolejne pytania: jaki jest charakter tej zależności oraz jaka jest jej siła?
98 Zależnośd korelacyjna pomiędzy cechami X i Y charakteryzuje sie tym, że wartościom jednej cechy są przyporządkowane ściśle określone wartości średnie drugiej cechy.
99 Jeżeli otrzymamy bezładny zbiór punktów, który nie przypomina kształtem wykresu znanego związku funkcyjnego, to powiemy że pomiędzy cechami X i Y nie ma zależności. Gdy smuga punktów układa sie w kształt paraboli, powiemy, że istnieje zależnośd pomiędzy cechami X i Y i jest to związek nieliniowy; zależnośd nieliniowa. Gdy smuga punktów układa sie wzdłuż linii prostej, powiemy, że istnieje zależnośd pomiędzy cechami X i Y i jest to związek liniowy; zależnośd liniowa.
100 Pomiar KIERUNKU i SIŁY zależności liniowej. Szeregi szczegółowe Współczynnik korelacji (Pearsona) r xy obliczamy dla cech ilościowych wg następującego wzoru: gdzie: C(X,Y) kowariancja pomiędzy cechami X i Y s x (s y ) odchylenie standardowe cechy X (cechy Y)
101 INTERPRETACJA współczynnika korelacji r xy Znak współczynnika r xy mówi nam o kierunku zależności. I tak: znak plus zależnośd liniowa dodatnia, tzn. wraz ze wzrostem wartości jednej cechy rosną średnie wartości drugiej z cech, znak minus zależnośd liniowa ujemna, tzn. wraz ze wzrostem wartości jednej cechy maleją średnie wartości drugiej z cech.
102 Siła zależności Wartośd bezwzględna współczynnika korelacji, czyli r xy, mówi nam o sile zależności. Jeżeli wartośd bezwzględna r xy : jest mniejsza od 0,2, to praktycznie brak związku liniowego pomiędzy badanymi cechami, 0,2 0,4 - zależnośd liniowa wyraźna, lecz niska, 0,4 0,7 - zależnośd liniowa umiarkowana, 0,7 0,9 - zależnośd liniowa znacząca, powyżej 0,9 - zależnośd liniowa bardzo silna
103 przykład W grupie 7 studentów badano zależnośd pomiędzy ocena z egzaminu ze statystyki (Y), a liczba dni poświęconych na naukę (X).
104 Widad tutaj wyraźną zależnośd liniową (dodatnia). Obliczamy współczynnik korelacji (Pearsona). UWAGA! Liczebnośd populacji jest mała (n=7). Użyjemy tak małego przykładu tylko dlatego, aby sprawnie zilustrowad procedurę liczenia.
105
106
107 Współczynnik korelacji rang (Spearmana) Współczynnik korelacji rang (Spearmana) używamy w przypadku gdy: r S 1. chod jedna z badanych cech jest cecha jakościowa (niemierzalna), ale istnieje możliwośd uporządkowania (ponumerowania) wariantów każdej z cech; 2. cechy maja charakter ilościowy (mierzalny), ale liczebnośd zbiorowości jest mała (n<30). Numery jakie nadajemy wariantom cech noszą nazwę rang.
108 uwagi UWAGA! W procesie nadawania rang stymulanty porządkujemy malejąco, a destymulanty rosnąco. UWAGA! W procesie nadawania rang może zdarzyd się więcej niż 1 jednostka o takiej samej wartości cechy (np. k jednostek). Wówczas należy na chwile nadad tym jednostkom kolejne rangi. Następnie należy zsumowad takie rangi i podzielid przez k (otrzymamy w ten sposób średnią rangę dla tej grupy k jednostek). W ostateczności każda jednostka z tych k jednostek otrzyma identyczna rangę (średnia dla danej grupy k jednostek).
109 Współczynnik korelacji rang (Spearmana) r S wyznaczamy wg następującego wzoru: di różnica pomiędzy rangami dla cechy X i cechy Y Współczynnik korelacji rang (Spearmana) r S spełnia zawsze warunek: INTERPRETACJA Analogiczna jak dla współczynnika korelacji (Pearsona).
110 Wartośd współczynnika korelacji rang (Spearmana) potwierdza bardzo silna, dodatnia (znak plus) zależnośd pomiędzy czasem nauki (X), a uzyskana ocena (Y). przykład Dla danych z przykładu 1 obliczenia współczynnika korelacji rang (Spearmana) są następujące:
111 Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem związków i zależności pomiędzy rozkładami dwu lub więcej badanych cech w populacji generalnej. Termin regresja dotyczy kształtu zależności pomiędzy cechami. Dzieli się na analizę regresji liniowej i nieliniowej. W przypadku analizy nieliniowej, graficzną reprezentacją współzależności są krzywe wyższego rzędu np. parabola. Pojęcie korelacji dotyczy siły badanej współzależności. Analiza regresji i korelacji może dotyczyd dwóch i większej ilości zmiennych (analiza wieloraka). W tym miejscu zajmowad się będziemy jedynie najprostszym przypadkiem regresji prostoliniowej dwóch zmiennych.
112 Zapamiętad Co to jest korelacja, jakie są jej własności? Kiedy stosowad korelację rang Spearmana a kiedy Pearsona? Kiedy korelacja jest dodatnia / ujemna? Jak opisywad dany zbiór danych (jakie wskaźniki)? Jak zrobid wykres częstości?
POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.
[1] POJĘCIA WSTĘPNE STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych. BADANIE STATYSTYCZNE - ogół prac mających na celu poznanie struktury określonej
Bardziej szczegółowoStatystyczne metody analizy danych
Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezińska Definicje Statystyka (ang.statistics) - to nauka zajmująca się zbieraniem, prezentowaniem i analizowaniem
Bardziej szczegółowoWykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy
Wykład Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy Zbiorowość statystyczna - zbiór elementów lub wyników jakiegoś procesu powiązanych ze sobą logicznie (tzn. posiadających wspólne cechy
Bardziej szczegółowoStatystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41
Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna
Bardziej szczegółowoMIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy
MIARY POŁOŻENIA Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji
Bardziej szczegółowoStatystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40
Statystyka Wykład 5 Magdalena Alama-Bućko 26 marca 2018 Magdalena Alama-Bućko Statystyka 26 marca 2018 1 / 40 Uwaga Gdy współczynnik zmienności jest większy niż 70%, czyli V s = s x 100% > 70% (co świadczy
Bardziej szczegółowoStatystyczne metody analizy danych. Agnieszka Nowak - Brzezińska
Statystyczne metody analizy danych Agnieszka Nowak - Brzezińska SZEREGI STATYSTYCZNE SZEREGI STATYSTYCZNE odpowiednio usystematyzowany i uporządkowany surowy materiał statystyczny. Szeregi statystyczne
Bardziej szczegółowoCharakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące
Bardziej szczegółowoStatystyka. Opisowa analiza zjawisk masowych
Statystyka Opisowa analiza zjawisk masowych Typy rozkładów empirycznych jednej zmiennej Rozkładem empirycznym zmiennej nazywamy przyporządkowanie kolejnym wartościom zmiennej (x i ) odpowiadających im
Bardziej szczegółowo1 Podstawy rachunku prawdopodobieństwa
1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej
Bardziej szczegółowo-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak
Wzory dla szeregu szczegółowego: Wzory dla szeregu rozdzielczego punktowego: ->Średnia arytmetyczna ważona -> Średnia arytmetyczna (5) ->Średnia harmoniczna (1) ->Średnia harmoniczna (6) (2) ->Średnia
Bardziej szczegółowoMiary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej
Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej cechy. Średnia arytmetyczna suma wartości zmiennej wszystkich
Bardziej szczegółowoStatystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA
Statystyka opisowa PRZEDMIOT: PODSTAWY STATYSTYKI PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA Statystyka opisowa = procedury statystyczne stosowane do opisu właściwości próby (rzadziej populacji) Pojęcia:
Bardziej szczegółowo1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:
Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.
Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Zadania analityczne (1) Analiza przewiduje badanie podobieństw
Bardziej szczegółowoW kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:
Na dzisiejszym wykładzie omówimy najważniejsze charakterystyki liczbowe występujące w statystyce opisowej. Poszczególne wzory będziemy podawać w miarę potrzeby w trzech postaciach: dla szeregu szczegółowego,
Bardziej szczegółowoStatystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski
Literatura STATYSTYKA OPISOWA A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu
Bardziej szczegółowoW1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Bardziej szczegółowoSTATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)
STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Praca z danymi zaczyna się od badania rozkładu liczebności (częstości) zmiennych. Rozkład liczebności (częstości) zmiennej to jakie wartości zmienna
Bardziej szczegółowoStatystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33
Statystyka Wykład 4 Magdalena Alama-Bućko 19 marca 2018 Magdalena Alama-Bućko Statystyka 19 marca 2018 1 / 33 Analiza struktury zbiorowości miary położenia ( miary średnie) miary zmienności (rozproszenia,
Bardziej szczegółowoStatystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34
Statystyka Wykład 2 Magdalena Alama-Bućko 5 marca 2018 Magdalena Alama-Bućko Statystyka 5 marca 2018 1 / 34 Banki danych: Bank danych lokalnych : Główny urzad statystyczny: Baza Demografia : https://bdl.stat.gov.pl/
Bardziej szczegółowoPodstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na
Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony zbiór jednostek, które
Bardziej szczegółowo1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:
Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,
Bardziej szczegółowoPróba własności i parametry
Próba własności i parametry Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony
Bardziej szczegółowoStatystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39
Statystyka Wykład 2 Magdalena Alama-Bućko 27 lutego 2017 Magdalena Alama-Bućko Statystyka 27 lutego 2017 1 / 39 Banki danych: Bank danych lokalnych : Główny urzad statystyczny: https://bdl.stat.gov.pl/
Bardziej szczegółowoSTATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)
STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Dla opisania rozkładu badanej zmiennej, korzystamy z pewnych charakterystyk liczbowych. Dzielimy je na cztery grupy.. Określenie przeciętnej wartości
Bardziej szczegółowoPo co nam charakterystyki liczbowe? Katarzyna Lubnauer 34
Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34 Def. Charakterystyki liczbowe to wielkości wyznaczone na podstawie danych statystycznych, charakteryzujące własności badanej cechy. Klasyfikacja
Bardziej szczegółowoPlan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii
Plan wykładu Statystyka opisowa Dane statystyczne miary położenia miary rozproszenia miary asymetrii Statystyka matematyczna Podstawy estymacji Testowanie hipotez statystycznych Żródła Korzystałam z ksiażek:
Bardziej szczegółowoMiary statystyczne w badaniach pedagogicznych
Miary statystyczne w badaniach pedagogicznych Szeregi statystyczne Szczegółowy - gdzie materiał uporządkowany jest rosnąco lub malejąco Rozdzielczy - gdzie poszczególnym wariantom zmiennej przyporządkowane
Bardziej szczegółowoStatystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl
Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych
Bardziej szczegółowoStatystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt
Statystyka matematyczna dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt Zasady zaliczenia przedmiotu: część wykładowa Maksymalna liczba punktów do zdobycia 40. Egzamin będzie
Bardziej szczegółowoStatystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28
Statystyka Wykład 3 Magdalena Alama-Bućko 6 marca 2017 Magdalena Alama-Bućko Statystyka 6 marca 2017 1 / 28 Szeregi rozdzielcze przedziałowe - kwartyle - przypomnienie Po ustaleniu przedziału, w którym
Bardziej szczegółowoStatystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),
Statystyka zbiór przetworzonych i zsyntetyzowanych danych liczbowych, nauka o ilościowych metodach badania zjawisk masowych, zmienna losowa będąca funkcją próby. Podstawowe pojęcia: populacja (zbiorowość
Bardziej szczegółowoWykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia
Wykład 2 Statystyka opisowa - Miary rozkładu: Miary położenia Podział miar Miary położenia (measures of location): 1. Miary tendencji centralnej (measures of central tendency, averages): Średnia arytmetyczna
Bardziej szczegółowoStatystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład I, 22.02.2016 STATYSTYKA OPISOWA, cz. I Kwestie techniczne Kontakt: ajanicka@wne.uw.edu.pl Dyżur: strona z materiałami z przedmiotu: wne.uw.edu.pl/azylicz akson.sgh.waw.pl/~aborata
Bardziej szczegółowoParametry statystyczne
I. MIARY POŁOŻENIA charakteryzują średni lub typowy poziom wartości cechy, wokół nich skupiają się wszystkie pozostałe wartości analizowanej cechy. I.1. Średnia arytmetyczna x = x 1 + x + + x n n = 1 n
Bardziej szczegółowoWykład 5: Statystyki opisowe (część 2)
Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz
Bardziej szczegółowoWykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.
Wykład 3. Opis struktury zbiorowości 1. Parametry opisu rozkładu badanej cechy. 2. Miary połoŝenia rozkładu. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle. W praktycznych zastosowaniach bardzo często
Bardziej szczegółowoAnaliza struktury i przeciętnego poziomu cechy
Analiza struktury i przeciętnego poziomu cechy Analiza struktury Pod pojęciem analizy struktury rozumiemy badanie budowy (składu) określonej zbiorowości, lub próby, tj. ustalenie, z jakich składa się elementów
Bardziej szczegółowoStatystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl
Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych
Bardziej szczegółowoSTATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;
STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych; - badanie skuteczności nowego leku; - badanie stopnia zanieczyszczenia gleb metalami
Bardziej szczegółowoAnaliza współzależności zjawisk. dr Marta Kuc-Czarnecka
Analiza współzależności zjawisk dr Marta Kuc-Czarnecka Wprowadzenie Prawidłowości statystyczne mają swoje przyczyny, w związku z tym dla poznania całokształtu badanego zjawiska potrzebna jest analiza z
Bardziej szczegółowoSTATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE
STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE CECHY mogą być: jakościowe nieuporządkowane - skala nominalna płeć, rasa, kolor oczu, narodowość, marka samochodu,
Bardziej szczegółowoStatystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35
Statystyka Wykład 7 Magdalena Alama-Bućko 16 kwietnia 2017 Magdalena Alama-Bućko Statystyka 16 kwietnia 2017 1 / 35 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Bardziej szczegółowoPodstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.
Podstawy Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna. Funkcja informacyjna umożliwia pełny i obiektywny obraz badanych zjawisk Funkcja analityczna umożliwia określenie czynników
Bardziej szczegółowoWIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY Liczebności i częstości Liczebność liczba osób/respondentów/badanych, którzy udzielili tej konkretnej odpowiedzi. Podawana w osobach. Częstość odsetek,
Bardziej szczegółowoOpisowa analiza struktury zjawisk statystycznych
Statystyka Opisowa z Demografią oraz Biostatystyka Opisowa analiza struktury zjawisk statystycznych Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2
Bardziej szczegółowoWykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.
Wykład 5. Opis struktury zbiorowości 1. Miary asymetrii. 2. Miary koncentracji. Przykład Zbadano stawkę godzinową (w zł) pracowników dwóch branŝ, otrzymując następujące charakterysty ki liczbowe: Stawka
Bardziej szczegółowoSTATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP
STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 12 listopada 2017 1 Analiza współzależności dwóch cech 2 Jednostka zbiorowości - para (X,Y ). Przy badaniu korelacji nie ma znaczenia, która
Bardziej szczegółowoPozyskiwanie wiedzy z danych
Pozyskiwanie wiedzy z danych dr Agnieszka Goroncy Wydział Matematyki i Informatyki UMK PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO Pozyskiwanie wiedzy
Bardziej szczegółowoStatystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR
Statystyka Opisowa WK1.2017 Andrzej Pawlak Intended Audience: PWR POJĘCIA STATYSTYKI 1. Zbiór danych liczbowych pokazujących kształtowanie się określonych zjawisk i procesów (roczniki statystyczne). 2.
Bardziej szczegółowoSTATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoStatystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38
Statystyka Wykład 8 Magdalena Alama-Bućko 23 kwietnia 2017 Magdalena Alama-Bućko Statystyka 23 kwietnia 2017 1 / 38 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Bardziej szczegółowoStatystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski
STATYSTYKA OPISOWA Literatura A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu
Bardziej szczegółowoWskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii
Miary asymetrii Miary asymetrii (skośności) określają kierunek rozkładu cech zmiennych w zbiorowości (rozkład może być symetryczny lub asymetryczny lewostronnie lub prawostronnie) oraz stopień odchylenia
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoĆwiczenia 1-2 Analiza rozkładu empirycznego
Ćwiczenia 1-2 Zadanie 1. Z kolokwium z ekonometrii studenci otrzymali następujące oceny: 5 osób dostało piątkę, 20 os. dostało czwórkę, 10 os. trójkę, a 3 osoby nie zaliczyły tego kolokwium. Należy w oparciu
Bardziej szczegółowo4.2. Statystyczne opracowanie zebranego materiału
4.2. Statystyczne opracowanie zebranego materiału Zebrany i pogrupowany materiał badawczy należy poddać analizie statystycznej w celu dokonania pełnej i szczegółowej charakterystyki interesujących badacza
Bardziej szczegółowoMiary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018
STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 6 marca 2018 1 pozwalaja określić, czy jednostki zbiorowości maja tendencje do skupiania się przy niskich wartościach cechy (tzw. asymetria
Bardziej szczegółowoAnaliza zróżnicowania, asymetrii i koncentracji
Analiza zróżnicowania, asymetrii i koncentracji Miary zróżnicowania Miary średnie, chociaż reprezentują wszystkie jednostki badanej zbiorowości, nie dają wyczerpującej charakterystyki szeregu statystycznego,
Bardziej szczegółowoSTATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)
STATYSTYKA wykłady L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 17) I. (08.X) 1. Statystyka jest to nauka zajmująca się metodami ilościowymi badania prawidłowości
Bardziej szczegółowoSTATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2
STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 Statystyka zbiór przetworzonych i zsyntetyzowanych danych liczbowych, nauka o ilościowych metodach
Bardziej szczegółowoStatystyka opisowa. Wykład I. Elementy statystyki opisowej
Statystyka opisowa. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Elementy statystyku opisowej 1 Elementy statystyku opisowej 2 3 Elementy statystyku opisowej Definicja Statystyka jest to nauka o
Bardziej szczegółowoPopulacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Bardziej szczegółowoKARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4
KARTA KURSU (do zastosowania w roku ak. 2015/16) Nazwa Statystyka 1 Nazwa w j. ang. Statistics 1 Kod Punktacja ECTS* 4 Koordynator Dr hab. Tadeusz Sozański (koordynator, wykłady) Dr Paweł Walawender (ćwiczenia)
Bardziej szczegółowoStatystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.
Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych. Statystyka zajmuje się prawidłowościami zaistniałych zdarzeń. Teoria prawdopodobieństwa dotyczy przewidywania, jak często mogą zajść
Bardziej szczegółowoMiary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018
STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 6 marca 2018 1 MIARY ZMIENNOŚCI (inaczej: rozproszenia, rozrzutu, zróżnicowania, dyspersji) informuja o zróżnicowaniu jednostek zbiorowości
Bardziej szczegółowoZadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Bardziej szczegółowoStatystyka. Wydział Zarządzania Uniwersytetu Łódzkiego
Statystyka Wydział Zarządzania Uniwersytetu Łódzkiego 2017 Statystyka to nauka zajmująca się badaniem prawidłowości w procesach masowych, to jest takich, które realizują się na dużą skalę (np. procesy
Bardziej szczegółowoWykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
Bardziej szczegółowoStatystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26
Statystyka Wykład 5 Magdalena Alama-Bućko 20 marca 2017 Magdalena Alama-Bućko Statystyka 20 marca 2017 1 / 26 Koncentracja Analiza struktury zbiorowości miary położenia ( miary średnie) miary zmienności
Bardziej szczegółowoStatystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
Bardziej szczegółowoSCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
Bardziej szczegółowoANALIZA KORELACJI I REGRESJI
Szkic wykładu Zależności korelacyjne 1 Zależności korelacyjne 2 Przykłady Zależności korelacyjne Badajac różnego rodzaju zjawiska, np. społeczne, ekonomiczne, psychologiczne, przyrodniczne itp. stwierdzamy
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
Bardziej szczegółowoStatystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31
Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Bardziej szczegółowoAnaliza współzależności zjawisk
Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.
Bardziej szczegółowoKorelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy
Bardziej szczegółowoStatystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36
Statystyka Wykład 7 Magdalena Alama-Bućko 3 kwietnia 2017 Magdalena Alama-Bućko Statystyka 3 kwietnia 2017 1 / 36 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Bardziej szczegółowoPDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Bardziej szczegółowoRok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -
Nazwa modułu: Statystyka opisowa i ekonomiczna Rok akademicki: 2013/2014 Kod: ZIE-1-205-n Punkty ECTS: 6 Wydział: Zarządzania Kierunek: Informatyka i Ekonometria Specjalność: - Poziom studiów: Studia I
Bardziej szczegółowo99 wybranych pytań ze statystyki i odpowiedzi na nie
99 wybranych pytań ze statystyki i odpowiedzi na nie Artykuł pobrano ze strony eioba.pl 1. Podać określenie i przykłady zbiorowości statystycznej, generalnej i próbnej. Zbiorowość generalną stanowią wszystkie
Bardziej szczegółowoPorównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?
1 Zadanie 1.1 W dwóch zakładach produkcyjnych Złomex I i Złomex II, należących do tego samego przedsiębiorstwa Złomowanie na zawołanie w ostatnim miesiącu następująco kształtowały się wynagrodzenia pracowników.
Bardziej szczegółowoRachunek prawdopodobieństwa i statystyka
Rachunek prawdopodobieństwa i statystyka Współczynnik zmienności Klasycznym współczynnikiem (wskaźnikiem) zmienności zmiennej losowej X nazywamy wyrażenie gdzie E(X) 0. v k z (X) = D(X) E(X), Klasyczny
Bardziej szczegółowoBiostatystyka, # 1 /Weterynaria I/
Biostatystyka, # 1 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
Bardziej szczegółowoAnaliza statystyczna w naukach przyrodniczych
Analiza statystyczna w naukach przyrodniczych Po co statystyka? Człowiek otoczony jest różnymi zjawiskami i próbuje je poznać, dowiedzieć się w jaki sposób funkcjonują, jakie relacje między nimi zachodzą.
Bardziej szczegółowoMiary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna
Miary w szeregach 1 Miary klasyczne 1.1 Średnia 1.1.1 Średnia arytmetyczna Zad. 1 średnia dla szeregu rozdzielczego punktowego W tabeli zestawiono wyniki badań czasu wykonania 15 detali. Jest to szereg
Bardziej szczegółowoAnaliza współzależności dwóch cech I
Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych
Bardziej szczegółowoX WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15
X WYKŁAD STATYSTYKA 14/05/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 10 ANALIZA KORELACJI Korelacja 1. Współczynnik korelacji 2. Kowariancja 3. Współczynnik korelacji liniowej definicja 4. Estymacja współczynnika
Bardziej szczegółowoPodstawowe pojęcia statystyczne
Podstawowe pojęcia statystyczne Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny Jean Rigaux Co to jest statystyka? Nauka o metodach ilościowych badania zjawisk
Bardziej szczegółowoWprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 2 1 / 20 MIARY ROZPROSZENIA, Wariancja Wariancją z próby losowej X
Bardziej szczegółowoWykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)
Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Co na dzisiejszym wykładzie: definicje, sposoby wyznaczania i interpretacja STATYSTYK OPISOWYCH prezentacja
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 1 1 / 33 Warunki zaliczenia 1 Ćwiczenia OBOWIĄZKOWE (max. 3 nieobecności) 2 Zaliczenie
Bardziej szczegółowoAgata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.
1 Agata Boratyńska WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne. Agata Boratyńska Wykłady ze statystyki 2 Literatura J. Koronacki i J. Mielniczuk Statystyka WNT 2004
Bardziej szczegółowoStatystyka. Wykład 6. Magdalena Alama-Bućko. 9 kwietnia Magdalena Alama-Bućko Statystyka 9 kwietnia / 36
Statystyka Wykład 6 Magdalena Alama-Bućko 9 kwietnia 2018 Magdalena Alama-Bućko Statystyka 9 kwietnia 2018 1 / 36 Krzywa koncentracji Lorenza w ekonometrii, ekologii, geografii ludności itp. koncentrację
Bardziej szczegółowoEstymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Bardziej szczegółowo