Wybrae litery alfabetu greckiego α alfa β beta Γ γ gamma δ delta ɛ, ε epsilo η eta Θ θ theta κ kappa Λ λ lambda µ mi ν i ξ ksi π pi ρ, ϱ ro σ sigma τ tau Φ φ, ϕ fi χ chi Ψ ψ psi Ω ω omega
Ozaczeia a i = a 1 + a 2 + + a a i = a 1 a 2 a
Statystyka zbiór przetworzoych i zsytetyzowaych daych liczbowych, auka o ilościowych metodach badaia zjawisk masowych, zmiea losowa będąca fukcją próby. Podstawowe pojęcia: populacja (zbiorowość statystycza), jedostka statystycza, próba. Cechy: ilościowe (mierzale), skokowe (dyskrete), ciągłe, jakościowe (iemierzale).
Skale słabe, iemetrycze, jakościowe: omiala (kategoryja, wariatowa): dwudziela (dychotomicza): p. kobieta/mężczyza, tak/ie, 0/1, wielodziela (politomicza): p. kolor, marka, gatuek, porządkowa (ragowa), p. ocey, preferecje, ie/raczej ie/ie mam zdaia/raczej tak/tak sile, metrycze, ilościowe: przedziałowa (iterwałowa), p. temperatura w skali Celsjusza, ilorazowa (stosukowa), p. temperatura w skali Kelvia, zamkięte/otwarte, Zmiea ze skali mociejszej może być rozpatrywaa w skali słabszej, ale ie odwrotie.
Szereg szczegółowy (wyliczający, dae idywiduale) 3590, 1520, 2340, 1460, 1990, 1830, 1830, 1520, 1460, 1990, 2612, 1520, 2340, 2145, 1460, 1830, 1520, 2299, 1460, 1460, 1520, 2145, 1990, 1830, 1990, 1830, 1460, 1460, 1660, 1660, 1830, 1990, 1460, 1520, 1830, 1830, 1460, 1460, 1460, 1460, 1660, 1520, 2340, 1460, 2045, 1520, 2145, 2145, 2299, 1660, 1520, 2340, 1520, 1520, 1460, 2145, 2145, 1460, 1460, 1520, 1460, 1460, 4960, 2612
Szereg rozdzielczy puktowy i x i i 1 1460 18 2 1520 12 3 1660 4 4 1830 8 5 1990 5 6 2045 1 7 2145 6 8 2299 2 9 2340 4 10 2612 2 11 3590 1 12 4960 1 Razem 64
Szereg rozdzielczy przedziałowy x i i 1000 1999 47 2000 2999 15 3000 3999 1 4000 4999 1 x i i miej iż 1500 18 1500 2000 29 2000 2500 13 2500 3000 2 3000 i więcej 2
Empiryczy rozkład cechy wartości cechy: x i, i = 1,..., k, zakładamy dalej, że wartości są uporządkowae rosąco: x mi = x 1 < x 2 < < x k = x max, końce przedziałów klasowych: x 0i < x 1i, rozpiętość przedziału: h i = x 1i x 0i, środek przedziału: ẋ i = x 0i + x 1i. 2 liczebości: i liczba obserwacji o wartościach rówych x i, lub mieszczących się w i-tym przedziale klasowym, liczebość zbiorowości (próby, populacji): = k i, częstości względe: w i = i, k w i = 1,
Miary opisu struktury klasycze, pozycyje, poziomu przeciętego (położeia), zróżicowaia (rozproszeia, dyspersji, zmieości), asymetrii (skośości), kocetracja (spłaszczeia),
Momety Momet zwykły rzędu r: m r = 1 xi r, Momet cetraly rzędu r: M r = 1 (x i x) r, ( m r = 1 ) k xi r i ( M r = 1 ) k (x i x) r i
Średia arytmetycza dla daych idywidualych: x = 1 x i = x 1 + + x, dla szeregów rozdzielczych puktowych: x = 1 k x i i = k x i w i, dla szeregów rozdzielczych przedziałowych: x = 1 k x i i = k x i w i.
Średia arytmetycza - własości: x mi x x max, x i = x, (x i x) = 0 (lub k (x i x) i = 0 lub k ( x i x) i = 0). mi a (x i a) 2 = (x i x) 2. Przykładowe obliczeia: x i i x i x i i (20, 25] 11 22.5 247.5 (25, 30] 23 27.5 632.5 (30, 35] 16 32.5 520.0 Σ 50 1400 x = 1400 50 = 28.
Średia harmoicza Dla wielkości stosukowych czasem zamiast średiej arytmetyczej ależy stosować średią harmoiczą. Chcemy policzyć średią wielkości stosukowych (prędkość, gęstość, wydajość, zużycie a osobę, itp.) a i = b i c i, i = 1,..., k. Jeśli zamy wartości a i oraz c i, to b i = a i c i, zatem odpowiedia jest średia arytmetycza, ważoa współczyikami c i : k b k i a i c i ā = k = c k. i c i Jeśli zamy wartości a i oraz b i, to c i = b i, zaś właściwą średią a i jest średia harmoicza z wagami b i : k b i ā = k b i k c i = k b i a i.
Średia harmoicza - przykład 1 Jaka jest średia gęstość zaludieia w Trójmieście? Miasto Gdańsk Gdyia Sopot Ludość 461 489 247 820 37 654 Gęstość zaludieia 1762 1834 2179 Licząc (zwykłą) średią arytmetyczą otrzymujemy: x = 1762 + 1834 + 2179 3 podczas gdy prawidłowy wyik, to = 1925, x H = 461 489 + 247 820 + 37 654 1802.87. 461 489 1762 + 247 820 1834 + 37 654 2179
Średia harmoicza - przykład 2 Przez kolejych di kupujemy akcje pewej spółki, po ceie x i w i-tym diu, i = 1,...,, za stałą kwotę c. Średia cea zakupu jest średią harmoiczą: c x H = c = 1. x i x i Przez kolejych di sprzedajemy akcje pewej spółki, w liczbie k sztuk każdego dia, po ceie x i w i-tym diu, i = 1,...,. Średia cea sprzedaży, to średia arytmetycza: x i k x i x = =. k Dla dowolych 0 < x 1,..., x zachodzi waruek: x H = 1 x i x i = x.
Wariacja dla daych idywidualych: s 2 = 1 (x i x) 2 = 1 xi 2 ( x) 2, dla szeregów rozdzielczych puktowych: s 2 = 1 k (x i x) 2 i = 1 k xi 2 i ( x) 2, dla szeregów rozdzielczych przedziałowych: s 2 = 1 k ( x i x) 2 i = 1 k x 2 i i ( x) 2, poprawka Shepparda: s 2 = s 2 h2 12,
Wariacja c.d. wariacji ie iterpretujemy!!!, odchyleie stadardowe: s = s 2, współczyik zmieości: V = s x [%], alteratywa odchyleie przecięte: d = 1 x i x ( d = 1 ) k x i x i, rozstęp: R = x max x mi.
Wariacja przykład obliczeń x i i x i x i i ( x i x) 2 ( x i x) 2 i (20, 25] 11 22.5 247.5 30.25 332.75 (25, 30] 23 27.5 632.5 0.25 5.75 (30, 35] 16 32.5 520.0 20.25 324.00 Σ 50 1400 662.50 x = 1400 50 = 28, s 2 = 662.5 = 13.25, 50 s = 13.25 3.64.
Rówość wariacyja mamy iformacje o k grupach: ich liczebości i, średie x i oraz wariacje (wewątrzgrupowe) s 2 i, średia ogóla, to średia ważoa liczebościami: x = k x i i k i. wariacja ogóla wyraża się wzorem: s 2 = si 2 wariacja wewątrzgrupowa: + s 2 ( x i ), gdzie s 2 i = k si 2 i k, i wariacja międzygrupowa: s 2 ( x i ) = k ( x i x) 2 i k i.
Asymetria klasyczy współczyik asymetrii: γ 3 = M 3 s 3, wartości dodatie asymetria prawostroa wartości ujeme asymetria lewostroa
Kurtoza współczyik kurtozy, ekscess: γ 4 = M 4 s 4 3, wartości dodatie rozkład wysmukły (leptokurtyczy) wartości ujeme rozkład spłaszczoy (platokurtyczy)
Krzywa kocetracji Loreza, współczyik Giiego liia łamaa powstała z połączeia puktów o współrzędych: ( j j (x 0, y 0 ) = (0, 0), (x j, y j ) =, z ) i, j = 1,...,. z i dla szeregu rozdzielczego: (x 0, y 0 ) = (0, 0), ( j (x j, y j ) = j i, z ) i i k, j = 1,..., k. z i i podwojoe pole obszaru między krzywą Loreza a przekątą kwadratu jedostkowego azywamy współczyikiem kocetracji Giiego: j=1 (2j 1)z j G = 2. z współczyik Giiego przyjmuje wartości z przedziału [0, 1], gdzie 0 ozacza rozkład rówomiery, a wartość 1 rozkład skupioy w pojedyczej wartości,
j z j j z i x j y j 2j 1 (2j 1)z j 1 1 1 0.2 0.01-4 -4 2 2 3 0.4 0.03-2 -6 3 3 6 0.6 0.06 0 0 4 4 10 0.8 0.10 2 20 5 90 100 1 1 4 400 0.2 0.4 0.6 0.8 G = 4 6 + 20 + 400 5 2 20 = 410 500 = 0.82.
Źródło: e.wikipedia.org, dae: World Bak
Liczebość skumulowaa, dystrybuata empirycza Liczebość skumulowaa: liczba obserwacji ie większa od daej wartości cechy: (x) = {i : x i x} Dystrybuata empirycza: frakcja (część) obserwacji ie większa od daej wartości cechy: F (x) = {i : x i x} i w i = (x).
Liczba Liczebość Częstość Skumulowaa Dystrybuata zadań względa liczebość empirycza x i i w i (x i ) F (x i ) 0 7 0.175 7 0.175 1 14 0.35 21 0.525 2 6 0.15 27 0.675 3 9 0.225 36 0.900 4 4 0.1 40 1 5 0 0 40 1 Suma 40 1
Mediaa wartość środkowa Mediaą z próby Me azywamy taką wartość, że co ajmiej połowa obserwacji ma wartość ie większą iż Me i rówocześie co ajmiej połowa obserwacji ma wartość ie miejszą iż Me. Iaczej: jest to ajmiejsza wartość, dla której F (Me) 1 2 lub rowoważie (Me) 2. dla szeregów szczegółowych: x ( +1 2 ) Me = x ( 2) + x ( +1) 2 2 gdy jest ieparzyste, gdy jest parzyste.
Kwatyle, kwartyle kwatylem empiryczym rzędu p, gdzie 0 < p < 1, azywamy ajmiejszą wartość q p cechy, dla której zachodzi: F (q p ) p. dla szeregów szczegółowych, p.: q p = x ( p +1), dla szeregów przedziałowych kwatyle aproksymujemy wzorem q p x 0p + [p (x 0p )] hp p p rząd kwatyla, (x 0p ) liczebość skumulowaa w przedziale poprzedzającym przedział kwatyla, x0p dola graica przedziału kwatyla: (x 0p ) < p (x 1p ), p liczebość przedziału kwatyla, hp szerokość przedziału kwatyla, kwartyle: Q 1 = q 0.25, Q 2 = Me = q 0.5, Q 3 = q 0.75,
1 x i i F (x i ) (20, 25] 11 0.22 (25, 30] 23 0.68 (30, 35] 16 1 0.75 0.5 0.25 20 25 30 35 Q 1 = 25 + [0.25 0.22] 50 5 23 25.33, Me = 25 + [0.5 0.22] 50 5 23 28.04, Q 3 = 30 + [0.75 0.68] 50 5 16 31.09.
Domiata Domiatą (modą, modalą) azywamy wartość zmieej, która występuje ajczęściej, moża wyzaczać tylko w rozkładach jedomodalych, w szeregach szczegółowych i puktowych jest to wartość cechy odpowiadająca ajwiększej liczebości, w szeregach przedziałowych aproksymujemy ją wzorem: D x 0D + D D 1 ( D D 1 ) + ( D D+1 ) h D, x 0D dola graica przedziału domiaty (o ajwiększej liczebości), D, D 1, D+1 odpowiedio liczebość przedziału domiaty, przedziału poprzediego i astępego, hd rozpiętość przedziału domiaty. Wzór Pearsoa : Me 1 3 D + 2 3 x.
25 x i i (20, 25] 11 (25, 30] 23 (30, 35] 16 20 15 10 5 20 25 D 30 35 D = 25 + 23 11 (23 11) + (23 16) 5 28.16. Uwaga: w przypadku przedziałów o różej szerokości liczebości i zastępujemy gęstościami: g i = i /h i.
Pozycyje miary rozproszeia odchyleie ćwiartkowe: Q = Q 3 Q 1, 2 pozycyjy współczyik zmieości: V = Q Me, rozstęp ćwiartkowy (międzykwartylowy): IQR = Q 3 Q 1,
Pozycyje miary asymetrii współczyik Yule a-kedalla (Bowleya): A Q = (Q 3 Q 2 ) (Q 2 Q 1 ) (Q 3 Q 2 ) + (Q 2 Q 1 ), współczyik skośości Pearsoa: A s = x D. s