Statystyka. Katarzyna Chudy Laskowska



Podobne dokumenty
Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

W1. Wprowadzenie. Statystyka opisowa

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Wykład ze statystyki. Maciej Wolny

Statystyka. Opisowa analiza zjawisk masowych

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Parametry statystyczne

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka Matematyczna Anna Janicka

Statystyczne metody analizy danych

Próba własności i parametry

1 Podstawy rachunku prawdopodobieństwa

Podstawowe pojęcia statystyczne

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Opisowa analiza struktury zjawisk statystycznych

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka matematyczna i ekonometria

Miary statystyczne w badaniach pedagogicznych

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Pozyskiwanie wiedzy z danych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka w pracy badawczej nauczyciela

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Analiza struktury i przeciętnego poziomu cechy

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Wykład 5: Statystyki opisowe (część 2)

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Wykład 4: Statystyki opisowe (część 1)

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Biostatystyka, # 1 /Weterynaria I/

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

4.2. Statystyczne opracowanie zebranego materiału

Analiza zróżnicowania, asymetrii i koncentracji

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Statystyka opisowa SYLABUS A. Informacje ogólne

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

You created this PDF from an application that is not licensed to print to novapdf printer (

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Zakład Ubezpieczeń Społecznych Departament Statystyki. Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2010 roku.

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Statystyka opisowa. Robert Pietrzykowski.

Statystyki opisowe i szeregi rozdzielcze

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, mgr

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Graficzna prezentacja danych statystycznych

Opis przedmiotu: Probabilistyka I

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Transkrypt:

Statystyka Katarzyna Chudy Laskowska http://kc.sd.prz.edu.pl/

1. ORGANIZACJA ZAJĘĆ 15 h WYKŁADÓW 15 h LABORATORIÓW Program komputerowy: Statistica PL 8.1 (wydział posiada licencję, która uprawnia studentów do korzystania z programu na komputerach domowych) Warunki zaliczenia przedmiotu: 1. Obecność na zajęciach (dotyczy laboratoriów i wykładów) 2. Laboratoria (dotyczą umiejętności praktycznych wykonywanie zadań i ich interpretacja) kończą się zaliczeniem przy komputerze (zaliczenie sprawdza umiejętność interpretacji zagadnień statystycznych). Zaliczenie laboratoriów jest warunkiem dopuszczającym do egzaminu 2. Uzyskanie pozytywnej oceny z egzaminu (egzamin w formie pisemnej sprawdza umiejętność rachowania podstawowych zagadnień statystycznych oraz interpretację. 2

2. WPROWADZENIE W TEMATYKĘ ZAJĘĆ 1. Krótki rys historyczny. 2. Podstawowe pojęcia. 3. Statystyki opisowe. (miary położenia, zmienności, asymetrii i koncentracji) 4. Badanie zależności pomiędzy cechami statystycznymi. (korelacja, test chi kwadrat niezależności Pearsona, test ANOVA) 5. Weryfikacja hipotez statystycznych (parametrycznych i nieparametrycznych). 6. Rozkłady zmiennych (ciągłe i dyskretne), prawdopodobieństwo, elementy kombinatoryki.

3. LITERATURA Podstawowe podręczniki: 1. Ostasiewicz S., Rusnak Z., Siedlecka U. Statystyka elementy teorii i zadania, AE Wrocław 1999 2. Sobczyk M., Statystyka Wydawnictwo PWN, Warszawa 1998 3. Szwed R. Metody statystyczne w badaniach społecznych, Wydawnictwo KUL, Lublin 2009 Literatura uzupełniająca 1. Aczel D.A., Statystyka w zarządzaniu, PWN, Warszawa 2000. 2. Koronacki J., Mielniczuk J., Statystyka dla studentów kierunków technicznych i przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa 2000. 3. Stanisz A., Przystępny kurs statystyki z wykorzystaniem pakietu Statistica PL na przykładzie danych z medycyny. Tom I i II. StatSoft Polska, Kraków 2000. 4. Zając K. Zarys metod statystycznych,pwe, Warszawa, 1982 5. Luszniewicz A., Słaby T. Statystyka stosowana, PWE, Warszawa, 1997

Statystyka status (łac. państwo) stato (wł. państwo) 4. Trochę historii. SZTUKA NAUKA 2000 lat b.c. spisy ludności i zasobów państw w Egipcie i Chinach 600 lat b.c. spisy ludności w Cesarstwie Rzymskim 300 lat b.c. spisy w Indiach, Grecji, Babilonii, Persji, początkowo charakter słowny później bardziej formalny średniowiecze spisy gospodarcze majątków feudalnych i kościelnych NAUKI O PAŃSTWIE zajmowały się gromadzeniem danych liczbowych i opisem stanu państwa na podstawie tych danych XVI wiek - Włochy G. Botero XVII wiek -Niemcy H. Conrig G. Achenwall tabelaryczne zestawienia XVII/XVIII Rosja K. Kigiłow ARYTMETYKA POLITYCZNA rozumowanie na podstawie liczb umożliwiające wykrycie prawidłowości wśród pozornie chaotycznych zjawiskach masowych XVII wiek Anglia J. Graunt W. Petty 1662 statystyka dyscyplina naukowa ukazała się praca Graunta o śmiertelności XIX w. (1834) włączona jako sekcja do Brytyjskiego Towarzystwa Postępu Nauki

5. PODZIAŁ Statystyka współczesna podstawą statystyki współczesnej jest teoria rachunku prawdopodobieństwa, która wyjaśnia, w jakich warunkach ujawniają się prawidłowości w zjawiskach masowych. Prace arytmetyków politycznych oraz matematyków, rozwijających rachunek prawdopodobieństwa doprowadziły do powstania nowego działu statystyki, jakim jest statystyka matematyczna. Statystyka opisowa Wnioskowanie statystyczne zajmuje się gromadzeniem, opracowaniem i prezentacją danych o obserwowanej zbiorowości, opisuje zbiorowość przy wykorzystaniu narzędzi statystycznych pozwala określić prawidłowości i scharakteryzować populację generalną za pomocą zredukowanej liczby danych (próby), przy zastosowaniu rachunku prawdopodobieństwa.

6. PODSTAWOWE POJĘCIA Statystyka to zbiór metod służących pozyskiwaniu, prezentacji i analizie danych Statystyka jest bardziej sposobem myślenia lub wnioskowania niż pęczkiem recept na młócenie danych w celu odsłonięcia odpowiedzi. Trzeba ją traktować jako naukę, technikę i sztukę RAO C.R., Statystyka i prawda, PWN, Warszawa 1994 s.64

6. PODSTAWOWE POJĘCIA, POPULACJA STATYSTYCZNA I PRÓBNA Realizując badania statystyczne należy zapoznać się z podstawowymi pojęciami jakie wykorzystywane są na etapie projektowania badań i doboru metod ich analizy. Zbiorowość statystyczna (populacja statystyczna) jest przedmiotem badania statystycznego, to zbiór wszystkich elementów NIEIDENTYCZNYCH (jednostek), które podlegają badaniu z punktu widzenia różnych kryteriów badawczych (przedsiębiorcy z wybranego województwa, studenci np. uczelni medycznych, kierowcy autobusów itp.) Z reguły jest ona dla nas niedostępna w całości do badań Próba (populacja próbna) stanowić ją może grupa lub podzbiór jednostek lub elementów całej populacji (zbiorowości generalnej), który podlega bezpośrednio badaniu ze względu na rozpatrywaną cechę, co pozwala na wyciągnięcie wniosków o kształtowaniu się badanej cechy w populacji generalnej.

6. PODSTAWOWE POJĘCIA CECHY STATYSTYCZNE Cechami statystycznymi nazywamy własności charakteryzujące każdą jednostkę statystyczną. Podstawowy podział cech statystycznych wskazuje na możliwość ich opisu. Dzielimy je na ilościowe (mierzalne) i jakościowe (niemierzalne). Cechy statystyczne Mierzalne (ilościowe) ciągłe i skokowe interwałowa lub ilorazowa warianty tych cech mogą przyjmować postać ciągłą lub skokową. Realizacje cech ciągłych wyrażane są przez dowolne liczby (całkowite lub ułamkowe, np. metry, gramy, sztuki) podczas gdy realizacje cech skokowych są wyrażane na ogół przez liczby całkowite Niemierzalne (jakościowe) nominalna lub porządkowa warianty tych cech mogą przyjmować tylko postać opisu słownego, sprowadzonego jedynie do postaci mierzalnej poprzez zastosowanie umownych skal numerycznych (także postać zero-jedynkowa). Można jedynie stwierdzić, który z wariantów cechy występuje u danej jednostki.

0 5 8 10 12 14 15 20 24 25 30 35 40 45 50 60 75 90 100 120 180 240 6. HISTOGRAMY Rysunek 1 Przykłady cech ilościowych: ilość czasu spędzanego w komunikacji publicznej oraz ocena punktualności odjazdu autobusów MPK 18% 16% 14% 12% 10% 8% 6% 4% 2% 0% 15% 14% 13% 11% 10% 10% 5% 4% 4% 2% 3% 2% 0% 0% 1% 0% 1% 0% 0% 0% 1% 1% 40% 35% 30% 25% 20% 15% 10% 5% 0% 37% 34% 20% 9% ndst dst db bdb ilość czasu spędzanego w komunikacji publicznej ocena punktualności odjazdu autobusów MPK Rysunek 2 Cechy jakościowe: płeć oraz częstość korzystania z komunikacji miejskiej 70% 60% 50% 40% 30% 20% 10% 0% 37% kobiety 63% mężczyźni 50% 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% 29% codziennie 47% kilka razy w tygodniu 14% 9% raz w tygodniu nie korzystam

6. SKALE POMIAROWE Skala nominalna (nominalna dychotomiczna) - stosuje wyłącznie opis słowny dla potrzeb identyfikacji jednostki. Pomiar polega na zastosowaniu liczby jako nazwy, czyli grupowaniu jednostek w klasy (kategorie). Wartości na tej skali nie mają oczywistego, wynikającego z natury danego zjawiska uporządkowania (np. nazwy miejscowości). Nawet jeśli wartości zmiennej nominalnej są wyrażane liczbowo, to liczby te są tylko umownymi identyfikatorami, nazwami, nie można więc wykonywać na nich działań arytmetycznych, ani ich porównywać miejsce zamieszkania, płeć

6. SKALE POMIAROWE Skala porządkowa służy, do porządkowania danych. Pomiar polega na grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy lub liczby i porządkuje się te klasy ze względu na stopień natężenia, w jakim posiadają one badaną cechę. Wartości mają więc jasno określony porządek (kolejność), ale jednak nie da się w sensowny sposób określić różnicy ani ilorazu między dwiema wartościami wykształcenie, stan zdrowia, stan finansów, kolejność zawodników na podium

6. SKALE POMIAROWE Skala ilorazowa (stosunkowa, przedziałowa) spełnia wszystkie aksjomaty liczb, stosunki między dwiema jej wartościami mają interpretację w świecie rzeczywistym; nie tylko różnice, ale także ilorazy wielkości. Wielkości na skali ilorazowej można więc dodawać odejmować i dzielić przez siebie. Pomiary w tej skali charakteryzują się stałymi ilorazami i zerem bezwzględnym cena w zł, napięcie elektryczne, inflacja, bezrobocie, masa, czas wykonywania danej czynności,czas przejazdu z miasta do miasta.

6. SKALE POMIAROWE Skala interwałowa (przedziałowa) ma własności skali porządkowej, gdyż możliwe jest porządkowanie jednostek statystycznych. Różnice pomiędzy wartościami dają się obliczyć i mają sensowną interpretację w świecie rzeczywistym, jednak nie ma sensu dzielenie dwóch wartości zmiennej przez siebie. Innymi słowy określona jest jednostka miary, jednak punkt zero jest wybrany umownie. daty, temperatura w stopniach Celsjusza

7. PODSTAWOWE STATYSTYKI OPISOWE Podstawowe statystyki opisowe Miary położenia Miary zmienności Miary asymetrii Miary przeciętne charakteryzują średni lub typowy poziom badanej cechy ilościowej. Są to wartości wokół których skupiają się wszystkie pozostałe wartości analizowanej cechy Miary zmienności charakteryzują stopień zróżnicowania badanych jednostek pod względem badanej cechy Miary asymetrii służą do oszacowania czy większa część wartości jest mniejsza czy większa od przeciętnego poziomu badanego zjawiska Miary koncentracji Miary koncentracji wskazują jaka jest koncentracja badanej cechy wokół średniej

7A. MIARY POŁOŻENIA ŚREDNIA ARYTMETYCZNA KLASYCZNE ŚREDNIA HARMONICZNA ŚREDNIA GEOMETRYCZNA MIARY POŁOŻENIA MODALNA DOMINANTA KWARTYL DOLNY POZYCYJNE KWARTYLE MEDIANA KWANTYLE DECYLE KWARTYL GÓRNY CENTYLE

7A. MIARY POŁOŻENIA Średnia arytmetyczna (przeciętna) to suma wartości cechy ilościowej podzielona przez liczbę jednostek badanej grupy. Oblicza się ją dla danych zgromadzonych w postaci szeregów szczegółowych. Przykład W grupie dziesięciu studentów sprawdzono czas dojazdu na uczelnię (w min.). Wyniki przedstawia szereg: 17,14,11,9,9,9,17,13,17,14. Obliczyć średni czas dojazdu studentów na uczelnię. Średni czas dojazdu studentów na uczelnię to 13 minut. W pewnej firmie transportowej zbadano wiek ośmiu pracowników i otrzymano wyniki: 25, 36, 28, 27, 22, 20, 34, 32. Policzyć średni wiek pracownika w badanej firmie.

7A. MIARY POŁOŻENIA Średnia arytmetyczna ważona obliczana jest w przypadku szeregów rozdzielczych punktowych oraz przedziałowych. Środki przedziałów tylko w przybliżeniu odzwierciedlają rzeczywiste wartości danych empirycznych. Podstawowym ograniczeniem w przypadku przedziałów klasowych jest niemożliwość jej obliczenia gdy pierwszy lub ostatni przedział klasowy są otwarte.

7A. MIARY POŁOŻENIA Przykład W grupie dziesięciu studentów sprawdzono czas dojazdu na uczelnię (w min.). Wyniki przedstawia szereg: 17, 14, 11, 9, 9, 9, 17, 13, 17, 14. Obliczyć średni czas dojazdu studentów na uczelnię. Dane można przedstawić w postaci szeregu rozdzielczego punktowego Tabela 1 Dane dotyczące czasu dojazdu studentów na uczelnię Numer klasy Czas (min) Liczba studentów i xi ni 1 9 3 27 2 11 1 11 3 13 1 13 4 14 2 28 5 17 3 51 130 Średnio student potrzebuje 13 minut aby dotrzeć na uczelnię.

7A. MIARY POŁOŻENIA Przykład 3 W postaci szeregu rozdzielczego przedstawiono liczbę linii krajowych komunikacji autobusowej (dalekobieżnych) w województwach w Polsce. Policzyć średnią liczbę linii przypadających na województwo. Liczba linii krajowych dalekobieżnych Liczba województw od 0 do 20 2 10 20 od 20 do 40 6 30 180 od 40 do 60 4 50 200 od 60 do 80 3 70 210 od 80 do 100 1 90 90 16 700 Średnia liczba linii krajowych dalekobieżnych przypadających na województwo wynosi 43,75. (około 44 linie)

W pewnej firmie kurierskiej zbadano dzienną dostawę przesyłek przez 103 pracowników. Wyniki przedstawia tabela: Liczba dostarczonych przesyłek w ciągu dnia Liczba pracowników firmy kurierskiej 5-7 13 7-9 22 9-11 31 11-13 26 13-15 11 Obliczyć ile średnio przesyłek dostarczają dziennie kurierzy w badanej firmie.

7A. MIARY POŁOŻENIA Średnia uwzględnia wszystkie informacje zawarte w zbiorze danych, ale nie zawsze położona jest w środku badanego zbioru. Średnia arytmetyczna ma kilka własności: suma wartości cechy jest równa iloczynowi średniej arytmetycznej i liczebności zbiorowości spełnia warunek średnia odchyleń poszczególnych wartości cechy od średniej równa jest zero średnia arytmetyczna jest wrażliwa na skrajne wartości (wartości odstające).

7A. MIARY POŁOŻENIA Średnia geometryczna znajduje zastosowanie w przypadku obliczania średniego tempa zmian wartości zjawisk w czasie (badań przyrostu w czasie pewnych wartości bądź ich spadku) Przykład 4 W kolejnych latach w pewnym regionie liczba linii komunikacji miejskiej wynosiła odpowiednio: Liczba linii komunikacji Lata miejskiej w miejscowości A 2007 11 2008 22 2009 33 Należy obliczyć średni przyrost względny liczby linii w pewnym regionie.

7A. MIARY POŁOŻENIA Średnia harmoniczna ma zastosowanie w przypadku gdy wartości cechy podane są w przeliczeniu na stałą jednostkę innej zmiennej (km/h, osoby/km 2, zł/szt.). Przykład Zanotowano czas przejazdu czterech pociągów na trasie Rzeszów Kraków. Czasy przejazdu były następujące: 3,10 min, 3,20 min, 3,33 min, oraz 3,41 minut. Średni czas dojazdu pociągu z Rzeszowa do Krakowa wynosi około 205 minut czyli 3,25 min.

7A. MIARY POŁOŻENIA Dominanta D (modalna M o, moda) to wartość, która najczęściej pojawia się w badanej zbiorowości (dominuje). Przykład Zbadano czas oczekiwania (w minutach) na odprawę celną na przejściu granicznym z Ukrainą w Medyce przez samochody osobowe. Wynoszą one odpowiednio: 2, 5,8 12, 8, 16, 20, 5, 9, 5, 13, 14, 5. Wskazać dominantę czasu oczekiwania na odprawę celną. D=5

7A. MIARY POŁOŻENIA Przykład Zbadano czas oczekiwania (w minutach) samochodów ciężarowych na odprawę celną na przejściu granicznym z Ukrainą w Medyce. Dane przedstawiono w tabeli (). Wskazać dominantę czasu oczekiwania na odprawę celną. Czas oczekiwania samochodów ciężarowych na odprawę celną (min) Liczba oczekujących samochodów od 0 do 10 14 od 10 do 20 20 od 20 do 30 25 od 30 do 40 27 D od 40 do 50 20 od 50 do 60 9 115 Dominanta czasu oczekiwania samochodów ciężarowych na odprawę celną wynosi 31,67 min.

W pewnej firmie kurierskiej zbadano dzienną dostawę przesyłek przez 103 pracowników. Wyniki przedstawia tabela: Liczba dostarczonych przesyłek w ciągu dnia Liczba pracowników firmy kurierskiej 5-7 13 7-9 22 9-11 31 11-13 26 13-15 11 Wskazać dominantę liczby dostarczonych przesyłek.

7A. MIARY POŁOŻENIA Kwantyle są pozycyjnymi miarami położenia, zdefiniowane są jako wartości cechy badanej zbiorowości, przedstawionej w postacie szeregu, które dzielą zbiorowość na określone części pod względem liczby jednostek. Najczęściej używanymi kwantylami są kwartale które dzielą badaną zbiorowość na cztery części. Często używane są także decyle (dzielące zbiorowość na dziesięć części oraz percentyle (dzielące zbiorowość na 100 części procenty).

7A. MIARY POŁOŻENIA Kwartyl dolny (Q 1 ) dzieli zbiorowość na dwie części w taki sposób że 25% jednostek badanej zbiorowości ma badaną cechę niższą bądź równą niż wartość Q 1 (czyli co czwarta jednostka), natomiast 75% (¾) jednostek ma badaną cechę większą bądź równą Q 1 Mediana M e jest to wartość środkowa i dzieli badaną zbiorowość na dwie równe części. Połowa (50%) jednostek zbiorowości ma wartości badanej cechy niższe lub równe medianie a połowa (50%) większe lub równe medianie. Kwartyl górny (Q 3 ) dzieli zbiorowość na dwie części w taki sposób że 75% (¾) jednostek badanej zbiorowości ma badaną cechę niższą bądź równą niż wartość Q 3, natomiast 25% (co czwarta jednostka) ma badaną cechę większą bądź równą Q 3.

7A. MIARY POŁOŻENIA Dla szeregu szczegółowego pozycję oraz wartości kwartyli oblicza się ze wzorów () przy czym należy pamiętać że poszczególne wartości należy uszeregować w sposób rosnący Dla szeregów rozdzielczych poszczególne miary można policzyć ze wzorów () przy czyn należy pamiętać że pozycje poszczególnych miar pozycyjnych wyznacza się z liczności skumulowanej.

7A. MIARY POŁOŻENIA Przykład Zbadano czas oczekiwania (w minutach) samochodów ciężarowych na odprawę celną na przejściu granicznym z Ukrainą w Medyce. Dane przedstawiono w tabeli (). Wskazać i zinterpretować medianę, kwartyl dolny i górny. Czas oczekiwania samochodów ciężarowych na odprawę celną (min) Liczba oczekujący ch samochodó w Pozycja od 0 do 10 14 5 70 14 od 10 do 20 20 15 300 34 od 20 do 30 25 25 625 59 od 30 do 40 27 35 945 86 od 40 do 50 20 45 900 106 od 50 do 60 9 55 495 115 115 3335

W pewnej firmie kurierskiej zbadano dzienną dostawę przesyłek przez 103 pracowników. Wyniki przedstawia tabela: Liczba dostarczonych przesyłek w ciągu dnia Liczba pracowników firmy kurierskiej x n nsk 5-7 13 13 7-9 22 35 9-11 31 66 11-13 26 92 13-15 11 103 Obliczyć kwartyl dolny, medianę i kwartyl górny liczby dostarczanych przesyłek.

Miary zmienności charakteryzują stopień zróżnicowania badanych jednostek pod względem badanej cechy. Dzielą się na miary klasyczne i pozycyjne. 7B. MIARY ZMIENNOŚCI WARIANCJA KLASYCZNE ODCHYLENIE STANDARDOWE ODCHYLENIE PRZECIĘTNE MIARY ZMIENNOŚCI WSPÓŁCZYNNIK ZMIENNOŚCI ROZSTĘP POZYCYJNE ODCHYLENIE ĆWIATRKOWE WSPÓŁCZYNNIK ZMIENNOŚCI

7B. MIARY ZMIENNOŚCI Wariancja to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej. Wariancja jest wartością niemianowaną. Aby otrzymać informację o zróżnicowaniu zbiorowości oblicza się pierwiastek kwadratowy z wariancji nazywany odchyleniem standardowym. Odchylenie informuje o przeciętnym zróżnicowaniu poszczególnych wartości cechy od średniej arytmetycznej. Odchylenie standardowe jest wartością mianowaną i interpretuje się go w jednostkach badanej cechy.

7B. MIARY ZMIENNOŚCI Odchylenie standardowe Dla szeregu szczegółowego Dla szeregu rozdzielczego Przykład W grupie dziesięciu studentów sprawdzono czas dojazdu na uczelnię (w min.). Wyniki przedstawia szereg: 17, 14, 11, 9, 9, 9, 17, 13, 17, 14. Obliczyć wariancję i odchylenie standardowe. =3,19 Przeciętne zróżnicowanie czasu dojazdu na uczelnię wśród studentów od cechy średniej wynosi 3,19 min.

7B. MIARY ZMIENNOŚCI Przykład Zbadano czas oczekiwania (w minutach) samochodów ciężarowych na odprawę celną na przejściu granicznym z Ukrainą w Medyce. Dane przedstawiono w tabeli (). Obliczyć wariancję i odchylenie standardowe. Czas oczekiwania samochodów ciężarowych na odprawę celną (min) Liczba samochodów Odchylenie standardowe Odchylenie przeciętne od 0 do 10 14 5 70 576 8064 336 od 10 do 20 20 15 300 196 3920 280 od 20 do 30 25 25 625 16 400 100 od 30 do 40 27 35 945 36 972 162 od 40 do 50 20 45 900 256 5120 320 od 50 do 50 9 55 495 676 6084 234 115 3335 24560 1432 Przeciętne zróżnicowanie czasu oczekiwania samochodów ciężarowych na odprawę celną wynosi 14,61 min.

7B. MIARY ZMIENNOŚCI Typowy przedział zmienności to obszar, w którym mieści się około 2/3 jednostek badanej zbiorowości Typowy przedział zmienności dla danych z przykładu () wynosi:

7B. MIARY ZMIENNOŚCI Odchylenie przeciętne d (dewiata) jest średnią arytmetyczną bezwzględnych odchyleń wartości cechy od średniej arytmetycznej. Informuje o ile średnio różnią się poszczególne wartości od wartości średniej.(niezależnie od znaku) Dla szeregu szczegółowego Dla szeregu rozdzielczego Zazwyczaj odchylenie przeciętne jest mniejsze od odchylenia standardowego obliczonego dla tych samych danych. Średnio wartości czasu oczekiwania na odprawę celną przez samochody ciężarowe różnią się od wartości średniej o około 12 minut (12,45).

7B. MIARY ZMIENNOŚCI Współczynnik zmienności jest ilorazem bezwzględnej miary zmienności cechy i średniej wartości tej cechy. Zazwyczaj wartość współczynnika zmienności podana jest w procentach. Przyjmuje się że jeśli współczynnik zmienności jest mniejszy niż 10% to cechy wykazują zróżnicowanie niewielkie (statystycznie nieistotne). Duże wartości świadczą o znacznym zróżnicowaniu badanej cechy i wskazują na brak jednorodności w analizowanym zbiorze wyników. Przykład Obliczyć współczynnik zmienności czasu oczekiwania samochodów ciężarowych na odprawę celną (min)gdzie średnia wynosi 29 minut a odchylenie standardowe 14,61 minuty a odchylenie przeciętne 12,45 minuty.

7B. MIARY ZMIENNOŚCI Rozstęp. Charakteryzuje on empiryczny obszar zmienności badanej cechy i jest najprostszą miarą dyspersji. Jest to różnica między wartością największą a najmniejszą. Rozstęp jest liczony na podstawie dwóch wartości ekstremalnych.

7B. MIARY ZMIENNOŚCI Odchylenie ćwiartkowe określa odchylenie wartości cechy od mediany. (Q) Jest liczony jako połowa różnicy między kwartylem pierwszym i trzecim. Im większa wartość odchylenia ćwiartkowego tym większa koncentracja pomiarów w środkowej części wszystkich pomiarów.

W pewnej firmie kurierskiej zbadano dzienną dostawę przesyłek przez 103 pracowników. Wyniki przedstawia tabela: Liczba dostarczonych przesyłek w ciągu dnia Liczba pracowników firmy kurierskiej x n nsk 5-7 13 13 7-9 22 35 9-11 31 66 11-13 26 92 13-15 11 103 Obliczyć podstawowe miary zmienności.

7C. MIARY ASYMETRII Miary asymetrii służą do oszacowania czy odchylenia od wartości centralnej grupują się z prawej bądź lewej strony rozkładu empirycznego, inaczej mówiąc czy większa część wartości jest mniejsza czy większa od przeciętnego poziomu badanego zjawiska. Rozkłady cech różnią się między sobą siłą i kierunkiem asymetrii. Miary asymetrii można podzielić także na klasyczne i pozycyjne. KLASYCZNE WSPÓŁCZYNNIK ASYMETRII A MIARY ASYMETRII OPARTE NA MIARACH KLASYCZNYCH I POZYCYJNYCH WSPÓŁCZYNNIK SKOŚNOŚCI I WSPÓŁCZYNNIK SKOŚNOŚCI II POZYCYJNE WSKAŹNIKI SKOŚNOŚCI OPARTE MA MIARACH POZYCYJNYCH WSPÓŁCZYNNIK SKOŚNOŚCI

7C. MIARY ASYMETRII Do miar klasycznych zalicza się współczynnik asymetrii A. Liczony jest rzadko ze względu na pracochłonność. Dla szeregu szczegółowego Dla szeregu rozdzielczego m 3 1 n n x x i 1 3 i n i Częściej do określenia asymetrii wykorzystywane są miary pozycyjne. Jeżeli Są także miary, które wykorzystują do określenia asymetrii zarówno wielkości klasyczne jak i pozycyjne. Do takich miar zalicza się współczynniki skośności.

68% wartości cechy leży w odległości 95,5% wartości cechy leży w odległości 99,7% wartości cechy leży w odległości od wartości oczekiwanej; od wartości oczekiwanej; od wartości oczekiwanej. 90 140 80 120 70 60 100 Liczba obserwacji 50 40 Liczba obserwacji 80 60 30 40 20 10 20 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 0 0 10 20 30 40 50 60 70 80 90 100 110 120 130

7C. MIARY ASYMETRII Asymetrię rozkładu można także sprawdzić za pomocą położenia średniej względem mediany. Jeżeli Jeżeli Jeżeli to rozkład jest symetryczny to rozkład jest asymetryczny prawostronnie to rozkład jest asymetryczny lewostronnie Me średnia

7D. MIARY KONCENTRACJI Między zróżnicowaniem cechy a koncentracją wartości wokół średniej istnieje pewien związek. Im większe jest zróżnicowanie tym mniejsza jest koncentracja. Miarą skupienia wokół średniej jest współczynnik skupienia (kurtoza). dla szeregu szczegółowego dla szeregu rozdzielczego m 3 1 n n x x i 1 4 i n i Im wyższa wartość współczynnika K, tym bardziej smukła jest krzywa liczebności a więc większa koncentracja wartości cechy wokół średniej. Małe wartości wskazują na spłaszczenie rozkładu zbiorowości względem badanej cechy. Przyjmuje się że: jeśli K = 3 to zbiorowość ma rozkład normalny, jeśli K < 3 to rozkład jest bardziej spłaszczony od normalnego- platykurtyczny jeśli K > 3 to rozkład jest bardziej smukły od normalnego leptokurtyczny

7D. MIARY KONCENTRACJI KRZYWA LORENZA KRZYWA Koncentracji Lorenza Stopień nasilenia koncentracji ilustruje wielobok koncentracji zwany Krzywą koncentracji albo krzywą Lorenza. Na osi odciętych zaznacza się skumulowane wskaźniki struktury a na osi rzędnych skumulowany odsetek iloczynu xi n i. Łącząc punkty o odpowiednich współrzędnych otrzymuje się Krzywą Lorenza. W przypadku równomiernego rozkłady cechy wszystkie punkty leżałyby na przekątnej kwadratu o boku równym 100. Przekątna nosi nazwę linii równomiernego podziału. Im większy stopień koncentracji tym bardziej krzywa odchyla się od linii równomiernego podziału A wiec tym większe jest pole figury a (wyznaczonej przez linię równomiernego podziału i krzywą koncentracji. Maxymalna wartość powierzchni koncentracji jest równa połowie pola kwadratu (a+b=5000). Stosunek pola a do połowy pola Kwadratu nosi nazwę współczynnika koncentracji Lorenza. K L K L a 5000 5000 b 5000 1 Współczynnik przyjmuje wartość ZERO w przypadku równomiernego podziału a JEDEN w przypadku całkowitej koncentracji. 1 5000 k i 1 z isk z 2 isk 1 i

7D. MIARY KONCENTRACJI KRZYWA LORENZA Czas oczekiwania na odprawę celną ni xi xini i od 0 do 10 14 5 70 12,2 2,1 12,2 2,1 12,8 od 10 do 20 20 15 300 17,4 9,0 29,6 11,1 114,7 od 20 do 30 25 25 625 21,7 18,7 51,3 29,8 444,9 od 30 do 40 27 35 945 23,5 28,3 74,8 58,2 1033,1 od 40 do 50 20 45 900 17,4 27,0 92,2 85,2 1246,3 od 50 do 50 9 55 495 7,8 14,8 100,0 100,0 724,5 S 115 S 3335 3576,4 zi isk zisk z isk z isk 2 1 i P O L A F I G U R z isk Graficzna interpretacja miary korelacji 120 100 K L a 5000 b 1 5000 5000 1 5000 k i 1 z isk z 2 isk 1 i 80 60 40 20 a b K L 1 1 5000 k i 1 z isk z 2 3576,4 i 1 5000 isk 1 0,28 0 0 10 20 30 40 50 60 70 80 90 100 isk

Źródło: www.wikipedia.pl 7D. MIARY KONCENTRACJI

Biorąc pod uwagę podział na cechy ilościowe i jakościowe, prezentacja danych i ich opis wygląda odmiennie. Dla cech jakościowych stosuje się rozkład procentowy i jego interpretację. Jeśli chodzi o cechy ilościowe to dysponuje się szerokim wachlarzem miar opisowych charakteryzujących badaną zmienną. STATYSTYKI OPISOWE PODSUMOWANIE: MIARY ROZPROSZENIA MIARY ASYMETRII MIARY POŁOŻENIA KLASYCZNE POZYCYJNE MIARY KONCENTRACJI KLASYCZNE POZYCYJNE KLASYCZNE POZYCYJNE KLASYCZNE POZYCYJNE Miary klasyczne (średnia, odchylenie standardowe i inne) są wyznaczane na podstawie wszystkich obserwacji - są w związku z tym nieodporne na obserwacje odstające. Miary pozycyjne (minimum, maksimum, mediana, kwartyle, percentyle) są wyznaczane na podstawie pozycji zajmowanej przez odpowiednie obserwacje i w związku z tym nie są zależne od ewentualnych obserwacji ekstremalnych.

Zadanie 1 Ilość lat eksploatacji samochodów w pewnym przedsiębiorstwie transportowym wynosi: Ilość lat eksploatacji samochodu Liczba samochodów 0-3 9 3-6 13 6-9 18 9-12 10 12-15 4 Policzyć i zinterpretować podstawowe miary opisowe: średnią, odchylenie standardowe, współczynnik zmienności, medianę, modalną, kwartyle oraz określić asymetrię rozkładu i dokonać jej interpretacji. Policzyć współczynnik koncentracji. Zadanie 2 Ocena skuteczności instruktorów PJ Liczba oceniających 0 8 1 9 2 12 3 18 4 36 5 17 Policzyć i zinterpretować podstawowe miary opisowe: średnią, odchylenie standardowe, współczynnik zmienności, wskazać dominantę. Zadanie 3 Zanotowano czas opóźnienia pociągów w ostatnich dniach na dworcu kolejowym w pewnej miejscowości:12,13,14,12,18, 16,12,13,16,17,21,28 Policzyć i zinterpretować podstawowe miary opisowe: średnią, odchylenie standardowe, współczynnik zmienności, medianę, modalną, kwartyle oraz dokonać interpretacji.

8. GRUPOWANIE DANYCH I SZEREGI ROZDZIELCZE GRAFICZNA PREZENTACJA MATERIAŁU 1. Szereg szczegółowy {0,0,0,0,1,1,1,2,2,2,3,3,4,4,4,5,5,6,6,8,9,11,15} 2. Szereg rozdzielczy punktowy Numer klasy (ilość popełnionych błędów w teście) Liczba kierowców 0 55 1 15 2 10 3 2 3. Szereg rozdzielczy klasowy (przedziałowy) Czas oczekiwania samochodów ciężarowych na odprawę celną (min) Liczba samochodów od 0 do 10 14 od 10 do 20 20 od 20 do 30 25 od 30 do 40 27 od 40 do 50 20 od 50 do 50 9

8. GRUPOWANIE DANYCH I SZEREGI ROZDZIELCZE GRAFICZNA PREZENTACJA MATERIAŁU Konstrukcja szeregu rozdzielczego z przedziałami klasowymi Ustalenie rozpiętości przedziału klasowego h x max x k min R k gdzie k n Liczba obserwacji Ilość zalecanych klas od 40 do 60 6-8 od 60 do 100 7-10 od 100 do 200 9-12 od 200 do 500 11-17 Wskaźnik struktury i ni n n i 1 1 0 1 i i

8. GRUPOWANIE DANYCH I SZEREGI ROZDZIELCZE GRAFICZNA PREZENTACJA MATERIAŁU W kilkudziesięciu ośrodkach kształcenia kierowców zbadano liczbę osób które otrzymały prawo jazdy w ostatnim kwartale: 75,62,94,56,66,90, 72,76,73,64,96,50,70,91, 59, 88,80,54,83,58, 81, 68, 93, 84, 92,71,76,57,85,78,67,76,74,,79,63,86, 74,84,69,55,80,65, 75,87,85,82,82,84,77, Dokonać prezentacji graficznej i tabelarycznej zebranego materiału. 1. Uszeregowanie obserwacji w ciągu rosnącym: 50,54, 55, 56, 57, 58, 59, 62, 63, 63, 65, 66, 67, 68, 69, 70, 70, 70, 72, 73, 74, 74, 75, 75, 76, 76, 77, 78, 79, 80, 80, 81, 82, 82, 83, 84, 84,84, 85, 85, 86, 87, 88, 90, 91, 92, 93, 94, 96 2. Ustalenie rozpiętości przedziału i liczby klas: h x max x k min 96 50 49 46 7 7

8. GRUPOWANIE DANYCH I SZEREGI ROZDZIELCZE GRAFICZNA PREZENTACJA MATERIAŁU Liczba osób, które Liczba otrzymały prowo-jazdy ośrodków 50-57 5 57-64 5 64-71 8 71-78 10 78-85 12 85-92 6 92-99 3 14 12 10 8 6 4 2 0 12 10 8 6 5 5 3 50-57 57-64 64-71 71-78 78-85 85-92 92-99 Histogram to zbiór prostokątów, których Podstawy wyznaczone na osi odciętych stanowią Rozpiętości poszczególnych przedziałów klasowych a wysokości są określane na osi rzędnych przez liczebności, Odpowiadające poszczególnym przedziałom. Diagram (wielobok liczebności) jest łamaną powstałą Przez połączenie punktów, których współrzędnymi są Środki przedziałów klasowych i odpowiadające im liczebności

8. GRUPOWANIE DANYCH I SZEREGI ROZDZIELCZE GRAFICZNA PREZENTACJA MATERIAŁU Liczba osób, które otrzymały prowo-jazdy x i Liczba ośrodków n Wskaźnik struktury 50-57 5 0,10 57-64 5 0,10 64-71 8 0,16 71-78 10 0,20 78-85 12 0,24 85-92 6 0,12 92-99 3 0,06 i i 0,3 0,25 0,2 0,15 0,1 0,05 0 0,24 0,2 0,16 0,12 0,1 0,1 0,06 50-57 57-64 64-71 71-78 78-85 85-92 92-99 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 57 64 71 78 85 92 94 Dystrybuanta empiryczna to diagram liczebności (częstości skumulowanej), który jest łamaną powstałą przez połączenie punktów, których współrzędne to : górne granice przedziałów kalsowych i odpowiadające im liczebności (częstości skumulowane).

W pewnej firmie transportowej sprawdzono dzienne zużycie paliwa przez samochody rozwożące towar do pobliskich miejscowości: 7, 11, 8, 14, 14, 10, 5, 18, 12, 21, 14, 13, 15, 11, 9, 6, 17, 16, 19, 15, 14, 19, 17, 13, 19, 18, 13, 15, 11, 13, 18, 14, 19, 16, 17, 15, 14, 15, 12, 12, 13, 17, 13, 18, 14, 8, 9, 21, 22, 24, 17, 28,, 22, 14, 15, 19, 17, 19, 23, 12, 13, 8, 9, 11. Przedstawić dane w postaci szeregu rozdzielczego, przedstawić histogram, dystrybuantę, policzyć podstawowe statystyki opisowe i dokonać ich interpretacji.

JAK TO SIĘ ROBI W STATYSTYCE?