Porównywanie populacji

Podobne dokumenty
Przygotowanie danych

Tabela 1. Rozproszenie wartości zmiennych. Zmienna Populacja Wartości dyrektorzy szkół gimnazjalnych

Miary statystyczne w badaniach pedagogicznych

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

RAPORT ZBIORCZY z diagnozy umiejętności matematycznych

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

RAPORT z diagnozy umiejętności matematycznych

RAPORT ZBIORCZY z diagnozy Matematyka PP

RAPORT z diagnozy umiejętności matematycznych

ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY

Pozyskiwanie wiedzy z danych

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Wyniki egzaminu gimnazjalnego 2016/2017 część humanistyczna język polski

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

RAPORT z diagnozy Matematyka na starcie

Analiza struktury i przeciętnego poziomu cechy

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Wyniki egzaminu gimnazjalnego 2014/2015 część humanistyczna język polski

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

1 Podstawy rachunku prawdopodobieństwa

Statystyka. Opisowa analiza zjawisk masowych

Analiza statystyczna. Ogólne własności funkcji. Funkcja liniowa. Równania i nierówności liniowe

PRÓBNY WEWNĘTRZNY SPRAWDZIAN SZÓSTOKLASISTÓW z CKE GRUDZIEŃ 2014

Klasa I szkoły ponadgimnazjalnej matematyka

Analiza zróżnicowania, asymetrii i koncentracji

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

PODSTAWOWE FIGURY GEOMETRYCZNE

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Testy nieparametryczne

Publiczna Szkoła Podstawowa nr 14 w Opolu. Edukacyjna Wartość Dodana

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

ANALIZA JEDNOZMIENNOWA. podstawowe pojęcia

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Badania marketingowe 2016_12. Krzysztof Cybulski Katedra Marketingu Wydział Zarządzania Uniwersytet Warszawski

Parametry statystyczne

A N K I E T A. Zalety i wady ankiety. wielka możliwość nieszczerych odpowiedzi przy posyłaniu ankiet pocztą wiele z nich nie wraca

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Wykład 5: Statystyki opisowe (część 2)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Podstawy statystyki - ćwiczenia r.

Zadania ze statystyki, cz.6

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Próba własności i parametry

Wybrane wyniki w zakresie umiejętności matematycznych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyka Matematyczna Anna Janicka

Czy średnia średnich jest średnią?

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Raport z analizy badania diagnozującego uczniów klas czwartych

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

PRÓBNY WEWNĘTRZNY SPRAWDZIAN SZÓSTOKLASISTÓW z OPERONEM. styczeń 2015

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013

Raport z analizy badania diagnostycznego uczniów klas czwartych 2016

Ewaluacja sprawdzianu 2009 klas szóstych szkoły podstawowej na podstawie sprawozdania sporządzonego przez OKE w Jaworznie

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Przedmiotem pomiaru są umiejętności zgodne z Podstawą programową kształcenia ogólnego dla szkół podstawowych z dnia r.

Analiza i monitoring środowiska

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Analiza wyników egzaminu gimnazjalnego 2013 r. Test matematyczno-przyrodniczy (matematyka) Test GM-M1-132

W1. Wprowadzenie. Statystyka opisowa

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

4.2. Statystyczne opracowanie zebranego materiału

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

POMIAR DYDAKTYCZNY Z MATEMATYKI

Joanna Konieczna Repetytorium ze statystyki opisowej (materiał roboczy)

Wojewódzki Konkurs Matematyczny dla uczniów gimnazjów rok szkolny 2016/2017 Etap II etap rejonowy- klucz odpowiedzi

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Szkoła Podstawowa nr 2 im. Floriana Adamskiego w Chełmie Śląskim. Analiza testu diagnostycznego z matematyki dla klas czwartych

Wykład 4: Statystyki opisowe (część 1)

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 2. ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ

PRZEDMIOTOWY SYSTEM OCENIANIA JĘZYKI OBCE

EGZAMIN GIMNAZJALNY 2011 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Raport z wyników sprawdzianu szóstoklasistów w SP Nr 40 kwiecień 2015

STATYSTYKA POWTÓRZENIE WIADOMOŚCI

2 Ustalamy długość klasy, dzieląc rozstęp R przez liczbę klas, czyli przez 6. Klasy mają więc długość

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

DANE STATYSTYCZNE

SPRAWDZIAN I EGZAMINY 2013 W SZKOŁACH ARTYSTYCZNYCH. w w o je w ó dztwie śląskim

Raport z ewaluacji wewnętrznej. Publicznej Szkoły Podstawowej w Sieciechowie

PRZEDMIOTOWY SYSTEM OCENIANIA Z MATEMATYKI DLA KLASY 3TI ROK SZKOLNY 2018/2019

Kontekstowe wskaźniki efektywności nauczania - warsztaty

WYNIKI EGZAMINU GIMNAZJALNEGO 2015 R. GIMNAZJUM IM. KSIĄŻĄT ŚWIDNICKICH W WITOSZOWIE DOLNYM

RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013

Transkrypt:

3 Porównywanie populacji

2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej zmiennej. Oznacza to, że jeżeli np. na teście wiadomości z matematyki uczniowie Jan i Marcin osiągnęli 34 i 39 punktów, można z tych osiągnięć od razu wnioskować, iż Marcin jest lepszy (osiągnął wyższy wynik). W niektórych zmiennych wprawdzie wyższa wartość oznacza gorszy wynik (np. większa liczba błędów w dyktandzie), jednak nie zmienia to sedna porównań osiągnięć jednostek. Jak postępować, gdy porównuje się całe populacje statystyczne? Dlaczego należy porównywać populacje? Oto odpowiedź istnieje potrzeba ustalenia: - Czy test lepiej rozwiązali uczniowie klasy V B czy klasy V C? - Czy staż pracy nauczycieli w szkołach podstawowych różni się od stażu pracy nauczycieli w szkołach średnich? - Czy studenci zaoczni studiują dłużej niż studenci dzienni? - itp. Przy porównywaniu dwóch grup można porównać wszystkie wyniki z pierwszej grupy z wszystkimi wynikami z drugiej grupy. Jednak od razu można stwierdzić, że ten sposób może okazać się skuteczny tylko i wyłącznie w przypadkach, gdy grupy liczą zaledwie kilka jednostek. Dla trochę większych grup nie jest to możliwie. Wówczas można wybrać z każdej grupy tylko jedną jednostkę do porównywania, jednak którą? Jeżeli najlepszy uczeń z jednej klasy osiągnął wyższy wynik niż najlepszy uczeń z drugiej klasy, nie oznacza to wcale, że jego klasa jest lepsza. Podobnie jest z wynikami najniższymi. Takie postępowanie nie daje rzetelnej i dobrej komparacji. Najbardziej rzetelne komparacje umożliwiają wartości umieszczone w centrum grupy. Te wartości są

3 typowe i najbardziej liczne. Dlatego też należy porównywać grupy według takich właśnie wartości, które nazywa się miarami tendencji centralnej. Tendencja centralna to zjawisko polegające na tym, że wartości zmiennych ilościowych na ogół skupiają się w środku (w centrum). Im bliżej centrum, tym wartości bardziej zgęszczone; im dalej od centrum, tym występują rzadziej. Można to zilustrować przykładem: w większej grupie 10-letnich uczniów ich wzrost koncentruje się w przybliżeniu wokół wartości 128 cm. Większość uczniów znajduje się niedaleko tej ( przeciętnej ) wartości. Uczniów, których wzrost przewyższa 150 cm jest stosunkowo mało, a takich o wzroście ponad 160 cm jest jeszcze mniej. Podobnie jest też w przypadku niższych wartości. Jest to tendencja centralna i z tego powodu w większości przypadków najlepiej porównywać populacje według takich wartości (które znajdują się w centrum). Naturze zjawisk i zmiennych w obszarze edukacji najbardziej odpowiadają następujące trzy miary tendencji centralnej: -wartość modalna lub dominanta (M o ), -mediana (M e ), -średnia arytmetyczna (M). Wartość modalna Modalną jest punkt (wartość), gdzie wartości zmiennej są najbardziej zagęszczone. W najprostszym ujęciu jest to wartość, która pojawia się najczęściej. Przykład: jeżeli w klasie większość uczniów posiada ocenę dobrą (4) z określonego przedmiotu, to ocena ta jest modalną (Mo=4,00). Modalną można ustalić nawet dla zmiennych nominalnych (jednak jest prawdą, że to nie ma prawie żadnego praktycznego znaczenia). Modalna jest najprostszą miarą tendencji centralnej: szybka i prosta do obliczeń, prosta do zrozumienia i interpretacji. Z powodu tego, że dla określenia wartości modalnej nie są potrzebne wszystkie dane w grupie, porównania grup są często nierzetelne. Oprócz tego w grupie może się

4 pojawić więcej wartości modalnych - wówczas porównanie staje się niemożliwym. Mediana Medianą jest wartość (punkt), od której połowa grupy posiada wartości wyższe, a połowa niższe. Szereguje się na przykład uczniów w klasie według wzrostu od najmniejszego do największego. Należy odnaleźć ucznia, który jest w centrum (połowa uczniów w klasie jest wyższa, a połowa niższa). Wzrost tego ucznia jest medianą (np. 161 cm). Dla określenia mediany potrzebna jest przynajmniej zmienna porządkowa. Dla zmiennych nominalnych nie da się określić mediany, ponieważ nie ma wartości wyższych i niższych. Mediana jest też prostą miarą tendencji centralnej: często można ją określić bez obliczeń, jest ona łatwa do zrozumienia i wystarczająco prosta do interpretacji. Do określania mediany także nie są potrzebne dane dla wszystkich jednostek w grupie. Z tego powodu mediana nie jest rzetelna i stosuje się ją rzadko. W przypadkach małych populacji medianę można łatwo określić bez jakichkolwiek wzorów i obliczeń. Natomiast w przypadkach populacji z większą liczebnością i tak nie używa się ręcznego opracowania. Jedyną potrzebną procedurą jest sortowanie wartości do szeregu prostego. Oto kilka przykładów określania mediany z szeregu prostego. Przykład 1. x 4 5 8 12 12 21 22 24 R 1 2 3 4 5 6 7 8 50 % wartości 50 % wartości mediana jest po środku pomiędzy wartościami 12 i 12

5 Przykład 2. x 2 4 7 12 13 17 19 24 R 1 2 3 4 5 6 7 8 50 % wartości 50 % wartości mediana jest po środku pomiędzy wartościami 12 i 13 Średnia arytmetyczna Średnia arytmetyczna jest sumą wszystkich wartości podzieloną przez liczebność grupy. Oblicza się ją według wzoru: M N średnia arytmetyczna suma wszystkich wartości liczebność populacji Sumować można tylko wartości zmiennych przedziałowych. Dla zmiennych nominalnych nie da się zastosować średniej arytmetycznej, a dla zmiennych porządkowych jej stosowanie jest nieuzasadnione (nie poprawne). Fakt, że określa się ją z wszystkich wyników powoduje, że umożliwia ona najbardziej rzetelne porównania. Średnia arytmetyczna jest czuła na najmniejsze zmiany w grupie: jeżeli zmienia się wartość nawet jednej jedynej jednostki - od razu zmienia się średnia arytmetyczna. Do obliczania średniej arytmetycznej potrzebne są wszystkie wyniki, dlatego też średnia arytmetyczna wymaga najwięcej pracy. Interpretacja średniej arytmetycznej nie jest już tak prosta, jak w przypadku mody i mediany. Fakt, iż średnia arytmetyczna uwzględnia wszystkie rezultaty w grupie, jest jednocześnie jej słabością: uzależniona jest też od najbardziej ekstremalnych wartości (te mogą być w niektórych przypadkach bardzo nietypowe i dają ułomny obraz grupy).

6 Wymienione wyżej argumenty powodują, iż w badaniach najczęściej stosuję się średnią arytmetyczną. Mediana i moda znajdują zastosowanie tylko dodatkowo, obok średniej arytmetycznej, a samodzielne jedynie w incydentalnych przypadkach. Kolejnym problemem, który należy omówić są sytuacje specjalne, dotyczące okoliczności stosowania miar tendencji centralnej w obszarze edukacji. Tu często pojawiają się zmienne porządkowe, np. oceny szkolne. Różne okoliczności mogą spowodować, że stosowanie mediany nie umożliwia porównania, a stosowanie średniej arytmetycznej jest nieuzasadnione. Taki przypadek można zilustrować za pomocą danych z dwóch klas szkolnych: Tabela 1. Oceny w dwóch klasach szkolnych Klasy Oceny Mediana Średnia arytmetyczna V B 3,3,4,4,4,4,4,4,4,4,4,4,4,4,4, 5,5,5,5,5,5,5,5,5, V C 2,2,2,2,2,3,3,3,4,4,4,4,4,4,4, 4,4,4,4,4,4,4,4,5,5,5,5 Me = 4,00 M = 4,29 Me = 4,00 M = 3,67 Porównanie median prowadzi do błędnego wniosku, że klasy według ocen są jednakowe. Proste przejrzenie ocen dowodzi, iż nie jest to prawdą. Zastosowana średnia arytmetyczna nie odpowiada naturze ocen szkolnych, ale pokazuje, iż oceny w klasie V B są wyższe (co jest prawdą). Upieranie się przy stosowaniu całkowicie odpowiednich metod, uniemożliwia w tym przypadku dokonanie porównania. Można jednak zastosować średnią arytmetyczną, lecz przy zachowaniu wielkiej ostrożności podczas interpretacji. Średnia arytmetyczna umożliwia stwierdzenie, że oceny w klasie V B są wyższe. Twierdzenie natomiast, iż oceny są wyższe precyzyjne za 0,62 jest zbyt nieostrożne i nieprawdziwe, pomimo różnicy średnich arytmetycznych wynoszącej rzeczywiście 0,62. Można zatem stosować metody w warunkach nie zupełnie odpowiednich, jednak należy wiedzieć, co to oznacza i w jaki sposób uwzględnić to w interpretacji.

7 Obliczanie średniej arytmetycznej Z powodów praktycznych zostanie szczegółowo opisane tylko obliczanie średniej arytmetycznej z danych nie zgrupowanych. W ankiecie zapytano nauczycieli o staż pracy. Oto odpowiedzi uszeregowane do szeregu prostego: x 1 2 2 5 5 6 8 8 11 12 15 22 Do obliczenia średniej arytmetycznej należy zsumować wszystkie wartości, a następnie podzielić tę sumę przez liczebność populacji. Wiadomo, że pokazana procedura służy raczej do wyjaśnienia, niż do praktycznego stosowania. W praktyce nie jest niezbędne tworzenie szeregu. Nie należy również wszystkiego zapisywać w długi (rozbudowany) sposób. Najlepiej przyzwyczaić się do stosowania takich tabel: Tabela 2. x 1 2 2 5 5 6 8 8 11 12 15 22 Σx= 97 N =12 Mając średnią arytmetyczną można tę populację porównać z którąkolwiek inną populacją (według tej zmiennej). Porównywania te są głównym celem stosowania średnich wartości. Średnia arytmetyczna znajduje zastosowanie także w niektórych innych procedurach, np. przy pomiarze rozproszenia.