Anna Malarska. statystyczna analiza danych. wspomagana programem SPSS



Podobne dokumenty
Realizacje zmiennych są niezależne, co sprawia, że ciąg jest ciągiem niezależnych zmiennych losowych,

Wymagania edukacyjne matematyka klasa 2 zakres podstawowy 1. SUMY ALGEBRAICZNE

Wymagania edukacyjne matematyka klasa 2b, 2c, 2e zakres podstawowy rok szkolny 2015/ Sumy algebraiczne

2. FUNKCJE WYMIERNE Poziom (K) lub (P)

Wymagania kl. 2. Uczeń:

Wymagania na ocenę dopuszczającą z matematyki klasa II Matematyka - Babiański, Chańko-Nowa Era nr prog. DKOS /02

Algorytmy graficzne. Filtry wektorowe. Filtracja obrazów kolorowych

MATeMAtyka 3 inf. Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych. Zakres podstawowy i rozszerzony. Dorota Ponczek, Karolina Wej

Temat lekcji Zakres treści Osiągnięcia ucznia

WYMAGANIA EDUKACYJNE Z MATEMATYKI W KLASIE IIc ZAKRES PODSTAWOWY I ROZSZERZONY

Oznaczenia: K wymagania konieczne; P wymagania podstawowe; R wymagania rozszerzające; D wymagania dopełniające; W wymagania wykraczające

usuwa niewymierność z mianownika wyrażenia typu

Szczegółowe wymagania edukacyjne z matematyki, klasa 2C, poziom podstawowy

Sumy algebraiczne i funkcje wymierne

Propozycja przedmiotowego systemu oceniania wraz z określeniem wymagań edukacyjnych (zakres podstawowy)

WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY VIII w roku szkolnym 2015/2016

Wektor kolumnowy m wymiarowy macierz prostokątna o wymiarze n=1 Wektor wierszowy n wymiarowy macierz prostokątna o wymiarze m=1

Kodowanie liczb. Kodowanie stałopozycyjne liczb całkowitych. Niech liczba całkowita a ma w systemie dwójkowym postać: Kod prosty

Komisja Egzaminacyjna dla Aktuariuszy LII Egzamin dla Aktuariuszy z 15 marca 2010 r. Część I Matematyka finansowa

PODSTAWY BAZ DANYCH Wykład 3 2. Pojęcie Relacyjnej Bazy Danych

2. PODSTAWY STATYKI NA PŁASZCZYŹNIE

Dorota Ponczek, Karolina Wej. MATeMAtyka 2. Plan wynikowy. Zakres podstawowy

Komisja Egzaminacyjna dla Aktuariuszy LIX Egzamin dla Aktuariuszy z 12 marca 2012 r. Część I Matematyka finansowa

FUNKCJA KWADRATOWA. Moduł - dział -temat Lp. Zakres treści. z.p. z.r Funkcja kwadratowa - powtórzenie PLANIMETRIA 1

Algebra Boola i podstawy systemów liczbowych. Ćwiczenia z Teorii Układów Logicznych, dr inż. Ernest Jamro. 1. System dwójkowy reprezentacja binarna

Grażyna Nowicka, Waldemar Nowicki BADANIE RÓWNOWAG KWASOWO-ZASADOWYCH W ROZTWORACH ELEKTROLITÓW AMFOTERYCZNYCH

WYMAGANIA I KRYTERIA OCENIANIA Z MATEMATYKI W 3 LETNIM LICEUM OGÓLNOKSZTAŁCĄCYM

WYMAGANIA I KRYTERIA OCENIANIA DO EGZAMINU POPRAWKOWEGO MATEMATYKA. Zakresie podstawowym i rozszerzonym. Klasa II rok szkolny 2011/2012

Karta oceny merytorycznej wniosku o dofinansowanie projektu innowacyjnego testującego składanego w trybie konkursowym w ramach PO KL

Przedmiotowy system oceniania z matematyki wraz z określeniem wymagań edukacyjnych (zakres podstawowy) Klasa II TAK

Przedmiotowy system oceniania z matematyki wraz z określeniem wymagań edukacyjnych (zakres podstawowy) Klasa II LO

Równania i nierówności kwadratowe z jedną niewiadomą

Matematyka wykaz umiejętności wymaganych na poszczególne oceny KLASA II

Zastosowanie multimetrów cyfrowych do pomiaru podstawowych wielkości elektrycznych

STYLE. TWORZENIE SPISÓW TREŚCI

Załącznik nr 3 do PSO z matematyki

Karta oceny merytorycznej wniosku o dofinansowanie projektu konkursowego PO KL 1

Wykład 2. Granice, ciągłość, pochodna funkcji i jej interpretacja geometryczna

Matematyka finansowa r. Komisja Egzaminacyjna dla Aktuariuszy. LXVI Egzamin dla Aktuariuszy z 10 marca 2014 r. Część I

Sumy algebraiczne i funkcje wymierne

Księga Identyfikacji Wizualnej. Polskie Sieci Elektroenergetyczne S.A.

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA

2. Tensometria mechaniczna

Wymagania na poszczególne oceny z matematyki w Zespole Szkół im. St. Staszica w Pile. Kl. II poziom podstawowy

Klucz odpowiedzi do zadań zamkniętych i schemat oceniania zadań otwartych

Karta oceny merytorycznej wniosku o dofinansowanie projektu konkursowego PO KL 1

O RELACJACH MIĘDZY GRUPĄ OBROTÓW, A GRUPĄ PERMUTACJI

RBD Relacyjne Bazy Danych

Wymagania edukacyjne z matematyki FUNKCJE dopuszczającą dostateczną dobrą bardzo dobrą

ZASTOSOWANIE RÓWNANIA NASGRO DO OPISU KRZYWYCH PROPAGACYJI PĘKNIĘĆ ZMĘCZENIOWYCH

O PEWNYCH MODELACH DECYZJI FINANSOWYCH

Matematyczne Podstawy Informatyki

Wykład 2. Pojęcie całki niewłaściwej do rachunku prawdopodobieństwa

WYMAGANIA EDUKACYJNE NIEZBĘDNE DO UZYSKANIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH Z MATEMATYKI POZIOM PODSTAWOWY KLASA 2

Rozwiązania maj 2017r. Zadania zamknięte

KOMPENDIUM MATURZYSTY Matematyka poziom podstawowy

WYZNACZANIE OGNISKOWEJ SOCZEWEK CIENKICH ZA POMOCĄ ŁAWY OPTYCZNEJ

Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych klasa druga zakres podstawowy

Analiza matematyczna i algebra liniowa

Metoda sił jest sposobem rozwiązywania układów statycznie niewyznaczalnych, czyli układów o nadliczbowych więzach (zewnętrznych i wewnętrznych).

3. F jest lewostronnie ciągła

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

Podstawy układów logicznych

Wymagania edukacyjne z matematyki Klasa IIB. Rok szkolny 2013/2014 Poziom podstawowy

WEKTORY skalary wektory W ogólnym przypadku, aby określić wektor, należy znać:

Lista 4 Deterministyczne i niedeterministyczne automaty

DZIAŁ 2. Figury geometryczne

Zbiory wyznaczone przez funkcje zdaniowe

Wyk lad 1 Podstawowe wiadomości o macierzach

Modelowanie i obliczenia techniczne. Metody numeryczne w modelowaniu: Różniczkowanie i całkowanie numeryczne

PRZEDMIOTOWY SYSTEM OCENIANIA Z MATEMATYKI W II LICEUM OGÓLNOKSZTAŁCĄCYM im. M. KONOPNICKIEJ W RADOMIU

KONKURS MATEMATYCZNY dla uczniów gimnazjów w roku szkolnym 2012/13. Propozycja punktowania rozwiązań zadań

Wprowadzenie: Do czego służą wektory?

Wyznacznikiem macierzy kwadratowej A stopnia n nazywamy liczbę det A określoną następująco:

4. RACHUNEK WEKTOROWY

Zadania. I. Podzielność liczb całkowitych

Technikum Nr 2 im. gen. Mieczysława Smorawińskiego w Zespole Szkół Ekonomicznych w Kaliszu

Wymagania edukacyjne na poszczególne oceny z matematyki w klasie II poziom rozszerzony

Wymagania edukacyjne z matematyki

MATEMATYKA KLASY I K i rozszerzonym WYMAGANIA EDUKACYJNE NIEZBĘDNE DO UZYSKANIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH

symbol dodatkowy element graficzny kolorystyka typografia

załącznik nr 3 do uchwały nr V Rady Miejskiej w Andrychowie z dnia 24 lutego 2011 r.

Wykład 6 Dyfrakcja Fresnela i Fraunhofera

1 klasyfikacja trójkątów twierdzenie o sumie miar kątów w trójkącie

WEKTORY skalary wektory W ogólnym przypadku, aby określić wektor, należy znać:

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKÓW OBCYCH w Gimnazjum nr 2 im. ks. Stanisława Konarskiego nr 2 w Łukowie

CAŁKOWANIE NUMERYCZNE

Klasa druga: II TK1, II TK2 Poziom podstawowy 3 godz. x 30 tyg.= 90 nr programu DKOS /07 I. Funkcja kwadratowa

wersja podstawowa (gradient)

Dorota Ponczek, Karolina Wej. MATeMAtyka 2. Propozycja przedmiotowego systemu oceniania wraz z określeniem wymagań edukacyjnych.

MATEMATYKA Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych z przedmiotu matematyka w PLO nr VI w Opolu

zestaw DO ĆWICZEŃ z matematyki

Zadanie 5. Kratownica statycznie wyznaczalna.

PRÓBNA MATURA Z MATEMATYKI Z OPERONEM LISTOPAD ,0. 3x 6 6 3x 6 6,

Fizyka. Kurs przygotowawczy. na studia inżynierskie. mgr Kamila Haule

ZADANIA OTWARTE. Są więc takie same. Trzeba jeszcze pokazać, że wynoszą one 2b, gdyż taka jest długość krawędzi dwudziestościanu.

SZTUCZNA INTELIGENCJA

Nauki ścisłe priorytetem społeczeństwa opartego na wiedzy Zbiór scenariuszy Mój przedmiot matematyka

WYMAGANIA NA OCENĘ DOPUSZCZAJĄCĄ DLA UCZNIÓW KLASY Ia TECHNIKUM

Jest błędem odwołanie się do zmiennej, której nie przypisano wcześniej żadnej wartości.

Transkrypt:

Ann Mlrsk sttystyczn nliz dnych wspomgn progrmem SPSS SPSS Polsk Krków 2005

Sttystyczn nliz dnych wspomgn progrmem SPSS 1.2 Grficzne formy prezentcji dnych 1.2.1 Wykres słupkowy, histogrm Częstości relizcji ośmiu wrintów cechy skokowej 100-elementowej ziorowości przedstwiją zestwieni 17 n rysunku 1.4. Rysunek 1.4 Rozkłd zmiennych: ) Zm1; ) Zm2 Podstwowymi grficznymi formmi prezentcji dnych są wykresy słupkowe i histogrmy. N osi odciętych (OX), zrówno wykresu słupkowego, jk i histogrmu, zwsze lokowne są wrtości cechy, n osi rzędnych (OY) ntomist lo częstości (kolumn 2 n powyższych rysunkch), lo procentowo wyrżone wskźniki struktury (kolumn 3 n powyższych rysunkch). Jk nietrudno zuwżyć, sum częstości (OGÓłEM) rozkłdu zmiennej Zm1 wynosi 200, Zm2 100. Stąd wynik, że wrtości w kolumnch CZĘSTOŚĆ i PROCENT dl Zm2 są soie równe, dl Zm1 równe nie są. Efekty tego ędą widoczne n sklch osi rzędnych wykresów częstości i procentów dnej zmiennej. Dl cech typu ilościowego możn sporządzić oie z wymienionych form grficznego rozkłdu, podczs gdy dl cech wyrżonych n sklch słych (opisnych słownie) konstruowne są wyłącznie wykresy słupkowe 18. Oś odciętych wykresu słupkowego opisn jest wówczs wrintmi cechy lu ich etykietmi, jeśli tylko zostły one ndne. Dl zmiennej Zm1 (rys. 1.4) uzysk się wykresy przedstwione n rysunku 1.5. 17 O telrycznych i grficznych formch prezentcji dnych, zsdch orz zletch ich sporządzni trktuje m.in. rozdził 2 prcy ziorowej [9], s. 25 49. 18 Wyrzem tego jest utomtyczny rk cech tekstowych w liście potencjlnych cech poddwnych nlizie grficznej z pomocą histogrmu. 24

Eksplorcj jednej zmiennej Rysunek 1.5 Zmienn Zm1: ) wykres słupkowy z częstościmi; ) histogrm częstości Rysunek 1.6 Zmienn Zm1: ) wykres słupkowy z procentmi; ) histogrm częstości z krzywą normlną Ze względu n dość liczny (o 8-elementowy) i liczowy chrkter wrintów cechy, którym nie ndno opisu (etykiet), etykiety znczników osi odciętych są tkie sme dl wykresów słupkowych z częstościmi (por. rys. 1.5 i ), jk i procentowymi wskźnikmi struktury (por. rys. 1.5 i 1.6). Oferowne w progrmie SPSS histogrmy mogą uwzględnić empiryczną krzywą normlną ądź nie. Wykresy słupkowe tej opcji nie mją. Krzywą normlną nłożoną n histogrm grficznie prezentownej cechy opisują empiryczne wrtości średniej rytmetycznej i odchyleni stndrdowego (por. rys. 1.5 i 1.6). Rysunki 1.5 i 1.6 są tkie sme, jednk z uwgi n inną zmienną zleżną (częstość i procent) skle osi OY są różne. Grficznemu wizerunkowi rozkłdu tej smej cechy w formie histogrmu możn ndwć różny wygląd. N rysunku 1.7 przedstwione są przykłdowe histogrmy dl zmiennej Zm2 (rys. 1.4). Rysunek 1.7 Zmienn Zm2: histogrmy częstości z krzywą normlną. Ojśnieni w tekście 25

Sttystyczn nliz dnych wspomgn progrmem SPSS Oś OX ou histogrmów opisują środki przedziłów cechy. Pierwszy z wykresów (rys. 1.7) jest oryginlnym (utomtycznie generownym) produktem progrmu SPSS. W drugim (rys. 1.7) skorygowne zostły zrówno rozpiętości przedziłów cechy (1.125), jk i zkres skli osi OY (mx = 9.6). Dostępn w pkiecie SPSS możliwość ingerencji użytkownik w klsyfikcję cechy (skutkując modyfikcją skli osi OX) sprzyj częstym poszukiwniom niekoniecznie formlnych rgumentów przemwijących z zgodnością rozkłdu empirycznego cechy z rozkłdem normlnym. W kżdym histogrmie możn umieszczć legendę z empirycznymi wrtościmi średniej rytmetycznej i odchyleni stndrdowego. N przedstwionych powyżej histogrmch opcj t zostł wyłączon. 1.2.2 Wykres skrzynkowy Wykres skrzynkowy (Box-nd-Whisker Plot, Boxplot), zwny też pudełkowym lu skrzynką z wąsmi, przedstwi rozkłd uporządkownych wrtości cechy pod postcią wykorzystnego w nzwie prostego przedmiotu. Ułtwi dignostykę rozproszeni wrtości cechy orz chrkteru (typu) skośności rozkłdu cechy. Z wykresu skrzynkowego nietrudno odczytć: położenie wrtości środkowej (mediny); wrtości kwrtyli (pierwszego i trzeciego); położenie wrintów cechy, które nie odstją od tendencji centrlnej; występownie nietypowych wrintów cechy; występownie ekstremlnych wrintów cechy. Chrkterystykę wykresu skrzynkowego przedstwi rysunek 1.8. Wrtości cechy wąs wrtość mksymln (skrjn) wrtość nietypow njwyższ oserwown wrtość, któr nie odstje od pozostłych Rysunek 1.8 Wykres skrzynkowy dl rozkłdu symetrycznego cechy Y rozstęp międzykwrtylowy wąs 75 percentyl medin 25 percentyl njniższ oserwown wrtość, któr nie odstje od pozostłych wrtość nietypow wrtość minimln (skrjn) Nzw cechy Długość rozstępu międzykwrtylowego (hspred) jest różnicą między krwędzimi skrzynki (pudełk). W oszrze pudełk mieści się 50% wrtości cechy. Wąsy skrzynki pokzują wrtości cechy, jkie mieszczą się wewnątrz 1.5 26

Eksplorcj jednej zmiennej długości zwisu (choć 1.5 długości zwisu może wykrczć poz wąsy). Symolem oznczone są nietypowe wrtości ekstremlne oddlone od 25. (75.) percentyl dlej niż 3 długości pudełk, zś symolem nietypowe wrtości, oddlone od 25. (75.) percentyl dlej niż 1.5 długości pudełk. Zsdę wnioskowni o typie skośności rozkłdu n podstwie wykresu skrzynkowego przedstwi rysunek 1.9. Rysunek 1.9 Wykresy skrzynkowe dl rozkłdu symetrycznego: ) lewostronnie; ) prwostronnie Me x Me > x x Me < 0 x Me Me < x x Me > 0 W progrmie SPSS możliw jest prezentcj kilku oxplotów n jednym wykresie równocześnie. Znjduje to zstosownie w nlizch porównwczych rozkłdów wrunkowych (podziorów) cechy, wyodręninych np. ze względu n płeć, grupy wieku, kontynenty itp. Przykłdem tego są wykresy przedstwione n rysunku 1.10. Rysunek 1.10 Zmienn Z: ) oxplot rozkłdu; ) oxploty rozkłdów wrunkowych Wykresy skrzynkowe z rysunku 1.10 ilustrują zdekomponowny n 3 rozłączne, różnoliczne klsy rozkłd cechy Z z rysunku 1.10. Tylko kls środkow tej cechy chrkteryzuje się rkiem wrtości odstjących (w pozostłych klsch jest ich po kilk). W żdnym z rozkłdów wrunkowych nie występują wrtości skrjne. Licz 132 (widoczn n rysunku 1.10) jest etykietą (tu: pozycją oserwcji) jedynego nietypowego wrintu zmiennej Z, jki cechuje rozkłd ogólny. 27

Sttystyczn nliz dnych wspomgn progrmem SPSS 1.2.3 Digrm łodyg i liście Digrm łodyg i liście 19 (Stem-nd-Lef Plot) jest formą grficznej prezentcji rozkłdu zmiennej przypominjącą histogrm. Punktowo zgregowne wrtości relizcji zmiennej przedstwione są w postci poziomego ciągu znków numerycznych odpowidjących leżącym (oróconym o kąt 90 ) kolumnom histogrmu. Kżd z trzech odręnych kolumn digrmu optrzon jest osonym ngłówkiem o treści: częstość, łodyg i liść (odpowiednio: FREQUENCY, STEM & LEAF). Digrm uzupełniją informcje o wystąpieniu wrtości ekstremlnych i komunikt o tym, że kżdy element liści odpowid pojedynczemu przypdkowi cechy (EACH LEAF: 1 CASE(S)). Istotę konstrukcji digrmu łodyg i liście orz podoieństwo z histogrmem njlepiej prześledzić n przykłdch. PRZYKŁAD 1.1 N rysunku 1.11 znjduje się histogrm częstości i odpowidjący mu digrm łodyg i liście przykłdowej zmiennej Z1. Rysunek 1.11 Zmienn Z1: ) digrm łodyg i liście; ) histogrm częstości Z drugiego od dołu wiersz digrmu czytmy, że pięciokrotnie (FREQUENCY=5) występuje wrtość 2.0 cechy (STEM=2). Z szerokości łodygi równej 1 wynik owiem, że kżdorzowo rząd wielkości wrtości oryginlnej cechy wynosi 1, tzn. jest on jednocyfrow (STEM WIDTH: 1), z zwrtości kolumny łodygi (STEM) w tym wierszu, że wynosi dokłdnie 2. Część dziesiętn tego wrintu cechy wynosi kżdorzowo 0, poniewż w kolumnie liści (LEAF) występuje pięć zer. 19 Zmiennie z łodygą używny jest termin głąź. 28

Eksplorcj jednej zmiennej PRZYKŁAD 1.2 N rysunku 1.12 znjduje się histogrm częstości i odpowidjący mu digrm łodyg i liście przykłdowej zmiennej Z2. Rysunek 1.12 Zmienn Z2: ) digrm łodyg i liście; ) histogrm częstości Z drugiego wiersz digrmu wynik, że wrtość 6.0 cechy występuje dziewięciokrotnie, gdyż część dziesiętn tego wrintu cechy wynosi kżdorzowo 0 (podonie, jk w przykłdzie 1.1, szerokość głęzi wynosi 1). Zdrz się, że digrm łodyg i liście nie posid dorego odpowiednik (wiernej kopii) w postci histogrmu. Świdectwem tego są prezentowne w przykłdch 1.3 i 1.4 lterntywne wersje histogrmów. Automtycznie uzyskiwne w progrmie SPSS oie formy grficznego rozkłdu cechy są mło zieżne (niepodone), histogrmy wnoszą mniej szczegółów do opisu rozkłdu zmiennej niżeli digrm łodyg i liście. PRZYKŁAD 1.3 N rysunku 1.13 znjduje się histogrm częstości (wersj utomtycznie wygenerown przez progrm i wersj skorygown) i odpowidjący mu digrm łodyg i liście przykłdowej zmiennej. PRZYKŁAD 1.4 N rysunku 1.14 znjduje się histogrm częstości (wersj utomtycznie wygenerown przez progrm i wersj skorygown) i odpowidjący mu digrm łodyg i liście przykłdowej zmiennej. W przykłdch 1.3 i 1.4 szerokość głęzi wynosi 10 (STEM WIDTH: 10). Ozncz to, że wrtości wrintów cech przedstwionych n ou digrmch są dwucyfrowe. Pierwsz z cyfr wrtości cechy, ędąc liczą dziesiątek, podn jest wprost w kolumnie łodygi digrmu (STEM), ntomist informcj o cyfrze jednostek poszczególnych wrintów cechy znjduje się n kolejnych pozycjch liści (LEAF). W przykłdzie 1.3 odpowid to schemtowi z teli 1.4. 29

Sttystyczn nliz dnych wspomgn progrmem SPSS c Rysunek 1.13 Przykłdow zmienn: ) digrm łodyg i liście; histogrm: ) wersj utomtyczn; c) wersj skorygown c Rysunek 1.14 Przykłdow zmienn: ) digrm łodyg i liście; histogrm: ) wersj utomtyczn; c) wersj skorygown Tel 1.4 Zsd konstrukcji digrmu łodyg i liść Cyfr dziesiątek (Stem) Cyfr jednostek (Lef ) Licz 8 02 80, 82 7 223489 72, 72, 73, 74, 78, 79 6 5889 65, 68, 68, 69 5 2389 52, 53, 58, 59 4 4 44 W liściu trzecim przykłdu 1.4 występuje 8 znków numerycznych, które po skojrzeniu z wrtością głęzi (7) i jej szerokością (10) odpowidją nstępującym relizcjom zmiennej: 70, 70, 71, 72, 73, 74, 74 i 74. W drugim wierszu tego digrmu powtrz się licz dziesiątek głęzi trzeciej, le znki numeryczne liści są większe od 4. Tym smym widomo, że jeszcze trzykrotnie, 30

Eksplorcj jednej zmiennej choć w osonej klsie, występują wrinty cechy z przedziłu 70 79, tzn. 75, 75 i 78. Uniwerslnym i prostym sposoem ustlni wrtości konkretnego wrintu cechy jest jednoczesne wykorzystnie informcji o wrtości łodygi (STEM), wrtości liści (LEAF) i o szerokości głęzi (STEM WIDTH) w myśl zsdy: (Stem.Lef ) Stem width = wrtość cechy, gdzie: Stem część wrtości cechy występując przed przecinkiem (tu: kropką) liczy; Lef część wrtości cechy występując po przecinku liczy. W przykłdzie 1.1 wrtości wszystkich wrintów cechy z częstością 5 (wyróżniony wiersz 2 digrmu) wynoszą: 2.0 1 = 2. W przykłdzie 1.3 w wyróżnionym czwrtym wierszu digrmu łodyg i liść z częstością 4 występują różne wrtości cechy wynoszące kolejno: 5.2 10 = 52, 5.3 10 = 53, 5.8 10 = 58, 5.9 10 = 59. Przykłdy 1.3 i 1.4 prezentują podził wrintów cechy n pięć kls. Rozkłdy te różni rozpiętość kls, któr w przykłdzie 1.3 wynosi 9, w przykłdzie 1.4 jest niższ i wynosi tylko 4. Jkkolwiek pró unifikcji rozpiętości przedziłów ou rozkłdów jest ezzsdn. Potwierdzeniem tego są odpowidjące digrmom histogrmy. Kżdy z histogrmów jest owiem rozieżny z wizerunkiem rozkłdu przedstwionego n digrmie dltego, że inn jest metod grupowni dnych. A metod t jest notene niezleżn od użytkownik. Wszystkie zprezentowne przykłdy kcentują rolę, potrzeę i przydtność wielu różnych, uzupełnijących się sposoów telrycznej i grficznej prezentcji dnych w poprwnej dignostyce rozkłdów cech. 1.2.4 Wykresy normlności Zprezentowne powyżej grficzne formy wizulizcji dnych wykorzystywne są w większości przypdków do opisu rozkłdu pojedynczej zmiennej Y = {y 1, y 2,..., y n }. Tymczsem widomo, że kżd tk zmienn Y może podlegć wewnętrznemu zróżnicowniu ze względu n określony czynnik X = {x 1, x 2,..., x k }. 31

Sttystyczn nliz dnych wspomgn progrmem SPSS Pojwieniu się nowej zmiennej X w nlizch rozkłdu zmiennej Y towrzyszą znne już prolemy opisu jej ogólnego rozkłdu orz w wydzielnych przez czynnik X grupch, tj.: identyfikcj typu rozkłdów wrunkowych, ocen wielkości rozrzutu czy symetrii wewnątrz grup. Widomo już, że do dignozowni symetrii rozkłdu stosowne są wykresy skrzynkowe (Boxplots) orz digrmy łodyg i liście (Stem-nd-Lef Plots), które wychwytują wrtości nietypowe w rozkłdzie empirycznym cechy i ułtwiją oserwcję wpływu trnsformcji zmiennej n zminę ksztłtu rozkłdu. Kolejną, grficzno-nlityczną ofertą progrmu SPSS wykorzystywną do dni wielkości odstępstw rozkłdu empirycznego zmiennej od normlności są wykresy normlności (Normlity Plots) 20 K K (Kwntyl Kwntyl) w wersji z tendencją główną i ez. Anlitycy twierdzą owiem, że skłonność czy wręcz preferencje do studiowni wykresów normlności, nie testownie hipotez o normlności rozkłdu, wynikją z potrzey identyfikcji orz oceny skli wystąpień pojedynczych różnic rozkłdu empirycznego zmiennej od oczekiwnego normlnego. Wykres normlności K K z trendem ilustruje położenie punktów P i o współrzędnych (x i, N x i ) w stosunku do prostej opisnej liniowym przeksztłceniem stndryzcyjnym empirycznych relizcji zmiennej X z i = x i x S(x). N osi odciętych (OX) wykresu znjdują się rzeczywiste kwntyle (x i ) zmiennej X, n osi rzędnych (OY) ntomist hipotetyczne kwntyle empiryczne odwrotnej, skumulownej funkcji gęstości stndryzownego rozkłdu normlnego wyznczne według wzoru: ( ) Nx i = Ψ 1 Ri (1.31) N + 1 gdzie: odwrotność skumulownej funkcji gęstości rozkłdu normlnego stndryzownego 21 ; Ψ 1 R i rng x i -tej oserwcji lu średni rng oserwcji powiąznych rngą. Oserwcje N x i są wrtościmi oczekiwnymi zmiennej rzeczywistej X wynikjącymi z złożeni o jej rozkłdzie normlnym stndryzownym. Współrzędne N x i punktów P i są wrtościmi rgumentów empirycznej dystryunty, liczonej według wzoru: F ( N x i ) = f i sk N (1.32) w którym f i sk oznczją skumulowne częstości empiryczne x i -tego kwntyl, N x i : N(0; 1). 20 Rozkłd normlny jest przedmiotem szczegółowych rozwżń w p. 3.1.2 prcy. 21 Funkcj Ψ 1 zwrc wrtość rgumentu podnej wielkości skumulownej funkcji gęstości rozkłdu normlnego stndryzownego. 32

Eksplorcj jednej zmiennej Jeżeli punkty P i ukłdją się (oscylują) wzdłuż linii prostej (zlineryzownej dl potrze grfiki krzywej normlnej), wówczs twierdzi się, że dne empiryczne dorze dopsowują się do rozkłdu normlnego, innymi słowy, że rozkłd normlny dostrcz dorego dopsowni do dnych empirycznych. Wyrz wolny i współczynnik kierunkowy dopsownej linii prostej są interpretowne jko grficzne oszcowni odpowiednio średniej (m) i odchyleni stndrdowego (σ) rozkłdu normlnego. Dopsown lini regresji jest przekątną wykresu normlności K K z trendem. Jeśli przed wygenerowniem linii regresji dopsownej do punktów P i (x i, N x i ) usunięt jest główn tendencj rozwojow (rozumin jko tendencj zmin), wówczs dopsown prost jest postci d i = 0, grficzny orz punktów empirycznych z hipotetycznymi nzywny jest wykresem normlności K K ez trendu. Wykres ten ilustruje położenie punktów P i o współrzędnych {x i, d i } w stosunku do linii d i = 0, przy czym d i jest różnicą wrtości jednostki stndryzownej i wrtości opisnej formułą (1.31), tzn.: d i = z i N x i (1.33) Wykres normlności K K ez trendu jest wykorzystywny do oceny tego, czy i do jkiego stopni rozkłd zmiennej podleg rozkłdowi normlnemu. Elimincj trendu skutkuje rozciągnięciem rzędnych wykresu (zwłszcz dl nielicznie reprezentownej zmiennej), ułtwijąc odkrywnie wzorców odchyleń. Oserwcj wielkości i tendencji odchyleń rozkłdu empirycznego od hipotetycznego rozkłdu normlnego stnowi podstwę poszukiwń formuł trnsformcji wrtości rzeczywistych zmiennej. Suiektywnie oceniny stopień zgodności empirycznego rozkłdu zmiennej (oryginlnej ądź jej trnsformcji) z oczekiwnym rozkłdem normlnym wynik z położeni punktów P i względem: linii regresji (linii dopsowni) w przypdku wykresu normlności K K z trendem, linii d i = 0 w przypdku wykresu normlności K K ez trendu. Wykres normlności K K ez trendu czytelniej opisuje poziom odchyleń rozkłdu empirycznego od hipotetycznego rozkłdu normlnego. N wykresie tym oczekiwne są jk njmniejsze dystnse wszystkich punktów empirycznych od linii regresji. W myśl teorii trzech sigm: P { X 3σ} = 0.9973, odstępstw te nie powinny przekrczć odległości ±3σ, co jest łtwo weryfikowlne n osi rzędnych wykresu. Istotę nlizy wykresów normlności rozkłdu njlepiej prześledzić n nstępujących przykłdch. PRZYKŁAD 1.5 Niech rysunki 1.15 i przedstwiją rozkłdy wrunkowe cech Z1 i Z2 ze względu n wiek respondentów nkiety przeprowdzonej wśród 100 osó 22. Wykresy normlności rozkłdów empirycznych zmiennych Z1 i Z2 wyłącznie dl grupy wiekowej 21 lt przedstwione są n rysunkch 1.16 (z uwzględnieniem tendencji głównej) i 1.17 (w wersji ez trendu). 22 Cechy Z1 i Z2 zczerpnięte są ze zioru 1 dodtku C. 33

Sttystyczn nliz dnych wspomgn progrmem SPSS Rysunek 1.15 Rozkłdy zmiennych: ) Z1 według wieku; ) Z2 według wieku Rysunek 1.16 Wykres normlności z trendem dl zmiennej: ) Z1; ) Z2 Rysunek 1.17 Wykres normlności ez trendu dl zmiennej: ) Z1; ) Z2 Niełtwe jest wnioskownie o tym, który z porównywnych rozkłdów (cechy Z1, czy Z2) jest liższy normlnemu. N ou wykresch owiem położenie punktów o współrzędnych określonych przez wrtości oserwowne i oczekiwne względem linii regresji jest rdzo podone, chociż nieco liższe prostej wydją się yć one dl zmiennej Z2. Więcej szczegółów w tym zkresie wnoszą wykresy ez trendu (rys. 1.17). 34

Eksplorcj jednej zmiennej Z porównni skl osi rzędnych wykresów normlności ez trendu wynik, że odchyleni rozkłdu empirycznego od normlnego w przypdku zmiennej Z1 mieszczą się w oszrze ±0.8σ, podczs gdy dl zmiennej Z2 są mniejsze i mieszczą się w oszrze ±0.6σ. Sugeruje to, że rdziej zliżony do normlnego jest rozkłd zmiennej Z2 niżeli Z1, co nie jest równoznczne z domniemniem, że rozkłd którejkolwiek ze zmiennych jest normlny. Wnioskownie o tym wymg przeprowdzeni stosownego testu sttystycznego. Z punktu widzeni nliz młych ziorowości przydtnym może yć też spostrzeżenie, że to oserwcje skrjne ou zmiennych są przyczyną njwiększych odstępstw rozkłdów empirycznych od normlnego. Korekt rozkłdów empirycznych może iść w kierunku elimincji zidentyfikownych wykresmi normlności przypdków skrjnych dnych zmiennych. 1.2.5 Wykres rozrzut poziom Punktowy wykres rozrzut poziom (Spred-versus-Level Plot) znjduje zstosownie wyłącznie w nlizie rozkłdu zmiennej Y = {y 1, y 2,..., y n } podlegjącej zróżnicowniu ze względu n określony czynnik X = {x 1, x 2,..., x k }. Jest on nrzędziem dignostyki zmin równości wrincji międzygrupowych zmiennej Y (Xk ) poddnej n przykłd różnym formułom trnsformcji. Wykres skli dyspersji i poziomu średniego zmiennej wrunkowej ilustruje położenie punktów P i o współrzędnych {p i, r i } dl i = 1, 2,..., k grup. Oś odciętych wykresu stnowią wrtości medin zmiennej w kżdej z grup (lu ich logrytmy), p i, zś oś rzędnych międzykwrtylowe rozstępy (odchyleni ćwirtkowe) zmiennej odpowidjące kżdej z grup (lu ich logrytmy), r i. Wykres rozrzut poziom sporządzny jest w trzech wrintch. W wersji pierwszej (OSZACOWANIE POTĘGI, Power estimtion) logrytmów nturlnych odchyleń ćwirtkowych względem logrytmów nturlnych medin dl kżdej z grup wykres rozrzut poziom zwier dwuskłdnikowy komentrz słowny zwierjący informcje dotyczące: wielkości nchyleni (slope) linii regresji punktów P i względem poziomu; wrtości wykłdnik potęgi przeksztłceni potęgowego zmiennej (MOC TRANSFORMACJI, Power for trnsformtion), które zrównuje wrincje międzygrupowe 23. W komentrzch do ou nstępnych wersji wykresu rozrzut poziom znjduje się tylko jeden prmetr nchylenie linii regresji punktów P i względem poziomu. W wersji drugiej (PRZEKSZTAłCONE DANE, Trnsformed) wyiern jest formuł przeksztłceni zmiennej. W wersji trzeciej (NIE PRZEKSZTAłCONE, Untrnsformed) tk możliwość nie występuje, wykres sporządzny jest n podstwie dnych źródłowych zmiennej. 23 Równość wrincji międzygrupowych zmiennej Y (Xk) m miejsce wówczs, gdy wykres rozrzut poziom przedstwi liniowy ukłd punktów P i z prmetrem nchyleni liskim zero i wykłdniku liskim jeden. 35

Sttystyczn nliz dnych wspomgn progrmem SPSS Zstosownie tego nrzędzi jest pomocne w doorze postci trnsformcji zmiennej. Zmienną przeksztłc się po to, y stilizując rozrzut, symetryzowć jej rozkłd. Wyznczon w progrmie SPSS wrtość mocy trnsformcji (wykłdnik potęgi) n poziomie 0 (i lisk temu) sugeruje trnsformcję logrytmiczną, wrtość 0.5 (i lisk temu) trnsformcję w postci pierwistk kwdrtowego, ntomist wrtość 1 jest symptomem rku wskzń do trnsformcji 24. Wrtości mocy z przedziłu (0,..., 0.5) wskzują n testownie dwóch postci trnsformcji uwzględnijących wrtości skrjne tego przedziłu, moc z przedziłu (0.5,..., 1) pierwistk kwdrtowego. Uzyskiwne wskzni tego nrzędzi mogą yć zwodne dl zmiennych o zyt młej liczie rozkłdów wrunkowych. Istotną sugestią w tym zkresie jest konfrontcj wielu postci trnsformcji dokonywn w kontekście wizulnej oceny rozkłdów wrunkowych zmiennej n podstwie wykresów skrzynkowych, digrmów łodygi i liści orz wyników testu Levene jednorodności wrincji. Nie ez znczeni jest tkże rozpoznnie iliogrficzne stosownych trnsformcji w zkresie nlizownej i pokrewnej temtyki. Inną przyczyną zwodności dignostyki postci trnsformcji zmiennej n podstwie wykresu rozrzut poziom jest występownie nietypowych grup zmiennej wrunkowej spowodowne młą liczą oserwcji. Poszukiwnie włściwej trnsformcji zmiennej yw nieskuteczne w przypdkch, w których nietypowe rozkłdy wrunkowe mją wpływ n prmetr nchyleni. Wówczs odrzucne są punkt/punkty nietypowe (wizulnie wystrczy zkryć je ręką), dlsze rozwżni dotyczą tego, czy wykłdnik potęgi poszukiwnej krzywej przeiegjącej przez pozostłe punkty wykresu jest dodtni, czy ujemny. Zsdne jest trnsformownie zmiennej priori (wyznczenie przykłdowo jej wrtości logrytmicznej) i sporządzenie wykresu rozrzut poziom. Anliz wykże, czy t klsyczn postć trnsformcji m sens, czy też nie. A nie jest on ezzsdn wtedy, gdy uzyskne nchylenie jest liskie zeru (±), tym smym wykłdnik trnsformcji potęgowej (moc) jedynce (odp. ). Przykłdy wykresów rozrzut poziom dl zmiennych Z1 i Z2 (por. rys. 1.15) przedstwiją rysunki 1.18. Rysunek 1.18 Wykres rozrzut poziom zmiennej: ) Z1 (Ln rozrzutu vs Ln poziomu, nchylenie =.140, moc przeksztłceni =.860); ) Z2 (Ln rozrzutu vs Ln poziomu, nchylenie =.1.085, moc przeksztłceni =.085) według wieku 24 Pełniejszy wykz tych przeksztłceń pokzuje zestwienie znjdujące się w p. 2.3.1 dotyczącym testu Levene jednorodności wrincji. 36

Eksplorcj jednej zmiennej Położenie punktów rejestrujących równoczesną wielkość poziomu i rozrzutu zmiennej Z1 względem wieku nie wykzuje żdnej regulrnej tendencji zmin. Ukłd punktów ż trzech (spośród pięciu) ktegorii wieku wskzuje n rk związku między poziomem rozproszeniem, gdyż różn jest wielkość rozrzutu dl tego smego poziomu średniego cechy. W przypdku zmiennej Z2 prwidłowość t dotyczy dwóch pierwszych kls wieku. Z informcji zwrtych w podpisie do wykresów (o postci sugerownej trnsformcji cech) wynik, że zmienn Z1 nie powinn yć trnsformown (moc przeksztłceni wynoszącą 0.860 możn uznć z liską 1), ntomist woec zmiennej Z2 sugerowne jest przeksztłcenie logrytmiczne (moc przeksztłceni wynoszącą 0.085 możn uznć z liską 0). Dl zoserwowni skutków przeksztłceni wrtości zmiennych n relcję między poziomem rozrzutem zstosown zostł trnsformcj logrytmiczn. Rezultty tych ziegów ilustruje rysunek 1.19. Rysunek 1.19 Wykres rozrzut poziom zmiennej: ) Ln(Z1) (Ln rozrzutu vs Ln poziomu, nchylenie =.198, moc przeksztłceni = 1.198); ) Ln(Z2) (Ln rozrzutu vs Ln poziomu, nchylenie = 1.346, moc przeksztłceni =.346) według wieku W ou przypdkch ziegi zmin tendencji i relcji między poziomem rozrzutem okzują się yć nieskuteczne, gdyż ogólny orz punktów n rysunkch 1.18 i nie różni się od rysunków 1.19 i. UWAGA Szykim sposoem przeprowdzeni opercji trnsformowni zmiennej, nstępnie jej testowni wykresem rozrzut poziom, ez konieczności powrotu do Edytor dnych, jest powtórne uruchomienie opcji OPIS STATYSTYCZNY EKSPLORACJA, z poziomu której możn nrysowć wykres rozrzut poziom, doierjąc jedną z sześciu wudownych postci trnsformcji. Wystrczy zznczyć polecenie TRANSFORMACJA, ktywując opcję PRZEKSZTAłCONE dne znjdujące się pod poleceniem ROZRZUT POZIOM Z TESTEM LEVENE A w oknie dilogowym EKSPLORACJA WYKRESY. 1.2.6 Wykres punktowy W dignostyce powiązń między cechmi 25 we wstępnym rozpoznniu chrkteru i kierunku zleżności pr cech ilościowych pomocny jest njprostszy 25 Punkt ten, w drodze wyjątku, nie jest elementem eksplorcyjnej nlizy jednej zmiennej. Prezentcj wykresów punktowych w tym miejscu podyktown jest zmirem wyczerpni i zgrupowni njczęściej wykorzystywnych grficznych form prezentcji dnych. 37

Sttystyczn nliz dnych wspomgn progrmem SPSS z wykresów korelcyjnych tzw. wykres punktowy w progrmie SPSS zwny wykresem rozrzutu (Sctter Plots). Przykłdowe wykresy rozrzutu przedstwi rysunek 1.20. Rysunek 1.20 Wykres rozrzutu prostoliniowej zleżności cech X i Y postci ŷ i = + x i wg kierunku zleżności cech: ) kierunek dodtni; ) kierunek ujemny Zgodnie z ogólną zsdą grficznej prezentcji zleżności między dwom cechmi (y i = f (x i )) wrinty cechy niezleżnej X reprezentuje oś odciętych ukłdu współrzędnych, oś rzędnych ntomist wrinty cechy zleżnej Y. Wnętrze wykresu wypełniją punkty P i (o współrzędnych {x i, y i } dl i = 1, 2,..., n) chrkteryzujące się i-tymi relizcjmi cech X (x i X) i Y (y i Y) równocześnie. Proste znjdujące się n wykresch są teoretycznymi linimi regresji, opisującymi liniowe zleżności zmiennych. N podstwie ich położeni nietrudno zuwżyć, że w wrincie z rysunku 1.20 wzrostowi wrtości cechy X towrzyszy wzrost wrtości cechy Y, ntomist w wrincie przedstwionym n rysunku 1.20, wzrostowi wrtości cechy X towrzyszy spdek wrtości cechy Y. W pierwszym przypdku dodtni współczynnik liniowej zleżności cech X i Y wskzuje n korelcję dodtnią między cechmi, w drugim ntomist współczynnik jest ujemny, wskzując n korelcję ujemną. Nie zwsze jednk jednoznczn jest postć, czy kierunek zleżności między cechmi X i Y. Tego typu sytucję ilustruje rysunek 1.21. Rysunek 1.21 Wykres rozrzutu dodtniej zleżności cech X i Y wg typu ŷ i = + x i, ŷ i = + x i + cx 2 i : ) zleżność prostoliniow; ) zleżność kwdrtow Dl tych smych dnych zleżność między cechmi w wrincie przedstwionym n rysunku 1.21 opisuje regresj prostoliniow, w wrincie z rysunku 1.21 krzywoliniow (prwe rmię proli). O tym, któr z teoretycznych linii regresji lepiej dopsowuje się do dnych empirycznych, decydują szczególne chrkterystyki regresji dostępne już n etpie konstruowni wykresu punktowego (współczynnik determincji R 2 ). 38

Eksplorcj jednej zmiennej Rysunek 1.22 Wykres rozrzutu kwdrtowej zleżności cech X i Y (ŷ i = + x i + cxi 2 ) wg typu: ) zleżność wypukł, c > 0; ) zleżność wklęsł, c < 0 Frgmentmi różnokierunkową zleżność między cechmi opisują proliczne linie regresji utomtycznie uzyskiwne w progrmie SPSS n dnym mterile empirycznym. Ilustrcją tego jest rysunek 1.22. 1.3 Przeksztłceni dnych Niemjąc żdnych przeciwwskzń dignostyk rozkłdów cech nie jest sztuką smą w soie. Sprzyj poprwności zstosowń wielu procedur sttystycznych, u podstw których leżą wymogi formlne stwine cechom wyrżonym n skli co njmniej porządkowej. Woec dnych sttystycznych o chrkterze ilościowym njczęściej formułownymi postultmi są: symetri rozkłdu cech; ddytywność (sumowlność) cech, oznczjąc zdolność ich porównywlności, zwłszcz gdy są różnoimienne; stłość rozstępu cech (stłość wrtości ekstremlnych); dodtniość cech, oznczjąc występownie wyłącznie wrtości dodtnich; jednolitość preferencji, czyli jednokierunkowość oddziływni cech n zjwisko przez nie opisywne. Spełnienie przez cechę dowolnego z ww. postultów, którego nturlnie nie posid, uzyskiwne jest różnymi sposomi. Njczęściej są to przeksztłceni lgericzne określne ogólnym minem normlizcji. Ten sm typ normlizcji zpewni równoczesne spełnienie postultów ddytywności i stłości rozstępu. Formułmi ujednolicni cech są: rngownie, przeksztłceni ilorzowe, stndryzcj, unitryzcj. Rngownie, dresowne do cech wyrżonych n skli co njmniej porządkowej, poleg n zstąpieniu relizcji zmiennej wyjściowej ich rngmi (miejscmi n liście), wynikjącymi z uporządkowni oserwcji (przypdków) zgodnie z zsdą monotonicznej hierrchizcji wrintów cechy. 39