Podstawy statystyki medycznej Laboratorium. Zajęcia 5 wprowadzenie do programu Statistica

Podobne dokumenty
Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

ZARZĄDZANIE DANYMI W STATISTICA

Ćwiczenia nr 4. Arkusz kalkulacyjny i programy do obliczeń statystycznych

1. WPROWADZENIE DO OBSŁUGI PROGRAMU STATISTICA. Nazwy zmiennych

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Temat: Organizacja skoroszytów i arkuszy

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Opracowywanie wyników doświadczeń

Podstawowe czynnos ci w programie Excel

UONET+ - moduł Sekretariat. Jak wykorzystać wydruki list w formacie XLS do analizy danych uczniów?

MS Excell 2007 Kurs podstawowy Filtrowanie raportu tabeli przestawnej

BAZA_1 Temat: Tworzenie i modyfikowanie formularzy.

Praktyczne wykorzystanie arkusza kalkulacyjnego w pracy nauczyciela część 1

Sekretariat Optivum. Jak przygotować listę uczniów zawierającą tylko wybrane dane, np. adresy ucznia i jego opiekunów? Projektowanie listy

Wykład 4: Statystyki opisowe (część 1)

Wprowadzenie do analizy dyskryminacyjnej

Zadanie 10. Stosowanie dokumentu głównego do organizowania dużych projektów

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Analiza Statystyczna

Jak przygotować pokaz album w Logomocji

Celem ćwiczenia jest zapoznanie się z podstawowymi funkcjami i pojęciami związanymi ze środowiskiem AutoCAD 2012 w polskiej wersji językowej.

Trik 1 Autorejestrowanie zmian dokonanych w obliczeniach

Arkusz kalkulacyjny EXCEL

Tworzenie i modyfikowanie wykresów

Trik 1 Edycja wykresu bezpośrednio w dokumencie Worda

Arkusz kalkulacyjny MS Excel 2010 PL.

I Tworzenie prezentacji za pomocą szablonu w programie Power-Point. 1. Wybieramy z górnego menu polecenie Nowy a następnie Utwórz z szablonu

TABELE I WYKRESY W EXCELU I ACCESSIE

Tworzenie prezentacji w MS PowerPoint

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

TABELE I WYKRESY W EXCELU I ACCESSIE

EXCEL TABELE PRZESTAWNE

Podstawy tworzenia prezentacji w programie Microsoft PowerPoint 2007

Zadanie 11. Przygotowanie publikacji do wydrukowania

INSTRUKCJA UŻYTKOWNIKA PORTALU SIDGG

Tworzenie szablonów użytkownika

4.Arkusz kalkulacyjny Calc

Zadanie 1. Stosowanie stylów

Instrukcja. importu dokumentów. z programu Fakt do programu Płatnik. oraz. przesyłania danych do ZUS. przy pomocy programu Płatnik

UMOWY INSTRUKCJA STANOWISKOWA

Edytor tekstu OpenOffice Writer Podstawy

Rys.1. Technika zestawiania części za pomocą polecenia WSTAWIAJĄCE (insert)

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS cz. 1

Projekt ZSWS. Instrukcja uŝytkowania narzędzia SAP Business Explorer Analyzer. 1 Uruchamianie programu i raportu. Tytuł: Strona: 1 z 31

TP1 - TABELE PRZESTAWNE od A do Z

Kolumna Zeszyt Komórka Wiersz Tabela arkusza Zakładki arkuszy

Prezentacja multimedialna MS PowerPoint 2010 (podstawy)

Lp. Nazwisko Wpłata (Euro)

INSTRUKCJA OTWIERANIA PLIKU DPT (data point table)

Jak korzystać z Excela?

Wykład 3: Prezentacja danych statystycznych

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

% sumy wiersza nadrzędnego. % sumy kolumny nadrzędnej. % sumy elementu nadrzędnego. Porządkuj od najmniejszych do największych.

Kadry Optivum, Płace Optivum

Dla kas Nano E w wersjach od 3.02 oraz Sento Lan E we wszystkich wersjach.

Instrukcja użytkownika ARSoft-WZ3

prosta baza danych (nawet trochę bardziej niż prosta) tworzenie dokumentów (zwłaszcza z dużą ilością tabel lub o tabularycznej

BAZY DANYCH Formularze i raporty

MS Excel. Podstawowe wiadomości

Statystyki opisowe i szeregi rozdzielcze

Płace Optivum. Jak wykonać eksport danych do SIO z programu Płace Optivum? Przygotowanie pliku dla SIO w programie Płace Optivum

POMIARY WIDEO W PROGRAMIE COACH 5

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego.

KONSOLIDACJA. Cel ćwiczenia: Funkcjonalności:

Ćw. IV. Tabele przestawne

2. Tworzenie tabeli przestawnej. W pierwszym oknie dialogowym kreatora określamy źródło danych, które mamy zamiar analizować.

najlepszych trików Excelu

WyŜsza Szkoła Zarządzania Ochroną Pracy MS EXCEL CZ.2

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS cz. 1

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

Arkusz strona zawierająca informacje. Dokumenty Excela są jakby skoroszytami podzielonymi na pojedyncze arkusze.

Przedszkolaki Przygotowanie organizacyjne

Zadanie Wstaw wykres i dokonaj jego edycji dla poniższych danych. 8a 3,54 8b 5,25 8c 4,21 8d 4,85

Sposoby prezentacji problemów w statystyce

Laboratorium z Grafiki InŜynierskiej CAD. Rozpoczęcie pracy z AutoCAD-em. Uruchomienie programu

Przewodnik dla każdego po: Dla każdego coś miłego Microsoft Excel 2010

UONET+ moduł Dziennik

Prezentacja multimedialna MS PowerPoint 2010 (podstawy)

Przygotowanie własnej procedury... 3 Instrukcja msgbox wyświetlanie informacji w oknie... 6 Sposoby uruchamiania makra... 8

Edytor tekstu MS Word 2010 PL. Edytor tekstu to program komputerowy umożliwiający wprowadzenie lub edycję tekstu.

LABORATORIUM 6: ARKUSZ MS EXCEL JAKO BAZA DANYCH

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows 7

Program EWIDENCJA ODZIEŻY ROBOCZEJ INSTRUKCJA UŻYTKOWNIKA Przejdź do strony producenta programu

You created this PDF from an application that is not licensed to print to novapdf printer (

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

UONET+ moduł Dziennik

Zadanie 3. Praca z tabelami

Po naciśnięciu przycisku Dalej pojawi się okienko jak poniżej,

Arkusz kalkulacyjny MS EXCEL ĆWICZENIA 4

Aby utworzyć tabelę przestawną należy ustawić aktywną komórkę na dowolnej komórce tabeli z danymi i wybrać z

Aby zaimportować plan lekcji ułożony za pomocą programu Plan lekcji Optivum, wykonaj następujące czynności:

Zadanie 8. Dołączanie obiektów

Automatyzowanie zadan przy uz yciu makr języka Visual Basic

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Zagadnienia: Program ten umożliwi Tobie między innymi: tworzenie arkuszy kalkulacyjnych wyszukiwanie i analizę danych tworzenie wykresów (diagramów)

1. Opis okna podstawowego programu TPrezenter.

Podręczna pomoc Microsoft Power Point 2007

PROGRAM DO PLANOWANIA ZAKUPÓW wg CPV/CPC

Transkrypt:

Podstawy statystyki medycznej Laboratorium Zajęcia 5 wprowadzenie do programu Statistica Program STATISTICA uruchamia się klikając na przycisk Start w systemie Windows, a następnie na pozycję STATISTICA dostępną w menu Programy. Po uruchomieniu programu na ekranie pojawia się okno aplikacji podobne do tego z Rys. 1. Rys. 1. Okno programu STATISTICA. Poszczególne opcje programu uruchamia się z tzw. wstążki Rys. 2. Rys. 2. Wstążka opcje dostępne na karcie Statystyka Tworzenie nowego dokumentu 1. Na karcie wstążki Podstawowe kliknij górną część przycisku polecenia Nowy umieszczonego w grupie Plik. Na ekranie pojawi się okno Utwórz nowy dokument (Rys. 3). Dla naszych potrzeb utworzymy na początku tabelę z Rys. 4. W tym celu na karcie Arkusz zmieniamy wartość w polu Liczba przypadków z 10 na 15. Resztę ustawień należy pozostawić bez zmian i kliknąć OK. Zostanie utworzony nowy arkusz danych. Korzystając z polecenia Zapisz jako dostępnego pod dolną częścią przycisku Zapisz

umieszczonego w grupie Plik na karcie wstążki Podstawowe nadajemy dokumentowi nazwę Przyklad_1.sta. Rys. 3. Opcje dostępne na karcie Arkusz w oknie Utwórz nowy dokument. Nazwisko i imię Nowak Jerzy Kowal Anna Rózga Jan Sala Ewa Róg Edyta Bodo Kamil Dyra Andrzej Malak Ewa Car Magda Wilk Jan Bendo Ola Bik Kasia Bora Piotr Lis Elwira Madziar Anna Płeć 2 1 2 1 1 2 2 1 1 2 1 1 2 1 1 Wzrost 174 169 179 170 156 184 176 171 182 178 162 171 180 175 167 Rys. 4. Dane do przykładu 1. Waga 79 77 69 70 55 74 96 57 94 71 62 83 81 61 54

2. Wprowadzanie danych do arkusza rozpoczniemy od wprowadzenia nazw przypadków. W tym celu klikamy dwukrotnie lewym przyciskiem myszy w pierwszej od góry komórce, umieszczonej w pierwszej z lewej strony kolumnie arkusza. Następnie kolejno wpisujemy nazwiska i imiona osób. Po wpisaniu nazwiska i imienia naciskamy przycisk ENTER przechodząc do następnego wiersza. 3. Po wpisaniu wszystkich nazwisk i imion pierwszej zmiennej w pliku nadajemy nazwę Płeć. W tym celu klikamy dwukrotnie lewym klawiszem myszy w obrębie nagłówka zmiennej Zmn1. Pojawi się okno jak na Rys. 5. W polu Nazwa należy wprowadzić nazwę zmiennej (należy wpisać Plec w zależności od ustawień programu STATISTICA może nie być możliwości wprowadzania polskich liter w nazwie zmiennej). Rys. 5. Okno specyfikacji zmiennej Płeć. 4. Po wprowadzeniu nazwy zmiennej Płeć w kolumnie o tej nazwie wprowadzamy kody liczbowe, za pomocą których zostaną oznaczone kategorie występujące dla zmiennej Płeć. Założymy, że dla kobiet wprowadzimy kod 1, a dla mężczyzn kod 2. Po wprowadzeniu kodów liczbowych przypiszemy im etykiety tekstowe. W tym celu klikamy dwukrotnie na nagłówku zmiennej Płeć, a następnie wybieramy przycisk Etykiety tekstowe. Na ekranie pojawi się okno Edytor etykiet tekstowych [Płeć]. Aby przypisać etykiety tekstowe wprowadzonym wcześniej kodom liczbowym w pierwszym wierszu kolumny Etykieta tekstowa wprowadzamy tekst Kobieta i przypisujemy mu (w kolumnie Liczbowe) kod liczbowy 1. Podobnie w komórce znajdującej się w drugim wierszu wprowadzamy tekst Mężczyzna i przypisujemy mu kod liczbowy 2. 5. W następnych krokach wprowadzamy nazwy i wartości dla kolejnych dwóch zmiennych Wzrost i Waga.

6. Utwórz w 4 kolumnie (Zmn4) nową zmienną WBC wg formuły: wzrost-waga-100. Formułę należy wpisać w polu Długa nazwa (etykieta lub formuła) okna specyfikacji zmiennej, jak to pokazano na Rys. 6. Rys. 6. Okno specyfikacji zmiennej WBC z formułą. 7. W tym kroku przekształcimy zmienną ilościową na zmienną typu jakościowego (kategoryzacja). W tym celu utworzymy zmienną WBC_kat, w której umieścimy kody liczbowe (1, 2 lub 3) w sposób umowny określające kategorie proporcji wagowowzrostowych. Z wstążki wybierz kolejno polecenia Dane/Przekoduj. Na ekranie pojawi się okno Przekoduj wartości zmiennej 5: WBC_kat. W kolejnych polach należy wprowadzić formuły definiujące proponowane kategorie. przedstawia wygląd okna po wprowadzeniu odpowiednich formuł. 8. Utworzonym kategoriom nadaj etykiety tekstowe wg następującego szablonu: 1Nadwaga, 2 Norma, 3 Niedowaga. Sposób nadawania etykiet tekstowych został pokazany w punkcie 4.

Rys. 7. Okno Przekoduj wartości zmiennej5: WBC_kat z wprowadzonymi formułami. Import przykładowego zbioru z innej aplikacji W przykładzie zostanie zaimportowany zbiór danych Zapotrzebowanie I 2013.xls, który został przygotowany w programie Excel. Zbiór przedstawia zapotrzebowanie na energię elektryczną liczoną w MW w pewnym mieście. 1. Kliknij przycisk Otwórz na karcie Podstawowe w grupie Plik. W oknie Otwórz, które pojawi się na ekranie wskaż folder zawierający importowany plik. W wybranym folderze pojawi się m.in. nazwa pliku Zapotrzebowanie I 2013.xls. Zaznacz ją i kliknij przycisk Otwórz. Program rozpocznie operację importu pliku. Na ekranie pojawi się okno Otwierany plik: Zapotrzebowanie I 2013.xls. () Rys. 8. Okno Otwierany plik. 2. Kliknij przycisk Import wybranego arkusza. Pojawi się okno Wybierz arkusz do importu, w którym można wybrać arkusz, gdzie znajdują się dane. Zaznacz Arkusz 1. Na ekranie

pojawi się okno Otwórz plik Excel (Rys. 9). Znajduje się w nim informacja o zakresie importowanych danych. W oknie zaznacz pole wyboru Weź nazwy z 1 wiersza (dzięki temu zaimportowany plik będzie posiadał odpowiednie nazwy zmiennych). Rys. 9. Wygląd okna Otwórz plik Excel. 3. Kliknij OK, co kończy proces importowania pliku. Po zaimportowaniu pliku (z domyślną nazwą taką jak oryginalny plik oraz z rozszerzeniem sta) czasami zachodzi konieczność dostosowania wyglądu tabeli. W tym celu należy zaznaczyć wszystkie zmienne i kliknąć prawy przycisk myszy. Z menu podręcznego, które pojawi się na ekranie wybierz opcję Format, a następnie Automatyczne dopasowanie. Po tej modyfikacji plik wygląda tak jak na Rys. 10. Rys. 10. Wygląd arkusza po operacji importowania

Sprawdzanie poprawności danych Zaimportowane dane mogą zawierać pewne błędy np. wartości danych mogą odstawać tzn. wykraczać poza dopuszczalny zakres. Przykładowo jeżeli tabela zawiera zmienną wzrost człowieka, to nie jest możliwe, aby były tam wartości powyżej 3m. Program Statistica zawiera narzędzia pozwalające na sprawdzanie poprawności danych. Aby skorzystać z tych narzędzi należy najpierw określić zakres wartości sprawdzanej zmiennej. Z reguły osoba przeprowadzająca analizę zna zakres zmiennych. Jeżeli tak nie jest to można spróbować zidentyfikować ten zakres. 1. W tym punkcie ćwiczenia zostanie sprawdzona poprawność danych zawartych w zmiennej Zapotrzebowanie. W tym celu kliknij dwukrotnie w nagłówku zmiennej Zapotrzebowanie i w oknie, które się pojawi kliknij przycisk Wartości, statystyki. Spowoduje to pojawienie się okna pokazującego wartości sprawdzanej zmiennej posortowane od najmniejszej do największej. Dzięki temu można sprawdzić, czy w obrębie zmiennej nie występują odstające wartości. Zanotuj na kartce lub w pamięci prawidłowy zakres danych, następnie kliknij przycisk Anuluj i jeszcze raz Anuluj. 2. Po ustaleniu zakresu wartości sprawdzanej zmiennej kliknij przycisk Dane na wstążce i w grupie Operacje na arkuszach kliknij przycisk Sprawdź. Na ekranie pojawi się okno Sprawdzanie danych. W oknie tym można wprowadzać określone warunki służące do sprawdzania poprawności danych. Dla naszego przykładu można przyjąć, że jako niepoprawne będziemy traktować przypadki, dla których zapotrzebowanie będzie wykraczać poza przedział od 300 do 700 MW. A zatem w polu Warunek 1 najpierw w polu listy wybierz polecenie Niepoprawne jeśli, a następnie wprowadź warunek o postaci: v4<300 or v4>700 W polu Zakres ustal zakres przypadków od przypadku 1 do przypadku 744. Po wykonaniu czynności z tego punktu okno Sprawdzanie danych powinno wyglądać jak na Rys. 11.

Rys. 11. Okno Sprawdzanie danych z wprowadzonymi warunkami 3. Mamy teraz możliwość sprawdzenia czy przypadki zawarte w pliku danych spełniają podany warunek. W celu rozpoczęcia sprawdzania poprawności danych kliknij Znajdź pierwszy. Zostanie podświetlony pierwszy przypadek, który nie spełnia podanych kryteriów. Naciskaj Kombinację klawiszy CTRL+F3 aby interaktywnie kontynuować sprawdzanie danych. 4. Wywołaj jeszcze raz okno sprawdzanie danych w sposób podany w kroku 2. Tym razem użyj przycisku Podświetl niepoprawne w celu podświetlenia wszystkich przypadków nie spełniających naszych warunków. Zmień kolor podświetlonych przypadków na niebieski, a czcionkę na pogrubioną w oknie Edytuj układ arkusza: Podświetlone komórki, do którego uzyskuje się dostęp korzystając z opcji menu Narzędzia/Podświetlanie komórek/edytuj układ Podświetlone komórki. 5. Istnieje również możliwość utworzenia podzbioru przypadków spełniających podane przez użytkownika warunki w osobnym arkuszu. W celu utworzenia podzbioru dodaj w arkuszu danych zmienną o nazwie Lp. W oknie specyfikacji tej zmiennej w polu Długa nazwa (etykieta lub formuła z funkcją) wprowadź formułę =v0, która spowoduje wstawienie nr przypadków. 6. W celu utworzenia podzbioru na karcie Dane wybierz polecenie Podzbiór. Na ekranie pojawi się okno Utwórz podzbiór. W oknie tym kliknij przycisk Zmienne i wybierz wszystkie zmienne dla tworzonego podzbioru w tym celu w oknie Wybierz zmienne kliknij przycisk Wszystkie i kliknij OK. Następnie kliknij przycisk Przypadki. Na ekranie pojawi się okno Warunki selekcji przypadków. Zaznacz pole Włącz warunki selekcji i w polu Włącz przypadki zaznacz przycisk Określone przez, a następnie w polu Wyrażenie: wpisz warunek: v4<300 or v4 >700

7. W nowym arkuszu zostaną umieszczone nieprawidłowe przypadki. Na Rys. 12 przedstawiono ten arkusz. Dzięki temu, że wcześniej została dodana zmienna Lp można łatwo zidentyfikować przypadki w wyjściowym arkuszu danych. Rys. 12. Arkusz zawierający niepoprawne dane Podstawowe narzędzia analizy danych Ten przykład prezentuje najważniejsze metody analizy danych w programi STATISTICA. 1. Otwórz plik Zawaly.sta zawierający informacje o wybranych parametrach biochemicznych i klinicznych, które zebrano wśród pacjentów z chorobą niedokrwienną serca. Naszym zadaniem jest utworzenie zestawienie liczby i odsetka kobiet i mężczyzn, u których stwierdzono różne rodzaje zawałów serca. Zestawienia tego typu nazywa się tabelami dwudzielczymi. Zaobserwowane prawidłowości zostaną zilustrowane wykresami. Rys. 13. Okno Statystyki podstawowe i tabele

Rys. 14. Okno definiowania Tabele wielodzielcze. 2. W celu sporządzenia tabeli dwudzielczej na karcie Statystyka kliknij przycisk Statystyki podstawowe. Na ekranie pojawi się okno Statystyki podstawowe i tabele: Zawały.sta (Rys. 13). W oknie tym wybierz pozycję tabele wielodzielcze. Po kliknięciu przycisku OK program przejdzie do okna definiowania analizy Tabele wielodzielcze: Zawały, które zamieszczono na Rys. 14. 3. Na oknie z Rys. 14 kliknij przycisk Określ tabele (wybierz zmienne). W kolejnym oknie jakie się pojawi wybierz zmienne do analizy. Na liście Lista1 zaznacz zmienną Płeć, a na liście Lista2 zmienną Rodzaj zawału. Następnie naciśnij przycisk OK oraz ponownie OK. Po chwili pojawi się okno Wyniki tabelaryzacji: Zawały, które umożliwia wybranie całego szeregu wyników analizy w postaci tabel i wykresów. Dostępne opcje zostały rozmieszczone na kartach. Przejdź na kartę Opcje i odznacz pole wyboru Podświetl liczności > 10 (opcja ta jest wykorzystywana w przypadku przeprowadzania testu chikwadrat. Następnie przejdź na kartę Więcej i kliknij przycisk Dokładne tabele dwudzielcze. Na ekranie pojawi się okno kolejnego dokumentu programu STATISTICA, a mianowicie skoroszytu, który zawiera arkusz z wynikami analizy Rys. 15. Rys. 15. Okno skoroszytu z arkuszem zawierającym tabelę dwudzielczą. Na podstawie otrzymanych wyników można porównać liczby pacjentów, u których stwierdzono występowanie zawałów określonego rodzaju (pomiędzy badanymi kobietami i mężczyznami). 4. Na podstawie otrzymanej tabeli dwudzielczej można utworzyć wykres. W tym celu naciśnij kombinację klawiszy CTRL+R przez co zostanie przywołane okno Wyniki tabelaryzacji: Zawały.sta oraz kliknij przycisk Wykresy interakcji liczności. Na ekranie pojawi się wykres zamieszczony na Rys. 16.

Rys. 16. Okno skoroszytu z aktywnym wykresem 5. Wygląd wykresu można dostosować do naszych wymagań, aby to zrobić kliknij dwukrotnie lewym klawiszem myszy w obrębie wykresu. Rys. 17. Okno opcje wykresu z aktywną kartą Okno

Pojawi się okno jak na Rys. 17. Przejdź dla przykładu na kartę Wykres właściwy/etykiety punktów i zaznacz pole wyboru Wyświetl etykiety punktów, a następnie usuń zaznaczenie pola wyboru Pokaż etykiety tekstowe i w zamian za to zaznacz pole wyboru Współrzędne Y. Tych samych modyfikacji dokonaj po wybraniu w polu Wykres właściwy opcji 2: Płeć Mężczyzna. Zmień także odpowiednio opisy zawarte w legendzie wykresu. Po zaakceptowaniu zmian kliknięciem przycisku OK. zmodyfikowany wykres powinien wyglądać tak jak na Rys. 18. Rys. 18. Okno skoroszytu z aktywnym wykresem po modyfikacjach. 6. Utwórz tablicę dwudzielczą zawierającą odsetki kobiet i mężczyzn w zależności od rodzaju zawału. W tym celu naciśnij kombinację klawiszy CTRL+R przywołując okno Wyniki tabelaryzacji: Zawały i przejdź na kartę Opcje. Aby uwzględnić relatywne liczebności badanych pacjentów obydwu płci zaznacz pole wyboru Procenty w wierszach. Następnie wróć na kartę Więcej i kliknij przycisk Dokładne tabele dwudzielcze. Arkusz z wynikami zamieszczono na Rys. 19.. Rys. 19. Okno skoroszytu z aktywnym arkuszem wyników

Elementy opisowej analizy danych Po sprawdzeniu poprawności danych i ewentualnym wyliczeniu dodatkowych zmiennych można przystąpić do opracowania zebranych danych. Z reguły taką analizę rozpoczyna się od tabelarycznej i graficznej prezentacji empirycznych rozkładów badanych zmiennych. Następnie można wyliczyć charakterystyki liczbowe zmiennych zgodnie z regułami statystyki opisowej. Badanie empirycznego rozkładu zmiennej jakościowej W tym punkcie zostanie przedstawiony sposób wyznaczenia empirycznego rozkładu zmiennej jakościowej w postaci tabelarycznej i graficznej. W tym celu otwórz plik Analiza płac.sta. 1. Na początek utworzymy szereg rozdzielczy dla jakościowej zmiennej Wykszałcenie. W tym celu na karcie wstążki Statystyka kliknij przycisk Statystyki podstawowe umieszczony w grupie Podstawowe. Następnie w oknie, które pojawi się na ekranie wybierz pozycję Tabele liczności. Pojawi się okno jak na Rys. 20. Rys. 20. Widok okna Tabele liczności: Analiza_plac.sta. 2. W oknie z Rys. 20 kliknij przycisk Zmienne i w oknie Wybierz zmienne wskaż zmienną Wykształcenie. Następnie przejdź na kartę Więcej i kliknij przycisk Podsumowanie:. W przypadku zmiennych jakościowych rozkład empiryczny określa się bardzo prosto podając wartości badanych zmiennych i odpowiadające im liczności, liczności procentowe oraz liczności skumulowane i liczności skumulowane procentowe. Na Rys. 21 pokazano Skoroszyt z tabelą liczności dla zmiennej Wykształcenie.

Rys. 21. Tabela liczności dla zmiennej Wykształcenie. 3. Kontynuuj analizę klikając lewym przyciskiem myszy na ikonę Tabele liczności: Ana umieszczoną na pasku Analizy w dolnej części okna aplikacji. Na ekranie ponownie pojawi się okno Tabele liczności: Analiza płac.sta. Zostanie teraz utworzony histogram rozkładu dla zmiennej Wykształcenie, który jest graficznym odpowiednikiem szeregu rozdzielczego. W tym celu kliknij na przycisk Histogramy. 4. Po utworzeniu wykresu zmień jego domyślny tytuł na: Histogram rozkładu zmiennej Wykształcenie poprzez dwukrotne kliknięcie lewym przyciskiem myszy na tytule wykresu i wpisaniu odpowiedniego tytułu. Zmniejsz również szerokość słupków na 0,75 tak, aby pomiędzy słupkami występowały odstępy (w ten sposób powszechnie przedstawia się histogramy dla zmiennych jakościowych). Aby zmniejszyć szerokość słupków kliknij prawym klawiszem myszy na dowolny słupek i w menu podręcznym wybierz Opcje słupka, a następnie w polu Szerokość wpisz wartość 0,75. Po wykonaniu opisanych wyżej czynności wykres powinien wyglądać jak na Rys. 22. Rys. 22. Histogram rozkładu empirycznego dla zmiennej Wykształcenie.

Badanie empirycznego rozkładu zmiennej ilościowej W kolejnym punkcie zostanie zbadany rozkład zmiennej ilościowej. W tym celu otwórz najpierw plik Zawały.sta. 1. Po otwarciu pliku z danymi przejdź na kartę Statystyka i kliknij przycisk Statystyki podstawowe umieszczony w grupie Podstawowe. W oknie, które pojawi się na ekranie wybierz opcję Tabele liczności. Następnie kliknij przycisk Zmienne i zaznacz zmienną Choresterol całkowity i kliknij OK. Przejdź na kartę Więcej i w polu Metoda kategoryzacji dla tabel i wykresów zaznacz przycisk opcji Krok (oznaczający szerokość przedziału klasowego). W sąsiednim polu edycji wprowadź wartość 20 oraz anuluj zaznaczenia pola wyboru od minimum, a w polu edycji rozpocznij od wprowadź wartość 100. Wygląd okna Tabele liczności: Zawały.sta z wybraną kartą Więcej i wprowadzonymi wartościami przedstawia Rys. 23. 2. Aby obejrzeć wynikową tabelę liczności kliknij przycisk Podsum.: Tabele liczności. Na ekranie pojawi się tabela z szeregiem rozdzielczym przedstawiona na Rys. 23. Wygląd okna Tabele liczności: Zawały.sta po wybraniu karty Więcej i wprowadzeniu wartości.

Rys. 24. Szereg rozdzielczy dla zmiennej Choresterol całkowity. 3. Na podstawie danych z tabeli widzimy, że liczności najpierw stopniowo wzrastają, a potem maleją. Może to oznaczać, że zmienna ma rozkład zbliżony do normalnego. Aby zaobserwować empiryczny rozkład można wyznaczyć histogram. Aby to zrobić kliknij na przycisk Tabele liczności: Zaw w dolnym lewym rogu okna programu STATISTICA. W oknie, które się pojawi kliknij przycisk Histogramy. Pojawi się wykres jak na. Słupki odzwierciedlają rozkład empiryczny zmiennej. Na histogram jest nałożona krzywa rozkładu normalnego w celu przybliżonej oceny rozkładu empirycznego z rozkładem teoretycznym. Rys. 25. Histogram rozkładu dla zmiennej Cholesterol całkowity z nałożoną krzywą rozkładu normalnego.

Szerokość przedziału klasowego W tym punkcie zostaną porównane ze sobą histogramy o różnych szerokościach przedziałów klasowych. Zostanie również pokazany sposób umieszczania wyników bezpośrednio w dokumencie programu Word. Aby pokazać wspomniane opcje otwórz plik Analiza płac.sta. 1. Po otwarciu pliku przejdź na kartę Podstawowe i w grupie Narzędzia wybierz polecenie Opcje. W oknie Opcje, które pojawi się na ekranie przejdź na pozycję Globalne ustawienia wyjścia i w polu z listą opcji Wyjście do MS Word wybierz opcję Jeden dokument (wspólny dla wszystkich analiz). Następnie na karcie Statystyka wybierz kolejno polecenie Statystyki podstawowe oraz Tabele liczności. Kliknij przycisk Zmienne i zaznacz zmienną Wiek, a następnie przejdź na kartę Więcej i w polu Metoda kategoryzacji dla tabel i wykresów zaznacz przycisk opcji Krok (oznaczający szerokość przedziału klasowego). W sąsiednim polu edycji wprowadź wartość 10 oraz anuluj zaznaczenia pola wyboru od minimum, a w polu edycji rozpocznij od wprowadź wartość 10. Następnie kliknij przycisk Podsum.: Tabele liczności w celu obejrzenia tabeli liczności. W celu utworzenia histogramu kliknij przycisk Histogramy. 2. Utwórz histogramy dla przedziałów klasowych 5, 3 i 2. Aby to zrobić trzeba kliknąć przycisk Tabele liczności: Ana. Następnie zmienić wartość Krok na odpowiednią wartość (5 lub 3 lub 2) i kliknąć przycisk Histogramy. Za każdym razem po wykonaniu czynności w tym kroku w skoroszycie będzie pojawiał się nowy histogram (dla kolejnej wartości przedziału klasowego). Ostateczny wygląd skoroszytu jest przedstawiony na Rys. 26. Niezależnie od pojawiania się histogramów w skoroszycie, pojawiają się również one w dokumencie MS Word. 3. Aby porównać ze sobą histogramy warto umieścić je w jednym oknie obok siebie. W tym celu kliknij na kartę Wykresy, a następnie Układ wielu wykresów i wybierz opcję Pusty wykres. Następnie do okna, które pojawiło się na ekranie przeciągnij ikony histogramów ze skoroszytu. Po przeciągnięciu wszystkich ikon rozmieść je tak, aby móc porównać ze sobą histogramy ( Rys. 27). Rys. 26. Wygląd skoroszytu po utworzeniu 4 histogramów.

Rys. 27. Wygląd okna Pusty wykres po dodaniu do niego histogramów. Z porównania histogramów wynika, że aby dobrze zinterpretować empiryczny rozkład zmiennej należy przeanalizować histogramy dla różnych przedziałów klasowych. Pierwszy rozkład (dla szerokości przedziału klasowego 10) sugeruje, że mamy do czynienia z rozkładem jednomodalnym o prawostronnej skośności (asymetrii). Natomiast ostatni z histogramów wydaje się być zbyt szczegółowy i zacierać występujące prawidłowości. Dokładne przyjrzenie się drugiemu i trzeciemu histogramowi pozwala zauważyć, że oprócz asymetrii badany rozkład charakteryzuje się dwumodalnością. W rozkładzie empirycznym występuje lokalne maksimum dla wieku około 25-28 lat, a drugie w pobliżu wieku 45 lat. Dokładniejsza analiza przyczyn tego zjawiska może niekiedy doprowadzić do wartościowych wniosków badawczych. Charakterystyki liczbowe rozkładu zmiennej W tym punkcie zapoznamy się z wybranymi miarami opisowymi próby losowej takimi jak średnia, mediana, odchylenie standardowe, miary asymetrii itp. Obliczanie miar opisowych 1. Otwórz plik danych Analiza płac.sta. Korzystając ze wstążki wybierz kolejno polecenia Statystyka/Statystyki podstawowe/statystyki opisowe. Pojawi się okno jak na Rys. 28.

Rys. 28. Widok okna Statystyki opisowe: Analiza płac. sta 2. W oknie Statystyki opisowe kliknij przycisk Zmienne i przytrzymując klawisz CTRL wskaż zmienne: Wiek, Staż pracy i Płaca brutto. Po zaakceptowaniu wyboru zmiennych (kliknięciem przycisku OK.) przejdź na kartę Więcej i oprócz domyślnych ustawień programu dodatkowo zaznacz pola wyboru: %ważnych, Mediana, Wsp. Zmienności oraz Skośność (Rys. 29). Po kliknięciu przycisku Podsumowanie program obliczy zaznaczone statystyki opisowe dla wybranych zmiennych i umieści arkusz zawierający wyniki w skoroszycie (Rys. 30). Rys. 29. Wygląd okna Statystyki opisowe po wybraniu karty Więcej.

Rys. 30. Skoroszyt z arkuszem wyników statystyk opisowych Analiza w grupach W tym punkcie zostaną przeanalizowane dane zawarte w pliku Nadciśnienie.sta. Plik zawiera wybrane dane dotyczące osób, u których zdiagnozowano chorobę nadciśnieniową. Najpierw zostanie porównany przeciętny poziom skurczowego ciśnienia krwi pomiędzy badanymi kobietami i mężczyznami, a następnie dodatkowo będzie uwzględnione to, czy badane osoby były osobami palącymi, czy też osobami niepalącymi. 1. Otwórz plik Nadciśnienie.sta. Ze wstążki wybierz kartę Statystyka i Statystyki podstawowe. Następnie w oknie Statystyki podstawowe i tabele: Nadciśnienie, które pojawi się na ekranie wybierz pozycję Przekroje, prosta ANOVA. Po kliknięciu przycisku OK program przejdzie do okna definiowania analizy Statystyki w grupach (przekroje): Nadciśnienie. (Rys. 31). 2. Na karcie Pojedyncze tabele w tym oknie kliknij przycisk Zmienne. W kolejnym oknie, które pojawi się na ekranie wybierz zmienne do analizy. Na liście Zmienne zależne zaznacz zmienną Ciśnienie skurczowe, a na liście Zmienne grupujące zmienną Płeć. Następnie kliknij OK oraz ponownie OK, aby program wykonał odpowiednie obliczenia. Rys. 31. Okno definiowania analizy Statystyki w grupach (przekroje) Po chwili na ekranie pojawi się okno Statystyki w grupach wyniki, które umożliwia wybranie całego szeregu wyników analizy. Dostępne opcje zostały rozmieszczone na kartach.

Przechodząc na kartę Statystyki opisowe można np. wybrać rodzaj statystyk, które zostaną wyświetlone w arkuszu z wynikami (Rys. 32). Rys. 32. Okno wyników analizy Statystyki w grupach wyniki 3. Aby uzyskać dobry obraz sytuacji trzeba obliczyć podstawowe charakterystyki liczbowe zmiennej Ciśnienie skurczowe w grupach badanych kobiet i mężczyzn. W tym celu na karcie Statystyki opisowe zaznacz dodatkowo pole wyboru Mediana i kwartale. Aby obejrzeć wyniki kliknij przycisk Podsum: tabela statystyk. Jeżeli wszystko zostało poprawnie wykonane na ekranie powinna pojawić się tabela jak na Rys. 33. Rys. 33. Arkusz wyników analizy przekrojowej. 4. Na podstawie wyników zawartych w tabeli z Rys. 33 można stwierdzić, że wyższy przeciętny poziom badanej zmiennej występuje w grupie mężczyzn. Warto dodatkowo utworzyć wykresy typu ramka-wąsy, które pozwalają bliżej przyjrzeć się rozkładom

badanej zmiennej w porównywanych grupach. Aby to zrobić przywołaj okno Statystyki w grupach wyniki za pomocą kombinacji klawiszy CTRL+R i kliknij przycisk Skategoryzowane wykresy ramka-wąsy. Jako typ wykresu wskaż Mediana/Kwartyle/Rozstęp. Na ekranie pojawi się wykres zamieszczony na Rys. 34. Rys. 34. Wykresy ramka wąsy w porównywanych grupach kobiet i mężczyzn. 5. Wykres przedstawiony na Rys. 34 ilustruje podstawowe statystyki opisowe analizowanej zmiennej w porównywanych grupach badanych. Można zauważyć, że wyższy przeciętny poziom zmiennej Ciśnienie skurczowe występuje u mężczyzn a ponadto zróżnicowanie wyników jest zdecydowanie większe w tej grupie badanych. Na wykresie typu ramkawąsy można przedstawić także surowe dane. W tym celu kliknij dwukrotnie lewym przyciskiem myszy w obrębie tła wykresu i w oknie Opcje wykresu, które pojawi się na ekranie przejdź kolejno na karty Wykres właściwy i Ramka-wąsy. Aby umieścić na wykresie surowe dane kliknij przycisk Więcej i kolejno zaznacz pole wyboru Pokaż dane surowe oraz Losowa na liście Separacja punktów. Można także zmienić rodzaj znacznika punktów (wybierz Wykres właściwy/ogólne wybierz Dane surowe i kliknij przycisk Znaczniki) oraz usunąć ramki i wąsy (wybierz Wykres właściwy/rozrzut i odznacz odpowiednie pola). Po modyfikacji wykres wygląda jak na Rys. 35.

Rys. 35. Zmodyfikowany wykres ramka-wąsy z surowymi danymi. Jak widać wykres pozwala na dokładną analizę rozkładu surowych danych poprzez łatwą identyfikację obserwacji, które odbiegają od środka rozkładu. 6. W tym kroku zostanie wykonana analiza danych w grupach ze względu na zmienną grupującą Palenie. W tym celu w oknie z wynikami analizy Statystyki w grupach wyniki klikamy przycisk Anuluj aby cofnąć się do poprzedniego kroku analizy i zmodyfikować zmienne do analizy. W oknie Statystyki w grupach (przekroje) kliknij przycisk Zmienne i na liście Zmienne grupujące zaznacz dodatkowo zmienną Palenie (przy zaznaczaniu trzymaj wciśnięty przycisk CTRL) Kliknij przycisk OK w celu zaakceptowania wyboru oraz kliknij ponownie przycisk OK, aby program wykonał potrzebne obliczenia. Aby obejrzeć wyniki analizy kliknij przycisk Podsum.: tabela statystyk na karcie Statystyki opisowe. Na ekranie pojawi się arkusz wyników jak na Rys. 36. 7. Podobnie jak poprzednio można również przedstawić wyniki na wykresie typu ramka wąsy. Należy to zrobić tak jak w kroku 4. Jeżeli wszystkie czynności wykonano poprawnie powinien pojawić się wykres jak na.

Rys. 36. Arkusz wyników analizy przekrojowej Rys. 37. Wykresy ramka-wąsy w grupach palących i niepalących w podziale na płeć. Wyniki przedstawione zarówno w tabeli z Rys. 36 jak i wykresu z pozwalają na jednoczesną ocenę zróżnicowanego przeciętnego poziomu skurczowego ciśnienia krwi ze względu na płeć badanych osób oraz status palenia.