Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica



Podobne dokumenty
Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Podstawy statystyki medycznej Laboratorium. Zajęcia 5 wprowadzenie do programu Statistica

Tworzenie tabeli przestawnej krok po kroku

Przypomnienie: Ćwiczenie 1.

1. WPROWADZENIE DO OBSŁUGI PROGRAMU STATISTICA. Nazwy zmiennych

ZARZĄDZANIE DANYMI W STATISTICA

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Niestandardowa tabela częstości

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Wykład 4: Statystyki opisowe (część 1)

Jak korzystać z Excela?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

o nazwie: adresy.xls. Fragment danych źródłowych przestawiono na rysunku 1. Rysunek 1. Dane źródłowe - plik "adresy.xls"

Organizacja edytora danych

Import danych z plików CSV

Wykład 3: Prezentacja danych statystycznych

Analiza Statystyczna

TABELE I WYKRESY W EXCELU I ACCESSIE

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego.

Obliczenie kratownicy przy pomocy programu ROBOT

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

7.9. Ochrona danych Ochrona i zabezpieczenie arkusza. Pole wyboru

4.Arkusz kalkulacyjny Calc

TABELE I WYKRESY W EXCELU I ACCESSIE

Przedszkolaki Przygotowanie organizacyjne

Excel zadania sprawdzające 263

System imed24 Instrukcja Moduł Analizy i raporty

Spis treści. Laboratorium II: Analiza opisowa. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

Wykład 2: Arkusz danych w programie STATISTICA

Temat: Organizacja skoroszytów i arkuszy

w kalendarzu pracownika po wybraniu z menu podręcznego polecenia Dziennik zdarzeń pracownika

Rys. 1. Daty rozpoczęcia i zakończenia uŝytkowania maszyn

Tworzenie i modyfikowanie wykresów

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

Pracownia Informatyczna Instytut Technologii Mechanicznej Wydział Inżynierii Mechanicznej i Mechatroniki. Podstawy Informatyki i algorytmizacji

% sumy wiersza nadrzędnego. % sumy kolumny nadrzędnej. % sumy elementu nadrzędnego. Porządkuj od najmniejszych do największych.

Temat: Arkusze kalkulacyjne. Program Microsoft Office Excel. Podstawy

Informatyka. Arkusze 1. 1 Wprowadzenie.

Kolumna Zeszyt Komórka Wiersz Tabela arkusza Zakładki arkuszy

Ćwiczenia nr 4. Arkusz kalkulacyjny i programy do obliczeń statystycznych

Zadanie Wstaw wykres i dokonaj jego edycji dla poniższych danych. 8a 3,54 8b 5,25 8c 4,21 8d 4,85

SPOSÓB WYKONANIA OBLICZEŃ I FORMATOWANIA KOMÓREK

Instrukcja obsługi aplikacji PQ-CONTROL

Ćwiczenie 2 arkusze kalkulacyjne użycie funkcji logicznych

Arkusz kalkulacyjny EXCEL

2. Tworzenie tabeli przestawnej. W pierwszym oknie dialogowym kreatora określamy źródło danych, które mamy zamiar analizować.

Wprowadzenie do analizy dyskryminacyjnej

Działki Przygotowanie organizacyjne

Opracowywanie wyników doświadczeń

MS Excell 2007 Kurs podstawowy Filtrowanie raportu tabeli przestawnej

Arkusz kalkulacyjny Excel

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka

Finanse. Jak wykonać import listy płac z programu Płace Optivum do aplikacji Finanse?

KaŜdy z formularzy naleŝy podpiąć do usługi. Nazwa usługi moŝe pokrywać się z nazwą formularza, nie jest to jednak konieczne.

TECHNIKI INFORMACJI I KOMUNIKACJI. Arkusz Kalkulacyjny EXCEL praca z bazą danych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.

Importowanie danych z Excela

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Struktura dokumentu w arkuszu kalkulacyjnym MS EXCEL

Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt

Uruchom polecenie z menu Wstaw Wykres lub ikonę Kreator wykresów na Standardowym pasku narzędzi.

Arkusz kalkulacyjny. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

WASTE MANAGEMENT SYSTEM PODRĘCZNIK UŻYTKOWNIKA SERWISU WWW

Instrukcja szybkiej obsługi

Bazy danych kwerendy (moduł 5) 1. Przekopiuj na dysk F:\ bazę M5KW.mdb z dysku wskazanego przez prowadzącego

SPIS ILUSTRACJI, BIBLIOGRAFIA

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

You created this PDF from an application that is not licensed to print to novapdf printer (

Wykład 1: O statystyce i analizie danych. Arkusz danych w programie STATISTICA

INSTRUKCJA OTWIERANIA PLIKU DPT (data point table)

1. Zaloguj się do systemu UONET+ jako administrator i uruchom moduł Administrowanie.

Kalkulator kalorii i wartości odżywczych by CTI. Instrukcja

PRZYKŁADOWY TEST EGZAMINACYJNY

Aplikacja npodpis do obsługi certyfikatu

Ćwiczenie 3. Wprowadź do odpowiednich komórek następujące dane: Ćwiczenie 4. Wprowadź do odpowiednich komórek następujące dane: - 1 -

Informatyka w Zarządzaniu

Instalowanie certyfikatów celem obsługi pracy urządzenia SIMOCODE pro V PN z poziomu przeglądarki internetowej w systemie Android

Instalacja i obsługa aplikacji MAC Diagnoza EP w celu wykonania Diagnozy rozszerzonej

Temat: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Arkusz strona zawierająca informacje. Dokumenty Excela są jakby skoroszytami podzielonymi na pojedyncze arkusze.

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

Trik 1 Autorejestrowanie zmian dokonanych w obliczeniach

Ćwiczenie 2. Statystyka opisowa i metody symulacyjne

MS Excel. Podstawowe wiadomości

Formularz pierwszej oceny w służbie cywilnej

Aplikacja npodpis do obsługi certyfikatu (instrukcja użytkownika)

Sposoby prezentacji problemów w statystyce

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

Instrukcja obsługi Zaplecza epk dla Pracowników Instytucji w zakresie zarządzania danymi szczegółowymi dotyczącymi sposobu realizacji procedury

Instrukcja migracji do nowej bankowości internetowej dla obecnych użytkowników KIRI

Aplikacja npodpis do obsługi certyfikatu

Transkrypt:

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

1. Zarządzanie danymi. Pierwszą czynnością w pracy z pakietem Statistica jest zazwyczaj wprowadzenie danych do arkusza. Oprócz możliwości pracochłonnego ich wklepywania, Statistica umożliwia również import danych z innych aplikacji - na przykład z arkusza kalkulacyjnego. Załóżmy, że w arkuszu kalkulacyjnym posiadamy dane jak poniżej: Jeśli zadaniem do wykonania jest import do Statistica danych z zakresu liczby porządkowej od 1 do 10, to wygodnym może okazać się przekopiowanie pożądanych danych do nowego skoroszytu (pliku Excel). Sugeruję przy kopiowaniu nie pomijać nazw zmiennych, zakładam również, że kolumna lp. jest zbyteczna, zaś badane przypadki będę identyfikował po imieniu i nazwisku. Po przekopiowaniu dane w nowym skoroszycie wyglądają jak poniżej: zaś plik wynikowy zapisano pod nazwą do_importu.xlsx. 2

Aby zaimportować dane do arkusza Statistica, należy: 1. Otworzyć aplikację Statistica i jeśli będą w niej otwarte jakiekolwiek arkusze lub skoroszyty, dla porządku, proponuję ich zamknięcie, widok jak poniżej: 2. Z menu Plik należy wybrać polecenie Otwórz i wskazać zapisany wcześniej plik do_importu.xlsx. a następne zatwierdzić wybór przyciskiem Otwórz. 3. Następnie winno ukazać się okno jak poniżej w którym należy wybrać przycisk Import wybranego arkusza i wskazać jego nazwę. 3

4. Po czym powinno pojawić się poniższe okno aplikacji: Skoro w arkusz kalkulacyjnym (rysunek 2) w wierszu numer 1 widnieją nazw zmiennych, zaś w kolumnie A widnieją personalia badanych (przypadków), to należy zaznaczyć dwie opcje Weź nazwy zmiennych z 1 wiersza oraz Weź nazwy przypadków z 1 kolumny. 5. Dane przeniesione do arkusza Statistica winny prezentować się jak poniżej: 6. Korzystając z menu Plik -> Zapisz należy zachować nowo utworzony arkusz Statistica pod nazwą wyniki_badan.sta. 7. Po wykonaniu powyższych operacji w katalogu znajduja się już dwa pliki: oryginalny arkusz kalkulacyjny z danymi o nazwie do_importu.xlsx oraz nowo utworzony arkusz Statistica pod nazwą wyniki_badan.sta. 4

2. Podstawowe operacje w pakiecie Statistica Do podstawowych operacji w arkuszu Statistica należy dodawanie: przypadków (czyli wierszy), które przechowują informacje na temat badanych przypadków/osób zmiennych (czyli kolumn), przechowujących informacje o wartości zmiennej, którą osiągnął konkretny badany 2.1. Dodawanie przypadków odbywa się poprzez kliknięcie prawym klawiszem myszy na jednym lub kilku przypadkach, a następnie wybranie z rozwijalnego menu opcji Dodaj przypadki (patrz poniżej zakładamy, że przed Janem Kowalskim chcę wstawić informacje związane z Nieznaną Osobą) Krok 1. Dodawanie przypadków Krok 2. Krok 3. 2.2. Dodawanie zmiennych odbywa się poprzez kliknięcie prawym klawiszem myszy na jednej lub kilku zmiennych, a następnie wybranie z rozwijalnego menu opcji Dodaj zmienne (patrz poniżej zakładamy, że przed zmienną wzrost [w cm] życzymy sobie dodania zmiennej Płeć ) Krok 1. Dodawanie zmiennych Krok 2. (w polu Nazwa wpisz nazwę zmiennej) Krok 3. 5

2.3. Kodowanie zmiennych Po wstawieniu do arkusza zmiennej Płeć należy uzupełnić wartości kobieta/mężczyzna każdemu z badanych przypadków. W sukurs przychodzi użytkownikowi mechanizm kodowania zmiennych. Polega on na zdefiniowaniu kodów dla każdej z płci; np. wpisowi kobieta przyporządkujemy liczbę 1, zaś mężczyźnie 2. W arkuszu Statistica realizowane jest to poprzez opcję Etykiety tekstowe... dostępną w menu Zmienna, którą wywołujemy dwukrotnym kliknięciem na zmiennej, dla której chcemy określić kody. Kodowanie zmiennych Krok 1. dwukrotne kliknięcie na nazwie zmiennej i wybór przycisku Etykiety tekstowe... Krok 2. Odpowiednie uzupełnienie kolumn Etykieta tekstowa i Liczbowe Krok 3. Odpowiednie uzupełnienie kolumny/zmiennej Płeć za pomocą zdefiniowanych kodów 6

2.4. Korzystanie z formuł w aplikacji Statistica Formuły mają szerokie, by nie powiedzieć podstawowe, zastosowane przy takich czynnościach choćby jak: określanie wartości zmiennej w oparciu o inne zmienne (np. wyliczenie wartości BMI w oparciu o dane z kolumn wzrost i masa ciała zdefiniowanie kategorii zmiennej (np. dla wyliczonej wskaźnika BMI, utworzenie nowej zmiennej BMI kategoria) określenie warunków selekcji (czyli ograniczenia danych do określonego podzbioru, na którym zostanie wykonana analiza) Wykorzystanie formuł do wyliczenia wartości zmiennej i utworzenia nowej zmiennej z kategoriami Tworzymy nową zmienną o nazwie BMI, który to wskaźnik wylicza się z zależności masa ciała [w kg] podzielona przez wzrost [w metrach] do kwadratu. Krok 1. Utworzenie nowej zmiennej Krok 2. Określenie formuły wyliczającej wartość zmiennej BMI Formułę wpisuje się w polu znajdującym się na dole okna Zmienna; każda formuła zaczyna się znakiem =, po czym odwołanie do każdej zmiennej odbywa się poprzez symbol złączony symbol v wraz z numerem zmiennej, np. zmienna masa ciała [w kg] ma numer 3 (patrz na powyższym rysunku), zaś zmienna wzrost [w cm] ma numer 2, stąd odwołanie do niej to v2, podnoszenie do potęgi realizuje się poprzez symbol ^, stąd finalnie otrzymujemy formułę =v3/(v2/100)^2 7

Krok 3. Po akceptacji wyskakującego okna z pytaniem Kontynuować? Otrzymujemy finalny efekt. Dodanie kolejnej zmiennej o nazwie BMI kategorie analogicznie poniższy uwzględniając algorytm kategoryzacji: jeżeli zmienna BMI ma wartość poniżej 18 przypisuje się zmiennej BMI kategorie wartość niedobór masy ciała jeżeli zmienna BMI ma wartość od 18 włącznie do 25 włącznie przypisuje się zmiennej BMI kategorie wartość w normie jeżeli zmienna BMI ma wartość powyżej 25 przypisuje się zmiennej BMI kategorie wartość nadmiar masy ciała Krok 1. Dodanie nowej zmiennej o nazwie BMI kategorie i zdefiniowanie jej kategorii 8

Krok 2. Wpisanie formuły definiującej podział na kategorie Formuła zdefiniowana jest jak poniżej: =(v4<18)*1+(v4>=18 and v4<=25)*2+(v4>25)*3 gdzie v4 to odwołanie do wartości BMI danej osoby wyrażenie (v4<18), to wyrażenie logiczne; jeśli v4 jest mniejsze od 18, to przyjmuje ono wartość prawda (czyli liczbowo 1), jeśli zaś v4 jest większe lub równe 18, to przyjmuje wartość fałsz (czyli liczbowo 0) przykładowa wartość (v4<18)*1 wylicza się następująco jeśli v4 jest mniejsze od 18, to prawda * 1 = 1 * 1 = 1 (przypominam, że kategorii niedobór masy ciała przypisano wartość 1) wszystko w temacie reszta przez analogię 9

2.5. Wprowadzanie warunków dla wykonywania analiz Podobnie przy definiowaniu analiz można ustanowić warunek wybierający jedynie określone przypadki do analizy. Wybierając dowolną z analiz: w lewym dolnym rogu okna znajduje się przycisk SELECT CASES, po jego wciśnięciu ukaże się okno: należy tu koniecznie aktywować możliwość wprowadzania warunków poprzez zaznaczenie opcji Włącz warunki selekcji, a następnie w wybranym oknie (tutaj akurat Określone przez) wprowadzenie warunku selekcji v1=1 (zmienna 1 równa 1 przypominam, że kodem 1 oznaczono płeć kobieta ) 10

3. Podstawowe analizy w pakiecie Statistica 3.1. Analiza rozkładu jednej zmiennej Kiedy chcemy przyjrzeć się rozkładowi jednej zmiennej (np. wzrost), wówczas wykorzystujemy menu Statystyka -> Statystyki podstawowe i tabele -> Tabele liczności Po zaakceptowaniu Tabele liczności - > OK, wskazujemy zmienną, która będzie analizowana. Okno analizy w zakładce Podstawowe oferuje: 11

Podsumowanie: tabele liczności Histogramy tabela liczności (czy inaczej szereg rozdzielczy) dla zmiennej ilościowej, która przybiera wiele wartości, zazwyczaj wymaga pogrupowania/utworzenia przedziałów (szczegóły grupowania zdefiniujesz w zakładce Więcej) statystyki opisowe wykres obrazujący liczność występowania: kategorii zmiennej jakościowej lub wartości/przedziałów wartości zmiennej ilościowej Kolumnom wypada/należy przypisać etykiety - prawy myszy na słupku i wybór Etykiety punktów -> Wyświetl etykiety punktów pozwala uzyskać podstawowe charakterystyki liczbowe analizowanej zmiennej jak: średnia i odchylenie standardowe, minimum, maksimum, mediana i kwartyle 12

3.2. Kiedy analizujesz rozkład dwóch zmiennych jakościowych względem siebie. Po wybraniu menu Statystyka -> Statystyki podstawowe i tabele -> Tabele wielodzielcze należy wskazać zmienne do analizy (przycisk Określ tabele (wybierz zmienne)) na zakładce Tabelaryzacja. po wyborze zmiennych (tutaj Płeć i BMI- kategorie) oraz po dwukrotnym zatwierdzeniu wyboru przyciskiem OK, pojawić powinno się okno Wyniki tabelaryzacji, jak poniżej z trzema zakładkami: Podstawowe, Więcej i Opcje Tabela zbiorcza oraz histogramy dostępne na zakładce podstawowe prezentują się jak poniżej Tabela zbiorcza (wielodzielcza) Histogram skategoryzowany (polecam w zakładce Opcje oznaczenie wyboru Procenty w wierszach, co wzbogaci tabelę o wyznaczenie procentowego rozkładu zmiennej) (w zakładce Więcej znajdziesz całą gamę dostępnych wykresów) 13

3.3. Kiedy analizujesz rozkład zmiennej ilościowej względem kategorii zmiennej jakościowej (czyli wykonujesz analizę w grupach, na przykład płci i/lub wykształcenia). Po wybraniu menu Statystyka -> Statystyki podstawowe i tabele -> Przekroje, prosta ANOVA należy określić zmienne (pamiętaj zmienna grupującą jest najczęściej zmienna jakościowa) po dwukrotnym zatwierdzeniu wyboru zmiennych przyciskiem OK., pojawi się okno analizy Statystyki w grupach wyniki (jak poniżej) 14

Zakładka Podstawowe oferuje możliwość wygenerowania tabeli z wartościami charakterystyk liczbowych takich jak średnia, odchylenie standardowe, liczebność w grupach (przycisk Podsum.: tabela statystyk), zaś przyciski Wykresy interakcji lub Skategoryzow. wykresy ramka-wąsy wygenerują wykresy obrazujące rozkład badanej cechy w grupach. Tabela statystyk Wykresy interakcji (w zakładce Statystyki opisowe można dokonać wyboru większej liczby charakterystyk liczbowych badanej grupy, np. mediany, kwartyli) 15