Statystyka matematyczna

Wielkość: px
Rozpocząć pokaz od strony:

Download "Statystyka matematyczna"

Transkrypt

1 Projekt pn. Wzmocnienie potencjału dydaktycznego UMK w Toruniu w dziedzinach matematyczno-przyrodniczych realizowany w ramach Poddziałania Programu Operacyjnego Kapitał Ludzki Joanna Karłowska-Pik Statystyka matematyczna Ćwiczenia laboratoryjne realizowane z wykorzystaniem pakietu IBM SPSS Statistics Wersja z dnia 7 maja 2012 Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

2

3 Wstęp Skrypt Statystyka matematyczna. Ćwiczenia laboratoryjne powstał na potrzeby zajęć z przedmiotu Statystyka matematyczna prowadzonych dla studentów II roku kierunku Matematyka i ekonomia oraz III roku kierunku Matematyka specjalność Matematyka w ekonomii i finansach, które w całości mogą odbywać się zdalnie. Ćwiczenia laboratoryjne są prowadzone w oparciu o program IBM SPSS Statistics w wersji 20 (najnowszej). Skrót SPSS tłumaczy się jako Statistical Package for the Social Sciences, ale metody zaimplementowane we wspomnianym oprogramowaniu już od dawna są stosowane poza kręgiem nauk społecznych. Wraz z konkurencyjnym programem Statistica i darmowym środowiskiem R pakiet SPSS należy do najczęściej wykorzystywanych narzędzi analitycznych zarówno na polskich i zagranicznych uczelniach wyższych, jak i w wielu firmach różnych branż. Licencja posiadana przez Uniwersytet Mikołaja Kopernika pozwala na instalację programu IBM SPSS Statistics na komputerach domowych studentów, co jest szczególnie ważne w przypadku prowadzenia zajęć zdalnych. Jedynym warunkiem jest zapoznanie się z warunkami umowy licencyjnej oraz podpisanie stosownego oświadczenia. Wzory oświadczeń oraz płyty z oprogramowaniem znajdują się u osób prowadzących zajęcia. 14-dniowa wersja próbna jest dostępna na stronie SPSS Statistics Desktop firmy IBM pod adresem US/trialprograms /W110742E06714B29.html (dostęp z dnia ). Wykorzystywane w ćwiczeniach pliki danych są dostępne na platformie Moodle lub są plikami przykładowymi programu, które można znaleźć w katalogu C:\\Program Files\IBM\SPSS\Statistics\20\Samples\Polish. Praca ze skryptem polega na przeczytaniu części teoretycznej, samodzielnym wykonaniu ćwiczeń, porównaniu otrzymanych wyników z zamieszczony- 3

4 mi rozwiązaniami i w przypadku rozbieżności ponownym wykonaniu zamieszczonych w ćwiczeniu poleceń. Skrypt jest skierowany do osób posługujących się systemem Windows w stopniu co najmniej podstawowym oraz posiadających elementarną wiedzę z zakresu teorii prawdopodobieństwa. Gwiazdką oznaczono tematy nieobowiązkowe przeznaczone dla osób szczególnie uzdolnionych lub zainteresowanych metodami statystycznymi i oprogramowaniem SPSS. 4

5 Rozdział 1. Podstawy pracy w IBM SPSS Statistics 1.1. Instalacja oprogramowania Do instalacji podstawowej wersji potrzebna jest 1 płyta dvd z programem oraz 1 płyta cd zawierająca Bonus Pack. Po uruchomieniu płyty (setup.exe, najlepiej na koncie użytkownika z prawami administratora) pojawia się menu, z którego wybieramy Instalacja IBM SPSS Statistics 20 (uruchomienie instalatora może trwać dłuższą chwilę). Następnie w oknie IBM SPSS Statistics 20 - InstallShield Wizard: Czytamy informacje i klikamy Dalej. Zaznaczamy Licencja typu Site i klikamy Dalej. Czytamy informacje o licencji i zaznaczamy Akceptuję warunki umowy licencyjnej i klikamy Dalej. Wpisujemy: Nazwa użytkownika Imię i nazwisko, Organizacja skrót nazwy wydziału, skrót nazwy uniwersytetu. Klikamy Dalej. Wybieramy języki pomocy (domyślnie jest to język polski) i klikamy Dalej. Wskazujemy folder docelowy, domyślnie: 5

6 i klikamy Dalej. Klikamy Instaluj. C:\\Program Files\IBM\SPSS\Statistics\20\ Po zakończeniu otrzymujemy komunikat o pomyślnej instalacji. Po naciśnięciu OK przystępujemy do autoryzacji. Uwagi: Domyślnie mamy zaznaczone Kliknij tutaj, aby zarejestrować się... Możemy to odznaczyć, jeśli nie chcemy rejestrować się na stronie producenta. W celu dokonania autoryzacji konieczne jest podłączenie komputera do internetu! Autoryzacja produktu wymaga wprowadzenie kodu można go otrzymać od osób prowadzących zajęcia. Wybieramy Uzyskaj teraz licencję. Klikamy Dalej. Wprowadzamy kod. (Kod uprawnia do pracy z programem do dnia 31 marca 2012 roku). Klikamy Dalej. Otrzymujemy komunikat, że autoryzacja powiodła się i pomyślnie przetworzono wszystkie kody. Klikamy Dalej i Zakończ. W oknie powitalnym klikamy Zakończ. Przystępujemy do instalacji materiałów znajdujących się na płycie Bonus Pack (autosetup.exe). Są tam m.in. mapy do kartogramów oraz język programowania Python wraz z wtyczką. Klikamy Instaluj PS Bonus Pack do IBM SPSS Statistics 20. Postępujemy zgodnie z zaleceniami kreatora instalacji Bonus Packa i klikamy Dalej. Czytamy warunki umowy licencyjnej i klikamy Zgadzam się. Wybieramy katalog docelowy dla Bonus Packa, domyślnie C:\\Program Files\IBM\SPSS\Statistics\20\ 6

7 i klikamy Zainstaluj. Pojawia się komunikat o konieczności zainstalowania Essentials for Python (wtyczka SPSSa do języka Python). Klikamy OK. W oknie kreatora instalacji dla Essentials for Python czytamy informacje o licencji i klikamy Dalej. Czytamy treść umowy licencyjnej, zaznaczamy Akceptuję warunki umowy licencyjnej i klikamy Dalej. Czytamy informację o instalowanych elementach i klikamy Dalej. Wybieramy, czy zainstalować Pythona dla wszystkich, czy tylko jednego użytkownika komputera (do Państwa decyzji) i klikamy Next. Wybieramy katalog do instalacji Pythona (domyślnie C:\\Python27\) i klikamy Next. Wybieram sposób instalacji poszczególnych elementów Pythona (najlepiej zostawić domyślnie) i klikamy Next. Otrzymujemy komunikat o pomyślnej instalacji Pythona i klikamy Finish. Powracamy do okna instalacji Essentials for Python i wskazujemy katalog, w którym mamy zainstalowany program IBM SPSS Statistics 20, domyślnie Klikamy Dalej. Klikamy Instaluj. C:\\Program Files\IBM\SPSS\Statistics\20\ Zaznaczamy, czy chcemy przeczytać dokumentację programistyczną i klikamy Zakończ. Otrzymujemy komunikat o pomyślnej instalacji Bonus Packa. Możemy od razu uruchomić program IBM SPSS Statistics 20, zaznaczając tę opcję. Klikamy Zakończ. Uwagi: W przypadku komunikatu, że zapora systemu Windows zablokowała niektóre funkcje tego programu, można kliknąć Anuluj. 7

8 Warto zwrócić uwagę, że na płycie z Bonus Packiem znajduje się samouczek programu IBM SPSS Statistics zawierający wiele prezentacji multimedialnych, które mogą w przyszłości ułatwić naukę pracy z programem Uruchamianie oprogramowania Program uruchamiamy, klikając dwukrotnie odpowiednią ikonę, bądź wybierając Start > Wszystkie programy > IBM SPSS Statistics > IBM SPSS Statistics 20. Po uruchomieniu programu pojawia się okno dialogowe. Można od razu z niego coś wybrać lub kliknąć Anuluj. Program pozwala na pracę z następującymi oknami: Okno danych. Plik > Otwórz > Dane... Pliki danych programu IBM SPSS Statistics mają rozszerzenie.sav. Okno raportów. Plik > Otwórz > Raport... Pliki raportów programu IBM SPSS Statistics mają rozszerzenie.spv. Okno poleceń. Plik > Otwórz > Polecenia... Pliki poleceń programu IBM SPSS Statistics mają rozszerzenie.sps. Okno edytora skryptów. Plik > Otwórz > Skrypt... Pliki skryptów programu IBM SPSS Statistics mają rozszerzenie.wwd bądź.py Okno danych Okno ma postać arkusza z danymi. Bezpośrednio nad wierszem zawierającym nazwy zmiennych znajduje się pole, w którym można odczytać pozycję (czyli numer wiersza i nazwę kolumny) aktywnej komórki, oraz pole, w którym można edytować zawartość tej komórki. Kolumny w arkuszu danych są nazywane zmiennymi, a wiersze obserwacjami. Po najechaniu myszką na nazwę zmiennej pojawia się etykieta z opisem zmiennej. W pasku ikon jako czwarta od prawej strony znajduje się ikona Etykiety wartości, która pozwala na zamianę wartości zmiennych na ich etykiety i na odwrót. 8

9 U dołu arkusza znajdują się dwie zakładki pozwalające na przełączanie się z arkusza danych do arkusza specyfikacji zmiennych. Dla każdej zmiennej określone są tam: Nazwa krótka nazwa zmiennej, długości do 64 bajtów, nie może zawierać spacji; Typ po uaktywnieniu tej komórki pojawiają się..., wystarczy kliknąć na nie myszką i otwiera się okienko, pozwalające zmienić typ zmiennej na np. numeryczny, tekstowy, dolar, itp. Szerokość liczba znaków, którą maksymalnie będą miały wpisywane dane; Dziesiętne liczba miejsc dziesiętnych, wpisuje się tylko dla danych liczbowych; Etykieta pełna charakteryzacja zmiennej, można tutaj wpisać dokładną informację o rodzaju danych umieszczonych w danej kolumnie; Wartości jeżeli zmienna przyjmuje tylko kilka powtarzających się wartości (najczęściej tekstowych), np. kolor oczu: niebieskie, zielone, piwne, brązowe, to możemy je oznaczyć liczbami i w tym polu zdefiniować ich wartości; Braki danych wartości zmiennej, które program ma traktować jako braki danych i nie wliczać ich np. do wyznaczanych statystyk. 9

10 Kolumny liczba znaków w kolumnie (szerokość kolumny), powinna być tak dobrana, żeby mieściły się dane i nazwy zmiennych; Wyrównanie wyrównanie danych: do lewej, do prawej lub centralnie; Poziom pomiaru można wybrać: ilościowy, gdy ważne jest, żeby dane porównywać i móc wykonywać na nich działania, np. A jest dwa razy cięższy niż B; porządkowy, gdy ważne będzie porównywanie danych, np. oceny na koniec roku szkolnego; nominalny, gdy na danych nie wykonujemy żadnych operacji, np. numer PESEL, nazwisko. Rola służy do oznaczenia roli danej zmiennej w analizie. Efekt wyboru roli jest taki, że w trakcie analizy w niektórych oknach dialogowych zmienne będą się już automatycznie pojawiać w odpowiednich polach. Domyślnie ustawiana jest rola Wejście. Ustawienie roli ma na celu tylko ułatwienie korzystania z programu. Dokładniejszego wyjaśnienia wymaga typ zmiennej, oznaczenie braków danych oraz wybór odpowiedniego poziomu pomiaru. Dysponujemy kilkoma typami zmiennych. Najbardziej popularnym jest typ numeryczny. Mają go wszystkie zmienne typowo liczbowe np. waga, wzrost, liczba dzieci, ale również zmienne jakościowe, tj. mające wartości będące kategoriami. Najczęściej bowiem różnym kategoriom takich zmiennych przypisuje się kolejne wartości liczbowe, np. 1 mężczyzna, 2 kobieta. Ułatwia to wprowadzanie danych. W polu Wartości definiuje się wówczas jaka wartość zmiennej odpowiada której kategorii. Typ tekstowy pozostawia się dla danych, które faktycznie zostały wpisane jako tekst. Warto zauważyć jak wiele jest możliwości wyboru konkretnego typu daty, czy dolara (dla kwot z oznaczeniem waluty). Typ użytkownika pozwala z kolei na wprowadzenie danych z dowolnym oznaczeniem, np. symbolem % czy PLN. Trzeba go jednak wcześniej zdefiniować w opcjach programu (patrz rozdział Opcje użytkownika). Funkcjonalność pola Braki danych wyjaśnimy na przykładzie. Wyobraźmy sobie, że pracujemy w komitecie wyborczym kandydata X. Robimy sondaż na temat jego szans na wygranie wyborów. Poza odpowiedziami typu głosuję na kandydata X, Y, Z mogą pojawić się odpowiedzi nie wiem na kogo zagłosuję oraz nie idę na wybory. Są to ważne informacje, mogą one pomóc nam zdecydować, czy dalej prowadzić kampanię wyborczą 10

11 (gdy odpowiedzi nie wiem na kogo zagłosuję ), czy z niej zrezygnować (gdy w przewadze będą odpowiedzi nie idę na wybory ). Wprowadzając dane, oznaczamy: 1 będę głosować na kandydata X, 2 będę głosować na kandydata Y, 3 będę głosować na kandydata Z, 8 nie wiem na kogo zagłosuję, 9 nie idę na wybory. Zazwyczaj te dodatkowe odpowiedzi umieszcza się na końcu skali, jako 8, 9, czy 98, 99. Teraz trzeba program poinformować, że przy robieniu analiz, np. wykonywaniu wykresów poparcia dla kandydatów, nie ma uwzględniać wartości 8 i 9 są to zdefiniowane braki danych (w przeciwieństwie do systemowych braków danych, czyli po prostu pustych pól). Robimy to wypełniając pole Braki danych. Jak brak danych może występować cały przedział (np. błędy pomiarów). Dla poprawnego wykonania analizy danych kluczowe jest ustawienie odpowiedniego poziomu pomiaru. Złe dobranie poziomu pomiaru może skutkować brakiem dostępu do odpowiedniego wykresu czy testu statystycznego. Zasadniczo wyróżnia się zmienne (cechy) jakościowe i ilościowe. Zmienne jakościowe mają wartości będące kategoriami, przy czym kategorie te mogą mieć jakiś naturalny porządek czy kolejność (poziom porządkowy) lub nie (poziom nominalny). Zmienne ilościowe są zmiennymi typowo liczbowymi jak wzrost, waga, czy wysokość zarobków. Poniżej cytujemy fragmenty rozdziału 6. podręcznika J. Koronackiego i J. Mielniczuka Statystyka dla studentów kierunków technicznych i przyrodniczych [3]. Zacząć wypada od zwrócenia uwagi na to, że dane jakościowe mogą być dwojakiego typu. Mogą mianowicie opisywać cechy nominalne lub uporządkowane [...] Niech [...] interesującą nas cechą będzie wyznanie religijne, populacją zaś, w której chcemy poznać rozkład tej cechy, niech będą mieszkańcy Warszawy w zadanym roku. Cechę tę opisują następujące kategorie: katolik, prawosławny, ewangelik, żyd oraz kategoria inne wyznania, z której wymieniania rezygnujemy. [...] Wyznanie religijne jest cechą nominalną, nie ma bowiem żadnej relacji jakoś porządkującej kategorie wyznaniowe są to po prostu różne kategorie i tyle. Tak samo rzecz ma się z takimi cechami jak kolor włosów, nazwa miejscowości, w której może być zameldowany mieszkaniec województwa pomorskiego, czy zawód. 11

12 Inaczej jest, gdy interesującą nas cechą jest stopień sympatii do pewnej partii politycznej, przy czym cecha ta może występować na pięciu poziomach: nienawidzę, nie lubię, jest mi obojętna, lubię, bardzo lubię. Ów stopień sympatii jest ewidentnie uporządkowany, ponieważ możliwe poziomy sympatii potrafimy uporządkować od najgłębszej antypatii do wielkiej sympatii. Podobnie mamy do czynienia z cechą uporządkowaną, gdy pytamy nie o kolor włosów, a o to, czy ktoś jest łysy, ma mało włosów, ma typową liczbę włosów na głowie, czy też ma gęstą czuprynę. [...] Przyglądając się uważniej podanym przykładom cech jakościowych musimy dostrzec, iż różnią się co do statusu nie tylko tym, że są albo nominalne, albo uporządkowane. Cechy nominalne są cechami fundamentalnie jakościowymi w tym sensie, że nie mają żadnych związków z cechami ilościowymi. Przy tym cecha taka pozostaje fundamentalnie jakościową także wtedy, gdy jej kategorie zakodujemy z jakiegoś względu jako liczby liczba odgrywa wówczas jedynie rolę nazwy i nie ma żadnego sensu np. odejmowanie jednej liczby od drugiej [...] W przeciwieństwie do cech nominalnych, cechy uporządkowane mają w mniejszym lub większym stopniu związek z pewnymi cechami ilościowymi. W przypadku sympatii do określonej partii politycznej można zauważyć, że niejako w tle mamy na myśli jakąś cechę mierzalną o nieskończenie wielu wartościach. Możemy powiedzieć, że między nienawiścią a miłością do partii politycznej (nie ma tu nic do rzeczy, że takie skrajne uczucia w odniesieniu do partii politycznej nie są racjonalne) istnieje continuum różnych stopni sympatii. Ponieważ jednak owej intuicji mierzalności sympatii na skali o nieskończenie wielu wartościach nie umiemy sprecyzować, nie tylko mamy rację cechę tę uznając za jakościową, ale też uznając jej związek z jakąś cechą ilościową za bardzo niejasny. Z kolei taka cecha jak fakt mieszkania na wsi lub w małym, średnim czy dużym mieście może mieć mocny i dobrze określony związek z cechą ilościową, a mianowicie z liczbą mieszkańców miast Pomorza. Otóż interesująca nas tu cecha jakościowa mogła powstać przez ustalenie, iż małymi miastami nazywamy miasta o liczebności mieszkańców do , natomiast miastami średnimi są miasta zamieszkiwane przez więcej niż , ale nie więcej niż osób. A zatem cechy ewidentnie jakościowe mogą powstawać przez dyskretyzację jakiejś cechy ilościowej [...] W niniejszym wprowadzeniu musimy jeszcze poruszyć dwie kwestie interpretacyjne traktowania danych jakościowych jako ilościowych i odwrotnie, traktowania cech ilościowych tak jakby były jakościowymi. Oceniamy studentów, stosując stopnie z pozoru liczbowe [...] Dziwi nas, że np. Anglosasi stosują wyłącznie oceny literowe [...] A przecież oceny opisują cechę jakościową! Student, który ma trójkę nie jest o 1 lepszy od studenta 12

13 z dwóją [...] Jeszcze śmieszniej brzmiałoby stwierdzenie, że student czwórkowy jest 2 razy lepszy od dwójkowego. [...] Gdy zatem mamy dokonać analizy danych z pozoru liczbowych, trzeba zacząć od sprawdzenia, czy nie są to w istocie kody kategorii jakościowych i jeśli tak, to gdy jest to tylko możliwe postępować zgodnie z procedurami właściwymi dla danych jakościowych. Niekiedy usprawiedliwia się pogwałcenie podanej właśnie reguły, trzeba jednak zawsze zachować krytycyzm wobec takiego, metodologicznie niepoprawnego postępowania. Na przykład, jeżeli ocenom z kolokwiów, testów i ustnych odpowiedzi w ciągu semestru trudno jest nadać obiektywny, ilościowy charakter, wypada pozostać przy ocenach porządkowych. Jeżeli są to oceny zakodowane liczbowo, trudno na koniec semestru postąpić inaczej niż wystawić ocenę równą średniej z ocen uzyskanych w ciągu semestru, mimo, że jest to krok arbitralny, a jego ścisłe uzasadnienie nie istnieje. [...] Przejdźmy teraz do drugiej z wymienionych kwestii interpretacyjnych, czyli do traktowania zmiennych ilościowych jako jakościowych. Niekiedy, gdy zmienna ilościowa przyjmuje bardzo mało wartości, nie jest błędem metodologicznym potraktowanie takiej zmiennej jako jakościowej. Można powiedzieć, że nieraz uzasadnione jest potraktowanie możliwych wartości zmiennej ilościowej jako różnych kategorii zmiennej jakościowej o uporządkowanych wartościach. Co więcej, dyskretyzację zmiennej ilościowej [...] można również potraktować jako przekształcenie tej zmiennej w uporządkowaną cechę jakościową. [...] Podkreślmy jeszcze, że traktowanie oryginalnych zmiennych ilościowych jako uporządkowanych cech jakościowych zawsze wymaga usprawiedliwienia przez cel, jakiemu ma służyć. [...] Trzeba jednak zawsze pamiętać, że potraktowanie zmiennej ilościowej jako jakościowej uniemożliwia uzyskanie odpowiedzi na wszelkie pytania wymagające ilościowego charakteru zmiennej. I jeszcze jeden cytat (D.J. Sheskin, Handbook of Parametric and Nonparametric Statistical Procedures [7, str. 2], tłumaczenie własne): Mimo że w praktyce IQ i wiele innych ludzkich charakterystyk mierzonych testami psychologicznymi (takich jak obawa, introwertyzm-ekstrawertyzm itp.) są traktowane jako zmienne mierzone na skali przedziałowej, wielu badaczy będzie argumentować, że bardziej właściwa będzie dla nich skala porządkowa. Taki argument będzie bazować na fakcie, że takie miary nie spełniają wymagań skali przedziałowej, ponieważ nie można wykazać, że równe różnice liczbowe w różnych punktach skali są porównywalne. Ćwiczenie 1.1. Przyjrzyj się danym i zmiennym zamieszczonym w pliku Employee data.sav (plik przykładowy programu). a) Sprawdź, ilu respondentów przebadano. 13

14 b) Najedź myszką na nazwy zmiennych (kolumn) i zapoznaj się z etykietami zmiennych. c) Kliknij kilka razy ikonę Etykiety wartości. d) Co opisuje zmienna minority? Jakie przyjmuje wartości? Które z nich są traktowane jako braki danych? Jaki jest poziom tej zmiennej? Rozwiązanie. Wybieramy z menu Plik > Otwórz > Dane i otwieramy plik Employee data.sav z katalogu C:\\Program Files\IBM\SPSS\Statistics\20\Samples\Polish. a) Przebadano 474 respondentów. b) Kolejne zmienne to id kod pracownika, gender płeć pracownika, bdate data urodzenia, educ wykształcenie (w latach nauki), jobcat grupa pracownicza, salary wynagrodzenie bieżące, salbegin wynagrodzenie początkowe, jobtime czas pracy (miesiące), prevexp poprzednie zatrudnienie (miesiące), minority przynależność do mniejszości. c) Ikona Etykiety wartości zmienia np. wartości 1, 2, 3 zmiennej jobcat na etykiety odpowiednio Urzędnik, Ochroniarz i Menedżer. d) Zmienna minority opisuje przynależność do mniejszości. Przyjmuje wartości 0 Nie, 1 Tak oraz 9 Brak. 9 jest brakiem danych. Zmienna ma poziom nominalny. W IBM SPSS Statistics własności zmiennych ustawiamy w oknie edytora danych, w zakładce Zmienne. Program oferuje nam pewne udogodnienie. Uzyskujemy je, wybierając z menu Dane > Definiuj własności zmiennych... W pierwszym oknie dialogowym wybieramy zmienne, które nas interesują. Wartości tych zmiennych są wówczas skanowane i na ich podstawie program wyświetla właściwości zmiennych i proponuje poziom pomiaru. 14

15 W przypadku dużych zbiorów danych możemy ograniczyć liczbę skanowanych obserwacji. W przypadku zmiennych o wielu możliwych wartościach (np. zmienne ilościowe), możemy ograniczyć liczbę skanowanych wartości. W drugim oknie dialogowym dla każdej z wybranych zmiennych możemy uzupełnić jej właściwości, w szczególności ustawić poziom pomiaru (uwaga: program sugeruje poziom pomiaru tylko i wyłącznie na podstawie liczby różnych wartości zmiennej występujących w pliku, w szczególności przy małej liczbie różnych wartości będzie sugerował poziom nominalny lub porządkowy nie zawsze powinniśmy się z tym zgadzać). Bardzo użyteczna jest możliwość dopisania brakujących etykiet oraz oznaczenia braków danych. Ćwiczenie 1.2. Wczytaj dane z pliku respondenci.sav (plik dostepny na Moodle). Zeskanuj wszystkie zmienne, sprawdź, jaki jest sugerowany przez program poziom pomiaru. Czy zgadzasz się z tymi sugestiami? Zwróć uwagę, czy każda zmienna ma zdefiniowane wszystkie kategorie i zadeklarowane braki danych. Rozwiązanie. Otwieramy plik respondenci.sav, a następnie wybieramy Dane > Definiuj własności zmiennych... W pierwszym oknie dialogowym przerzucamy wszystkie zmienne do pola z prawej strony i wybieramy Dalej. W drugim oknie dialogowym, w polu z lewej strony będziemy kolejno wybierać zmienne, aby w polu z prawej strony zdefiniować ich wszystkie własności. Wybieramy zmienną płeć. Widzimy, że ma ona etykietę Płeć respondenta i poziom pomiaru ilościowy. Klikamy Zasugeruj... Program sugeruje nam poziom nominalny i jest to właściwy poziom dla zmiennej płeć. Po kliknięciu Dalej poziom zostaje zmieniony. W tabeli zamieszczonej z prawej strony widzimy, że w pliku jest 21 obserwacji o wartości 1 mężczyzna i 29 o wartości 2 kobieta. Nie ma innych wartości, nie ma braków danych. Wybieramy zmienną wiek. Ma ona etykietę Wiek respondenta i poziom pomiaru ilościowy. Po kliknięciu Zasugeruj... okazuje się, że jest to zgodne z sugestiami programu. Przeglądamy wartości zmiennej pokazane w tabeli. Ostatnią z nich jest wartość 999 nie wiem. Musimy ją oznaczyć jako brak danych, stawiając ptaszek w kolumnie Braki. Wybieramy zmienną dzieci. Ma ona etykietę Liczba dzieci i poziom pomiaru ilościowy. Klikamy Zasugeruj... Ze względu na niewielką liczbę przyjmowanych wartości program sugeruje poziom porządkowy 15

16 lub nominalny. Nie powinniśmy się na to zgadzać. Należy pozostawić poziom ilościowy. Przeglądając tabelę wartości, widzimy wartość 99 nie wiem. Oznaczamy ją jako brak danych. Ostatnią zmienną jest zadowolenie. Zmienna ta ma etykietę Poziom zadowolenia z życia i poziom pomiaru ilościowy. Klikamy Zasugeruj... Proponowany poziom to porządkowy lub nominalny. Decydujemy się na ten pierwszy, gdyż kolejne kategorie to bardzo niezadowolony, niezadowolony, średnio zadowolony. W tabeli z podglądem widzimy, że zmienna przyjmuje wartość 0 trudno powiedzieć. Oznaczamy ją jako brak danych. Poza tym zmienna przyjmuje wartości 4 i 5, które nie mają żadnych etykiet. Możemy je dodać, jeśli oczywiście wiemy, jak dane były wprowadzane. Załóżmy, że 4 oznaczała zadowolony, a 5 bardzo zadowolony. Po zdefiniowaniu własności wszystkich zmiennych klikamy OK Okno raportu Wyniki analizy danych pojawiają się zawsze w formie nowego okna okna raportu. Najważniejszą jego cechą jest menu, które zawiera wszystkie pozycje menu okna danych. Umożliwia to dalszą analizę zmiennych bez konieczności powrotu do tabeli danych. Pakiet IBM SPSS Statistics umożliwia nam tworzenie prezentacji wyników analizy. Każdy fragment raportu: tytuły, tabele, wykresy, możemy edytować poprzez zmianę ich zawartości, zmianę koloru, czcionki, wielkości, itp. Chcąc uaktywnić element raportu należy kliknąć na niego myszką raz, aby go zaznaczyć, a potem dwa razy, aby go edytować. Jeśli fragment jest gotowy do edycji, to otacza go ramka narysowana przerywaną linią. Jeżeli zaznaczony element zawiera tekst, to pojawia się pasek pozwalający na zmianę czcionki, jej rozmiaru i koloru. W tabelach można edytować każdą wpisaną w nie wartość, ale również sam wygląd i kształt tabeli. Edycji tabeli dokonujemy, klikając prawym klawiszem myszki i wybierając Właściwości tabeli... Do przestawiania wierszy i kolumn tabeli służy panel przestawiania. Najwięcej możliwości mamy przy obróbce graficznej wykresów. Po uaktywnieniu fragmentu zawierającego wykres pojawia się edytor wykresu. Daje on nam możliwość zmiany np. słupków wykresu, ich wypełnienia, koloru, kształtu; linii, ich grubości, koloru, stylu; osi układu oraz tekstu. Aby dokonać zmian należy najpierw element, który chcemy edytować, zaznaczyć kliknięciem myszką, a następnie wybrać odpowiednie opcje. 16

17 W raporcie można zamieszczać własne komentarze. Aby dodać tekst należy kliknąć na element raportu, pod którym tekst miałby się pojawić, a następnie wybrać Wstaw > Nowy tekst. Ćwiczenie 1.3. Otwórz plik Employee data.sav. Wybierz z menu: Analiza > Opis statystyczny > Częstości... Do pola Zmienne przerzuć zmienną educ (wykształcenie). Kliknij Statystyki... i zaznacz średnią oraz minimum i maksimum. Kliknij Dalej. Kliknij Wykresy... i zaznacz Wykresy słupkowe. Kliknij Dalej i OK. W otrzymanym raporcie: a) Zmień czcionkę tytułu Częstości na inną i ustal jej kolor na czerwony. b) Uaktywnij tabelę statystyk. Kliknij na napis Minimum. Kliknij prawym klawiszem myszki i wybierz Co to jest? c) Edytuj tabelę częstości. W tytule zmień czcionkę na Comic Sans MS w kolorze czerwonym. W opisie wierszy i kolumn ustaw czcionkę w kolorze granatowym, a dla danych ustaw błękitne tło. d) Edytuj wykres. Ustaw efekt 3W. Zmień kolor wykresu na fioletowy i wybierz deseń w ukośne paski. Zachowując proporcje, zmień rozmiar wykresu tak, aby miał on wysokość przekraczającą 500 pkt. Dokonaj transpozycji wykresu tak, aby słupki były narysowane poziomo. e) Pod wykresem wstaw tekst To jest wstępna analiza zmiennej wykształcenie (w latach nauki). Rozwiązanie. Raport bezpośrednio po pojawieniu się zawiera następujące elementy: 17

18 a) Klikamy raz na napis Częstości, by go zaznaczyć, a następnie dwa razy, by go aktywować. Zaznaczamy napis myszką i zmieniamy czcionkę na Comic Sans MS, a jej kolor na czerwony (ikona z paletą). b) Po wybraniu opcji Co to jest? pojawia się definicja minimum. 18

19 c) Edycja tabeli odbywa się poprzez jej kliknięcie (w celu zaznaczenia), podwójne kliknięcie (w celu aktywowania), a następnie kliknięcie na tabeli prawym klawiszem myszki i wybranie opcji Właściwości tabeli... Następnie wybieramy zakładkę Formaty. Wybierając odpowiedni element z listy Obszar lub klikając na odpowiednie miejsce tabeli na podglądzie, dokonujemy jego edycji. d) Klikamy wykres najpierw raz, a następnie dwa razy. Pojawia się wówczas osobne okno edycji wykresu oraz okno właściwości (jeśli go nie ma, nale- 19

20 ży na oknie edycji wykresu kliknąć prawym klawiszem myszki i wybrać Właściwości). W oknie edycji wykresu klikamy na słupki, a następnie w oknie właściwości wybieramy zakładkę Efekty i kąty i zaznaczamy tam efekt 3-W. Klikamy Zastosuj. Następnie wybieramy zakładkę Wypełnienia i obramowania i zmieniamy kolor słupków oraz deseń. W zakładce Rozmiar wykresu możemy odpowiednio ustawić jego wysokość (uwaga: wybór jednostki pkt, cm czy cale jest dokonywany w menu Edycja > Opcje). Zamiany słupków na poziome dokonujemy, używając odpowiedniej ikony. 20

21 e) Klikamy na wykres, a następnie wybieramy z menu Wstaw > Nowy tekst. W otrzymane pole tekstowe wpisujemy podane w zadaniu zdanie. Finalnie raport ma postać 21

22 1.5. Okno poleceń* Okno poleceń pozwala na zapisywanie wykonywanych czynności w języku poleceń. Jest to bardzo użyteczne ze względu na możliwość szybkiego wykonania powtórnie wcześniej przygotowanej analizy, możliwość powtórzenia fragmentu analizy, możliwość skopiowania wybranych fragmentów analizy, zmiany nazwy zmiennej i wykonania ich dla nowej zmiennej, integrację języka poleceń ze środowiskiem R. Jeśli nie znamy języka poleceń, wystarczy przy wykonywaniu analiz przy każdym poleceniu kliknąć Wklej zamiast OK. Powoduje to wklejenie odpowiedniego polecenia do okna poleceń. Polecenie zaznaczamy i klikamy ikonkę z zieloną strzałką Uruchom zaznaczenie. W pliku poleceń można umieszczać komentarze. Powinny one zaczynać się gwiazdką *, a kończyć kropką. 22

23 Ćwiczenie 1.4. Wykonaj raport z ćwiczenia 1.3 (statystyki i wykres) i kliknij na koniec Wklej zamiast OK. Zaznacz kod, który pojawił się w oknie poleceń i uruchom go. Zobacz efekt tego działania w pliku z raportem. Następnie skopiuj zaznaczony kod, wklej go niżej w okno poleceń, zmień nazwę zmiennej z educ na jobtime i uruchom zmieniony fragment kodu. Sprawdź efekt działania w pliku raportu Okno skryptów* Skrypty to programy, najczęściej pozwalające na wykonanie pewnych operacji na plikach raportów. Skryty są pisane w języku podobnym do Visual Basica, ale po zmianie ustawień (Edycja > Opcje) można również używać języka Python. Program IBM SPSS Statistics zawiera kilka przykładowych skryptów. Ćwiczenie 1.5. W wykonanym wcześniej raporcie zaznacz kliknięciem tabelę częstości. Otwórz skrypt C:\\Program Files\IBM\SPSS\Statistics\19\Samples\ ExportTablesToExcelFiles.wwd. Przeczytaj opis zamieszczony na górze skryptu. Skrypt ma na celu przeniesienie tabel z raportu do pliku Excela. Spróbuj przenieść do Excela zaznaczoną tabelę, uruchamiając skrypt przyciskiem z zieloną strzałką (Start/Resume). 23

24 1.7. Tworzenie zbiorów danych Pliki tworzymy, wybierając Plik > Nowy > Dane... Pliki danych zapisujemy z rozszerzeniem *.sav. Dobrze jest zacząć tworzenie nowego zbioru danych od zdefiniowania zmiennych w zakładce Zmienne. Jeśli jakaś zmienna będzie miała w tej zakładce zdefiniowane wartości, to po przejściu do zakładki Dane i wciśnięciu ikony Etykiety wartości, wartości zmiennej będzie można wybierać z rozwijanej listy. Ćwiczenie 1.6. Utwórz własny plik uczniowie.sav zawierający dane 10 uczniów biorących udział w badaniu. Plik powinien zawierać następujące dane: nazwisko ucznia, imię ucznia, datę urodzenia, wiek w momencie przeprowadzania wywiadu, płeć (dziewczynka, chłopiec), typ szkoły (np. 1 podstawowa, 2 gimnazjum, 3 średnia). 24

25 Rozwiązanie. Zamieszczone na Moodle Import danych z plików tekstowych Otwieramy dany plik np. w Notatniku, aby poznać jego strukturę. Zamykamy plik. Wybieramy w IBM SPSS Statistics: Plik > Czytaj dane tekstowe..., otwieramy żądany plik. Uruchamia się kreator importu tekstu, w którym odpowiadamy na kolejne pytania i klikamy Dalej. U dołu mamy podgląd, w jaki sposób przy aktualnych ustawieniach wczyta się plik. W kreatorze pojawia się pojęcie formatu predefiniowanego jest to użyteczne przy wczytywaniu większej liczby plików zorganizowanych w ten sam sposób. Format predefiniowany uzyskuje się po przejściu wszystkich kroków kreatora i zapisaniu takiego formatu na końcu. Można go użyć przy wczytywaniu kolejnych plików skraca to liczbę kroków w kreatorze. Ćwiczenie 1.7. Zaimportuj do arkusza danych SPSSa plik tekstowy demo.txt (plik przykładowy programu). Rozwiązanie. Wybieramy Plik > Czytaj dane tekstowe... i otwieramy plik demo.txt. Krok 1. Nie mamy predefiniowanego formatu. Krok 2. Nasze zmienne są separowane i mają nazwy zapisane na początku pliku. Krok 3. Pierwsza obserwacja rozpoczyna się w wierszu 2. Każdy wiersz zawiera tylko jedną obserwacje i wszystkie zamierzamy importować. Krok 4. Jedynym separatorem zmiennych jest tabulator. W pliku nie ma żadnego kwalifikatora tekstu. Krok 5. W tym kroku możemy kliknąć każdą ze zmiennych zamieszczonych w podglądzie i zmienić jej nazwę lub ustawić format. Wszystkie zmienne mają format liczbowy. Krok 6. Kończymy wczytywanie danych. 25

26 1.9. Import danych z plików formatu Excel Otwieramy zadany plik w programie Excel, aby poznać jego strukturę. Zamykamy plik. Wybieramy w IBM SPSS Statistics: Plik > Otwórz > Dane..., zmieniamy na dole ustawienie na Pliki typu: Excel i otwieramy żądany plik. Pojawia się okno dialogowe, w którym należy zaznaczyć, czy w oryginalnym pliku nazwy zmiennych znajdowały się w pierwszym wierszu danych, wybrać odpowiedni arkusz pliku *.xls i ewentualnie podać zakres danych, które chcemy wczytać. Klikamy OK. Specyfikujemy zmienne. Ćwiczenie 1.8. Zaimportuj do arkusza danych SPSSa plik demo.xls (plik przykładowy programu). Rozwiązanie. Otwieramy plik demo.xls w programie Excel i zapoznajemy się z jego strukturą. Zamykamy program. Wybieramy Plik > Otwórz > Dane... W oknie dialogowym zmieniamy typ plików na Excel. Otwieramy żądany plik. Zaznaczamy opcje Czytaj nazwy zmiennych z pierwszego wiersza danych Wczytywanie danych z baz danych* Otwieramy bazę w programie Microsoft Access, aby obejrzeć jej strukturę. Zamykamy. 26

27 Wybieramy Plik > Przejmij bazę danych > Nowa kwerenda... Otwiera się kreator przejmowania baz danych. Spośród zdefiniowanych źródeł baz danych wybieramy MS Access Database, klikając dwukrotnie myszką. Uwaga: mogą wystąpić problemy, jeśli przy 64-bitowym systemie Windows (a tym samym instalującym się automatycznie 64- bitowym SPSSie) na komputerze jest zainstalowany 32-bitowy Office. Program będzie wtedy wyświetlał komunikat o konieczności logowania. W oknie, które się pojawi, klikamy Przeglądaj... i wczytujemy żądaną bazę danych. Klikamy OK. Po zaznaczeniu na dole opcji Tabele pokazują się możliwe do wyboru tabele bazy danych. Klikając na znak + przy nazwie tabeli, możemy otrzymać listę zmiennych tej tabeli. Zaznaczamy i przerzucamy do okna z prawej strony całą tabelę lub wybrane zmienne. Klikamy Dalej. W następnym kroku możemy zdecydować, które obserwacje wczytujemy. Możemy zadać jakiś warunek z użyciem funkcji i dostępnych zmiennych oraz wczytać losową próbkę spośród dostępnych obserwacji. Klikamy Dalej. Specyfikujemy zmienne. Zmienne tekstowe można przekodować na numeryczne. Klikamy Dalej. Otrzymujemy zapytanie w języku SQL, które możemy wykonać lub zapisać w oknie poleceń. Możemy również zapisać kwerendę w pliku.spq (kwerenda IBM SPSS Statistics) lub jako plik danych.sav. Uwagi: Pliki zapisane jako pliki baz danych programu IBM SPSS Statistics można edytować: Plik > Przejmij bazę danych > Edytuj kwerendę..., lub otwierać: Plik > Przejmij bazę danych > Uruchom kwerendę... Generator liczb losowych używany przy losowaniu ma ustalony punkt startowy, co zapewnia powtarzalność losowania. Można go jednak zmienić, wybierając Przekształcenia > Generatory liczb losowych... i w polu Inicjalizacja aktywnego generatora zaznaczając Ustaw punkt startowy. 27

28 Kreator zapamiętuje ostatnią bazę danych, którą wczytywałeś. Jeśli chcesz uruchomić inną bazę danych niż ostatnio używaną, zamknij program lub kliknij na Pliki programu dbase, jeśli nie ma tego typu baz, kliknij OK i wtedy wczytaj wybraną bazę mdb. Ćwiczenie 1.9. Wczytaj bazę demo.mdb (plik przykładowy programu) do IBM SPSS Statistics. Spośród 1000 pierwszych osób, których samochód należy do kategorii 3 (luksusowe), wybierz losowo 10. Zapisz plik jako demo.spq. Następnie edytuj kwerendę i zmień wybrane osoby na te, których samochód należy do kategorii 2. Otwórz bazę demo2.mdb (dostępna na Moodle). Zawiera ona dwie tabele: demo i KlasaSmochodu oraz kwerendę demo. Zamknij bazę danych i uruchom kreator przejmowania baz danych. Po otwarciu bazy przerzuć do prawego okna obie tabele. Następnie zaznacz relację między nimi: zmiennej CARCAT z tabeli demo odpowiada zmienna id z tabeli KlasaSamochodu. Zaznacz obie zmienne, trzymając klawisz Ctrl i kliknij Połącz. Następnie wybierz losową próbę 10% obserwacji z grupy respondentów, którzy nie przekroczyli 50. roku życia. Plik zapisz jako demo2.spq. Wczytaj go jako plik.sav Przekształcanie zmiennych Tworzenie funkcji do zmiennych zawartych w arkuszu. Wybieramy z menu: Przekształcenia > Oblicz wartości... W wyniku otrzymujemy okno, pozwalające definiować nowe zmienne, które powstają z przekształcenia starych. Kalkulator umieszczony na środku okna dialogowego zawiera następujące operacje: + dodawanie, odejmowanie, mnożenie, / dzielenie, potęgowanie, <, >, <=, >= znaki nierówności, = znak równości, = znak różności, & koniunkcja (spójnik logiczny ), alternatywa (spójnik logiczny ). Jeżeli w polu Zmienna wynikowa zamiast wzoru zostanie wpisane wyrażenie logiczne, to utworzona zmienna będzie miała wartość 1 dla obserwacji, dla których wartość tego wyrażenia jest prawdą, a 0 dla obserwacji, dla których wartość tego wyrażenia jest fałszem. Po zaznaczeniu w polu Grupa funkcji wybranej grupy w polu Funkcje i zmienne specjalne pojawi się lista dostępnych funkcji. Zaznaczając wybraną funkcję, otrzymujemy jej dokładny opis. Warto pamiętać, że funkcja SUM działa inaczej niż zwykłe dodawanie. W przypadku braku danych zwykłe dodawanie nie wykona się, a funkcja SUM potraktuje braki danych jako zera. 28

29 Przycisk Jeżeli... pozwala na wyznaczenie wartości nowej zmiennej tylko dla niektórych obserwacji (spełniających podany warunek). Należy pamiętać, że program nowo utworzonym zmiennym przypisuje automatycznie szerokość 8 i dwa miejsca dziesiętne. W zakładce Zmienne można to ustawić zgodnie z własnymi potrzebami. Ćwiczenie Otwórz plik Employee data.sav (plik przykładowy programu). Utwórz nowe zmienne: a) zmienną różnica, która będzie równa różnicy obecnych zarobków i zarobków początkowych, b) zmienną wiek, która będzie równa aktualnej liczbie lat respondenta (rocznikowo), c) zmienną doświadczony, która będzie miała wartość 1, jeżeli pracownik przepracował już w życiu co najmniej 20 lat, a 0 w przeciwnym wypadku. Rozwiązanie. a) Wybieramy z menu Przekształcenia > Oblicz wartości... W pole Zmienna wynikowa wpisujemy nazwę różnica. Klikamy Typ i etykieta i zaznaczamy Użyj formuły wyrażenia jako etykiety (pozwala to zachować jako etykietę wzór definiujący nową zmienną). W pole Wyrażenie numeryczne wpisujemy wzór salary salbegin. Klikamy OK. b) Wybieramy z menu Przekształcenia > Oblicz wartości... Resetujemy ustawienia. W pole Zmienna wynikowa wpisujemy nazwę wiek. Klikamy Typ i etykieta i wpisujemy etykietę wiek pracownika. Na liście grup funkcji znajdujemy Wyodrębniające datę. Jedną z tych funkcji jest XDATE.YEAR, która dla zmiennej opisującej datę zwraca rok. Wrzucamy tę funkcję do pola Wyrażenie numeryczne i zapisujemy wzór Klikamy OK XDATE.YEAR(bdate). c) Wybieramy z menu Przekształcenia > Oblicz wartości... Resetujemy ustawienia. W pole Zmienna wynikowa wpisujemy nazwę doświadczony. Klikamy Typ i etykieta i wpisujemy etykietę przepracował co najmniej 20 lat. Zapisujemy w polu Wyrażenie numeryczne warunek logiczny jobtime + prevexp >= 29

30 240. Klikamy OK. W zakładce Zmienne w polu Wartości wpisujemy 1 tak, 0 nie. Gotowy plik jest dostępny na Moodle. Zliczanie wystąpień wartości w obserwacji Po wybraniu z menu Przekształcenia > Zlicz wystąpienia... możemy utworzyć zmienną, która będzie zliczała wystąpienia danej wartości wśród wybranych przez nas zmiennych dla każdej obserwacji. Wybierane zmienne muszą być tego samego typu. Ćwiczenie Otwórz plik tv-survey.sav (plik przykładowy programu). W pliku tym znajdują się dane dotyczące programów telewizyjnych. Na dobrą pozycję takiego programu ma wpływ kilka aspektów uwzględnionych jako kolejne zmienne. Sprawdź szanse każdego z programów, zliczając dla ilu aspektów pojawiła się odpowiedź 1 tak. Rozwiązanie. Wybieramy z menu Przekształcenia > Zlicz wystąpienia... W pole Zmienna wynikowa wpisujemy nazwę nowej zmiennej, np. szanse. W polu Zmienne umieszczamy wszystkie zmienne dostępne w pliku. Klikamy Definiuj wartości... Jako zliczaną wartość wpisujemy 1 i klikamy Dodaj. Następnie wybieramy Dalej i OK. Gotowy plik jest dostępny na Moodle. Rekodowanie zmiennych Pakiet SPSS pozwala na rekodowanie wartości zmiennych, czyli przypisanie istniejącym zmiennym nowych wartości. Po wybraniu z menu Przekształcenia > Rekoduj na te same zmienne... nowe wartości zmiennej zastąpią stare. Natomiast po wybraniu Przekształcenia > Rekoduj na inne zmienne... do pliku danych zostanie dołączona nowa zmienna o nowych wartościach, a zmienna, którą rekodujemy pozostanie niezmieniona. Opcja ta pozwala przekodować zmienną na zmienną innego typu (numeryczną na tekstową lub odwrotnie). Za pomocą rekodowania można podzielić obserwacje na kategorie, przypisującym różnym wartościom wyjściowej zmiennej tę samą wartość nowej zmiennej. Uwagi: W przypadku rekodowania nierozłącznych przedziałów na dwie różne wartości, np. przedziału [0, 4] na 1, a [3, 6] na 2, wszystkie wartości z pierwszego z podanych przedziałów zostaną przekodowane na 1, a z drugiego przedziału rekodowaniu na 2 ulegną tylko wartości, których w pierwszym przedziale nie było, tj. należące do przedziału (4, 6]. 30

31 To pozwala nie martwić się o wartości brzegowe klas, zostaną one rekodowane w zależności od kolejności, w jakiej podawaliśmy klasy do rekodowania. Ćwiczenie Otwórz plik Employee data.sav (plik przykładowy programu). Przekoduj zmienną prevexp, czyli poprzednie zatrudnienie, na zmienną doświadczenie o wartościach: 0 (żadne), jeżeli prevexp = 0, 1 (małe), jeżeli 0 < prevexp 60, 2 (średnie), jeżeli 60 < prevexp 120, 3 (duże), jeżeli prevexp > 120. Rozwiązanie. Wybieramy z menu Przekształcenia > Rekoduj na inne zmienne... Do okienka Zmienna źródłowa > wynikowa przerzucamy zmienną prevexp. W polach Nazwa i Etykieta wpisujemy nazwę nowej zmiennej doświadczenie i etykietę np. określenie doświadczenia zawodowego. Klikamy Wartości źródłowe i wynikowe. Z lewej strony wpisujemy wartość 0, z prawej również 0 i wybieramy Dodaj. Następnie z lewej strony wybieramy Zakres, podajemy od 0 do 60, z prawej wpisujemy wartość 1 i klikamy Dodaj. Znów z lewej strony wybieramy Zakres, podajemy od 60 do 120, z prawej wpisujemy wartość 2 i klikamy Dodaj. Na koniec z lewej strony wybieramy Zakres wartości, od podanej do największej:, wpisujemy 120, z prawej strony wpisujemy wartość 3 i klikamy Dodaj. Okno dialogowe powinno mieć wówczas postać: 31

32 Po wyznaczeniu wartości nowej zmiennej dokonujemy jej specyfikacji w oknie Zmienne. Gotowy plik jest dostępny na Moodle. Automatyczne rekodowanie Najczęściej stosowane do zamiany zmiennych tekstowych na numeryczne. Program kategoriom zmiennej tekstowej (w porządku alfabetycznym) przyporządkowuje kolejne liczby naturalne, przy czym wartości zmiennej tekstowej stają się etykietami wartości zmiennej numerycznej. Dostęp w programie: Przekształcenia > Automatyczne rekodowanie... Ćwiczenie Otwórz plik Employee data.sav (plik przykładowy programu). Rekoduj zmienną gender o wartościach k Kobieta i m Mężczyzna na zmienną płeć o wartościach numerycznych z odpowiednimi etykietami. Rozwiązanie. Wybieramy z menu Przekształcenia > Automatyczne rekodowanie... w pole Zmienna > Nowa nazwa przerzucamy zmienną gender. Jako nową nazwę wpisujemy płeć i klikamy Dodaj nową nazwę. Klikamy OK. W pliku danych powstała zmienna płeć o wartościach 1 i 2 i etykietach odpowiednio Kobieta i Mężczyzna. Kategoryzacja wizualna Kategoryzacja wizualna jest pomocna w grupowaniu wartości danej zmiennej, m.in. w klasy o równej długości, co ułatwia sporządzanie szeregów rozdzielczych. Aby dokonać takiej kategoryzacji należy wybrać Przekształcenia > Kategoryzacja wizualna... i w oknie dialogowym wybrać zmienne do kategoryzacji. W kolejnym oknie dialogowym widoczne są histogramy wybranych zmiennych. Należy tu podać nazwę zmiennej po kategoryzacji. Następnie po kliknięciu Punkty podziału... otwiera się kolejne okno, w którym można wybrać Równe szerokości przedziałów (i ustawić podział danych, wypełniając co najmniej dwa spośród trzech pól), Równe percentyle (ustalamy podział wypełniając przynajmniej jedno pole) lub Punkty podziału w średniej i odchyleniach standardowych. Klikając Zast..., wracamy do poprzedniego okna, w którym teraz widać dokonany podział na wykresie słupkowym i w tabeli wartości i etykiet. Punkty podziału na wykresie słupkowym można ręcznie przesuwać, wówczas wartości w tabeli wartości i etykiet będą aktualizowane automatycznie. Po ustawieniu żądanego podziału klikamy Ok. Nowa zmienna przyjmuje wartości będące kolejnymi liczbami naturalnymi, numeruje ona kolejne grupy. 32

33 Ćwiczenie Otwórz plik Employee data.sav (plik przykładowy programu). Podziel wartości a) zmiennej prevexp na 4 klasy o równej długości, b) zmiennej jobtime na 4 klasy o zbliżonej liczebności. Rozwiązanie. a) Wybieramy z menu Przekształcenia > Kategoryzacja wizualna... Jako zmienną do kategoryzacji wybieramy zmienną prevexp. W kolejnym oknie pojawia się podgląd z histogramem. W pole Skategoryzowana wpisujemy nazwę nowej zmiennej np. prevexp klasy. Odczytujemy minimalną wartość zmiennej prevexp 0 i maksymalną 476. Klikamy Punkty podziału. Zaznaczamy Równe szerokości przedziałów i wyliczamy: 476 : 4 = 119. To oznacza, że jako położenie pierwszego punktu podziału wpisujemy 119, jako liczbę punktów podziału 3 i jako szerokość przedziałów znów 119. Klikamy Zast... Otrzymujemy podział na 4 klasy: W tabeli wartości i etykiet utworzonym klasom możemy nadać etykiety. b) Wybieramy z menu Przekształcenia > Kategoryzacja wizualna... Jako zmienną do kategoryzacji wybieramy zmienną jobtime. W kolejnym oknie pojawia się podgląd z histogramem. 33

34 W pole Skategoryzowana wpisujemy nazwę nowej zmiennej np. jobtime klasy. Klikamy Punkty podziału. Zaznaczamy Równe percentyle. Jako liczbę punktów podziału wpisujemy 3, wówczas program sam wstawi 25% jako szerokość przedziałów. Klikamy Zast... Tu również możemy nadać etykiety utworzonym klasom. Tabela częstości utworzona dla zmiennej jobtime klasy ma postać Jak widać klasy są tylko w przybliżeniu równoliczne. Wynika to z faktu, że wśród danych było wiele powtarzających się wartości, które musiały zostać zakwalifikowane do tylko jednej z klas Restrukturyzacja danych* Restrukturyzacja pozwala na przekształcenie wybranych zmiennych w obserwacje, przekształcenie wybranych obserwacji w zmienne oraz transpozycję. Aby dokonać restrukturyzacji należy wybrać Dane > Restrukturyzuj 34

35 dane... Pojawi się wówczas kreator restrukturyzacji danych, w którym można wybrać poniższe opcje. 1. Wybrane zmienne przekształcić w obserwacje opcję tę należy wybrać w przypadku, gdy kilka kolumn chcemy przekształcić w jedną. Krok 2. Tu należy zdecydować, ile grup zmiennych chcemy restrukturyzować. Krok 3. W polu Identyfikacja grup obserwacji można ustalić zmienną identyfikującą grupy obserwacji. Zmienna ta mówi, w którym wierszu znajdowała się dana wartość przed restrukturyzacją. Wartością tej zmiennej może być numer obserwacji lub wartość innej zmiennej, która nie będzie restrukturyzowana. W okienko Zmienne do transponowania wstawiamy zmienne, które chcemy restrukturyzować. Wstawiamy tyle grup zmiennych, ile określiliśmy w kroku 2. Liczba zmiennych w każdej grupie musi być taka sama. W pliku wynikowym wszystkie wartości zmiennych z danej grupy będą tworzyły jedną, nową zmienną wynikową, której nazwę możemy wprowadzić. Do okienka Zmienne niezmienione można wprowadzić zmienne, których nie restrukturyzujemy, ale chcemy umieścić w nowym pliku. Krok 4. Tu należy określić, czy będą tworzone zmienne indeksujące. Zazwyczaj wystarcza utworzenie jednej takiej zmiennej. Wówczas mówi ona, w której kolumnie znajdowała się dana wartość przed restrukturyzacją. Krok 5. Dostępny, jeśli w kroku 4. zdecydowaliśmy się utworzyć zmienne indeksujące. Tutaj należy ustalić wartości zmiennych indeksujących. Mogą to być kolejne liczby naturalne albo nazwy kolumn, z których pochodzą dane. Krok 6. Traktowanie zmiennych niewybranych tu można zdecydować, czy zmienne, których nie restrukturyzujemy, mają być dołączone do pliku wynikowego. Systemowe braki danych lub puste wartości we wszystkich zmiennych transponowanych tu można zdecydować jak traktować braki danych. Zmienna zliczająca obserwacje mówi o tym, ile nowych wierszy powstało z jednego wiersza danych wejściowych. Koniec. Wykonanie restrukturyzacji. Po wybraniu opcji Restrukturyzuj dane plik wejściowy zostanie zastąpiony nowym. Ćwiczenie Plik piwo1.sav zawiera zestawienie dotyczące sprzedaży piwa w wybranych pubach w 15 miastach województwa kujawskopomorskiego. Cena piwa oraz wielkość zamówienia składanego przez pub 35

36 umieszczone są w trzech kolumnach, z podziałem na wtorek, środę, czwartek. Chcielibyśmy przeprowadzić analizę danych łącznie dla tych trzech dni. Dlatego bardziej użyteczne będzie umieszczenie ceny piwa i wielkości zamówienia jako pojedynczych zmiennych. Dokonaj odpowiedniej restrukturyzacji danych. 2. Wybrane obserwacje przekształcić w zmienne opcję tę należy wybrać w przypadku, gdy obserwacje znajdujące się w jednej kolumnie chcemy rozdzielić na kilka kolumn. Krok 2. W okienku Zmienne indentyfikujące umieszczamy zmienne, według których chcemy dokonać podziału. Po restrukturyzacji dane, dla których zmienne identyfikujące mają te same wartości, będą tworzyły jedną obserwację. Zmienne indeksujące określają sposób podziału kolumn. Plik po restrukturyzacji będzie zawierać po jednej nowej kolumnie dla każdej unikatowej wartości zmiennych indeksujących. Krok 3. Jeśli plik nie był wcześniej posortowany według zmiennych identyfikujących należy wybrać opcję Tak, dane zostaną posortowane według zmiennych identyfikujących i indeksujących. Krok 4. Porządek nowych grup zmiennych określa porządek kolumn w pliku wynikowym. Opcja Grupuj według zmiennej oryginalnej spowoduje, że kolumna z pliku wejściowego, która została podzielona utworzy grupę, w której kolumny różnią się wartością indeksu. Opcja Grupuj według indeksu spowoduje, że grupy utworzą podzielone kolumny z pliku wejściowego o różnych nazwach, ale takim samym indeksie. Zmienna zliczająca obserwacje mówi o liczbie wierszy, które zostały wykorzystane do utworzenia nowego wiersza w pliku wynikowym. Zaznaczenie opcji Zmienne wskaźnikowe spowoduje utworzenie zmiennej wskaźnikowej dla każdej unikatowej wartości zmiennej indeksującej. Zmienna wskaźnikowa jest równa 1, jeśli w pliku wejściowym dla jej indeksu była wartość równa wartości zmiennej identyfikującej oraz jest równa 0 w przeciwnym wypadku. Koniec. Wykonanie restrukturyzacji. Po wybraniu opcji Restrukturyzuj dane plik wejściowy zostanie zastąpiony nowym. Ćwiczenie Plik piwo2.sav zawiera wielkość zamówienia składanego przez wybrane puby w 15 miastach województwa kujawsko-pomorskiego w dzień powszedni oraz w weekend. Dane te zawarte są w jednej kolumnie. Dokonaj restrukturyzacji danych tak, aby można było analizować osobno wielkość zamówienia w dzień powszedni i weekendowy. 36

37 3. Dokonać transpozycji wszystkich danych jest to opcja równoważna Dane > Transponuj... 37

38 38

39 Rozdział 2. Statystyka opisowa i grafika 2.1. Podstawowe statystyki Podstawowe statystyki program IBM SPSS Statistics oblicza w kilku miejscach: Analiza > Raporty i zestawienia > Podsumowania obserwacji... > Statystyki lista statystyk do wyboru, Analiza > Opis statystyczny > Częstości... > Statystyki... lista statystyk do wyboru plus tabele częstości oraz wykresy (słupkowy, kołowy lub histogram z lub bez krzywej rozkładu normalnego), Analiza > Opis statystyczny > Statystyki opisowe... > Opcje... lista statystyk do wyboru plus standaryzacja zmiennych, Analiza > Opis statystyczny > Eksploracja... obliczane są: średnia, przedział ufności dla średniej (o zadanym poziomie ufności), średnia obcięta, mediana, wariancja, odchylenie standardowe, minimum, maksimum, rozstęp, rozstęp ćwiartkowy, skośność i kurtoza; dodatkowo mogą być liczone M-estymatory, wartości skrajne i percentyle oraz robione wykresy (skrzynkowe, łodyga i liście, histogram oraz wykresy normalności z testami). Przypomnimy krótko własności podstawowych statystyk, zakładając, że zostały one szczegółowo omówione na ćwiczeniach. Miary tendencji centralnej: Średnia x = Ni=1 x i N. 39

40 Średnią podajemy z dokładnością o 1 większą niż dane. Może być wykorzystywana w dalszych obliczeniach statystycznych. Jest najmniej podatna na błąd jako przybliżenie średniej dla całej populacji, ale wrażliwa na nienormalnie duże lub nienormalnie małe wartości skrajne. W przypadku rozkładów dwu- i wielomodalnych bywa myląca. W dowcipie rysunkowym robotnik mówi do dziennikarki: Średnio rocznie w naszej firmie zarabia się zł. Prezes zarabia milion, a nasza dziesiątka po Mediana wartość środkowa. Jeśli N jest nieparzyste, to medianą jest x ((N+1)/2), a jeśli parzyste, to x (N/2)+x ((N/2)+1). Łatwa do zrozumienia. 2 Nie ulega deformacji ze względu na nienormalnie duże lub nienormalnie małe wartości skrajne. Dla małych zbiorów danych, o pewnej szczególnej postaci, nie jest dobrą charakterystyką tendencji centralnej (np. medianą dla 5, 5, 5, 9, 10 jest 5). Miary rozproszenia: Rozstęp R = x max x min. Kwantyle: kwartyle, decyle, percentyle. Kwantyle rzędu m to punkty podziału próbki na m równych części. Kwantyli rzędu m jest m 1. Kwantyle rzędu 4 to kwartyle. Kwantyle rzędu 10 to decyle, a rzędu 100 to percentyle. W SPSSie l-ty kwartyl rzędu m (dla l = 1, 2,... m 1) jest liczony według wzoru ( ) ((N + 1) lm ) k Q l m = gdzie k = [ (N + 1) l m]. k + 1 (N + 1) l m x (k) + x (k+1), Graficzną prezentacją kwartyli jest wykres skrzynkowy (skrzynka z wąsami). Rysujemy go wzdłuż jednej osi ze skalą. Składa się on z pudełka rozciągającego się od 1. do 3. kwartyla, z przedziałką na wysokości mediany. Do pudełka doczepione są wąsy sięgające z jednej strony do najmniejszej wartości zmiennej, a z drugiej do największej wartości zmiennej. 40

41 Dla udoskonalonych wykresów skrzynkowych, a takie pojawiają się w IBM SPSS Statistics, wąsy mają długość nieprzekraczającą 1, 5 rozstęp międzykwartylowy (tzn. różnica Q 3/4 Q 1/4 ). Każda wartość, która znajduje się poza wąsami jest oznaczana kółeczkiem lub gwiazdką i nazywana wartością odstającą lub outsiderem. Kółkiem oznacza się wartości odstające o nie więcej niż 3 odstępy międzykwartylowe (tzw. wartości nietypowe), a gwiazdką odstające o ponad 3 odstępy międzykwartylowe (tzw. wartości skrajne) Odchylenie standardowe Ni=1 (x i x) ŝ = 2. N 1 W przypadku, gdy zgromadzone dane traktujemy jako dane całej populacji, odchylenie standardowe obliczamy, dzieląc sumę wystepującą w powyższym wzorze przez N. Jeśli natomiast analizujemy próbkę i otrzymane odchylenie standardowe ma być przybliżeniem odchylenia standardowego w całej populacji, należy dzielić przez N 1 (tak liczy IBM SPSS Statistics). Zapobiega to obciążeniu tego przybliżenia (estymatora). Odchylenie standardowe może nie być dobrą miarą rozproszenia, gdy zmienna przyjmuje kilka wartości bardzo oddalonych od reszty lub gdy rozkład jest mocno skośny. Pozostałe miary: Skośność g = N N i=1 (x i x) 3 (N 1)(N 2)s 3. Decyduje o kształcie rozkładu. Przy dodatniej skośności rozkład jest prawostronnie skośny, czyli histogram ma dłuższy prawy ogon. Przy ujemnej rozkład jest ujemnie skośny, czyli histogram ma dłuższy lewy ogon. 41

42 Kurtoza K = N(N + 1) N i=1 (x i x) 4 3(N 1) ( ) Ni=1 2 (x i x) 2. (N 1)(N 2)(N 3)s 4 Podany wzór różni się od wzoru zazwyczaj podawanego w literaturze. W naszym przypadku kurtoza dla standardowego rozkładu normalnego jest równa 0 (a nie 3). Dlatego K < 0 rozkład platykurtyczny (płaski), K > 0 rozkład leptokurtyczny (wysmukły), K = 0 rozkład mezokurtyczny. Ćwiczenie 2.1. Otwórz plik Employee data.sav (plik przykładowy programu). Wykonaj analizę statystyczną bieżącego wynagrodzenia następującymi trzema sposobami: a) Analiza > Opis statystyczny > Częstości..., b) Analiza > Opis statystyczny > Statystyki opisowe..., c) Analiza > Opis statystyczny > Eksploracja... Rozwiązanie. a) Wybieramy Analiza > Opis statystyczny > Częstości... Do pola Zmienne przenosimy zmienną salary. Klikamy Statystyki i zaznaczamy interesujące nas statystyki. Klikamy Wykresy i wybieramy Histogramy oraz Pokaż krzywa normalną na histogramie. Wyłączamy opcję Pokaż tabele częstości. 42

43 b) Wybieramy Analiza > Opis statystyczny > Statystyki opisowe... Do pola Zmienne przenosimy zmienną salary. Klikamy Opcje i zaznaczamy interesujące nas statystyki. (W oryginalnej tabeli zamienio- 43

44 no wiersze na kolumny, otrzymując tabelę podaną poniżej). c) Wybieramy Analiza > Opis statystyczny > Eksploracja... Do pola Zmienne zależne przenosimy zmienną salary. Klikamy Statystyki... i sprawdzamy, czy mamy zaznaczone Statystyki opisowe. Klikamy Wykresy... i zamiast wykresu łodyga i liście zaznaczamy histogram. 44

45 45

46 Po wykonaniu tabel i wykresów należy dokonać oceny rozkładu. Tu zauważmy tylko, że rozkład jest mocno skośny prawostronnie, leptokurtyczny, z wieloma wartościami odstającymi Analiza danych w podgrupach Wybierając opcję Dane > Podziel na podzbiory... mamy możliwość przeprowadzania analiz w podgrupach. W oknie dialogowym wybieramy Porównaj grupy i wtedy wyniki analiz dla każdej grupy dostajemy w jednej tabeli a wykresy dla grup są kolejno po sobie lub Przedstaw wyniki w podziale na grupy i wtedy wszystkie wyniki analiz i wykresy są wykonywane najpierw dla jednej grupy, potem dla kolejnej itd. Grupy są wyróżniane na podstawie wartości zmiennych, które zadeklarujemy jako zmienne grupujące. Jeśli chcemy korzystać z tej opcji, musimy dane posortować ze względu na zmienną grupującą, co jest domyślnie zaznaczone w oknie dialogowym. Możemy wybrać opcję Plik jest już posortowany, jeśli wcześniej przeprowadziliśmy sortowanie. Aby wrócić do analizy całego zbioru danych musimy wybrać Dane > Podziel na podzbiory... i zaznaczyć opcję Analizuj wszystkie obserwacje, nie twórz grup. Pewną odmianą analizy danych w podgrupach jest tworzenie kostek OLAP (ang. Online Analytical Processing przetwarzanie analityczne w trybie online). Procedura ta umożliwia obliczenie sum, średnich i innych statystyk zmiennych ilościowych w grupach wyznaczonych przez jedną lub kilka zmiennych jakościowych i jest dostępna przez Analiza > Raporty i zestawienia > Kostki OLAP... W wyniku otrzymujemy aktywną tabelę, w której początkowo statystyki obliczone są bez dzielenia na podgrupy. Po aktywowaniu tabeli możemy dowolnie definiować interesujące nas grupy, aby otrzymać statystyki dla wybranej zmiennej ilościowej w tych grupach. Niestety tabela przestanie być aktywna, jeżeli raport eksportujemy do jakiegokolwiek innego formatu niż.spv. SPSS pozwala również na wybranie i analizę tylko niektórych obserwacji. Dokonujemy tego za pomocą Dane > Wybierz obserwacje... Obserwacje, których nie chcemy analizować, możemy trwale usunąć z pliku, wybierając Usuń niewybrane obserwacje ze zbioru danych lub chwilowo wyłączyć z analizy, wybierając Odfiltruj niewybrane obserwacje. Można również wybrane obserwacje przekopiować do nowego zbioru danych, wybierając Skopiuj wybrane obserwacje do nowego zbioru. Przy odfiltrowywaniu automatycznie tworzy się zmienna filter $ przyjmująca wartość 1 dla obserwacji wybranych, a 0 dla pozostałych. 46

47 Obserwacje do analizy wybieramy: na bazie warunku, wybierając Jeśli spełniony jest warunek, losowo, wybierając Próba losowa obserwacji i podając procent lub liczbę obserwacji, które chcemy badać, na bazie czasu lub zakresu obserwacji, wybierając Na podstawie czasu lub zakresu obserwacji (opcja czasu dostępna jest tylko dla dat stworzonych za pomocą opcji Dane > Definiuj datę i czas), na podstawie zmiennej filtrującej, wybierając Użyj zmiennej filtrującej; do analizy zostaną wybrane dane, dla których zmienna filtrująca ma wartości różne od zera, niebędące brakami danych. Aby wrócić do analizy całego zbioru danych musimy wybrać Dane > Wybierz obserwacje... i zaznaczyć opcję Wszystkie obserwacje. Ćwiczenie 2.2. Otwórz plik Employee data.sav (plik przykładowy programu). Wybierz do analizy osoby, których doświadczenie zawodowe (czyli poprzednie zatrudnienie łącznie z obecnym stażem pracy) przekracza 120 miesięcy, a następnie dokonaj analizy ich bieżącego wynagrodzenia w podziale na kobiety i mężczyzn. Rozwiązanie. Wybieramy z menu Dane > Wybierz obserwacje... Następnie zaznaczamy Jeśli spełniony jest warunek i klikamy Jeżeli... Zapisujemy warunek jobtime + prevexp > 120. Klikamy Dalej Następnie w polu Wynik zaznaczamy Odfiltruj niewybrane obserwacje. W efekcie niektóre obserwacje w pliku danych zostaną skreślone, co oznacza, że nie będą brane do analizy. Wybieramy teraz Dane > Podziel na podzbiory... Zaznaczamy Porównaj grupy i w polu Grupy wyróżnione na podstawie umieszczamy zmienną gender. Wykonujemy teraz analizę danych, wybierając np. Analiza > Opis statystyczny > Eksploracja... i w polu Zmienne zależne umieszczając salary. 47

48 48

49 49

50 50

51 51

52 Ćwiczenie 2.3. Dla danych zawartych w pliku Employee data.sav wykonaj kostkę OLAP, która będzie prezentowała podstawowe statystyki (minimum, maksimum, mediana, średnia, odchylenie standardowe) dla bieżącego wynagrodzenia w podziale na grupy ze względu na płeć i grupę pracowniczą. Rozwiązanie. Jeśli korzystamy z pliku używanego w poprzednim ćwiczeniu, musimy pamiętać o usunięciu podziału na grupy i wyboru obserwacji. Wybieramy Analiza > Raporty i zestawienia > Kostki OLAP... W polu Charakteryzowane zmienne umieszczamy salary. W polu Zmienne grupujące gender i jobcat. Klikamy Statystyki i do pola z prawej strony przenosimy wybrane statystyki. Gotowy raport jest zamieszczony na Moodle Ważenie obserwacji W przypadku zmiennych zgrupowanych (szereg rozdzielczy zamiast danych surowych) konieczne jest dokonanie ważenia obserwacji, żeby poszczególne różne wartości zmiennej nie były liczone pojedynczo, tylko tyle razy, ile wystąpiły faktycznie w próbie. Opcja ta jest dostępna poprzez wybranie Dane > Ważenie obserwacji. Od momentu zdefiniowania wagi obowiązuje ona we wszystkich wykonywanych analizach (również wykresach) aż do odwołania poprzez zmianę na opcję Nie waż obserwacji. Ćwiczenie 2.4. Plik defekt.sav (dostępny na Moodle) zawiera dane dotyczące rozkładu liczby uszkodzeń na yard kwadratowy tkaniny bawełnianej. Wyznacz średnią wartość liczby uszkodzeń oraz narysuj histogram liczby uszkodzeń, nie oznaczając i oznaczając zmienną częstość jako zmienną ważącą. Rozwiązanie. Wybieramy Analiza > Opis statystyczny > Częstości... Do pola Zmienne przenosimy zmienną uszkodzenia. Pod przyciskiem Statystyki wybieramy średnią, a pod przyciskiem Wykresy histogram. Odznaczamy opcję Pokaż tabele częstości. 52

53 Jak widać powyższy wykres nie ma w ogóle sensu, można z niego odczytać jedynie, że każda kategoria wystąpiła jeden raz. W tabeli natomiast częstość jest równa liczbie klas. Włączamy opcję ważenia: Dane > Ważenie obserwacji... Zaznaczamy Zważ obserwacje, a jako zmienną ważącą podajemy częstość. Powtarzamy analizę. 53

54 Teraz odczytujemy z tabeli, że uwzględnionych zostało 100 obserwacji, a średnia i histogram mają zupełnie inną postać Kreator wykresów Dostęp do kreatora wykresów uzyskujemy wybierając Wykresy > Kreator wykresów... Pojawia się wówczas okno z ostrzeżeniem, że należy najpierw zadbać o wprowadzenie etykiet kategorii oraz sprawdzić, czy poziom zmiennych został dobrze wybrany. Można wybrać Definiuj własności zmiennych... i tam sprawdzić ustawienia. Wykres w kreatorze można stworzyć na dwa sposoby: 1. korzystając z galerii, w której zdefiniowane zostały najczęściej używane kategorie wykresów, tj.: słupkowe: prosty, zgrupowany, zestawiony, prosty 3-W, zgrupowany 3-W, zestawiony 3-W, prosty wykres słupków błędu, zgrupowany wykres słupków błędu, liniowe: prosty, wielokrotny (grupowany, wieloliniowy), warstwowe: prosty, zestawiony, 54

55 kołowe / biegunowe: prosty, rozrzutu / punktowe: prosty rozrzutu, zgrupowany rozrzutu, prosty rozrzutu 3-W, zgrupowany rozrzutu 3-W, podsumowujący wykres punktowy, prosty punktowy, macierzowy rozrzutu, wykres linii rzutowania, histogram: prosty, zestawiony, wielokąt częstości (niedostępny z poziomu wykresów tradycyjnych), piramida populacyjna, max-min: maks-min-zamknięcie, prosty wykres rozstępu, zgrupowany wykres rozstępu, liniowy wykres różnic, skrzynkowe: prosty, zgrupowany, skrzynka podsumowująca obserwacje, dwuosiowe: dwuosiowy Y z osią jakościową X, dwuosiowy Y z osią ilościową X (niedostępne z poziomu wykresów tradycyjnych), 2. krok po kroku, z elementów podstawowych. Korzystanie z galerii jest najprostszym sposobem wykonania własnego wykresu. Aby stworzyć wykres, należy kliknąć na zakładkę Galeria, wybrać kategorię wykresu z listy, a następnie typ wykresu na podstawie dostępnych rysunków. Wybrany rysunek należy przeciągnąć myszką do obszaru roboczego, znajdującego się w prawym górnym rogu okna kreatora wykresów (lub dwukrotnie kliknąć myszką na wykres). W obszarze roboczym pojawią się obszary upuszczania osi oraz (przy niektórych wykresach) obszar upuszczania grupowania / zestawiania. Jeżeli są one opisane niebieską czcionką, należy na nie przeciągnąć odpowiednie zmienne z listy Zmienne lub przypisać odpowiednie statystyki. Czcionka w kolorze czarnym w obszarze upuszczania oznacza, że zawiera on już zmienną lub statystykę (niektóre wykresy mają z góry przypisane statystyki w obszarze upuszczania osi). Aby usunąć zmienną z obszaru upuszczania, należy ją z powrotem przeciągnąć na listę Zmienne. Można również tworzyć wykresy porównujące kilka zmiennych. Po przeciągnięciu do obszaru roboczego odpowiedniego wykresu, upuszczamy na oś pionową pierwszą zmienną. Następnie wybieramy drugą zmienną, przenosimy ją do tego samego obszaru upuszczania i upuszczamy po pojawieniu się znaku +. Aby zmienić właściwości któregokolwiek z elementów wykresu (osie, statystyki na osiach, legendę itp.), należy kliknąć przycisk Właściwości elementu. Okno właściwości elementu jest jedno dla wszystkich elementów wykresu, zaś modyfikacje na konkretnym elemencie przeprowadzamy, wybierając go z listy Edytuj właściwości. Po zmianie właściwości wybranych elementów należy je zachować, klikając przycisk Zastosuj. 55

56 Aby zmienić układ wykresu (np. transponować słupki z poziomych na pionowe), należy kliknąć zakładkę Podstawowe, a następnie przycisk Transponuj. Jeżeli chcielibyśmy otrzymać wiele wykresów (tabelę wykresów tzw. panel) w rozróżnieniu na wiele zmiennych jakościowych, np. wykształcenie, płeć, itp., należy dodać do wykresu więcej zmiennych. W tym celu klikamy zakładkę Grupy/ID punktów w oknie dialogowym kreatora wykresów, a następnie wybieramy odpowiednie opcje, np. zmienne panelu wierszowego lub kolumnowego. W obszarze roboczym pojawią się wówczas nowe obszary upuszczania, na które należy przeciągnąć zmienne jakościowe. Po zakończeniu tworzenia wykresu należy kliknąć przycisk OK, który spowoduje wyświetlenie wykresu w oknie raportu. Uwaga: należy wypełnić wszystkie obszary upuszczania opisane niebieską czcionką, inaczej nie będzie możliwe wygenerowanie wykresu (nie uaktywni się przycisk OK). Jeżeli utworzony przez nas wykres będzie często wykorzystywany, można go zapisać jako wykres użytkownika. Zapisane zostaną wówczas wszystkie ustawienia, które można zmieniać za pomocą kreatora wykresów (statystyki, typ skali itp.), poza zmiennymi. W celu zapisania wykresu, należy kliknąć prawym przyciskiem myszki w dowolnym miejscu na obszarze roboczym kreatora wykresów i kliknąć Dodaj do ulubionych. Po wprowadzeniu nazwy wykresu należy kliknąć przycisk OK. Od tego momentu wykres użytkownika pojawi się w galerii na liście Ulubione. Aby usunąć wykres użytkownika z listy, należy kliknąć na niego prawym przyciskiem myszy i wybrać Usuń z ulubionych. Tworzenie wykresu z elementów podstawowych jest metodą zalecaną dla bardziej zaawansowanych użytkowników. Jako elementy podstawowe rozumiemy osie wykresu oraz inne elementy graficzne. Klikamy na zakładkę Podstawowe. Zaczynamy od wyboru układu osi wykresu, gdzie mamy do wyboru 5 opcji: współrzędne jedno-, dwu- i trójwymiarowe, biegunowe i z dwiema osiami współrzędnych Y. W zależności od tego, jaki układ wybierzemy, uaktywnią się odpowiednie elementy graficzne, które możemy przeciągać do obszaru roboczego. Dalej postępujemy już tak, jak w przypadku tworzenia wykresu z galerii. Ćwiczenie 2.5. Otwórz zbiór Employee data.sav (plik przykładowy programu). a) Porównaj na wykresie słupkowym średnią wysokość bieżącego wynagrodzenia dla poszczególnych grup pracowniczych. b) Porównaj na wykresie słupkowym średnią wartość wynagrodzenia początkowego i bieżącego. 56

57 c) Przedstaw na wykresie kołowym udział procentowy poszczególnych grup pracowniczych w badanej grupie. d) Na trójwymiarowym wykresie słupkowym przedstaw zależność zajmowanego stanowiska i płci pracowników. e) Wykonaj piramidę populacyjną dla wieku pracowników w podziale na płeć. f) Na wykresie rozrzutu przedstaw zależność wynagrodzenia bieżącego od początkowego. g) Wykonaj panel wykresów liniowych, na których zaprezentujesz zależność średniego wynagrodzenia od stażu pracy dla poszczególnych grup pracowniczych. Rozwiązanie. a) Wybieramy z menu Wykresy > Kreator wykresów. Jeśli pojawi się okno informujące o potrzebie zdefiniowania własności zmiennych możemy to zrobić lub, w przypadku znanego zbioru danych z dobrze wyspecyfikowanymi zmiennymi, kliknąć OK. Z galerii wykresów wybieramy Słupkowe i prosty wykres słupkowy przenosimy do obszaru roboczego. Na oś X upuszczamy zmienną jobcat. Na oś Y zmienną salary. W oknie właściwości sprawdzamy, że statystyką podsumowującą jest rzeczywiście średnia. Wykres możemy aktywować i w oknie edycji wybrać ikonę Pokaż opis danych. 57

58 W rezultacie otrzymujemy wykres b) Wybieramy z menu Wykresy > Kreator wykresów. Z galerii wykresów wybieramy Słupkowe i prosty wykres słupkowy przenosimy do 58

59 obszaru roboczego. Na oś Y upuszczamy najpierw zmienną salbegin, a następnie salary (czekając aż w górnej części obszaru upuszczania pojawi się czerwony znak plusa). Pojawi się okno dialogowe informujące nas, że nazwy tych dwóch zmiennych będą nazwami kategorii na osi X. Klikamy OK. Otrzymujemy wykres c) Wybieramy z menu Wykresy > Kreator wykresów. Z galerii wykresów wybieramy Kołowe / Biegunowe. Wykres kołowy przenosimy do obszaru roboczego. W polu Wycinki tworzy umieszczamy zmienną jobcat. Jako statystyka ustawiła się liczebność. W oknie właściwości możemy ją zmienić na procent. Po wykonaniu wykresu możemy go aktywować i wycinki opatrzyć procentami. 59

60 d) Wybieramy z menu Wykresy > Kreator wykresów. Z galerii wykresów wybieramy Słupkowe i przenosimy do obszaru roboczego prosty wykres słupkowy 3-W. Zmienną gender umieszczamy na osi X, a zmienną jobcat na osi Z. Na osi Y automatycznie pojawi się liczebność. e) Tworzymy najpierw zmienną wiek (patrz ćwiczenie 1.10), obliczając aktualny wiek pracowników (na rok 2012). Następnie wybieramy z menu Wykresy > Kreator wykresów. Z galerii wykresów wybieramy Histogram, a następnie do obszaru roboczego przenosimy piramidę populacyjną. Jako zmienną podziału wybieramy gender, a jako zmienną dystrybucji wiek. 60

61 f) Wybieramy z menu Wykresy > Kreator wykresów. Z galerii wykresów wybieramy Rozrzutu/Punktowe, a następnie do obszaru roboczego przenosimy prosty wykres rozrzutu. Ponieważ to wynagrodzenie bieżące może zależeć od początkowego, a nie na odwrót, to na osi Y (zmiennej zależnej) umieszczamy zmienną salary, a na osi X (zmiennej niezależnej) salbegin. g) Wybieramy z menu Wykresy > Kreator wykresów. Następnie spośród wykresów liniowych wybieramy prosty wykres liniowy. Na oś X upuszczamy zmienną jobtime, a na oś Y zmienną salary. W oknie właściwości elementu zmieniamy statystykę z Wartości na Średnia. Klikamy Zastosuj. W oknie kreatora wykresów przechodzimy do zakładki Grupy/ID punktów i zaznaczamy opcję Zmienna panelu wierszowego. W obszarze roboczym pojawi się wówczas pole Panel, w którym umieszczamy zmienną jobcat. 61

62 Ćwiczenie 2.6. Na podstawie danych zawartych w pliku meteo.sav (dostępny na Moodle) wykonaj wykres, który będzie prezentował sumę opadów (w postaci słupków) oraz średnią temperatur (w postaci wykresu liniowego) w kolejnych miesiącach. Rozwiązanie. Wybieramy z menu Wykresy > Kreator wykresów. Z galerii wykresów wybieramy Dwuosiowe i do obszaru roboczego przenosimy wykres dwuosiowy Y z osią jakościową X. Na osi poziomej umieszczamy miesiąc. Na lewą oś pionową upuszczamy opady, a na prawą temperaturę. Klikamy na opis lewej osi i w oknie właściwości zmieniamy statystykę ze średniej na sumę. Klikamy Zastosuj. 62

63 Podstawowe zasady tworzenia wykresów: Wykresy słupkowe powinny mieć słupki rysowane osobno, chyba że odpowiadają kolejno następującym po sobie przedziałom liczbowym. Odległości między słupkami powinny być inne niż szerokość słupków. Słupki są rysowane poziomo, gdy prezentują długości (np. rzek, wieku itp.). Przy wykresach kołowych występują problemy ze wzrokową oceną miary kąta. Kąty ostre postrzegane są jako mniejsze, a rozwarte jako większe niż w rzeczywistości. Kąty położone poziomo wydają się większe niż umieszczone pionowo. Z tych powodów odradza się używanie tych wykresów. Wykresy liniowe są używane najczęściej do pokazywania zmian mierzonej wielkości w czasie. Nie należy tworzyć wykresów liniowych, gdy kategorie na osi poziomej nie są naturalnie uporządkowane. Należy stosować właściwą proporcję na wykresie - niektórzy autorzy podają, że stosunek wysokości wykresu do jego długości powinien wynosić 3 : 5. Należy dbać o właściwy i kompletny opis: tytuł, dane, właściwie dobrane jednostki na obu osiach, legendę zgodną z kolejnością danych na wykresie. 63

64 Należy unikać: porównywania na jednym diagramie danych podanych w różnej skali, zestawiania danych bez zachowania jednolitej skali na osi pionowej, przesytu elementów dekoracyjnych, niepotrzebnego wprowadzania efektów 3D Szablony wizualizacji danych Dostęp do szblonów wizualizacji danych uzyskujemy, wybierając Wykresy > Szablony wizualizacji danych... Szablony podpowiadają nam, na jakiego rodzaju wykresie możemy zaprezentować wartości badanej zmiennej lub zależność pomiędzy zmiennymi. Wystarczy na liście zmiennych wybrać jedną lub kilka (trzymając klawisz Ctrl) zmiennych, a w oknie pojawią się proponowane typy wykresów. Uwagi: Przy wykresach dotyczących zmiennych ilościowych często na wykresie zaznaczone są nie wartości tej zmiennej, ale np. średnia lub inna ich statystyka. Statystykę tę można wybierać z listy Podsumowanie. Kolejność wybierania zmiennych ma wpływ na wygląd wykresu (np. na kolejność zmiennych na osiach). W zakładce Opcje jest możliwość wyboru arkusza stylów spośród: niebieski księżycowy, karnawałowy, domyślny, słońce pustyni, szary, wysoki kontrast, standardowy dla map, przyćmiony pastelowy, przyćmiony delikatny, tradycyjny, tradycyjny dla map. Od wersji 20. istniej możliwość wykonywania wykresów na mapach. Są trzy zasadnicze rodzaje takich wykresów: mapy z podziałem administracyjnym, na których wartości zmiennej są ilustrowane zmiennym natężeniem koloru, mapy z punktami, na których wartości zmiennej są ilustrowane zmienną wielkością punktów oraz mapy z podziałem administracyjnym, na których nałożone są podstawowe diagramy statystyczne (wykresy kołowe, słupkowe, liniowe itp.). Do wykonania tych wykresów niezbędne jest posiadanie odpowiednich plików map. Na płycie Bonus Pack firma SPSS Polska przygotowała mapy Polski z podziałem na województwa oraz powiaty a także mapy ze stolicami województw i powiatów. Ważne jest, aby w analizowanym pliku danych istniała zmienna zawierająca nazwy wspomnianych jednostek administracyjnych. Należy ją dopasować do klucza mapy. 64

65 Ćwiczenie 2.7. Otwórz plik Empolee data.sav (plik przykładowy programu). Na dowolnie wybranym wykresie zaprezentuj zależność bieżącego wynagrodzenia od zajmowanego stanowiska oraz stażu pracy, wybierając jako podsumowanie raz średnią, a raz maksimum. Użyj stylu karnawałowy. Rozwiązanie. Wybieramy z menu Wykresy > Szablony wizualizacji danych... Trzymając Ctrl wybieramy wszystkie z podanych w zadaniu zmiennych. Spośród zaproponowanych przez program wykresów wybieramy Warstwowy 3-W. Klikamy zakładkę szczegółowe i sprawdzamy, czy program dobrze przypisał zmienne do osi, w szczególności, czy zmienna zależna bieżące wynagrodzenie znajduje się na osi Y. Jeśli nie, zamieniamy kolejność zmiennych na osiach. W zakładce Opcje spośród dostępnych arkuszy stylu wybieramy karnawałowy. Wykresy w szablonach wizualizacji danych można również tworzyć, wybierając najpierw rodzaj wykresu, a później zmienne, które mają być na nim przedstawione. Robi się to, wybierając zakładkę Szczegółowe. Wówczas z listy Typ wizualizacji wybieramy typ wykresu, a później wprowadzamy zmienne. Dobrze jest kliknąć najpierw Pomoc i w jej oknie u dołu kliknąć Dostępne wbudowane typy wizualizacji, aby zobaczyć jakie wykresy są przez program oferowane i co one tak naprawdę przedstawiają. 65

66 W szablonach wizualizacji danych mamy możliwość tworzenia kołowych wykresów trójwymiarowych, tzw. wykresów tortowych. Należy jednak uważać na fakt, że prezentują one zawsze sumę wartości zmiennej ilościowej w podziale na kategorie zmiennej jakościowej. Gdybyśmy chcieli stworzyć wykresy prezentujący tylko procentowy udział kategorii zmiennej jakościowej w całości, musielibyśmy stworzyć sztucznie zmienną ilościową, której wartościami byłyby same 1. Ćwiczenie 2.8. Korzystając z danych zawartych w pliku Employee data.sav, wykonaj: a) wykres bąbelkowy, zaznaczając na osi X początkowe wynagrodzenie, na osi Y bieżące wynagrodzenie, a jako rozmiary wykształcenie w latach nauki; dodatkowo oznacz kolorem płeć pracownika; b) mapę natężeń, umieszczając na w wierszach płeć pracownika, w kolumnach grupę pracowniczą, a jako kolor bieżące wynagrodzenie. Rozwiązanie. a) Wybieramy Wykresy > Szablony wizualizacji danych... Przechodzimy do zakładki Szczegółowe i jako typ wizualizacji wybieramy bąbelkowy. Umieszczamy zmienne zgodnie z opisem w zadaniu. b) Postępujemy podobnie jak wcześniej, ale jak typ wizualizacji wybieramy mapę natężeń. 66

67 Ćwiczenie 2.9. Korzystając z danych zawartych w pliku wojwodztwa.sav (dostępny na platformie Moodle), wykonaj a) kartogram, na którym zaprezentujesz gęstość zaludnienia poszczególnych województw, b) mapę z nakładanymi punktami o wielkościach odpowiadających liczbie mieszkańców stolic poszczególnych województw. Rozwiązanie. a) Wybieramy Wykresy > Szablony wizualizacji danych... Przechodzimy do zakładki Szczegółowe i z listy typów wizualizacji wybieramy np. Kartogram sum (w przypadku naszych danych przy każdym województwie mamy tylko jedną wartość, więc nie ma znaczenia, czy weźmiemy sumę, średnią czy medianę). Jako klucz danych wybieramy zmienną województwo, a jako kolor ustawiamy liczbę ludności na km 2. W polu Opcjonalne wymiary jako Opis danych znów możemy wybrać zmienną województwo, spowoduje to podpisanie na mapie województw ich nazwami. W polu Pliki map należy teraz wybrać odpowiednią mapę decydujemy się na ps województwa regiony i jako klucz wybieramy WO- JEWODZTW (jest to klucz zawierający nazwy województw zaczynające się wielką literą). Temu kluczowi mapy odpowiada w naszym pliku danych zmienna województwo (ustawiamy ją jako klucz danych). Klikamy przycisk Porównaj i sprawdzamy zgodność wartości zmiennej województwo 67

68 z oznaczeniami klucza mapy. Następnie klikamy OK. W zakładce Opcje możemy jeszcze zmienić arkusz stylu na np. Niebieski księżycowy. b) Wybieramy Wykresy > Szablony wizualizacji danych... Przechodzimy do zakładki Szczegółowe i z listy typów wizualizacji wybieramy mapę z nakładanymi punktami. Jako klucz danych wybieramy stolicę województwa a jako kolor województwo. W polu Opcjonalne wymiary ustawiamy stolicę województwa jako opis danych a liczbę ludności w tys. jako wielkość. Następnie wybieramy plik mapy: ps województwa stolice i jako klucz ustawiamy NAZWA. Kluczem danych jest stolica województwa. Klikamy Porównaj. Jako niedopasowane klucze mapy dostaliśmy Toruń i Zieloną Górę miasta, których po prostu nie ma w naszym zbiorze danych. Musimy jeszcze wybrać mapę referencyjną w przeciwnym wypadku nasze stolice województw byłyby zawieszone w próżni. Wybieramy mapę 68

69 ps województwa regiony. Klikamy OK. W zakładce Opcje możemy jeszcze zmienić arkusz stylu na np. Tradycyjny dla map. Możemy jeszcze dokonać zmiany symbolu (np. na kółko) i jego wielkości. Klikamy na wykres raz, żeby go zaznaczy, a następnie dwa razy, żeby go aktywować. Klikamy myszką w dowolny trójkąt symbolizujący stolicę województwa i dokonujemy zmian. (W podanym przykładzie wielkość symboli ustawiono na 10%). 69

70 Otrzymamy wówczas 70

71 W szablonach możemy również wykonywać animację wykresów. Wówczas wykres zmienia się w zależności od wartości zmiennej, którą zadeklarujemy jako zmienną animującą. Żeby zobaczyć animację, należy uaktywnić wykres uzyskany w raporcie, co spowoduje otwarcie kreatora wykresów panelowych. Klikamy w nim ikonkę Tryb eksploracji (druga od lewej), ustawiamy suwakami pod wykresem szerokość przedziału dla zmiennej animującej (w wersjach wcześniejszych niż 19. szerokość była dobierana automatycznie) i uruchamiamy animację. Animację można zatrzymać i klikając na początek lub koniec skali na osi zmiennej animującej, obejrzeć kolejno wszystkie stany wykresu. Ćwiczenie Otwórz plik Employee data.sav (plik przykładowy programu). rekoduj zmienną gender na zmienną płeć o wartościach 1 mężczyzna, 2 kobieta. Następnie, używając nowej zmiennej, wykonaj animowany wykres kołowy prezentujący udział procentowy kobiet i mężczyzn w zależności od wysokości bieżącego wynagrodzenia. Rozwiązanie. Rekodujemy zmienną gender na zmienną płeć, wybierając z menu Przekształcenia > Rekoduj na inne zmienne... Następnie w oknie danych w zakładce Zmienne przypisujemy zmiennej płeć odpowiednie etykiety wartości. Wybieramy z menu Wykresy > Szablony wizualizacji danych... W zakładce Szczegółowe wybieramy wykres kołowy liczebności. Jako kategorie wybieramy nową zmienną płeć, a na dole jako animację bieżące wynagrodzenie. Otrzymany wykres zaznaczamy kliknięciem, a następnie aktywujemy klikając dwukrotnie. Klikamy w ikonkę Tryb eksploracji, aby uruchomić animację. 71

72 72

73 Rozdział 3. Przedziały ufności 1. Przedziały ufności dla wartości oczekiwanej a rozkładu normalnego N (a, σ 2 ), parametr σ 2 nieznany. Przedziałem ufności dla a na poziomie ufności 1 α jest [ ] [a, ā] = x t (n 1) s, x + t (n 1) s, n n 1 α/2 1 α/2 gdzie t (n 1) 1 α/2 = F 1 t n 1 (1 α 2 ), a F t n 1 jest dystrybuantą rozkładu t-studenta z n 1 stopniami swobody. 2. Asymptotyczne przedziały ufności dla wartości oczekiwanej a dowolnego rozkładu o niezerowej wariancji. Przedziałem ufności dla a na poziomie ufności 1 α jest [ ] s s [a, ā] = x z 1 α/2, x + z 1 α/2, n n gdzie z 1 α/2 = Φ 1 (1 α ), a Φ jest dystrybuantą rozkładu normalnego 2 N (0, 1). Uwagi: Ponieważ przy n, niezależnie od wyjściowego rozkładu badanej zmiennej, statystyka wykorzystywana do konstrukcji przedziału ufności ma standardowy rozkład normalny i jest to rozkład graniczny rozkładu t-studenta, to przedział ufności może być wyznaczany dla zmiennych o dowolnym rozkładzie (dla którego istnieje wariancja), jeśli tylko próba jest dość liczna (n 30 i rozkład jest w przybliżeniu jednomodalny i symetryczny lub n 40, gdy rozkład jest wyraźnie skośny). W próbie nie powinny występować wartości odstające. 73

74 W przypadku rozkładu dwupunktowego, tj. zmiennej losowej X, która przyjmuje wartości 1 i 0 z prawdopodobieństwami odpowiednio p i 1 p, wartość średnia wynosi EX = 1 p + 0 (1 p) = p, jest więc równa prawdopodobieństwu wystąpienia 1. Oznacza to, że przedział ufności dla odsetka elementów populacji posiadających pewną własność można konstruować, używając wzorów na przedział ufności dla wartości oczekiwanej. Zalecenie dotyczące liczebności próby: nˆp 5 i n(1 ˆp) 5 (gdzie ˆp oznacza prawdopodobieństwo obserwowane), czyli liczba elementów, które mają pewną własność i liczba tych, które jej nie mają, wynoszą co najmniej 5. [3] Ćwiczenie 3.1. Z partii bawełny pobrano próbkę złożoną z 31 włókien, a następnie zmierzono długości tych włókien (w mm). Otrzymano następujące wyniki (dostępne w pliku włókna.sav): Wyznacz przedział ufności dla średniej na poziomie ufności 0,99. Rozwiązanie. Wyznaczamy najpierw podstawowe statystyki, rysujemy histogram oraz wykres skrzynkowy, co pozwala stwierdzić, że rozkład jest symetryczny, jednomodalny i nie posiada wartości odstających, a liczebność próby przekracza 30. Wybieramy z menu Analiza > Opis statystyczny > Eksploracja... W polu Zmienne zależne umieszczamy zmienną dlugosc wlokna. Pod przyciskiem Statystyki można wpisać poziom ufności (0, 99 zamiast domyślnego 0, 95). Otrzymujemy tabelę ze statystykami, wśród których jest dolna i górna granica przedziału ufności. 74

75 Ćwiczenie 3.2. [5, na podstawie zad. 8. str. 274] Przeprowadzono obserwacje dotyczące opóźnień w ruchu pociągów. Stwierdzono, że spośród 1000 losowo wybranych pociągów 160 przyjechało z opóźnieniem (dane w pliku pociągi.sav). Zakładając, że opóźnienia poszczególnych pociągów są niezależne od siebie i jednakowo prawdopodobne dla każdego pociągu, znajdź przedział ufności dla prawdopodobieństwa występowania opóźnienia na poziomie ufności 0,9. Rozwiązanie. Sprawdzamy, czy zmienna opoznienie ma wartości 0 i 1 (jeśli nie, trzeba ją rekodować na inną zmienną o takich wartościach). Liczebność próby jest duża, dodatkowo liczebność pociągów opóźnionych i pociągów, które przyjechały o czasie, przekracza 5. Wybieramy z menu Analiza > Opis statystyczny > Eksploracja... W polu Zmienne zależne umieszczamy zmienną opoznienie. Pod przyciskiem Statystyki sprawdzamy, czy poziom ufności wynosi 0, 9. Otrzymujemy tabelę ze statystykami, wśród których jest dolna i górna granica przedziału ufności. 75

76 76

77 Rozdział 4. Testowanie hipotez Testowanie hipotez jest jednym z podstawowych zagadnień statystyki matematycznej, która generalnie zajmuje się wyciąganiem wniosków dotyczących całej populacji na podstawie próby. Należy rozróżnić pojęcia hipotezy badawczej, która jest pewnym przypuszczeniem sformułowanym przez badacza, od hipotezy statystycznej. Hipoteza statystyczna jest formalnym sformułowaniem hipotezy badawczej odnoszącym się do konkretnych parametrów populacji. Wyróżnia się dwa rodzaje hipotez statystycznych: hipotezę zerową oraz hipotezę alternatywną. Hipoteza zerowa jest stwierdzeniem, które mówi o braku efektu lub braku różnic. Hipoteza alternatywna mówi o istnieniu efektu czy różnicy. Ponieważ hipotezy badawcze najczęściej mają na celu stwierdzenie efektu czy różnicy, są one najczęściej przyjmowane jako hipotezy alternatywne. Hipoteza alternatywna może być dwustronna (np. a 0) lub jednostronna (np. a < 0 czy a > 0). Badacze nie są zgodni co do warunków, pod którymi powinno się decydować na jedno- lub dwustronną hipotezę alternatywną. Niektórzy badacze uważają, że zawsze powinno się wybierać dwustronną hipotezę alternatywną, niezależnie od oczekiwań co do wyniku eksperymentu. Inni wierzą, że dwustronna hipoteza alternatywna powinna być wybierana tylko w przypadku braku oczekiwań co do wyniku eksperymentu. Zaletą wyboru jednostronnej hipotezy alternatywnej jest, że w celu odrzucenia hipotezy zerowej nie wymaga ona wystąpienia aż tak dużego efektu czy różnicy jak w przypadku dwustronnej hipotezy alternatywnej. [7, str. 26] Można się również spotkać ze stwierdzeniami, że na jednostronną hipotezę alternatywną należy się decydować tylko w przypadku, gdy w sumie z hipotezą zerową wyczerpuje ona wszystkie możliwe przypadki, tj. hipoteza przeciwna w rzeczywistości nie może być prawdziwa. Testy statystyczne dzielą się na parametryczne i nieparamteryczne. Istnie- 77

78 je duża zgodność wśród badaczy, że jeśli tylko są spełnione założenia testów, to przy zmiennych typu ilościowego należy posługiwać się testami parametrycznymi i są one z reguły mocniejsze niż ich nieparametryczne odpowiedniki. [7, str. 33] 4.1. Test t-studenta dla jednej średniej Hipoteza zerowa: Średnia wartość zmiennej w populacji jest równa określonej wartości a 0 (a = a 0 ). Hipoteza alternatywna 1.: Średnia wartość zmiennej w populacji jest różna od określonej wartości a 0 (a a 0 ). Hipoteza alternatywna 2.: Średnia wartość zmiennej w populacji jest mniejsza od określonej wartości a 0 (a < a 0 ). Hipoteza alternatywna 3.: Średnia wartość zmiennej w populacji jest większa od określonej wartości a 0 (a > a 0 ). Założenia: Zmienna ma rozkład normalny o nieznanej wariancji σ 2. Statystyka testowa: T n = n x a 0 s ma rozkład t-studenta z n 1 stopniami swobody (dla dużych n (n 30) rozkład ten jest zbliżony do standardowego rozkładu normalnego). Obszar krytyczny 1.: K = (, t n 1 1 α/2 ) (tn 1 1 α/2, + ) Obszar krytyczny 2.: K = (, t1 α) n 1 Obszar krytyczny 3.: K = (t n 1 1 α, + ) gdzie t n 1 1 α jest kwantylem rzędu 1 α rozkładu t-studenta z n 1 stopniami swobody. p-wartość 1.: α = 2 (1 F n 1 ( T n )) p-wartość 2. i 3.: α = 1 F n 1 ( T n ) gdzie F n 1 jest dystrybuantą rozkładu t-studenta z n 1 stopniami swobody. Uwagi: Ponieważ przy n, niezależnie od wyjściowego rozkładu badanej zmiennej, statystyka T n ma standardowy rozkład normalny i jest to rozkład graniczny rozkładu t-studenta, to test t-studenta może być stosowany dla zmiennych o dowolnym rozkładzie (dla którego istnieje wariancja), jeśli tylko próba jest dość liczna (n 30 i rozkład jest w przybliżeniu jednomodalny i symetryczny lub n 40, gdy rozkład jest wyraźnie skośny [3], choć czasami podawany jest warunek n 25 [7]). W próbie nie powinny występować wartości odstające. 78

79 W przypadku rozkładu dwupunktowego, tj. zmiennej losowej X, która przyjmuje wartości 1 i 0 z prawdopodobieństwami odpowiednio p i 1 p, wartość średnia wynosi EX = 1 p + 0 (1 p) = p, jest więc równa prawdopodobieństwu wystąpienia 1. Oznacza to, że testem t-studenta można testować hipotezę dotyczącą odsetka elementów populacji posiadających pewną własność. Zaleca się stosować ten test, jeśli nˆp 5 i n(1 ˆp) 5 (gdzie ˆp oznacza prawdopodobieństwo obserwowane), czyli liczba elementów, które mają pewną własność i liczba tych, które jej nie mają, wynoszą co najmniej 5. [3] Dostęp w IBM SPSS Statistics: Analiza > Porównywanie średnich > Test t dla jednej próby... W opcjach można ustawić poziom ufności dla przedziału ufności dla różnicy średniej w populacji i wartości testowanej oraz sposób postępowania z brakami danych w przypadku jednoczesnego testowania kilku zmiennych. W tabeli wyników testu otrzymamy wartość statystyki testu oznaczoną tu jako t, liczbę stopni swobody df, istotność dwustronną (czyli p-wartość testu dla dwustronnej hipotezy alternatywnej), różnicę średnich (czyli estymator różnicy średniej w populacji i wartości testowanej) oraz przedział ufności dla tej różnicy. W przypadku jednostronnej hipotezy alternatywnej p-wartość testu jest równa połowie istotności dwustronnej. Należy również zwrócić uwagę na znak statystyki t. Ćwiczenie 4.1. Liczbę sprzedanych biletów MZK w Toruniu w kolejnych niedzielach maja i czerwca przedstawia tabelka. Numer niedzieli Liczba biletów w tys. 2,9 3,3 3,2 3,2 3,2 3,0 2,9 3,1 Na podstawie tych danych (dostępnych również w pliku bilety.sav), na poziomie istotności α = 0, 1, przetestuj hipotezę, że średnia liczba sprzedawanych biletów w niedziele jest równa 3, 2 tys. przeciw hipotezie, że średnia sprzedawanych biletów jest a) różna od 3, 2 tys., b) mniejsza niż 3, 2 tys., jeżeli wiadomo, że liczba sprzedawanych biletów ma rozkład normalny. 79

80 Rozwiązanie. Wybieramy z menu Analiza > Porównywanie średnich > Test t dla jednej próby... W polu Zmienne testowane umieszczamy liczbę sprzedanych biletów, a w pole Wartość testowana wpisujemy 3, 2. a) Hipoteza zerowa: Średnia liczba biletów sprzedawanych w niedziele jest równa 3, 2 tys. (a = 3, 2). Hipoteza alternatywna: Średnia liczba biletów sprzedawanych w niedziele jest różna od 3, 2 tys. Istotność (czyli p-wartość) testu wyliczoną przez program porównujemy z zakładanym poziomem istotności równym 0, 1. Ponieważ 0, 104 > 0, 1, to nie mamy podstaw do odrzucenia hipotezy zerowej na rzecz hipotezy alternatywnej, że liczba sprzedawanych biletów jest różna od 3, 2 tys. b) Hipoteza zerowa: Średnia liczba biletów sprzedawanych w niedziele jest równa 3, 2 tys. (a = 3, 2). Hipoteza alternatywna: Średnia liczba biletów sprzedawanych w niedziele jest mniejsza od 3, 2 tys. W przypadku jednostronnej hipotezy alternatywnej p-wartość testu jest połową p-wartości testu z hipotezą dwustronną. Porównujemy zatem połowę istotności wyliczonej przez program z zakładanym poziomem istotności równym 0, 1. Ponieważ 0, 052 < 0, 1, to odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej jednostronnej. Ujemna wartość statystki t pozwala przyjąć hipotezę, że liczba biletów sprzedawanych w niedziele jest mniejsza od 3, 2 tys. W obu przypadkach obowiązuje założenie, że rozkład liczby biletów jest normalny, co pozwala uznać wyniki testów za wiarygodne. 80

81 Ćwiczenie 4.2. W czasie sondażu przeprowadzonego przez pracownię badania opinii społecznej spośród 1100 ankietowanych dorosłych Polaków 1090 odpowiedziało, że w ubiegłym miesiącu nie przeczytali żadnej książki, a pozostali potwierdzili, że przeczytali przynajmniej jedna książkę. Na podstawie tych danych (dostępnych również w pliku czytanie.sav), na poziomie istotności 0, 01, przetestuj hipotezę, że odsetek dorosłych Polaków, którzy nie przeczytali w ubiegłym miesiącu żadnej książki wynosi 99%, przeciw hipotezie, że odsetek ten jest inny. Rozwiązanie. W celu zastosowania testu t-studenta musimy się upewnić, czy mamy zmienną o wartościach 0 i 1, przy czym 1 powinny być oznaczone osoby, których odsetek nas interesuje, tj. nieczytający (jeśli zmienna ma inne wartości, musimy ją rekodować na zmienną o podanych własnościach), oraz czy próba ma odpowiednio dużą liczebność (bo rozkład na pewno nie jest rozkładem normalnym). Liczebność próby wynosi 1100, przy czym i osób, które przeczytały w ubiegłym miesiącu przynajmniej jedną książkę, i takich, które tego nie zrobiły, jest po co najmniej 5. Hipoteza zerowa: Zmienna czytanie ma średnią wartość równą 0, 99 (odsetek nieczytających wynosi 0, 99). Hipoteza alternatywna: Zmienna czytanie ma średnią wartość różną od 0, 99 (odsetek nieczytających jest różny od 0, 99). Wybieramy z menu Analiza > Porównywanie średnich > Test t dla jednej próby... Testujemy zmienną czytanie, a jako wartość testowaną wpisujemy 0,

82 Istotność testu wynosi 0, 751 i jest większa od zakładanego poziomu wynoszącego 0, 01, zatem nie mamy podstaw do odrzucenia hipotezy zerowej Test t-studenta dla dwóch średnich i prób niezależnych Hipoteza zerowa: Średnie wartości zmiennej są takie same w dwóch różnych populacjach (a 1 = a 2 ). Hipoteza alternatywna 1.: Średnie wartości zmiennej są różne w badanych populacjach (a 1 a 2 ). Hipoteza alternatywna 2.: Średnia wartość zmiennej w pierwszej populacji jest mniejsza od średniej wartości zmiennej w drugiej populacji (a 1 < a 2 ). Hipoteza alternatywna 3.: Średnia wartość zmiennej w pierwszej populacji jest większa od średniej wartości zmiennej w drugiej populacji (a 1 > a 2 ). Założenia: Zmienna ma w obu populacjach rozkład normalny o nieznanych wariancjach. a) Zmienna ma w obu populacjach rozkład normalny o nieznanych, ale równych wariancjach. Statystyka testowa: T n = x 1 x 2 (n1 1)s (n 2 1)s 2 2 n 1 + n 2 2 n1 + n 2 n 1 n 2 ma rozkład t-studenta z n 1 + n 2 2 stopniami swobody. Obszar krytyczny 1.: K = (, t n 1+n α/2 Obszar krytyczny 2.: K = (, t n 1+n α ) ) (t n 1+n 2 2, + ) 1 α/2 Obszar krytyczny 3.: K = (t n 1+n α, + ) gdzie t n 1+n α oznacza kwantyl rzędu 1 α z rozkładu t-studenta z n 1 + n 2 2 stopniami swobody. p-wartość 1.: α = 2 (1 F n 1+n 2 2 ( T n )) p-wartość 2. i 3.: α = 1 F n 1+n 2 2 ( T n ) gdzie F n 1+n 2 2 jest dystrybuantą rozkładu t-studenta z n 1 + n 2 2 stopniami swobody. b) Zmienna ma w obu populacjach rozkład normalny o nieznanych i różnych wariancjach. 82

83 Statystyka testowa: (statystyka Cochrana i Coxa). C n = x 1 x 2 s 2 1 n 1 + s2 2 n 2 Obszar krytyczny 1.: K = (, c n 1,n 2 1 α/2 ) (cn 1,n 2 1 α/2, + ) Obszar krytyczny 2.: K = (, c n 1,n 2 1 α ) Obszar krytyczny 3.: K = (c n 1,n 2 1 α, + ) gdzie Uwagi: c n 1,n 2 1 α ( ) ( ) s 2 1 t n α + s2 2 t n 2 1 s 2 1 α : 1 + s2 2. n 1 n 2 n 1 n 2 Test t-studenta dla dwóch średnich i prób niezależnych może być również używany w przypadku zmiennej, która nie posiada w badanych populacjach rozkładu normalnego. Wymagana jest wówczas duża liczebność obu prób (co najmniej po 30 obserwacji), symetria i brak obserwacji odstających. W idealnych warunkach obiekty powinny być losowo przypisane do dwóch grup, tak aby każda różnica ich reakcji była wynikiem oddziaływania (lub braku oddziaływania) tylko jednego czynnika. Nie jest tak w przypadku porównywania średniego dochodu mężczyzn i kobiet. Płeć badanych nie jest przypisywana losowo. W takich przypadkach należy zadbać o to, żeby różnice innych czynników nie pomniejszały, ani nie powiększały, znaczącej różnicy średnich. Na różnice średniego dochodu mogą mieć także wpływ takie czynniki jak wykształcenie (a nie tylko płeć). [Pomoc IBM SPSS Statistics] Dostęp w IBM SPSS Statistics: Analiza > Porównywanie średnich > Test t dla prób niezależnych... Wartości badanej zmiennej powinny w pliku znajdować się w jednej kolumnie, natomiast w drugiej kolumnie powinny występować wartości zmiennej, która określa przynależność obserwacji do jednej z dwóch badanych populacji. Wtedy w oknie dialogowym testu w polu Zmienne testowane umieszczamy badaną zmienną (lub kilka zmiennych), a w polu Zmienna grupująca zmienną, która definiuje przynależność do jednej z dwóch badanych populacji. Definiujemy grupy, uważając na kolejność wpływa ona na znak statystyki testu. Grupy można również zdefiniować, wybierając jakąś zmienną oraz podając jako ich definicję pewien punkt podziału. Wtedy do jednej grupy należeć będą obserwacje, 83

84 dla których wybrana zmienna ma wartość nieprzekraczającą podanego punkt podziału, a do drugiej obserwacje, dla których wybrana zmienna ma wartość przekraczającą ten punkt podziału. W opcjach można ustawić poziom ufności dla przedziału ufności dla różnicy średnich oraz sposób postępowania z brakami danych w przypadku jednoczesnego testowania kilku zmiennych. Jako wynik testu otrzymujemy tabelę o dwóch wierszach: w pierwszym znajdują się statystyki, które obliczono, zakładając równość wariancji, w drugim bez tego założenia. W tabeli znajduje się również wynik testu Levene a jednorodności wariancji, który sprawdza hipotezę o równości wariancji badanej zmiennej w obu populacjach. Wynik tego testu można potraktować jako wskazówkę, którą wartość statystyki i istotność testu średnich powinniśmy brać pod uwagę. Wyniki testu średnich to: wartość statystyki testowej oznaczona tutaj jako t, liczba stopni swobody df, istotność dwustronna, czyli p-wartość testu przy dwustronnej hipotezie alternatywnej, różnica średnich, błąd standardowy tej różnicy oraz przedział ufności. W przypadku jednostronnej hipotezy alternatywnej p-wartość testu jest równa połowie istotności dwustronnej. Należy również zwrócić uwagę na znak statystyki t. Ćwiczenie 4.3. [4, na podstawie zad str. 94] Producent płatków mydlanych wysunął hipotezę, że stopień wyprania tkaniny wełnianej płatkami mydlanymi jest wyższy od stopnia wyprania płynem do prania. W celu sprawdzenia tej hipotezy wykonano pomiary stopnia wyprania 10 wycinków tkaniny pranej płatkami, otrzymując w procentach wyniki 74, 4, 75, 1, 73, 0, 72, 8, 76, 2, 74, 6, 76, 0, 73, 4, 72, 9, 71, 6, oraz 7 wycinków pranych płynem do prania, otrzymując 56, 8, 57, 8, 54, 6, 59, 0, 57, 1, 58, 2, 57, 6. Zakładając, że stopień wyprania tkaniny ma rozkład normalny na poziomie istotności α = 0, 05 zweryfikuj hipotezę wysuniętą przez producenta. (Dane dostępne w pliku pranie.sav). Rozwiązanie. Hipoteza zerowa: Średni stopień wyprania tkaniny w płatkach jest taki sam jak średni stopień wyprania tkaniny w płynie do prania. Hipoteza alternatywna: Średni stopień wyprania tkaniny w płatkach jest wyższy od średniego stopnia wyprania tkaniny w płynie do prania. Założenie o normalności rozkładów pozwala uznać wyniki wykonanych niżej testów za wiarygodne. 84

85 Wybieramy z menu Analiza > Porównywanie średnich > Test t dla prób niezależnych... Zmienną testowaną jest stopień wyprania tkaniny, a zmienną grupującą rodzaj środka do prania. Definiujemy grupy, wpisując jako grupę 1. wartość 1 (płatki), a jako grupę 2. wartość 2 (płyn do prania). Test Levene a jednorodności wariancji sprawdza hipotezę o równości wariancji stopnia wyprania tkaniny w grupach wyróżnionych ze względu na rodzaj środka do prania. Jego wynik sugeruje, że należy raczej zakładać równość wariancji i wynik testu średnich odczytywać z 2., a nie 3. kolumny drugiej tabeli. Ze względu na jednostronną hipotezę alternatywną połowę istotności wyliczonej przez program w teście średnich, tj. wartość 0, 000, porównujemy z zakładanym poziomem istotności 0, 05. Ponieważ 0, 000 < 0, 05, więc odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej jednostronnej. Dodatnia wartość statystyki t pozwala przyjąć hipotezę, że średnia w pierwszej grupie (czyli przy stosowaniu płatków) jest wyższa niż w drugiej (czyli przy stosowaniu płynu do prania). 85

86 4.3. Test t-studenta dla dwóch średnich i prób zależnych Hipoteza zerowa: Dwie zmienne zależne mają jednakowe średnie (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią równą 0). Hipoteza alternatywna 1.: Zmienne zależne mają różne średnie (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią różną od 0). Hipoteza alternatywna 2.: Pierwsza ze zmiennych ma średnią mniejszą niż druga (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią ujemną). Hipoteza alternatywna 3.: Pierwsza ze zmiennych ma średnią większą niż druga (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią dodatnią). Statystyka testowa: T n = d s d n ma rozkład t-studenta z n 1 stopniami swobody. Obszar krytyczny 1.: K = (, t n 1 1 α/2 ) (tn 1 1 α/2, + ) Obszar krytyczny 2.: K = (, t1 α) n 1 Obszar krytyczny 3.: K = (t n 1 1 α, + ) gdzie t n 1 1 α jest kwantylem rzędu 1 α rozkładu t-studenta z n 1 stopniami swobody. p-wartość 1.: α = 2 (1 F n 1 ( T n )) p-wartość 2. i 3.: α = 1 F n 1 ( T n ) gdzie F n 1 jest dystrybuantą rozkładu t-studenta z n 1 stopniami swobody. Uwagi: Ponieważ test ten jest w praktyce testem t-studenta dla jednej średniej (dla zmiennej D = X Y ), to należy sprawdzić, czy różnica zmiennych spełnia wymagania testu dla jednej średniej, tj. ma rozkład normalny lub ma rozkład odbiegający od normalnego (ale bez wartości odstających), ale liczebność próby jest odpowiednio duża. Dostęp w IBM SPSS Statistics: Analiza > Porównywanie średnich > Test t dla prób zależnych... W oknie dialogowym definiujemy jedną lub kilka par zmiennych, których średnie chcemy porównać. Kolejność zmiennych ma znaczenie wpływa na znak statystyki testowej. W opcjach można ustawić poziom ufności dla przedziału ufności dla różnicy średnich oraz sposób postepowania z brakami danych w przypadku jednoczesnego testowania kilku zmiennych. 86

87 W tabeli wyników testu średnich otrzymujemy m.in. wartość statystyki testowej oznaczoną jako t oraz istotność dwustronną, czyli p-wartość testu otrzymaną przy dwustronnej hipotezie alternatywnej (w przypadku hipotezy alternatywnej jednostronnej p-wartość testu jest połową istotności dwustronnej). Oprócz tego otrzymujemy tabelę ze współczynnikiem korelacji badanych zmiennych oraz istotnością tego współczynnika. Ćwiczenie 4.4. [4, na podstawie 3.14 str. 97] Zmierzono ciśnienie tętnicze wśród losowo wybranej grupy chorych na pewną chorobę przed i po podaniu takiego samego leku każdemu z badanych pacjentów. Otrzymano następujące wyniki (dostepne w pliku cisnienie.sav): Nr pacjenta Ciśnienie przed Ciśnienie po Na poziomie istotności α = 0, 05 zweryfikuj hipotezę, że stosowany lek nie powoduje zmiany ciśnienia u pacjentów, wobec hipotezy alternatywnej, że wartość przeciętna ciśnienia przed podaniem leku jest wyższa niż po jego podaniu, wiedząc, że ciśnienie tętnicze ma rozkład normalny. Rozwiązanie. Hipoteza zerowa: Średnia wartość ciśnienia przed podaniem leku pacjentom jest taka sama jak po jego podaniu. Hipoteza alternatywna: Średnia wartość ciśnienia pacjentów przed podaniem leku jest wyższa niż po jego podaniu. Wybieramy z menu Analiza > Porównywanie średnich > Test t dla prób zależnych... Definiujemy 1 parę zmiennych, podając jako zmienną 1. ciśnienie przed podaniem leku, a jako zmienną 2. ciśnienie po podaniu leku. 87

88 Wysoka wartość współczynnika korelacji potwierdza zależność zmiennych. Ze względu na jednostronny charakter hipotezy zerowej istotność testu wynosi 0, 033/2 i jest mniejsza od zakładanego poziomu istotności wynoszącego 0, 05, co oznacza, że odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej jednostronnej. Dodatnia wartość statystyki t pozwala przyjąć hipotezę, że średnia wartość ciśnienia przed podaniem leku jest wyższa niż po jego podaniu. Wynik testu można uznać za wiarygodny dzięki założeniu o normalności rozkładu Test chi-kwadrat zgodności Założenia: Zmienna ma rozkład dyskretny, przyjmuje tylko wartości l 1,..., l k z prawdopodobieństwami odpowiednio p 1,..., p k, które nie są znane. Hipoteza zerowa: Zmienna ma rozkład dyskretny z określonymi prawdopodobieństwami p 0 1,..., p 0 k. Hipoteza alternatywna: Zmienna ma rozkład z innymi prawdopodobieństwami niż zadane. Statystyka testowa: k χ 2 (n i n 0 i ) 2 = i=1 n 0 i k (n i np 0 i ) 2 =, i=1 np 0 i gdzie n i oznaczają liczebności obserwowane, n 0 i oczekiwane, ma w przybliżeniu rozkład chi-kwadrat z k 1 stopniami swobody. Obszar krytyczny: K = (u k 1 1 α, + ), 88

89 gdzie u k 1 1 α oznacza kwantyl rzędu 1 α rozkładu chi-kwadrat z k 1 stopniami swobody. p-wartość: α = 1 F k 1 χ (χ 2 ), 2 gdzie F k 1 χ 2 jest dystrybuantą rozkładu chi-kwadrat z k 1 stopniami swobody. Uwagi: Jeżeli rozkład teoretyczny zależy od d nieznanych parametrów, to parametry te wyznaczamy metodą największej wiarogodności, a liczbę stopni swobody zmniejszamy o d. Statystyka χ 2 ma tylko w przybliżeniu (asymptotycznie) rozkład chikwadrat. Przybliżenie rozkładem chi-kwadrat uznajemy za dopuszczalne, gdy np 0 i 5, i = 1,..., k, a za dobre, gdy np 0 i 10, i = 1,..., k. Jeśli liczba kategorii jest duża (> 6), to zgadzamy się stosować przybliżenie rozkładem chi-kwadrat także wtedy, gdy dla jednej lub dwóch kategorii 1 np 0 i < 5 [3]. Mało liczne kategorie można również łączyć z kategoriami sąsiednimi, redukując wówczas odpowiednio liczbę stopni swobody. W przypadku zmiennej o rozkładzie z ciągłą dystrybuantą dane grupujemy w k (10k n) klas. Prawdopodobieństwa teoretyczne wyliczamy z dystrybuanty. Klasy staramy się dobrać tak, aby prawdopodobieństwa znalezienia się w klasie były równe 1/k, a liczebności teoretyczne były co najmniej równe 5. Testujemy wówczas hipotezę zerową: Zmienna ma rozkład o podanej dystrybuancie. Łatwo zauważyć, że testowanie zgodności z zadanym rozkładem ciągłym za pomocą testu chi-kwadrat jest przedsięwzięciem kontrowersyjnym, ponieważ punktem wyjścia do konstrukcji testu jest świadoma utrata informacji związana z koniecznością dokonania dyskretyzacji. Dlatego, gdy mamy do czynienia z rozkładem ciągłym, powinniśmy unikać stosowania tego testu [...] Dopiero, gdy próba losowa jest bardzo liczna i histogram sporządzony na jej podstawie przypomina gładki rozkład ciągły, zastosowanie testu chi-kwadrat przestaje być ryzykowne. Inna sprawa, że test ten może być jedynym dającym się zastosować w danej konkretnej sytuacji. Tak jest np. wtedy, gdy dane, którymi dysponujemy, pochodzą wprawdzie z rozkładu ciągłego, ale są już zdyskretyzowane. [3, str. 372] Jeśli założenia testu nie są spełnione, można wykonać tzw. test dokładny, który nie korzysta z rozkładu granicznego statystyki testowej tylko z jej właściwego rozkładu. 89

90 Dostęp w IBM SPSS Statistics: Pierwszy sposób (stary) wykonania testu chi-kwadrat w IBM SPSS Statistics polega na wybraniu Analiza > Testy nieparametryczne > Testy tradycyjne > Chi-kwadrat... Okno dialogowe pozwala na ustalenie oczekiwanego zakresu (tj. daje możliwość testowania proporcji nie dla wszystkich kategorii zmiennej, ale tylko dla kategorii należących do pewnego przedziału) oraz podania wartości oczekiwanych. Jako wartości oczekiwane podajemy oczekiwaną proporcję liczebności poszczególnych kategorii względem siebie. Kolejność powinna odpowiadać kolejności kategorii ustawionych w sposób rosnący. Jako wynik otrzymamy tabelę zawierającą wartość statystyki testowej, liczbę stopni swobody oraz istotność asymptotyczną. Korzystając z tego sposobu, możemy wykonać testy dokładne, w przypadku, gdy założenia testu asymptotycznego nie są spełnione. Drugi sposób (nowy) polega na wybraniu Analiza > Testy nieparametryczne > Jedna próba... W oknie dialogowym w zakładce Zmienne wybieramy zmienne do analizy. W zakładce Ustawienia zaznaczamy Testy niestandardowe i wybieramy Porównywanie prawdopodobieństw emiprycznych z hipotetycznymi (test chi-kwadrat). W opcjach tego testu podajemy testowane prawdopodobieństwa (w postaci ułamków dziesiętnych sumujących się do 1). W opcjach testów (pole z lewej strony) podajemy poziom istotności. Jako wynik otrzymamy tabelę zawierającą hipotezę zerową, nazwę użytego testu, istotność asymptotyczną oraz decyzję co do wyboru hipotezy. Tabelę można aktywować, klikając na nią dwukrotnie, co pozwala uzyskać opis modelu. Opis modelu można skopiować Edycja > Kopiuj dodatkowy widok i wkleić do raportu. Ćwiczenie 4.5. W czasie sondażu przeprowadzonego przez pracownię badania opinii społecznej spośród 1100 ankietowanych dorosłych Polaków 1090 odpowiedziało, że w ubiegłym miesiącu nie przeczytali żadnej książki, a pozostali potwierdzili, że przeczytali przynajmniej jedna książkę. Na podstawie tych danych (dostępnych również w pliku czytanie.sav), na poziomie istotności 0, 01, przetestuj hipotezę, że odsetek dorosłych Polaków, którzy nie przeczytali w ubiegłym miesiącu żadnej książki wynosi 99%, przeciw hipotezie, że odsetek ten jest inny. Rozwiązanie. Test chi-kwadrat testuje hipotezę Hipoteza zerowa: Kategorie czytał i nie czytał występują w stosunku 1:99 (inaczej: kategorie czytał i nie czytał występują z prawdopodobieństwami odpowiednio 0, 01 i 0, 99). Hipoteza alternatywna: Kategorie czytał i nie czytał występują w innym stosunku (inaczej: z innymi prawdopodobieństwami). 90

91 Pierwszy sposób wykonania testu chi-kwadrat polega na wybraniu z menu Analiza > Testy nieparametryczne > Testy tradycyjne > Chi-kwadrat... Testujemy zmienną czytanie, w pole Wartości oczekiwane wpisujemy odpowiednią proporcję zgodnie z oznaczeniami wartości zmiennej w pliku, tj. najpierw dla wartości 0 (czytał), a potem 1 (nie czytał). Istotność testu wynosi 0, 762, co jest większe od zakładanego poziomu 0, 01 i nie daje podstaw do odrzucenia hipotezy zerowej. Wynik testu jest wiarygodny, gdyż liczebności oczekiwane klas są większe od 10. Drugi sposób polega na wybraniu Analiza > Testy nieparametryczne > Jedna próba... W zakładce Zmienne sprawdzamy, że testowaną zmienną jest zmienna czytanie. W zakładce Ustawienia spośród testów niestandardowych wybieramy chi-kwadrat i w jego opcjach podajemy wartości zmiennej i odpowiadające im prawdopodobieństwa. W Opcje testów możemy podać zakładany poziom istotności. 91

92 Otrzymaną tabelę można aktywować, by otrzymać podgląd modelu. Ćwiczenie 4.6. W pewnym mieście przeprowadzono badania na temat dochodów jego mieszkańców. Przypuszczano, że osób z niskimi dochodami jest dwa razy więcej niż ze średnimi i sześć razy więcej niż z wysokimi. Wylosowano pewną grupę mieszkańców i stwierdzono, że 120 osób ma niskie dochody, 80 średnie i 50 wysokie (dane dostępne w pliku dochod.sav). Zweryfikuj, czy na poziomie istotności 0, 01 to przypuszczenie jest zgodne z rzeczywistością. 92

93 Rozwiązanie. Ponieważ dane, którymi dysponujemy nie są danymi surowymi, tylko zostały zliczone, musimy dokonać ważenia. Dane > Ważenie obserwacji... Zaznaczamy opcję Zważ obserwacje, podając jako zmienną ważącą liczbę mieszkańców o określonym dochodzie. Testujemy hipotezy: Hipoteza zerowa: Stosunek liczby mieszkańców o niskich dochodach do liczby mieszkańców o średnich dochodach do liczby mieszkańców o dochodach wysokich wynosi 6:3:1. (Odsetek mieszkańców o dochodach niskich, średnich i wysokich jest równy odpowiednio 0, 60, 0, 30, 0, 10). Hipoteza alternatywna: Podana proporcja jest inna. (Podane odsetki są inne). Pierwszy sposób polega na wybraniu Analiza > Testy nieparametryczne > Testy tradycyjne > Chi-kwadrat... Testujemy zmienną dochód, a jako wartości oczekiwane podajemy kolejno 6, 3, 1. Istotność testu wynosi 0, 000, a więc odrzucamy hipotezę zerową, a przyjmujemy alternatywną. Liczebności oczekiwane klas są odpowiednio duże, co pozwala uznać wynik testu za wiarygodny. Sposób drugi: Analiza > Testy nieparametryczne > Jedna próba... W zakładce Zmienne wybieramy do testowania zmienną dochód. W zakładce Ustawienia spośród testów niestandardowych wybieramy chikwadrat. W jego opcjach podajemy kategorie (kolejno 1, 2, 3) i odpowiadające im prawdopodobieństwa (kolejno 0, 6, 0, 3, 0, 1). W opcjach testów zmieniamy poziom istotności na 0,

94 Możemy aktywować przegląd modelu Test chi-kwadrat niezależności Hipoteza zerowa: Zmienne losowe X i Y są niezależne. Hipoteza alternatywna: X i Y są zależne. Założenia: Cechy X, Y są jakościowe (nominalne lub o wartościach uporządkowanych). Statystyka testowa: k r χ 2 (n ij n 0 = ij) 2, j=1 i=1 n 0 ij 94

95 gdzie r liczba kategorii zmiennej X (liczba wierszy w tablicy kontyngencji), k liczba kategorii zmiennej Y (liczba kolumn w tablicy kontyngencji), n ij liczba wystąpień w próbie par obserwacji (x i, y j ), k r n ij n ij n 0 j=1 i=1 ij =, n r k n = n ij. i=1 j=1 Dla zmiennych X i Y przyjmujących tylko po 2 wartości stosuje się statystykę k r χ 2 ( n ij n 0 = ij 1/2) 2, j=1 i=1 n 0 ij co zawiera tzw. poprawkę Yatesa na ciągłość poprawiającą jakość przybliżenia. [6] Obszar krytyczny: K = (u (r 1)(k 1) 1 α, + ), gdzie u (r 1)(k 1) 1 α jest kwantylem rzędu 1 α rozkładu chi-kwadrat z (r 1)(k 1) stopniami swobody. p-wartość: α = 1 F (r 1)(k 1) χ (χ 2 ), 2 gdzie F (r 1)(k 1) χ jest dystrybuantą rozkładu chi-kwadrat z (r 1)(k 1) 2 stopniami swobody. Uwagi: Podobnie jak w teście chi-kwadrat zgodności, przybliżenie statystyki testowej rozkładem chi-kwadrat stosujemy, gdy liczebności teoretyczne prób w wierszach (kolumnach) są stosunkowo duże (n 0 ij 5). Gdy tablica kontyngencji ma rozmiar 2 2 i liczebności próby w wierszach (kolumnach) są zbyt małe, można oprzeć się na tzw. dokładnym teście Fishera. W przypadku pary cech o uporządkowanych kategoriach test niezależności może okazać się zwodniczy. Może wówczas zajść potrzeba wprowadzenia odpowiedniej miary zależności między cechami. Miara gamma miara zależności monotonicznej, dodatniej, gdy γ > 0 i ujemnej, gdy γ < 0. Zasadniczo γ [ 1, 1]. p-wartość podawana przy tym współczynniku dotyczy testu hipotezy zerowej o niezależności zmiennych przy hipotezie alternatywnej orzekającej ich dodatnią (lub ujemną) zależność. 95

96 d Sommersa i τ b Kendalla używane, gdy liczba par związanych jest duża. Dostęp w IBM SPSS Statistics: Test jest dostępny poprzez wybranie Analiza > Opis statystyczny > Tabele krzyżowe... W oknie dialogowym należy najpierw rozmieścić zmienne w wierszach lub kolumnach tabeli. Następnie wybieramy Statystyki... i zaznaczamy Chi-kwadrat. Dla tabel kontyngencji o wymiarach 2 2 wyświetlana jest również istotność testu chi-kwadrat z poprawką Yatesa oraz dokładnego testu Fishera. Ćwiczenie 4.7. Wybrano losowo 780 mieszkańców Torunia, których zapytano o najchętniej oglądany rodzaj seriali. Poniższa tabela (oraz plik seriale.sav) przedstawia wyniki sondażu. Za pomocą testu chi-kwadrat niezależności, przyjmując poziom istotności 0,05, zbadaj czy płeć telewidza i rodzaj seriali przez niego oglądanych są niezależne. Rodzaj seriali Płeć telenowele seriale kryminalne seriale komediowe Razem Kobieta Mężczyzna Razem Rozwiązanie. Testujemy hipotezy: Hipoteza zerowa: Płeć telewidza i rodzaj oglądanych przez niego seriali są niezależne. Hipoteza alternatywna: Płeć telewidza i rodzaj oglądanych przez niego seriali są zależne. Ponieważ dane nie są danymi surowymi, tylko są pogrupowane, musimy dokonać ważenia. Wybieramy z menu Dane > Ważenie obserwacji... i podajemy, że liczba respondentów jest zmienną ważącą. Następnie wykonujemy test. Wybieramy Analiza > Opis statystyczny > Tabele krzyżowe... Płeć respondenta umieszczamy w wierszach, a rodzaj oglądanych seriali w kolumnach. Zaznaczamy opcję Pokaż zgrupowane wykresy słupkowe, a pod przyciskiem Statystyki... zaznaczamy Chikwadrat. 96

97 Istotność testu chi-kwadrat wynosi 0, 000, co jest mniejsze od zakładanego poziomu istotności i pozwala na odrzucenie hipotezy o niezależności rodzaju oglądanych seriali od płci respondenta. Wyniki testu można uznać za wiarygodne, gdyż wszystkie komórki mają liczebności oczekiwane większe od 5. 97

98 4.6. Dokładny test Fishera* Założenia: Rozważamy dwie zmienne losowe X i Y, z których każda może przyjmować po dwie wartości odpowiednio x 1, x 2 i y 1, y 2, a tablica kontyngencji ich rozkładu łącznego ma postać Y X x 1 x 2 y 1 a b a + b y 2 c d c + d a + c b + d n Hipoteza zerowa: Zmienne X i Y są niezależne (dokładniej: proporcja a : b jest taka sama jak c : d). Hipoteza alternatywna 1.: Zmienne X i Y są zależne (dokładniej: proporcja a : b jest różna od c : d). Hipoteza alternatywna 2.: Proporcja a : b jest większa od c : d. Hipoteza alternatywna 3.: Proporcja a : b jest mniejsza od c : d. p-wartość 1.: Test bazuje na prawdopodobieństwie określonym przez rozkład hipergeometryczny, tj. dla podanej tabeli oblicza się prawdopodobieństwo uzyskania tejże tabeli przy znanym jej rozkładzie brzegowym P = ( )( ) a+c b+d a b ( ) n. a+b Następnie rozważa się wszystkie tabele o identycznych jak podane rozkładach brzegowych, wylicza się dla nich prawdopodobieństwa i sumuje te, które są mniejsze bądź równe prawdopodobieństwu wyliczonemu dla wyjściowej tablicy. p-wartość 2. i 3.: Podobnie jak p-wartość dwustronna, tylko sumuje się tylko prawdopodobieństwa dla tabel zgodnych z zakładaną hipotezą jednostronną. Uwagi: Dokładny test Fishera stosuje się w przypadku, gdy nie zostały spełnione założenia testu chi-kwadrat niezależności. W przypadku jednostronnej hipotezy alternatywnej odczytujemy istotność jednostronną oraz sprawdzamy, czy zebrane dane są zgodne z badaną hipotezą jednostronną (czyli czy obserwowane proporcje spełniają nierówność tej hipotezy). 98

99 Dostęp w IBM SPSS Statistics: Test jest dostępny poprzez wybranie Analiza > Opis statystyczny > Tabele krzyżowe... W oknie dialogowym należy najpierw rozmieścić zmienne w wierszach lub kolumnach tabeli. Następnie wybieramy Statystyki... i zaznaczamy Chi-kwadrat. Ćwiczenie 4.8. [6, na podst. Example p. 152] 40 studentów zostało sklasyfikowanych według płci (kobieta/mężczyzna) i wybranego typu studiów (licencjat/inżynierskie). Wyniki zawarte są w pliku studia.sav. Sprawdź, czy istnieje zależność wybranego typu studiów od płci badanych. Rozwiązanie. Testujemy hipotezy: Hipoteza zerowa: Proporcja licencjatów do inżynierów jest taka sama dla obu płci. Hipoteza alternatywna: Podana proporcja jest inna. Próbujemy najpierw wykonać test chi-kwadrat niezależności. Analiza > Opis statystyczny > Tabele krzyżowe... Zmienną płeć umieszczamy w wierszach, a studia w kolumnach. Pod przyciskiem Statystki zaznaczamy Chi-kwadrat, a pod przyciskiem Komórki zaznaczamy liczebności Obserwowane i Oczekiwane. 99

100 Istotność testu chi-kwadrat wynosi 0, 455, co oznacza, że nie mamy podstaw do odrzucenia hipotezy zerowej. Podobny wniosek otrzymujemy, biorąc pod uwagę istotność testu z poprawką Yatesa na ciągłość. Jak jednak widzimy, jedna z komórek tabeli kontyngencji ma liczebność oczekiwaną mniejszą od 5, wyniki tych testów nie są zatem wiarygodne. Musimy wziąć pod uwagę istotność dokładnego testu Fishera. Wynosi ona 0, 690 i również nie daje podstaw do odrzucenia hipotezy zerowej Test Kołmogorowa Hipoteza zerowa: Zmienna ma rozkład o zadanej dystrybuancie F. Hipoteza alternatywna: Zmienna ma rozkład o innej niż zadana dystrybuancie. Statystyka testowa: D n = max{d n +, Dn } gdzie D n + i = max 1 i n n F (x (i)), D n = max 1 i n F (x (i) ) i 1 n Obszar krytyczny: (d n (1 α), 1] odczytujemy z tablic kwantyli statystyki Kołmogorowa, jest to taka wartość, dla której P (D n d n (1 α)) = α). Uwagi: W przypadku danych zgrupowanych w klasy bierzemy pod uwagę prawy koniec każdej z klas i zamiast podanych statystyk wyznaczamy wartość maksymalną statystyki F n (x i ) F (x i ), gdzie F n jest dystrybuantą empiryczną. Dla dużych prób (n > 100) używa się statystyki nd n, a obszar krytyczny wyznacza, używając kwantyli granicznego rozkładu Kołmogorowa. 100

101 W przypadku testowania zgodności z rozkładem normalnym zaleca się stosowanie testu Kołmogorowa z poziomem istotności Lillieforsa oraz testu Shapiro-Wilka (najbardziej polecany dla prób o liczebności nieprzekraczającej 2000). Dostęp w IBM SPSS Statistics: W IBM SPSS Statistics test Kołmogorowa występuje pod nazwą Kołmogorowa-Smirnowa (w literaturze matematycznej nazwa taka jest używana dla testu badającego zgodność rozkładów dwóch zmiennych losowych). Pierwszy sposób: Analiza > Testy nieparametryczne > Testy tradycyjne > K-S dla jednej próby... Możemy badać zgodność z rozkładem normalnym, jednostajnym, Poissona i wykładniczym. Parametry tych rozkładów są estymowane na podstawie próby. Jako wynik otrzymamy tabelę zawierającą m.in. wartość statystyki (oznaczoną tutaj jako Z) oraz istotność testu. Drugi sposób: Analiza > Testy nieparametryczne > Jedna próba... W zakładce Zmienne wybieramy zmienne do analizy. W zakładce Ustawienia spośród testów niestandardowych wybieramy Testowanie rozkładu empirycznego względem hipotetycznego (Kołmogorow- Smirnow). W opcjach tego testu możemy zaznaczyć, że parametry mają być estymowane na podstawie próby, lub podać własne wartości parametrów. Jako wynik otrzymamy tabelę zawierającą hipotezę zerową, nazwę użytego testu, istotność asymptotyczną oraz decyzję co do wyboru hipotezy. Tabelę można aktywować, klikając na nią dwukrotnie, co pozwala uzyskać opis modelu. Opis modelu można skopiować Edycja > Kopiuj dodatkowy widok i wkleić do raportu. Dostęp do testów Kołmogorowa z poprawką istotności Lillieforsa oraz Shapiro-Wilka uzyskujemy, wybierając Analiza > Opis statystyczny > Eksploracja... Badaną zmienną umieszczamy w polu Zmienne zależne. Pod przyciskiem Wykresy... zaznaczamy opcję Wykresy normalności z testami. Oprócz tabeli z wynikami testów otrzymujemy wykresy K-K (kwartyl-kwartyl) porównujące kwartyle testowanego rozkładu z kwartylami empirycznymi. Jeśli rozkład empiryczny zgadza się z teoretycznym, punkty na pierwszym wykresie układają się na przekątnej. Ćwiczenie 4.9. Generator liczb losowych wygenerował 20 liczb z rozkładu wykładniczego E(2). Liczby są uporządkowane niemalejąco: 0, 02 0, 03 0, 04 0, 04 0, 06 0, 11 0, 11 0, 18 0, 22 0, 26 0, 27 0, 44 0, 46 0, 60 0, 65 0, 80 0, 85 0, 95 1, 20 2,

102 Za pomocą testu Kołmogorowa na poziomie istotności 0,05 przetestuj zgodność tych danych z rozkładem E(2) (dane dostępne w pliku wykladniczy.sav na Moodle). Rozwiązanie. Testujemy hipotezy: Hipoteza zerowa: Zmienna ma rozkład wykładniczy E(2). Hipoteza alternatywna: Zmienna ma rozkład inny niż podany. Wybieramy z menu Analiza > Testy nieparametryczne > Testy tradycyjne > K-S dla jednej próby... Testujemy zmienną zamieszczoną w pliku, a jako testowany rozkład wybieramy wykładniczy. Otrzymujemy istotność 0, 834, która jest większa od zakładanego poziomu istotności i nie daje podstaw do odrzucenia hipotezy zerowej. Zauważmy jednak, że test sprawdził zgodność nie z rozkładem E(2), tylko z rozkładem wykładniczym o średniej 0, 4645, czyli E(2, 153). Drugi sposób wykonania testu pozwala sprawdzić hipotezę zerową w dokładnie takiej postaci jak podaliśmy. Wybieramy Analiza > Testy nieparametryczne > Jedna próba... W zakładce Zmienne sprawdzamy, że testowaną zmienną jest zmienna dane. W zakładce Ustawienia spośród testów niestandardowych wybieramy Kołmogorowa-Smirnowa i w jego opcjach zaznaczamy jako testowany rozkład wykładniczy ze średnią 0, 5. W Opcje testów możemy podać zakładany poziom istotności. 102

103 Otrzymaną tabelę można aktywować, by otrzymać podgląd modelu. Ćwiczenie Przyjmując poziom istotności 0, 01, sprawdź hipotezę, że zmienna v1 z pliku rozklady.sav (dostępny na Moodle) ma rozkład normalny. 103

104 Rozwiązanie. Testujemy hipotezy: Hipoteza zerowa: Zmienna v1 ma rozkład normalny. Hipoteza alternatywna: Zmienna v1 ma rozkład inny niż normalny. Wybieramy z menu Analiza > Opis statystyczny > Eksploracja... W polu Zmienne zależne umieszczamy zmienną v1. W polu Pokaż zaznaczamy Wykresy. Klikamy Wykresy i zaznaczamy Wykresy normalności z testami. Możemy również zamiast wykresu skrzynka z wąsami zaznaczyć histogram. 104

105 Istotność testu Shapiro-Wilka wynosi 0, 619, a testu Kołmogorowa (z poprawką istotności Lillieforsa) przekracza 0, 200, oba te wyniki znacznie prze- 105

106 kraczają 0, 01, co oznacza, że nie możemy odrzucić hipotezy o normalności rozkładu, a innymi słowy, możemy uznać, że rozkład zmiennej v1 nie odbiega znacząco od normalnego Test Wilcoxona znakowanych rang Założenia: Dysponujemy ciągiem par obserwacji: (X 1, Y 1 ),..., (X n, Y n ). Pary zmiennych losowych są niezależne, natomiast X i, Y i mogą być zależne. Definiujemy niezależne różnice Z i = Y i X i, i = 1..., n. Każda zmienna Z i, i = 1,..., n pochodzi z tego samego rozkładu ciągłego o dystrybuancie F i, symetrycznego względem wspólnej mediany θ (może być ona interpretowana jako efekt kuracji ). Hipoteza zerowa: θ = 0 (brak efektu kuracji ) Hipoteza alternatywna 1.: θ 0 (jest jakiś efekt kuracji ). Hipoteza alternatywna 2.: θ > 0 ( efekt kuracji jest dodatni). Hipoteza alternatywna 3.: θ < 0 ( efekt kuracji jest ujemny). Statystyka testowa: Jest to statystyka znakowanych rang Wilcoxona, czyli suma rang wartości bezwzględnych różnic odpowiadających różnicom dodatnim: T + = Z i >0 r( Z i ), gdzie r( Z i ) ranga Z i, i = 1,...(, n, (r(x i ) = j {1,...], n} X i = X j:n ). n(n + 1) Obszar krytyczny 1.: K =, w 1 α/2 [ w 1 α/2, ), 2 Obszar krytyczny 2.: K = ([w 1 α, + ) ] n(n + 1) Obszar krytyczny 3.: K =, w 1 α 2 gdzie w a jest kwantylem rozkładu statystyki znakowanych rang Wilcoxona (przy założeniu prawdziwości hipotezy zerowej) rzędu a (w tablicach). Uwagi: Test znakowanych rang Wilcoxona jest nieparametryczną alternatywą dla testu t-studenta w przypadku dwóch próbek dających się połączyć w pary. Różnica między tymi testami jest taka, że test t-studenta testuje równość średnich arytmetycznych, a test Wilcoxona testuje mediany. Test Wilcoxona nie wymaga założeń dotyczących rozkładu próby, może być więc używany, gdy założenia testu t-studenta nie są spełnione. Test dla jednej próby jest odpowiednikiem testu dla dwóch prób, w którym drugą z prób zastąpiono stałą równą wartości testowanej mediany. 106

107 Jeżeli n jest duże (w praktyce dla n 25), stosuje się tzw. test asymptotyczny, tj. używa się statystyki testowej postaci T = T + n(n+1) 4 n(n + 1)(2n + 1)/24, i obszarów krytycznych Obszar krytyczny 1.: K = (, z 1 α/2 ] [ z1 α/2, ) Obszar krytyczny 2.: K = [z 1 α, + ) Obszar krytyczny 3.: K = (, z 1 α ] gdzie z 1 α jest kwantylem rzędu 1 α standardowego rozkładu normalnego. W praktyce (w wyniku zaokrąglania) mogą pojawić się tzw. węzły, czyli grupy obserwacji o jednakowej wartości bezwzględnej. Postępowanie w przypadku, gdy 1. n < 25 - odrzucamy wszystkie Z i takie, że Z i = 0 i odpowiednio zmniejszamy n, - uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite), - stosujemy test dokładny ze zmodyfikowanymi rangami; 2. n 25 - odrzucamy wszystkie Z i takie, że Z i = 0 i odpowiednio zmniejszamy n, - uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite), - stosujemy test asymptotyczny ze modyfikowaną statystyką testową T : T = T = T + n(n+1) 4 n(n + 1)(2n + 1)/ , N (t 2 j 1)t j j=1 gdzie: N liczba grup węzłów (również jednoelementowych), t j liczba węzłów w j-tej grupie, j = 1,..., N. 107

108 Dostęp w IBM SPSS Statistics: W IBM SPSS Statistics wykonywane są asymptotyczne testy znakowanych rang Wilcoxona, tj. powinniśmy dysponować próbami składającymi się z co najmniej 25 obserwacji. W przypadku mniejszych prób powinno się wykonać tzw. test dokładny, który jest dostępny w menu testów tradycyjnych. Dostęp do testu dla jednej próby: Analiza > Testy nieparametryczne > Jedna próba... W zakładce Ustawienia wybieramy Porównanie mediany z wartością hipotetyczną (test Wilcoxona znakowanych rang) i podajemy testowaną wartość mediany. Pierwszy sposób wykonania testu dla dwóch prób: Analiza > Testy nieparametryczne > Testy tradycyjne > Dwie próby zależne... Wybieramy typ testu Wilcoxon. Drugi sposób wykonania testu dla dwóch prób: Analiza > Testy nieparametryczne > Próby zależne... W zakładce Ustawienia wybieramy Test znakowanych rang Wilcoxona dla par dopasowanych. Ćwiczenie Dziewięciu pacjentów ze zdiagnozowaną depresją poddano terapii lekiem uspokajającym T. Dane w pliku depresja.sav dotyczą wartości tzw. czynnika Hamiltona u pacjentów i zostały zmierzone po pierwszej oraz po drugiej wizycie u lekarza. Polepszeniu stanu pacjenta odpowiada obniżenie wartości czynnika Hamiltona. Stosując test znakowanych rang Wilcoxona, na poziomie istotności 0,049 przetestuj hipotezę, że efekt terapii jest zerowy, przeciwko hipotezie, że lek T przynosi pozytywne efekty. Rozwiązanie. Badamy różnice wartości współczynnika Hamiltona po drugiej i po pierwszej wizycie. Testujemy hipotezy: Hipoteza zerowa: Mediana różnic jest zerowa. Hipoteza alternatywna: Mediana różnic jest ujemna. Wybieramy Analiza > Testy nieparametryczne > Testy tradycyjne > Dwie próby zależne... Jako zmienną pierwszą wybieramy wartość współczynnika po pierwszej wizycie, jako drugą po drugiej. Wybieramy typ testu Wilcoxon. 108

109 Z tabeli statystyk testu widzimy, że statystyka dla różnicy po drugiej po pierwszej jest ujemna, a asymptotyczny dwustronny poziom istotności wynosi 0, 038. Jednostronny poziom istotności jest więc równy 0, 019, co oznacza, że odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej jednostronnej. Ujemna wartość statystyki pozwala nam przyjąć hipotezę, że mediana różnic jest ujemna, czyli u większości pacjentów wartość współczynnika Hamiltona uległa obniżeniu. Problemem pozostaje liczebność próby, jest ona mniejsza od 25, co nie pozwala na stosowanie asymptotycznej wersji testu. Wykonujemy test jeszcze raz, klikając w oknie dialogowym opcję Dokładne... i wybierając dokładną wersję testu z limitem czasu 5 minut. 109

110 Dokładna istotność jednostronna wynosi 0, 020 i nie zmienia podjętej wcześniej decyzji Test U Manna-Whitneya* Na podstawie [2, str. 672]. Założenia: Dysponujemy ciągłą zmienną losową i jej obserwacjami z dwóch różnych populacji. Hipoteza zerowa: Mediany zmiennej są takie same w dwóch różnych populacjach (θ 1 = θ 2 ). Hipoteza alternatywna 1.: Mediany zmiennej są różne w badanych populacjach (θ 1 θ 2 ). Hipoteza alternatywna 2.: Mediana zmiennej w pierwszej populacji jest mniejsza od mediany zmiennej w drugiej populacji (θ 1 < θ 2 ). Hipoteza alternatywna 3.: Mediana zmiennej w pierwszej populacji jest większa od mediany zmiennej w drugiej populacji (θ 1 > θ 2 ). Statystyka testowa: Obserwacje z obu prób łącznie porządkujemy od najmniejszej do największej i przypisujemy im rangi. r 1 suma rang z pierwszej próby. Statystyka testowa U = min { n 1 n 2 + n 1(n 1 + 1) r 1, r 1 n } 1(n 1 + 1). 2

111 Obszar krytyczny 1.: K = (, u n ] [ 1,n 2 1 α/2 u n 1,n 2 1 α/2, ) Obszar krytyczny 2.: K = [u n 1,n 2 1 α, + ) Obszar krytyczny 3.: K = (, u n 1,n 2 1 α ] gdzie u n 1,n 2 a jest kwantylem rozkładu statystyki U Manna-Whitneya (przy założeniu prawdziwości hipotezy zerowej) rzędu a (w tablicach). Uwagi: Test U Manna-Whitneya jest nieparametryczną alternatywą dla testu t- Studenta w przypadku dwóch prób niezależnych. Różnica między tymi testami jest taka, że test t-studenta testuje równość średnich arytmetycznych, a test U Manna-Whitneya testuje mediany. Test U Manna- Whitneya wymaga jedynie, żeby próby pochodziły z rozkładów o podobnym kształcie [7, str. 289], może być więc używany, gdy założenia testu t-studenta nie są spełnione. Jeżeli n 1 lub n 2 jest większe od 20 i próby mają zbliżoną liczebność, stosuje się tzw. test asymptotyczny, tj. używa się statystyki testowej postaci U U n 1n 2 2 = n 1 n 2 (n 1 + n 2 + 1)/12, i obszarów krytycznych Obszar krytyczny 1.: K = (, z 1 α/2 ] [ z1 α/2, ) Obszar krytyczny 2.: K = [z 1 α, + ) Obszar krytyczny 3.: K = (, z 1 α ] gdzie z 1 α jest kwantylem rzędu 1 α standardowego rozkładu normalnego. W przypadku pojawienia się węzłów, tj. obserwacji o tej samej wartości, każdemu z nich przypisuje się rangę będącą średnią rang przypadających na te wartości. Dostęp w IBM SPSS Statistics: W IBM SPSS Statistics wykonywany jest asymptotyczny test U Manna-Whitneya, tj. powinniśmy dysponować próbami składającymi się z co najmniej 20 obserwacji. W przypadku mniejszych prób powinno się wykonać tzw. test dokładny, który jest dostępny w menu testów tradycyjnych. Test dokładny jest wykonywany dla prób, dla których n 1 n i n 1 n 2 /2 + min(n 1, n 2 ) 220. Pierwszy sposób wykonania testu: Analiza > Testy nieparametryczne > Testy tradycyjne > Dwie próby niezależne... Wybieramy typ testu U Manna-Whitneya. (Przy tym sposobie mamy dostęp do testów dokładnych). 111

112 Drugi sposób wykonania testu dla dwóch prób: Analiza > Testy nieparametryczne > Próby niezależne... W zakładce Ustawienia wybieramy U Manna-Whitneya (2 próby). Ćwiczenie W celu sprawdzenia hipotezy o dużym wysiłku w pracy w pewnej fabryce przeprowadzono eksperyment, w którym zbadano tętno losowo wybranych pracowników fabryki oraz rowerzystów przy tej samej konsumpcji tlenu. Dane znajdują się w pliku tetno.sav (dostępnym na Moodle). Zweryfikuj podaną hipotezę, przyjmując poziom istotności 0, 1. Rozwiązanie. Badamy najpierw, czy są spełnione założenia testu t-studenta dla zmiennych niezależnych, tj. badamy normalność rozkładu. 112

113 113

114 114

115 115

116 Jak widać, przy poziomie istotności 0,1 rozkład zmiennej tętno w grupie pracowników odbiega od normalnego. Dlatego zastosujemy test U Manna- Whitneya. Ze względu na małą liczebność obu grup musimy zastosować dokładną wersję tego testu. Hipoteza zerowa: Mediana tętna jest taka sama w grupach pracowników i rowerzystów. Hipoteza alternatywna: Mediana tętna jest wyższa w grupie pracowników. Wybieramy Analiza > Testy nieparametryczne > Testy tradycyjne > Dwie próby niezależne... W polu Zmienne testowane umieszczamy zmienną tetno, w Zmienna grupująca zmienną grupa. Definiujemy grupy, podając kolejno wartości 1 (pracownicy) i 2 (rowerzyści). Zaznaczamy test U Manna-Whitneya. Klikamy Dokładne i wybieramy testy dokładne z limitem czasu 5 minut. 116

117 Dokładna istotność jednostronna wynosi 0, 024 i jest mniejsza od zakładanego poziomu istotności wynoszącego 0,1. Pozwala to na odrzucenie hipotezy zerowej na korzyść hipotezy konkurencyjnej jednostronnej. Ze względu na większą sumę rang dla pracowników niż dla rowerzystów, przyjmujemy hipotezę, że mediana tętna pracowników jest wyższa niż rowerzystów. 117

Przewodnik dla każdego po: Dla każdego coś miłego Microsoft Excel 2010

Przewodnik dla każdego po: Dla każdego coś miłego Microsoft Excel 2010 Przewodnik dla każdego po: Dla każdego coś miłego Microsoft Excel 2010 Czym jest Excel 2010 Excel jest programem umożliwiającym tworzenie tabel, a także obliczanie i analizowanie danych. Należy do typu

Bardziej szczegółowo

Instrukcja instalacji programu SPSS Statistics 21

Instrukcja instalacji programu SPSS Statistics 21 Instrukcja instalacji programu SPSS Statistics 21 UWAGA: DO POPRAWNEGO, PEŁNEGO ZAINSTALOWANIA (AKTYWACJI) PROGRAMU SPSS Statistics 21 NIEZBĘDNE JEST AKTYWNE POŁĄCZENIE Z INTERNETEM PODCZAS INSTALACJI

Bardziej szczegółowo

Tworzenie prezentacji w MS PowerPoint

Tworzenie prezentacji w MS PowerPoint Tworzenie prezentacji w MS PowerPoint Program PowerPoint dostarczany jest w pakiecie Office i daje nam możliwość stworzenia prezentacji oraz uatrakcyjnienia materiału, który chcemy przedstawić. Prezentacje

Bardziej szczegółowo

Temat: Organizacja skoroszytów i arkuszy

Temat: Organizacja skoroszytów i arkuszy Temat: Organizacja skoroszytów i arkuszy Podstawowe informacje o skoroszycie Excel jest najczęściej wykorzystywany do tworzenia skoroszytów. Skoroszyt jest zbiorem informacji, które są przechowywane w

Bardziej szczegółowo

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica 1. Zarządzanie danymi. Pierwszą czynnością w pracy z pakietem Statistica jest zazwyczaj wprowadzenie danych do arkusza. Oprócz możliwości

Bardziej szczegółowo

SPIS ILUSTRACJI, BIBLIOGRAFIA

SPIS ILUSTRACJI, BIBLIOGRAFIA SPIS ILUSTRACJI, BIBLIOGRAFIA Ćwiczenie 1 Automatyczne tworzenie spisu ilustracji 1. Wstaw do tekstu roboczego kilka rysunków (WSTAWIANIE OBRAZ z pliku). 2. Ustaw kursor w wersie pod zdjęciem i kliknij

Bardziej szczegółowo

Arkusz kalkulacyjny EXCEL

Arkusz kalkulacyjny EXCEL ARKUSZ KALKULACYJNY EXCEL 1 Arkusz kalkulacyjny EXCEL Aby obrysować tabelę krawędziami należy: 1. Zaznaczyć komórki, które chcemy obrysować. 2. Kursor myszy ustawić na menu FORMAT i raz kliknąć lewym klawiszem

Bardziej szczegółowo

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego.

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego. Tabele przestawne Niekiedy istnieje potrzeba dokonania podsumowania zawartości bazy danych w formie dodatkowej tabeli. Tabelę taką, podsumowującą wybrane pola bazy danych, nazywamy tabelą przestawną. Zasady

Bardziej szczegółowo

Zapytania i wstawianie etykiet z bazy danych do rysunku

Zapytania i wstawianie etykiet z bazy danych do rysunku Zapytania i wstawianie etykiet z bazy danych do rysunku Pracujemy z gotową bazą danych MSAccess o nazwie KOMIS.MDB. Baza ta składa się z kilku tabel, rys. 1 Rys. 1. Diagram relacji. Wybierając w MSAccess,

Bardziej szczegółowo

Zadanie 8. Dołączanie obiektów

Zadanie 8. Dołączanie obiektów Zadanie 8. Dołączanie obiektów Edytor Word umożliwia dołączanie do dokumentów różnych obiektów. Mogą to być gotowe obiekty graficzne z galerii klipów, równania, obrazy ze skanera lub aparatu cyfrowego.

Bardziej szczegółowo

Po naciśnięciu przycisku Dalej pojawi się okienko jak poniżej,

Po naciśnięciu przycisku Dalej pojawi się okienko jak poniżej, Tworzenie wykresu do danych z tabeli zawierającej analizę rozwoju wyników sportowych w pływaniu stylem dowolnym na dystansie 100 m, zarejestrowanych podczas Igrzysk Olimpijskich na przestrzeni lat 1896-2012.

Bardziej szczegółowo

1. Opis okna podstawowego programu TPrezenter.

1. Opis okna podstawowego programu TPrezenter. OPIS PROGRAMU TPREZENTER. Program TPrezenter przeznaczony jest do pełnej graficznej prezentacji danych bieżących lub archiwalnych dla systemów serii AL154. Umożliwia wygodną i dokładną analizę na monitorze

Bardziej szczegółowo

Co to jest arkusz kalkulacyjny?

Co to jest arkusz kalkulacyjny? Co to jest arkusz kalkulacyjny? Arkusz kalkulacyjny jest programem służącym do wykonywania obliczeń matematycznych. Za jego pomocą możemy również w czytelny sposób, wykonane obliczenia przedstawić w postaci

Bardziej szczegółowo

Edytor tekstu MS Word 2003 - podstawy

Edytor tekstu MS Word 2003 - podstawy Edytor tekstu MS Word 2003 - podstawy Cz. 4. Rysunki i tabele w dokumencie Obiekt WordArt Jeżeli chcemy zamieścić w naszym dokumencie jakiś efektowny napis, na przykład hasło reklamowe, możemy wykorzystać

Bardziej szczegółowo

Bazy danych Karta pracy 1

Bazy danych Karta pracy 1 Bazy danych Karta pracy 1 Bazy danych Karta pracy 1 1. Utwórz katalog Bazy danych służący do przechowywania wszelkich danych dotyczących kursu. 2. W katalogu Bazy danych stwórz podkatalog BD1 służący jako

Bardziej szczegółowo

BIBLIOGRAFIA W WORD 2007

BIBLIOGRAFIA W WORD 2007 BIBLIOGRAFIA W WORD 2007 Ćwiczenie 1 Tworzenie spisu literatury (bibliografii) Word pozwala utworzyć jedną listę główną ze źródłami (cytowanymi książkami czy artykułami), która będzie nam służyć w różnych

Bardziej szczegółowo

LABORATORIUM 6: ARKUSZ MS EXCEL JAKO BAZA DANYCH

LABORATORIUM 6: ARKUSZ MS EXCEL JAKO BAZA DANYCH UNIWERSYTET ZIELONOGÓRSKI INSTYTUT INFORMATYKI I ELEKTROTECHNIKI ZAKŁAD INŻYNIERII KOMPUTEROWEJ Przygotował: dr inż. Janusz Jabłoński LABORATORIUM 6: ARKUSZ MS EXCEL JAKO BAZA DANYCH Jeżeli nie jest potrzebna

Bardziej szczegółowo

Dlaczego stosujemy edytory tekstu?

Dlaczego stosujemy edytory tekstu? Edytor tekstu Edytor tekstu program komputerowy służący do tworzenia, edycji i formatowania dokumentów tekstowych za pomocą komputera. Dlaczego stosujemy edytory tekstu? możemy poprawiać tekst możemy uzupełniać

Bardziej szczegółowo

Kolumna Zeszyt Komórka Wiersz Tabela arkusza Zakładki arkuszy

Kolumna Zeszyt Komórka Wiersz Tabela arkusza Zakładki arkuszy 1 Podstawowym przeznaczeniem arkusza kalkulacyjnego jest najczęściej opracowanie danych liczbowych i prezentowanie ich formie graficznej. Ale formuła arkusza kalkulacyjnego jest na tyle elastyczna, że

Bardziej szczegółowo

TEMAT : TWORZENIE BAZY DANYCH PRZY POMOCY PROGRAMU EXCEL

TEMAT : TWORZENIE BAZY DANYCH PRZY POMOCY PROGRAMU EXCEL Konspekt lekcji TEMAT : TWORZENIE BAZY DANYCH PRZY POMOCY PROGRAMU EXCEL Czas trwania : 3 x 45 min. CELE NAUCZANIA : 1. Poziom podstawowy (ocena dostateczna) o uczeń potrafi założyć bazę danych i wprowadzić

Bardziej szczegółowo

Instalacja programu:

Instalacja programu: Instrukcja programu Konwerter Lido Aktualizacja instrukcji : 2012/03/25 INSTALACJA PROGRAMU:... 1 OKNO PROGRAMU OPIS... 3 DODANIE MODUŁÓW KONWERSJI... 3 DODANIE LICENCJI... 5 DODANIE FIRMY... 7 DODAWANIE

Bardziej szczegółowo

Ć w i c z e n i e 3 : W i z u a l i z a c j a d a n y c h - w y k r e s y S t r o n a 1

Ć w i c z e n i e 3 : W i z u a l i z a c j a d a n y c h - w y k r e s y S t r o n a 1 Ć w i c z e n i e 3 : W i z u a l i z a c j a d a n y c h - w y k r e s y S t r o n a 1 Zadanie 1. Tworzenie wykresów zmiennych jakościowych wyrażonych w skali nominalnej i porządkowej. Utworzyć wykres

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Synchronizator plików (SSC) - dokumentacja

Synchronizator plików (SSC) - dokumentacja SZARP http://www.szarp.org Synchronizator plików (SSC) - dokumentacja Wersja pliku: $Id: ssc.sgml 4420 2007-09-18 11:19:02Z schylek$ > 1. Witamy w programie SSC Synchronizator plików (SZARP Sync Client,

Bardziej szczegółowo

najlepszych trików Excelu

najlepszych trików Excelu 70 najlepszych trików W Excelu 70 najlepszych trików w Excelu Spis treści Formatowanie czytelne i przejrzyste zestawienia...3 Wyświetlanie tylko wartości dodatnich...3 Szybkie dopasowanie szerokości kolumny...3

Bardziej szczegółowo

Szybka instrukcja tworzenia testów dla E-SPRAWDZIAN-2 programem e_kreator_2

Szybka instrukcja tworzenia testów dla E-SPRAWDZIAN-2 programem e_kreator_2 Szybka instrukcja tworzenia testów dla E-SPRAWDZIAN-2 programem e_kreator_2 Spis treści: 1. Tworzenie nowego testu. str 2...5 2. Odczyt raportów z wynikami. str 6...7 3. Edycja i modyfikacja testów zapisanych

Bardziej szczegółowo

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Co na dzisiejszym wykładzie: definicje, sposoby wyznaczania i interpretacja STATYSTYK OPISOWYCH prezentacja

Bardziej szczegółowo

BAZY DANYCH Formularze i raporty

BAZY DANYCH Formularze i raporty BAZY DANYCH Formularze i raporty Za pomocą tabel można wprowadzać nowe dane, przeglądać i modyfikować dane już istniejące. Jednak dla typowego użytkownika systemu baz danych, przygotowuje się specjalne

Bardziej szczegółowo

Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt

Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt Zadanie: Utwórz szablon rysunkowy składający się z: - warstw - tabelki rysunkowej w postaci bloku (według wzoru poniżej)

Bardziej szczegółowo

Edytor tekstu OpenOffice Writer Podstawy

Edytor tekstu OpenOffice Writer Podstawy Edytor tekstu OpenOffice Writer Podstawy OpenOffice to darmowy zaawansowany pakiet biurowy, w skład którego wchodzą następujące programy: edytor tekstu Writer, arkusz kalkulacyjny Calc, program do tworzenia

Bardziej szczegółowo

Microsoft Access zajęcia 3 4. Tworzenie i wykorzystanie kwerend, formularzy i raportów

Microsoft Access zajęcia 3 4. Tworzenie i wykorzystanie kwerend, formularzy i raportów Microsoft Access zajęcia 3 4 Tworzenie i wykorzystanie kwerend, formularzy i raportów Kwerendy służą do tworzenia unikalnych zestawów danych, niedostępnych bezpośrednio z tabel, dokonywania obliczeń zawartych

Bardziej szczegółowo

Podręcznik użytkownika programu. Ceremonia 3.1

Podręcznik użytkownika programu. Ceremonia 3.1 Podręcznik użytkownika programu Ceremonia 3.1 1 Spis treści O programie...3 Główne okno programu...4 Edytor pieśni...7 Okno ustawień programu...8 Edycja kategorii pieśni...9 Edytor schematów slajdów...10

Bardziej szczegółowo

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA Krzysztof Suwada, StatSoft Polska Sp. z o.o. Wstęp Wiele różnych analiz dotyczy danych opisujących wielkości charakterystyczne bądź silnie

Bardziej szczegółowo

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. 1. Załóż we własnym folderze podfolder o nazwie cw2 i przekopiuj do niego plik

Bardziej szczegółowo

Wprowadzenie do formuł i funkcji

Wprowadzenie do formuł i funkcji Wprowadzenie do formuł i funkcji Wykonywanie obliczeń, niezależnie od tego, czy są one proste czy złożone, może być nużące i czasochłonne. Przy użyciu funkcji i formuł programu Excel można z łatwością

Bardziej szczegółowo

Instalacja systemu zarządzania treścią (CMS): Joomla

Instalacja systemu zarządzania treścią (CMS): Joomla Instalacja systemu zarządzania treścią (CMS): Joomla Na stronie http://www.cba.pl/ zarejestruj nowe konto klikając na przycisk:, następnie wybierz nazwę domeny (Rys. 1a) oraz wypełnij obowiązkowe pola

Bardziej szczegółowo

edycja szablonu za pomocą serwisu allegro.pl

edycja szablonu za pomocą serwisu allegro.pl edycja szablonu za pomocą serwisu allegro.pl 2 Do obsługi Twojego szablonu nie jest wymagane żadne dodatkowe oprogramowanie - jedyne czego potrzebujesz to aktywne konto w serwisie allegro.pl. Dokładne

Bardziej szczegółowo

MS Excell 2007 Kurs podstawowy Filtrowanie raportu tabeli przestawnej

MS Excell 2007 Kurs podstawowy Filtrowanie raportu tabeli przestawnej MS Excell 2007 Kurs podstawowy Filtrowanie raportu tabeli przestawnej prowadzi: dr inż. Tomasz Bartuś Kraków: 2008 04 04 Przygotowywanie danych źródłowych Poniżej przedstawiono zalecenia umożliwiające

Bardziej szczegółowo

Arkusz kalkulacyjny MS Excel

Arkusz kalkulacyjny MS Excel Arkusz kalkulacyjny MS Excel I. Wprowadzenie do arkusza kalkulacyjnego Program Excel służy do tworzenia elektronicznego arkusza kalkulacyjnego, który umożliwia dokumentowanie i analizę danych numerycznych.

Bardziej szczegółowo

Narzędzie informatyczne wspomagające dokonywanie ocen pracowniczych w służbie cywilnej

Narzędzie informatyczne wspomagające dokonywanie ocen pracowniczych w służbie cywilnej Narzędzie informatyczne wspomagające dokonywanie ocen pracowniczych w służbie cywilnej elektroniczne formularze arkuszy ocen okresowych i pierwszej oceny Instrukcja użytkownika Wersja 1.0 DSC KPRM 2015

Bardziej szczegółowo

Prezentacja multimedialna MS PowerPoint 2010 (podstawy)

Prezentacja multimedialna MS PowerPoint 2010 (podstawy) Prezentacja multimedialna MS PowerPoint 2010 (podstawy) Cz. 1. Tworzenie slajdów MS PowerPoint 2010 to najnowsza wersja popularnego programu do tworzenia prezentacji multimedialnych. Wygląd programu w

Bardziej szczegółowo

dolar tylko przed numerem wiersza, a następnie tylko przed literą kolumny.

dolar tylko przed numerem wiersza, a następnie tylko przed literą kolumny. Wskazówki do wykonania Ćwiczenia 0, przypomnienie (Excel 2007) Autor: dr Mariusz Giero 1. Pobieramy plik z linku przypomnienie. Należy obliczyć wartości w komórkach zaznaczonych żółtym kolorem. 2. Obliczenie

Bardziej szczegółowo

5.2. Pierwsze kroki z bazami danych

5.2. Pierwsze kroki z bazami danych 5.2. Pierwsze kroki z bazami danych Uruchamianie programu Podobnie jak inne programy, OO Base uruchamiamy z Menu Start, poprzez zakładkę Wszystkie programy, gdzie znajduje się folder OpenOffice.org 2.2,

Bardziej szczegółowo

Przewodnik Szybki start

Przewodnik Szybki start Przewodnik Szybki start Program Microsoft Access 2013 wygląda inaczej niż wcześniejsze wersje, dlatego przygotowaliśmy ten przewodnik, aby skrócić czas nauki jego obsługi. Zmienianie rozmiaru ekranu lub

Bardziej szczegółowo

TEMAT : Przykłady innych funkcji i ich wykresy.

TEMAT : Przykłady innych funkcji i ich wykresy. Elżbieta Kołodziej e-mail: efreet@pf.pl matematyka, informatyka Gimnazjum Nr 5 37-450 Stalowa Wola ul. Poniatowskiego 55 SCENARIUSZ LEKCJI PRZEPROWADZONEJ W KLASIE III TEMAT : Przykłady innych funkcji

Bardziej szczegółowo

Produkcja by CTI. Proces instalacji, ważne informacje oraz konfiguracja

Produkcja by CTI. Proces instalacji, ważne informacje oraz konfiguracja Produkcja by CTI Proces instalacji, ważne informacje oraz konfiguracja Spis treści 1. Ważne informacje przed instalacją...3 2. Instalacja programu...4 3. Nawiązanie połączenia z serwerem SQL oraz z programem

Bardziej szczegółowo

Sposób tworzenia tabeli przestawnej pokażę na przykładzie listy krajów z podstawowymi informacjami o nich.

Sposób tworzenia tabeli przestawnej pokażę na przykładzie listy krajów z podstawowymi informacjami o nich. Tabele przestawne Tabela przestawna to narzędzie służące do tworzenia dynamicznych podsumowań list utworzonych w Excelu lub pobranych z zewnętrznych baz danych. Raporty tabeli przestawnej pozwalają na

Bardziej szczegółowo

Dokument zawiera podstawowe informacje o użytkowaniu komputera oraz korzystaniu z Internetu.

Dokument zawiera podstawowe informacje o użytkowaniu komputera oraz korzystaniu z Internetu. Klub Seniora - Podstawy obsługi komputera oraz korzystania z Internetu Str. 1 Dokument zawiera podstawowe informacje o użytkowaniu komputera oraz korzystaniu z Internetu. Część 3 Opis programu MS Office

Bardziej szczegółowo

Jak utworzyć plik SIO dla aktualnego spisu?

Jak utworzyć plik SIO dla aktualnego spisu? System Informacji Oświatowej Jak utworzyć plik SIO dla aktualnego spisu? Programy Arkusz Optivum, Kadry Optivum, Płace Optivum, Sekretariat Optivum oraz Księgowość Optivum dostarczają znaczną część danych

Bardziej szczegółowo

INSTRUKCJA EDYCJI PROFILU OSOBOWEGO W SERWISIE WWW.UMCS.PL

INSTRUKCJA EDYCJI PROFILU OSOBOWEGO W SERWISIE WWW.UMCS.PL INSTRUKCJA EDYCJI PROFILU OSOBOWEGO W SERWISIE WWW.UMCS.PL Lublin, 16 stycznia 2014 r. 1. Logowanie do systemu Aby rozpocząć edycję profilu osobowego wejdź na stronę główną www.umcs.pl w zakładkę Jednostki

Bardziej szczegółowo

Instrukcja instalacji programu STATISTICA

Instrukcja instalacji programu STATISTICA Instrukcja instalacji programu STATISTICA UWAGA: Program STATISTICA wymaga zarejestrowania licencji, które należy przeprowadzić on-line. Dlatego też przed rozpoczęciem instalacji należy upewnić się, że

Bardziej szczegółowo

EXCEL. Diagramy i wykresy w arkuszu lekcja numer 6. Instrukcja. dla Gimnazjum 36 - Ryszard Rogacz Strona 20

EXCEL. Diagramy i wykresy w arkuszu lekcja numer 6. Instrukcja. dla Gimnazjum 36 - Ryszard Rogacz Strona 20 Diagramy i wykresy w arkuszu lekcja numer 6 Tworzenie diagramów w arkuszu Excel nie jest sprawą skomplikowaną. Najbardziej czasochłonne jest przygotowanie danych. Utworzymy następujący diagram (wszystko

Bardziej szczegółowo

Praca z tekstem: WORD Listy numerowane, wstawianie grafiki do pliku

Praca z tekstem: WORD Listy numerowane, wstawianie grafiki do pliku Praca z tekstem: WORD Listy numerowane, wstawianie grafiki do pliku W swoim folderze utwórz folder o nazwie 29_10_2009, wszystkie dzisiejsze zadania wykonuj w tym folderze. Na dzisiejszych zajęciach nauczymy

Bardziej szczegółowo

Bazy danych raporty. 1. Przekopiuj na dysk F:\ bazę M5BIB.mdb z dysku wskazanego przez prowadzącego.

Bazy danych raporty. 1. Przekopiuj na dysk F:\ bazę M5BIB.mdb z dysku wskazanego przez prowadzącego. Bazy danych raporty 1. Przekopiuj na dysk F:\ bazę M5BIB.mdb z dysku wskazanego przez prowadzącego. 2. Otwórz bazę (F:\M5BIB). 3. Utwórz raport wyświetlający wszystkie pola z tabeli KSIAZKI. Pozostaw ustawienia

Bardziej szczegółowo

Szkolenie dla nauczycieli SP10 w DG Operacje na plikach i folderach, obsługa edytora tekstu ABC. komputera dla nauczyciela. Materiały pomocnicze

Szkolenie dla nauczycieli SP10 w DG Operacje na plikach i folderach, obsługa edytora tekstu ABC. komputera dla nauczyciela. Materiały pomocnicze ABC komputera dla nauczyciela Materiały pomocnicze 1. Czego się nauczysz? Uruchamianie i zamykanie systemu: jak zalogować się do systemu po uruchomieniu komputera, jak tymczasowo zablokować komputer w

Bardziej szczegółowo

darmowe zdjęcia - allegro.pl

darmowe zdjęcia - allegro.pl darmowe zdjęcia - allegro.pl 1 Darmowe zdjęcia w Twoich aukcjach allegro? Tak to możliwe. Wielu sprzedających robi to od dawna i wbrew pozorom jest to bardzo proste. Serwis allegro oczywiście umożliwia

Bardziej szczegółowo

Sortowanie i filtrowanie list

Sortowanie i filtrowanie list Sortowanie i filtrowanie list Program Excel jest doskonałym narzędziem do analizowania liczb, a także świetnie się nadaje do tworzenia list i zarządzania nimi. Na liście można śledzić wszystko, od adresów

Bardziej szczegółowo

INSTRUKCJA DO OPROGRAMOWANIA KOMPUTEROWEGO

INSTRUKCJA DO OPROGRAMOWANIA KOMPUTEROWEGO INSTRUKCJA DO OPROGRAMOWANIA KOMPUTEROWEGO DLA LEKKIEJ PŁYTY DO BADAŃ DYNAMICZNYCH HMP LFG WYMAGANE MINIMALNE PARAMETRY TECHNICZNE: SPRZĘT: - urządzenie pomiarowe HMP LFG 4 lub HMP LFG Pro wraz z kablem

Bardziej szczegółowo

Europejski Certyfikat Umiejętności Komputerowych. Moduł 3 Przetwarzanie tekstów

Europejski Certyfikat Umiejętności Komputerowych. Moduł 3 Przetwarzanie tekstów Europejski Certyfikat Umiejętności Komputerowych. Moduł 3 Przetwarzanie tekstów 1. Uruchamianie edytora tekstu MS Word 2007 Edytor tekstu uruchamiamy jak każdy program w systemie Windows. Można to zrobić

Bardziej szczegółowo

Ćwiczenia nr 2. Edycja tekstu (Microsoft Word)

Ćwiczenia nr 2. Edycja tekstu (Microsoft Word) Dostosowywanie paska zadań Ćwiczenia nr 2 Edycja tekstu (Microsoft Word) Domyślnie program Word proponuje paski narzędzi Standardowy oraz Formatowanie z zestawem opcji widocznym poniżej: Można jednak zmodyfikować

Bardziej szczegółowo

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS cz. 1

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS cz. 1 Wyższa Szkoła Ekologii i Zarządzania Informatyka Arkusz kalkulacyjny 2010 dla WINDOWS cz. 1 Slajd 1 Slajd 2 Ogólne informacje Arkusz kalkulacyjny podstawowe narzędzie pracy menadżera Arkusz kalkulacyjny

Bardziej szczegółowo

Wykład III. dr Artur Bartoszewski www.bartoszewski.pr.radom.pl. Wydział Nauczycielski, Kierunek Pedagogika Wprowadzenie do baz danych

Wykład III. dr Artur Bartoszewski www.bartoszewski.pr.radom.pl. Wydział Nauczycielski, Kierunek Pedagogika Wprowadzenie do baz danych Wydział Nauczycielski, Kierunek Pedagogika Wprowadzenie do baz danych dr Artur Bartoszewski www.bartoszewski.pr.radom.pl Wykład III W prezentacji wykorzystano fragmenty i przykłady z książki: Joe Habraken;

Bardziej szczegółowo

Edytor tekstu OpenOffice Writer Podstawy

Edytor tekstu OpenOffice Writer Podstawy Edytor tekstu OpenOffice Writer Podstawy Cz. 3. Rysunki w dokumencie Obiekt Fontwork Jeżeli chcemy zamieścić w naszym dokumencie jakiś efektowny napis, na przykład tytuł czy hasło promocyjne, możemy w

Bardziej szczegółowo

Stawiamy pierwsze kroki

Stawiamy pierwsze kroki Stawiamy pierwsze kroki 3.1. Stawiamy pierwsze kroki Edytory tekstu to najbardziej popularna odmiana programów służących do wprowadzania i zmieniania (czyli edytowania) tekstów. Zalicza się je do programów

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

1. Instalacja Programu

1. Instalacja Programu Instrukcja obsługi dla programu Raporcik 2005 1. Instalacja Programu Program dostarczony jest na płycie cd, którą otrzymali Państwo od naszej firmy. Aby zainstalować program Raporcik 2005 należy : Włożyć

Bardziej szczegółowo

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej. Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej. Dział Zagadnienia Wymagania podstawowe Wymagania ponadpodstawowe Arkusz kalkulacyjny (Microsoft Excel i OpenOffice) Uruchomienie

Bardziej szczegółowo

BIBLIOTEKA LOKALNE CENTRUM WIEDZY PRAKTYCZNEJ PRZEWODNIK PO NARZĘDZIACH WARSZTAT NR 1: ARKUSZE KALKULACYJNE - MINI SKRYPT

BIBLIOTEKA LOKALNE CENTRUM WIEDZY PRAKTYCZNEJ PRZEWODNIK PO NARZĘDZIACH WARSZTAT NR 1: ARKUSZE KALKULACYJNE - MINI SKRYPT BIBLIOTEKA LOKALNE CENTRUM WIEDZY PRAKTYCZNEJ PRZEWODNIK PO NARZĘDZIACH WARSZTAT NR 1: ARKUSZE KALKULACYJNE - MINI SKRYPT 1. Wprowadzenie Arkusze kalkulacyjne Google umożliwiają łatwe tworzenie, udostępnianie

Bardziej szczegółowo

WyŜsza Szkoła Zarządzania Ochroną Pracy MS EXCEL CZ.2

WyŜsza Szkoła Zarządzania Ochroną Pracy MS EXCEL CZ.2 - 1 - MS EXCEL CZ.2 FUNKCJE Program Excel zawiera ok. 200 funkcji, będących predefiniowanymi formułami, słuŝącymi do wykonywania określonych obliczeń. KaŜda funkcja składa się z nazwy funkcji, która określa

Bardziej szczegółowo

Jak korzystać z Excela?

Jak korzystać z Excela? 1 Jak korzystać z Excela? 1. Dane liczbowe, wprowadzone (zaimportowane) do arkusza kalkulacyjnego w Excelu mogą przyjmować różne kategorie, np. ogólne, liczbowe, walutowe, księgowe, naukowe, itd. Jeśli

Bardziej szczegółowo

KARTA INFORMACYJNA Z INFORMATYKI DO KLASY 6. Imię i nazwisko ucznia:

KARTA INFORMACYJNA Z INFORMATYKI DO KLASY 6. Imię i nazwisko ucznia: Bezwzrokowe pisanie na klawiaturze Mistrz klawiatury II 1. znam prawidłowe ułożenie rąk na klawiaturze 2. znam nazwy poszczególnych palców u rąk 3. 4. 5. w piątej klasie znaki (czyli: a, d, e, f, g, h,

Bardziej szczegółowo

Prezentacja multimedialna MS PowerPoint 2010 (podstawy)

Prezentacja multimedialna MS PowerPoint 2010 (podstawy) Prezentacja multimedialna MS PowerPoint 2010 (podstawy) Cz. 2. Wstawianie obiektów do slajdu Do slajdów w naszej prezentacji możemy wstawić różne obiekty (obraz, dźwięk, multimedia, elementy ozdobne),

Bardziej szczegółowo

Access - Aplikacja. Tworzenie bazy danych w postaci aplikacji

Access - Aplikacja. Tworzenie bazy danych w postaci aplikacji Tworzenie bazy danych w postaci aplikacji Access - Aplikacja 1. Otwórz plik zawierający bazę danych Wypożyczalni kaset video o nazwie Wypożyczalnia.mdb. 2. Utworzy kwerendę, która wyświetli tytuły i opisy

Bardziej szczegółowo

Produkcja by CTI. Proces instalacji, ważne informacje oraz konfiguracja

Produkcja by CTI. Proces instalacji, ważne informacje oraz konfiguracja Produkcja by CTI Proces instalacji, ważne informacje oraz konfiguracja Spis treści 1. Ważne informacje przed instalacją... 3 2. Instalacja programu... 4 3. Nawiązanie połączenia z serwerem SQL oraz z programem

Bardziej szczegółowo

DODAJEMY TREŚĆ DO STRONY

DODAJEMY TREŚĆ DO STRONY DODAJEMY TREŚĆ DO STRONY SPIS TREŚCI Pasek narzędzi i wyszukiwarka aplikacji... 2 Dodawanie portletów... 3 Widok zawartości stron... 4 Zawartość portletu... 5 Ikonki wybierz oraz dodaj zawartość stron...

Bardziej szczegółowo

FORMUŁY AUTOSUMOWANIE SUMA

FORMUŁY AUTOSUMOWANIE SUMA Wskazówki do wykonania Ćwiczenia 1, ocena sprawdzianu (Excel 2007) Autor: dr Mariusz Giero 1. Pobierz plik do pracy. W pracy należy wykonać obliczenia we wszystkich żółtych polach oraz utworzyć wykresy

Bardziej szczegółowo

MS Word 2010. Długi dokument. Praca z długim dokumentem. Kinga Sorkowska 2011-12-30

MS Word 2010. Długi dokument. Praca z długim dokumentem. Kinga Sorkowska 2011-12-30 MS Word 2010 Długi dokument Praca z długim dokumentem Kinga Sorkowska 2011-12-30 Dodawanie strony tytułowej 1 W programie Microsoft Word udostępniono wygodną galerię wstępnie zdefiniowanych stron tytułowych.

Bardziej szczegółowo

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9 Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9 Uruchamianie edytora OpenOffice.ux.pl Writer 9 Dostosowywanie środowiska pracy 11 Menu Widok 14 Ustawienia dokumentu 16 Rozdział 2. OpenOffice

Bardziej szczegółowo

Kolejne osoby możemy wyświetlać naciskając przyciski do przesuwania rekordów.

Kolejne osoby możemy wyświetlać naciskając przyciski do przesuwania rekordów. Wskazówki do wykonania Ćwiczenia 7, Korespondencja seryjna (Word 2007) ze strony http://logika.uwb.edu.pl/mg/ Autor: dr Mariusz Giero Narzędzie korespondencji seryjnej warto użyć, gdy naszym zadaniem jest

Bardziej szczegółowo

Instalacja PPPoE w systemie Windows XP za pomocą kreatora nowego połączenia sieciowego

Instalacja PPPoE w systemie Windows XP za pomocą kreatora nowego połączenia sieciowego Instalacja PPPoE w systemie Windows XP za pomocą kreatora nowego połączenia sieciowego System Windows XP posiada wbudowaną obsługę połączenia PPPoE, nazywa się to połączenie szerokopasmowe, wymagające

Bardziej szczegółowo

MS Excel 2007 Kurs zaawansowany Obsługa baz danych. prowadzi: Dr inż. Tomasz Bartuś. Kraków: 2008 04 25

MS Excel 2007 Kurs zaawansowany Obsługa baz danych. prowadzi: Dr inż. Tomasz Bartuś. Kraków: 2008 04 25 MS Excel 2007 Kurs zaawansowany Obsługa baz danych prowadzi: Dr inż. Tomasz Bartuś Kraków: 2008 04 25 Bazy danych Microsoft Excel 2007 udostępnia szereg funkcji i mechanizmów obsługi baz danych (zwanych

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Automatyzowanie zadan przy uz yciu makr języka Visual Basic

Automatyzowanie zadan przy uz yciu makr języka Visual Basic Automatyzowanie zadan przy uz yciu makr języka Visual Basic Jeśli użytkownik nie korzystał nigdy z makr, nie powinien się zniechęcać. Makro jest po prostu zarejestrowanym zestawem naciśnięć klawiszy i

Bardziej szczegółowo

Nagrywamy podcasty program Audacity

Nagrywamy podcasty program Audacity Pobieranie i instalacja Program Audacity jest darmowym zaawansowanym i wielościeżkowym edytorem plików dźwiękowych rozpowszechnianym na licencji GNU GPL. Jest w wersjach dla systemów typu Unix/Linux, Microsoft

Bardziej szczegółowo

MATERIAŁY - udostępnianie materiałów dydaktycznych w sieci SGH

MATERIAŁY - udostępnianie materiałów dydaktycznych w sieci SGH MATERIAŁY - udostępnianie materiałów dydaktycznych w sieci SGH SPIS TREŚCI i EKRANÓW WSTĘP Ekran1: Wstęp. Logowanie Ekran2: Strona początkowa UDOSTEPNIONE MATERIAŁY Ekran3: Dostępne materiały Ekran4: Zawartość

Bardziej szczegółowo

dokumentacja Edytor Bazy Zmiennych Edytor Bazy Zmiennych Podręcznik użytkownika

dokumentacja Edytor Bazy Zmiennych Edytor Bazy Zmiennych Podręcznik użytkownika asix 4 Edytor Bazy Zmiennych Podręcznik użytkownika asix 4 dokumentacja Edytor Bazy Zmiennych ASKOM i asix to zastrzeżone znaki firmy ASKOM Sp. z o. o., Gliwice. Inne występujące w tekście znaki firmowe

Bardziej szczegółowo

inż. Konrad Postawa Akademia Aktywnego Seniora Wolontariusza

inż. Konrad Postawa Akademia Aktywnego Seniora Wolontariusza inż. Konrad Postawa Akademia Aktywnego Seniora Wolontariusza W ramach programu: Organizator: Wrocław 2012 Arkusz kalkulacyjny MS Excel Wstęp ARKUSZ KALKULACYJN - MS EXCEL Po zapoznaniu się z podstawami

Bardziej szczegółowo

WYKONANIE APLIKACJI OKIENKOWEJ OBLICZAJĄCEJ SUMĘ DWÓCH LICZB W ŚRODOWISKU PROGRAMISTYCZNYM. NetBeans. Wykonał: Jacek Ventzke informatyka sem.

WYKONANIE APLIKACJI OKIENKOWEJ OBLICZAJĄCEJ SUMĘ DWÓCH LICZB W ŚRODOWISKU PROGRAMISTYCZNYM. NetBeans. Wykonał: Jacek Ventzke informatyka sem. WYKONANIE APLIKACJI OKIENKOWEJ OBLICZAJĄCEJ SUMĘ DWÓCH LICZB W ŚRODOWISKU PROGRAMISTYCZNYM NetBeans Wykonał: Jacek Ventzke informatyka sem. VI 1. Uruchamiamy program NetBeans (tu wersja 6.8 ) 2. Tworzymy

Bardziej szczegółowo

Formularz pierwszej oceny w służbie cywilnej

Formularz pierwszej oceny w służbie cywilnej Narzędzie informatyczne wspomagające dokonywanie pierwszej oceny w służbie cywilnej przygotowane w ramach projektu pn. Strategia zarządzania zasobami ludzkimi w służbie cywilnej współfinansowanego przez

Bardziej szczegółowo

Windows XP - lekcja 3 Praca z plikami i folderami Ćwiczenia zawarte w tym rozdziale pozwolą na tworzenie, usuwanie i zarządzanie plikami oraz folderami znajdującymi się na dysku twardym. Jedną z nowości

Bardziej szczegółowo

Podstawy tworzenia prezentacji w programie Microsoft PowerPoint 2007

Podstawy tworzenia prezentacji w programie Microsoft PowerPoint 2007 Podstawy tworzenia prezentacji w programie Microsoft PowerPoint 2007 opracowanie: mgr Monika Pskit 1. Rozpoczęcie pracy z programem Microsoft PowerPoint 2007. 2. Umieszczanie tekstów i obrazów na slajdach.

Bardziej szczegółowo

Instrukcja użytkownika OPERATORA Akademickiego Systemu Archiwizacji Prac

Instrukcja użytkownika OPERATORA Akademickiego Systemu Archiwizacji Prac Instrukcja użytkownika OPERATORA Akademickiego Systemu Archiwizacji Prac Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym

Bardziej szczegółowo

MS Excel. Podstawowe wiadomości

MS Excel. Podstawowe wiadomości MS Excel Podstawowe wiadomości Do czego służy arkusz kalkulacyjny? Arkusz kalkulacyjny wykorzystywany jest tam gdzie wykonywana jest olbrzymia ilość żmudnych, powtarzających się według określonego schematu

Bardziej szczegółowo

Instrukcja wprowadzania graficznych harmonogramów pracy w SZOI Wg stanu na 21.06.2010 r.

Instrukcja wprowadzania graficznych harmonogramów pracy w SZOI Wg stanu na 21.06.2010 r. Instrukcja wprowadzania graficznych harmonogramów pracy w SZOI Wg stanu na 21.06.2010 r. W systemie SZOI została wprowadzona nowa funkcjonalność umożliwiająca tworzenie graficznych harmonogramów pracy.

Bardziej szczegółowo

INSTRUKCJA OBSŁUGI PROGRAMU FOTOLASER

INSTRUKCJA OBSŁUGI PROGRAMU FOTOLASER INSTRUKCJA OBSŁUGI PROGRAMU FOTOLASER Okno startowe programu W jednym zamówieniu można wysłać do 1000 zdjęć Wybierz odpowiednią opcję : Przelew ( tylko poczta) Wybieramy w momencie kiedy zdjęcia mają być

Bardziej szczegółowo

ZAJĘCIA KOMPUTEROWE KLASA IV. Opis wymagań, które uczeń powinien spełnić, aby uzyskać ocenę:

ZAJĘCIA KOMPUTEROWE KLASA IV. Opis wymagań, które uczeń powinien spełnić, aby uzyskać ocenę: ZAJĘCIA KOMPUTEROWE KLASA IV Opis wymagań, które uczeń powinien spełnić, aby uzyskać ocenę: CELUJĄCĄ Opanował wiadomości i umiejętności wynikające z programu nauczania na ocenę bardzo dobrą i ponadto:

Bardziej szczegółowo

Co nowego w wersji 3.7 programu Invest for Excel

Co nowego w wersji 3.7 programu Invest for Excel Co nowego w wersji 3.7 programu Invest for Excel Copyright Datapartner Oy 2014 1 Spis treści Wygląd... 3 Dla których wersji Microsoft Excel program jest objęty wsparciem?... 3 Kod programu z podpisem cyfrowym...

Bardziej szczegółowo

1. Przypisy, indeks i spisy.

1. Przypisy, indeks i spisy. 1. Przypisy, indeks i spisy. (Wstaw Odwołanie Przypis dolny - ) (Wstaw Odwołanie Indeks i spisy - ) Przypisy dolne i końcowe w drukowanych dokumentach umożliwiają umieszczanie w dokumencie objaśnień, komentarzy

Bardziej szczegółowo

Trik 1 Edycja wykresu bezpośrednio w dokumencie Worda

Trik 1 Edycja wykresu bezpośrednio w dokumencie Worda :: Trik 1. Edycja wykresu bezpośrednio w dokumencie Worda :: Trik 2. Automatyczne usuwanie nadanych nazw zakresów :: Trik 3. Warunki przy określaniu jednostek miary :: Trik 4. Najszybszy sposób podświetlenia

Bardziej szczegółowo

Konfiguracja szablonu i wystawienie pierwszej aukcji allegro

Konfiguracja szablonu i wystawienie pierwszej aukcji allegro Konfiguracja szablonu i wystawienie pierwszej aukcji allegro Metod na wystawienie aukcji na allegro jest co najmniej 2. W pierwszej przechodzimy do zakładki MOJA SPRZEDAŻ, w USTAWIENIACH SPRZEDAŻY odnajdujemy

Bardziej szczegółowo