PQScut Podręcznik Użytkownika Dla wersji 2.0.2 (1.6.4)
Barbara Więckowska Katedra i Zakład Informatyki i Statystyki Uniwersytet Medyczny w Poznaniu Październik 2017-2 -
Spis Treści Wstęp... 4 Literatura... 4 Pobieranie i instalacja... 4 Wymagania sprzętowe:... 4 Wprowadzanie danych... 5 Wykonywanie testu... 7 Opcje... 9 Wyniki analizy... 10 Raport... 10 Mapy... 11 Kopiowanie z relacją... 12 Symulacja próbkowania... 12 Standaryzacja... 12 Standaryzacja... Błąd! Nie zdefiniowano zakładki. - 3 -
Wstęp Program PQScut jest rozwijany w celu detekcji skupień czasowych i czasowo-przestrzennych o istotnie wyższych współczynnikach niż zadana przez badacza wielkość. W rezultacie program lokalizuje skupienia, bada ich istotność statystyczną i nanosi je mapę. Analiza jest przeprowadzana na danych zagregowanych (wielokątach). Literatura Metoda CutL bazuje na teście dokładnym dla jednej proporcji. Dokładny opis metody można znaleźć w pracy: Więckowska B, Marcinkowska J. CutL: an alternative to Kulldorff s scan statistics for cluster detection with a specified cut-off level. Geospatial Health, 2017 Nov 6, 12(2) Pobieranie i instalacja Program PQScut może zostać pobrany ze strony Katedry i Zakładu Informatyki i Statystyki lub poprzez bezpośrednie podanie adresu: http://pqscut.ump.edu.pl Aby zainstalować program, wybierz jego ikonę i postępuj zgodne z instrukcją krok po kroku. Wymagania sprzętowe: Minimalne wymagania dla komputera, aby można było na nim uruchomić PQScut to: Procesor: Intel Pentum II 500MHz Pamięć RAM: 256MB Karta Graficzna: SVGA 800 600 Wolne miejsce na dysku: 0.2GB W przypadku wersji na nośniku CD: CD-ROM Inne : klawiatura, mysz Zainstalowany system operacyjny: Windows 2000/XP/Vista/7/8-4 -
Wprowadzanie danych Aby pliki mapy zostały wczytane poprawnie, program PQScut wymaga mapy wektorowej zapisanej jako SHAPEFILE. SHP, SHX Mapa wraz z przypisanym plikiem atrybutów może być wczytana do programu poprzez import plików SHP. Aby zaimportować pliki SHP należy wybrać menu: Plik Importuj dane... SHP/SHX/DBF ESRI Shapefile (*.shp) DBF Atrybuty przypisane do pliku kształtu mapy, w formie DBF, nie są wymagane do jej poprawnego oczytania prze program. Atrybuty mogą zostać dopisane po załadowaniu mapy do programu poprzez uzupełnienie odpowiednich komórek arkusza programu PQScut powiązanego z mapą. Dla każdego obiektu na mapie, w każdym opisanym wierszu arkusza należy umieścić informacje w postaci dwóch kolumn (liczności populacji narażonej i liczby osób doświadczających zdarzenia). - 5 -
ID Populacja Przypadki 1 548028 505 2 4896 2 3 3981 5 4 5658 7 5 9591 4 6 3011 2 7 4938 7 8 8664 11-6 -
Wykonywanie testu Okno ustawień przestrzennej wersji metody CutL może zostać otwarte poprzez menu: Analiza przestrzenna Statystyki przestrzenne CutL - przestrzenne Okno ustawień czasowo-przestrzennej wersji metody CutL może zostać otwarte poprzez menu: Analiza przestrzenna Statystyki przestrzenne CutL czasowo-przestrzenne Analiza jest wykonywana w oparciu o dane dotyczące liczności populacji narażonej, liczby przypadków doświadczających zdarzenia oraz macierzy sąsiedztwa przestrzennego wyznaczonej na podstawie mapy. Użycie macierzy sąsiedztwa: Macierz sąsiedztwa granic Queen jest domyślnie wybierana podczas analizy. Inna macierz może być również wykorzystana, ale wymaga to jej wcześniejszego przygotowania i wybrania w oknie analizy. Punkt odcięcia tzw. cut-off level jest wartością powyżej której poszukiwane będą istotne statystycznie skupienia i może zostać ustawiony w oknie analizy. Jeśli badacz nie poda wartości punktu odcięcia, wówczas punktem odcięcia jest wartość domyślna, czyli średnia dla całego obszaru poddanego analizie. - 7 -
- 8 - PQScut Podręcznik Użytkownika
Opcje Korekcja wielokrotnych porównań Następujące korekcje wielokrotnych porównań mogą być zastosowane: Bonferroni-Hochberg Sidak-Hochberg Benjamini-Hochberg Abdi H. (2007), Bonferroni and Sidak corrections for multiple comparisons", in N.J. Salkind (ed.): Encyclopedia of Measurement and Statistics. Thousand Oaks, CA: Sage) Hochberg Y. (1988), A sharper Bonferroni procedure for multiple tests of significance. Biometrika 75, 800 803 Benjamini Y. and Hochberg Y. (1995), Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society Series B 57, 289 300 Dodaj porównanie klaster/poza klastrem Dodatkowo dla każdego skupienia można dokonać porównania danych z wewnątrz skupienia z danymi poza skupieniem. W tym celu użyty zostaje test dokładny dla jednej proporcji porównujący częstość wewnątrz skupienia do wartości odniesienia, którą stanowi częstość poza skupieniem. - 9 -
Wyniki analizy Wynik analizy jest prezentowany w postaci raportu i mapy z nakładanymi warstwami. Raport - 10 -
Mapy By przedstawić wyniki na mapie należy uruchomić Menadżer Map poprzez menu: Analiza przestrzenna Menadżer map, Warstwy analizy mogą zostać nałożone na mapę poprzez w oknie menadżera map. Lista warstw na liście warstw znajdują się poszczególne warstwy tworzące mapę (przycisk na pasku narzędzi). Lista pozwala przełączać widzialność poszczególnych warstw i zmienić kolejność w jakiej warstwy są dodawane, pozwala na edycję warstw i ich usuwanie. Jeśli źródło warstwy (raport analizy lub mapa przypisana do warstwy) zostaje usunięte wówczas odpowiednia warstwa zostaje automatycznie usunięta z listy warstw. - 11 -
Dodatkowa funkcjonalność Kopiowanie z relacją Poprzez menu: Dane ->Kopiowanie z relacją możliwe jest automatyczne dołączanie własnych danych do danych mapy. Zbudowanie relacji możliwe jest na podstawie arkuszy posiadających ten sam klucz, czyli jednoznaczny identyfikator poszczególnych wiersz arkusza. Przy czym klucz arkusza źródłowego, z którego chcemy przekopiować dane do arkusza docelowego, musi być unikalny. Powiązanie odbywa się według relacji jeden-do-wielu, czyli jeden wiersz z arkusza źródłowego może przekopiowany do wielu wierszy arkusza docelowego. Symulacja próbkowania Poprzez menu: Dane ->Symulacja próbkowania możliwe jest automatyczne generowanie danych z rozkładu wielomianowego. Standaryzacja Poprzez menu: Dane-> standaryzacja możliwe jest wykonanie standaryzacji pośredniej i bezpośredniej. Procedura standaryzacji rozpoczyna się od wyboru populacji standardowej, wyboru zmiennych wikłających tzn. cech wg których dokonywana jest standaryzacja, np. wiek oraz wyboru rodzaju standaryzacji. W arkuszu danych należy wprowadzić odpowiednie dane w kolumnach w taki sposób, by wiersze wskazywały poszczególne kategorie cechy wg której dokonywana jest standaryzacja Dane potrzebne do przeprowadzenia standaryzacji bezpośredniej lub pośredniej opisane są w tabeli, przy czym podział na kategorie których dane dotyczą wyznacza cecha wikłająca. Dla standaryzacji bezpośredniej Dane populacji standardowej liczność w poszczególnych kategoriach lub proporcje poszczególnych kategorii, przy czym suma zdefiniowanych proporcji musi wynosić 1 Dane populacji badanej liczność chorych w poszczególnych kategoriach i liczność populacji badanej w tych kategoriach - 12 -
Dla standaryzacji pośredniej liczność chorych w poszczególnych kategoriach i liczność populacji standardowej w tych kategoriach lub surowe współczynniki częstości w poszczególnych kategoriach lub surowe współczynniki częstości w poszczególnych kategoriach liczność w poszczególnych kategoriach lub proporcje poszczególnych kategorii, przy czym suma zdefiniowanych proporcji musi wynosić 1 Wygładzanie przestrzenne Poprzez menu: Analiza przestrzenna->narzędzia->wygładzanie przestrzenne możliwe jest wygładzenie zmiennej przestrzennej poprzez lokalnie ważoną średnią, lokalnie ważoną medianę i empiryczną lokalną metodę Bayes a. - 13 -