TEORIA A RZECZYWISTOŚĆ PROCES POZYSKIWANIA I ANALIZY DANYCH W ŚWIETLE BUDOWANIA MODELU SYMULACYJNEGO OBSŁUGI KLIENTÓW BANKU

Wielkość: px
Rozpocząć pokaz od strony:

Download "TEORIA A RZECZYWISTOŚĆ PROCES POZYSKIWANIA I ANALIZY DANYCH W ŚWIETLE BUDOWANIA MODELU SYMULACYJNEGO OBSŁUGI KLIENTÓW BANKU"

Transkrypt

1 Prace Naukowe Instytutu Organizacji i Zarządzania Nr 80 Politechniki Wrocławskiej Nr 80 Studia i Materiały Nr Justyna UZIAŁKO * ss TEORIA A RZECZYWISTOŚĆ PROCES POZYSKIWANIA I ANALIZY DANYCH W ŚWIETLE BUDOWANIA MODELU SYMULACYJNEGO OBSŁUGI KLIENTÓW BANKU W pracy poruszono istotne kwestie dotyczące prowadzenia badań na obiekcie rzeczywistym w celu uzyskania i przeanalizowania danych wejściowych potrzebnych do budowy modelu symulacyjnego banku. Omówiono typowe problemy, które pojawiły się podczas gromadzenia danych, a następnie przedstawiono proces analizy napływu zgłoszeń do systemu oraz ich obsługi w tymże systemie. Przeprowadzono eksperymenty symulacyjne mające na celu ukazanie wpływu stopnia szczegółowości gromadzonych danych wejściowych, a także zastosowania różnych metod dobierania do nich rozkładów prawdopodobieństwa na otrzymane z eksperymentów wyniki. 1. WPRPOWADZENIE Proces pozyskiwania i analizy danych źródłowych to niezwykle ważny etap podczas budowy modelu symulacyjnego. Jest to kolejny krok występujący już po sformułowaniu problemu decyzyjnego oraz dogłębnym poznaniu badanego systemu [Sadoun 2000], [Seila i in. 2003]. Spójne realizowanie tych początkowych prac nad modelem ma znaczący wpływ na jego całokształt. Gruntowne przeanalizowanie działania systemu obsługi klientów, jakim jest bank powinno skutkować pozyskaniem takich kategorii informacji jak: dane jakościowe sposób zaprojektowania sali operacyjnej w banku, harmonogram pracy poszczególnych stanowisk, sposób rejestracji, a następnie obsługi klientów oraz dane ilościowe czasy przybywania klientów do banku, czasy ich oczekiwania na obsługę oraz czasy obsługi. Niezmiernie ważnym zagadnieniem jest tu również ustalenie, jaki horyzont czasowy oraz jak dużą liczbę klientów objąć badaniem, aby przeprowadzona analiza była wiarygodna w sensie od- * Politechnika Wrocławska, Instytut Organizacji i Zarządzania; justyna.uzialko@pwr.wroc.pl

2 34 Justyna Uziałko dania istoty działania systemu (pozytywne przejście etapu walidacji) oraz w sensie możliwości stawiania i testowania hipotez statystycznych. Przed przystąpieniem do etapu gromadzenia i interpretacji potrzebnych danych, należy sobie odpowiedzieć na pytanie, w jakim celu badacz symulacyjny będzie je pozyskiwał. W niniejszej pracy zaproponowano i krótko scharakteryzowano trzy kierunki prowadzenia badań symulacyjnych. Jak zasugerowano wcześniej, jednym z celów może być zbudowanie modelu przedstawiającego badany proces (np. obsługi klientów w banku), a następnie wykorzystanie go do analizy pracy systemu i zaproponowanie ewentualnych usprawnień [cel pierwszy]. Ponadto zebrane dane można wykorzystać także jako podstawę do zaprezentowania możliwości narzędzia, jakim jest model symulacyjny do zbadania działania systemu (co nie jest jednoznaczne z budowaniem modelu symulacyjnego na konkretne zamówienie ) [cel drugi] oraz aby przedstawić wpływ sposobu pozyskiwania danych i wyboru metody ich interpretacji na uzyskiwane wyniki z eksperymentów przeprowadzanych na danym modelu symulacyjnym [cel trzeci]. W przypadku realizowania celu pierwszego, czyli wówczas, gdy badacz symulacyjny ma za zadanie stworzenie konkretnego modelu symulacyjnego, który dokładnie i jak najbardziej wiarygodnie powinien przedstawiać działanie systemu rzeczywistego, konieczne jest ścisłe trzymanie się wszelkich statystycznych wymogów. Należy więc objąć badaniem taką ilość dni oraz taką liczbę klientów, jaką wskazuje metoda reprezentacyjna, a po zbudowaniu modelu i przeprowadzeniu jego weryfikacji i walidacji konieczne jest poprawne pod względem statystycznym przeanalizowanie wyników otrzymanych z przeprowadzonych eksperymentów. Nieco inaczej postąpić można natomiast w dwóch pozostałych przypadkach. Zalecane jest oczywiście wykonywanie kolejnych kroków pełnego badania symulacyjnego, jednak w przypadku pojawienia się różnych trudności, np. związanych z niewystarczającą ilością danych, ograniczonym czasem badania, jego zbyt wysokimi kosztami, realizuje się kolejne etapy, mając świadomość, że uzyskane wyniki stosowane mogą być jedynie do interpretacji poglądowych, a nie jako na przykład gotowe narzędzie do wspomagania procesu podejmowania decyzji dla danego systemu, w tym przypadku w banku. Badania analizowane w niniejszym artykule zostały przeprowadzone w roku 2004/2005 w jednym z polskich banków podczas przygotowywania pracy magisterskiej autorki. Obejmowały one automatyczny system kierowania przybywaniem i obsługą klientów, określanego dalej jako system kolejkowy. Głównie z uwagi na niewystarczający dostęp do danych ich celem nie było zbudowanie modelu symulacyjnego procesu obsługi klientów banku służącego jako gotowe narzędzie wykorzystywane do podejmowania decyzji, a jedynie jako zaprezentowanie szerokich możliwości symulacji w usprawnieniu procesu obsługi w banku; działania te opisano w artykule [Uziałko 2005]. W tej natomiast pracy skupiono się na trzecim z wymienionych wcześniej celów, czyli omówieniu różnych sposobów przedstawienia oraz analizy danych i ich wpływie na wyniki przeprowadzanych eksperymentów symulacyjnych.

3 Teoria a rzeczywistość proces pozyskiwania i analizy danych CHARAKTERYSTYKA MODELU SYMULACYJNEGO PRZEDSTAWIAJĄCEGO PROCES OBSŁUGI KLIENTÓW BANKU X Zbudowany model symulacyjny przedstawia proces obsługiwania klientów w banku za pomocą zautomatyzowanego systemu kolejkowego. Rozpoczyna się on rejestracją w kolejce z użyciem zainstalowanego w badanym oddziale automatu z biletami. Ponieważ jest on połączony z poszczególnymi stanowiskami przypisanymi pracownikom banku, po obsłużeniu kolejnego klienta pracownicy przekazują tę informację do systemu i przydzielana jest im następna osoba do obsługi. W związku z tym, że analizowany system charakteryzuje się orientacją zdarzeniową, więc omawiany w niniejszym artykule model zbudowano z użyciem symulacji dyskretnej, z wykorzystaniem oprogramowania Arena 5.0 na poziomie ufności 0,95 [Kelton i in. 2002]. Wśród operacji realizowanych we wspomnianym banku (schematyczny przebieg procesu obsługi klientów przedstawiono na rys.1) wyróżnić można dwie podstawowe kategorie: operacje gotówkowe przeprowadzane przede wszystkim w trzech pierwszych polach A-C (takie jak np. wpłata i wypłata gotówki w walucie polskiej, skup i sprzedaż walut obcych) oraz operacje bezgotówkowe przeprowadzane w kolejnych czterech obszarach D-G (takie jak np. obsługa rachunków bankowych, obsługa spraw związanych z użytkowaniem kart płatniczych). Należy tu także zaznaczyć, że wśród pól realizujących operacje gotówkowe polem gromadzącym największą liczbę klientów jest pole A (około 85%-90%), natomiast wśród pól świadczących operacje bezgotówkowe jest pole D (około 60%-65%). Szczegółowe informacje dotyczące omawianego modelu, takie jak rodzaje operacji realizowanych w poszczególnych polach, założenia przyjęte do budowy modelu czy sprawdzenie poprawności jego działania zawarto w pracy [Uziałko 2005]. 3. OMÓWIENIE PROCESU POZYSKIWANIA DANYCH WEJŚCIOWYCH 3.1. NAJWAŻNIEJSZE PROBLEMY Z DANYMI Jednym z najistotniejszych problemów z danymi w analizowanym systemie były pewne nieścisłości wynikające przede wszystkim z rozbieżności pomiędzy okresem, w którym przeprowadzano prace modelowe, a okresem z którego pozyskiwano dane. Wymienić tu można na przykład zmiany w organizacji poszczególnych pól, czyli dodawanie kolejnych pól lub ich redukcja, zmiany w godzinach otwarcia oddziału, zmiany harmonogramów pracy pracowników, błędy w działaniu automatu kolejkowego (np. niezgodność pomiędzy danymi na poziomie zbiorczym a na poziomie szczegółowym).

4 36 Justyna Uziałko Przybycie klientów ABC Przybycie klientów DEFG Jaki rodzaj grup operacji wybrano? Oczekiwanie na obsługę w polach ABC Oczekiwanie na obsługę w polach DEFG Czy stanowisko A, B lub C wolne? TAK Czy stanowisko D, E, F lub G wolne? TAK NIE NIE TAK Obsługa w polu A Obsługa w polu B Obsługa w polu C Wyjście z systemu klientów obsłużonych w polach A, B, C Czy dalsze czekanie? NIE Rezygnacja z obsługi w polach A - G Obsługa w polu D Obsługa w polu E Obsługa w polu F Obsługa w polu G Wyjście z systemu klientów obsłużonych w polach D, E, F, G Rys.1. Schemat obsługi klientów w banku X Źródło: Opracowanie własne Kolejnym problemem dotyczącym gromadzonych danych była ich niedostateczna ilość. Przede wszystkim zostały one pozyskane ze zbyt krótkiego okresu. Co prawda, w przypadku danych dotyczących napływania klientów a także danych zbiorczych

5 Teoria a rzeczywistość proces pozyskiwania i analizy danych opisujących pracę w dwóch grupach pól: A-C oraz D-G, ich ilość była odpowiednia, co stwierdzono na podstawie metody reprezentacyjnej, jednak na dalszym etapie prac modelowych pojawiła się konieczność uzyskania informacji bardziej szczegółowych i właśnie te dane, opisujące pracę w poszczególnych polach, zebrano już tylko z określonego odgórnie okresu trzech dni. Źródłem trudności okazała się też konieczność wyboru właściwych dni do badania. Pojawiały się bowiem takie, w których obsłużono zdecydowanie zbyt niską w porównaniu z innymi dniami liczbę klientów, co mogło na przykład wynikać z pewnych prac reorganizacyjnych w banku czy też konkretnej pory roku, a być może również w związku z usterkami technicznymi automatu rejestrującego proces przybywania i obsługi klientów. Nie bez znaczenia jest tu również fakt, że gromadzone dane pochodziły przede wszystkim z gotowych wydruków z banku i nie było możliwości osobistego zweryfikowania poprawności otrzymanych danych. Można tu oczywiście zastanowić się nad odrzuceniem dni wykazujących określoną anomalię (decyzja taka mogłaby na przykład polegać na analizowaniu danych ze zredukowanej liczby dni w przypadku wybranych pól, tych gdzie nieprawidłowości te były najbardziej znaczące), trzeba tu jednak postępować ostrożnie z uwagi na całkowitą niewielką ilość danych. Innym problemem były wspomniane już niezgodności pomiędzy raportami zbiorczymi a szczegółowymi i wynikająca z tego konieczność właściwego dopasowania zebranych danych do otrzymanego harmonogramu pracy pracowników banku; dane te wymagały wnikliwej analizy i samodzielnych obserwacji systemu tak, aby kierować się zarówno faktyczną liczbą obsłużonych klientów, jak i liczbą pracowników w poszczególnych polach. Omówione powyżej problemy wskazują na to, że podjęte decyzje dotyczące analizy różnych rodzajów danych w kwestii relacji pomiędzy zbudowanym modelem a systemem rzeczywistym przemawiają bardziej za potraktowaniem badanego systemu jako możliwego do zaistnienia w rzeczywistości, niż jednego konkretnego oddziału banku, w związku z czym przedstawiono go po prostu jako bank X ZASIĘG PRAC MODELOWYCH METODA REPREZENTACYJNA Dane ilościowe, które zebrano w celu budowy modelu symulacyjnego obejmowały czasy przybywania klientów do systemu, ich oczekiwania na obsługę oraz samego procesu obsługi. Początkowo zebrano zbiorcze dane czyli dotyczące dwóch kategorii klientów przybywających do pól A-C i D-G oraz procesu ich obsługi w tych grupach pól z okresu 17 dni; czyli pozyskano 68 raportów w formie papierowej, które następnie wprowadzono do arkusza kalkulacyjnego. Łączną ilość dni, z których pobierano dane konieczne do zbudowania poprawnego pod względem statystycznym modelu symulacyjnego wyznaczono na podstawie metody reprezentacyjnej. Za jednostki badania przyjęto zgłoszenia klientów do banku, natomiast jako cechy zgłoszeń rozpatrywano czas przybycia klientów do systemu oraz

6 38 Justyna Uziałko czasy ich obsługi zarówno w jednej jak i drugiej grupie pól. Przeprowadzone losowanie to losowanie zespołowe (brano pod uwagę pełne dni z całego ich zbioru w badanym okresie, co skutkowało włączeniem do próby wszystkich klientów, którzy przybyli w tych dniach do banku), nieograniczone (nie dzielono zbioru danych na poszczególne warstwy), zależne (nie wybierano ponownie wylosowanego już dnia). Ponadto przyjęto, że poziom ufności w przeprowadzanym badaniu będzie wynosił 0,95, czyli dopuszczalny błąd nie przekroczy 5%. Na podstawie uzyskanych raportów, w których zawarto informację dotyczącą liczby klientów przybyłych do banku w dziesięciominutowych przedziałach od godziny 7:30 do 20:00, możliwe było wyznaczenie średniego czasu, jaki upływał pomiędzy przybyciem następujących po sobie zgłoszeń do systemu w ciągu danego dnia, a następnie średniej ze wszystkich (w tym wypadku siedemnastu) dni. Analogiczną analizę przeprowadzono także dla średniego czasu upływającego pomiędzy obsłużeniem kolejnych klientów. W następnym kroku, wykorzystując takie informacje jak: liczebność jednostek losowania (liczba dni roboczych w danym roku), przeciętną liczbę przybyłych (i obsłużonych) klientów podczas analizowanej ilości dni, średni czas upływający pomiędzy przybyciem (i obsłużeniem) kolejnych klientów, wyznaczono konieczną ilość dni, z których pobiera się dane do badania. Przeprowadzona analiza wykazała, że potrzebne są dane z okresu przynajmniej 8 dni. Na tej podstawie ze zgromadzonych raportów dotyczących przybywania klientów i ich obsługi w ciągu 17 różnych dni wybrano raporty z 10 dni. 4. ANALIZA PROCESU DOBORU ROZKŁADÓW DO ZEBRANYCH DANYCH 4.1. ROZKŁAD OPISUJĄCY PROCES PRZYBYWANIA KLIENTÓW DO BANKU Proces przybywania klientów do banku to zagadnienie charakterystyczne dla systemów masowej obsługi. Ponieważ zgłoszenia w takim systemie jak bank pojawiają się w nim losowo i czas nadejścia zgłoszenia jest niezależny od poprzednich zgłoszeń, a także prawdopodobieństwo pojawienia się zgłoszenia w określonym przedziale czasu jest proporcjonalne do jego długości, więc dla potrzeb budowanego modelu można było przyjąć, że czas upływający pomiędzy przybyciem do banku dwóch kolejnych klientów ma rozkład wykładniczy. Ponadto, przy stwierdzeniu wykładniczego charakteru czasów pomiędzy kolejnymi pojawieniami się zgłoszeń w systemie, prawdopodobieństwo przybycia tam określonej liczby zgłoszeń można opisać za pomocą dyskretnego rozkładu Poissona. Należy tu także zdawać sobie sprawę z różnicy pomiędzy stacjonarnym a niestacjonarnym rozkładem Poissona; choć w obydwu przypadkach zgłoszenia powinny napływać do systemu pojedynczo, a czas przybycia kolejnego nie może zależeć od przybycia poprzedniego, to w tym pierwszym przypadku musi być również zachowane stałe średnie tempo napływania zgłoszeń w czasie, drugi

7 Teoria a rzeczywistość proces pozyskiwania i analizy danych natomiast opisuje zmienne tempo ich przybywania [Gordon 1974] i [Law i Kelton 1991]. Ze względu na swoją istotę (większość klientów zwykle przybywa we wczesnych godzinach rannych oraz w godzinach popołudniowych) sposób przychodzenia klientów do banku można opisać za pomocą niestacjonarnego rozkładu Poissona. Ponieważ model symulacyjny analizowanego procesu budowano z wykorzystaniem specjalistycznego oprogramowania symulacyjnego, możliwe było uwzględnienie niestacjonarności w napływaniu klientów. W tym celu połączono dane pochodzące z przedziałów dziesięciominutowych do okresów godzinnych odpowiednio dla pól A-C oraz D-G, następnie biorąc pod uwagę dane z 10 dni wyliczono średnie dla każdego jednogodzinnego przedziału i tak stworzone schematy przybywania klientów włączono do odpowiednich modułów programu ROZKŁADY OPISUJĄCE PROCES OBSŁUGI KLIENTÓW W realizowanej pracy sposób obsługi klienta w banku przedstawiono za pomocą dwóch podejść; z jednej strony poprzez analizę liczby klientów udających się do danego pola, a z drugiej strony na podstawie różnych rozkładów prawdopodobieństwa charakteryzujących upływające w poszczególnych obszarach czasy obsługi. Jak już wcześniej wspomniano, obsługa klientów w analizowanym banku odbywać się może w dwóch grupach pól operacji gotówkowych i operacji bezgotówkowych. Dlatego też, w zależności od rodzaju danych, jakimi dysponuje badacz symulacyjny, możliwe jest przedstawienie sposobu obsługi albo za pomocą tzw. rozkładów zbiorczych, stworzonych na podstawie wspólnych danych dla obydwu grup pól, albo z użyciem tzw. rozkładów szczegółowych (w przypadku możliwości pozyskania odpowiednich danych) zbudowanych na podstawie osobnych grup danych dla każdego z pól. Przeprowadzona obserwacja systemu zasygnalizowała, że traktowanie obsługi klienta w sposób ujednolicony, bez rozróżnienia przynajmniej na kategorie operacji, mogłoby zaburzyć obraz badanego procesu. Można by tu więc postawić hipotezę, że długości czasów obsługi w poszczególnych grupach pól są zależne od typu grupy, w której realizowana jest dana operacja. Przypuszczenia te potwierdza przeprowadzony dla takiego zestawienia danych rodzaj testu chi-kwadrat Chi Square Contingency Test [Hoover i Perry 1989]. Za pomocą tego testu zweryfikowano hipotezę H 0, że długość czasu obsługi nie zależy od typu operacji charakterystycznej dla określonego pola wobec hipotezy alternatywnej H 1, że czas trwania obsługi jest zależny od rodzaju wykonywanej operacji bankowej realizowanej w danym polu. Po wyznaczeniu odpowiednich wartości średnich podanych w tab.1. oraz wartości oczekiwanych przedstawionych w tab.2., wyliczono kwadraty różnic pomiędzy kolejnymi rzeczywistymi o ) a oczekiwanymi e ) czasami obsługi w poszczególnych ( ij ( ij

8 40 Justyna Uziałko przedziałach, podzielono je przez odpowiednie wartości oczekiwanego czasu obsługi i dokonano ich zsumowania. Obliczoną w ten sposób statystykę: n A n B 2 ( o ) 2 ij eij χ = = 38,61 (1) e i= 1 j= 1 porównano z kwartylem o (11-1)(2-1) stopniach swobody na poziomie ufności 0,95 równym χ 2 (0,95;10) = 18, 307 i ponieważ wyznaczona statystyka przewyższą tę wartość, w związku z tym należy odrzucić hipotezę H 0 na korzyść hipotezy H 1. Tab. 1. Średnia liczba klientów obsłużonych w kolejnych dziesięciominutowych przedziałach czasu w podziale na dwie grupy operacji z okresu 10 dni ij Liczba klientów Przedziały czasu w minutach Ponad Suma Pola A- 646,1 78,0 25,5 11,6 6,4 3,2 1,5 1,2 0,4 0,2 1,1 775,2 C Pola D- G 227,2 63,6 23,2 10,5 7,0 3,6 1,6 0,9 0,6 0,5 1,0 339,7 SUMA 873,3 141,6 48,7 22,1 13,4 6,8 3, ,0 0,7 2,1 1114,9 Tab. 2. Wyznaczona liczba klientów obsłużona w kolejnych dziesięciominutowych przedziałach czasu w podziale na dwie grupy operacji Liczba klientów Przedziały czasu w minutach Ponad Pola A-C 607,2 98,5 33,9 15,4 9,3 4,7 2,2 1,5 0,7 0,5 1,5 Pola D-G 266,1 43,1 14,8 6,7 4,1 2,1 0,9 0,6 0,3 0,2 0,6 Oznacza to, że długość czasu trwania obsługi zależy od rodzaju grupy pól, do której zalicza się realizowaną operację. Dysponując odpowiednią liczbą danych można by również przeprowadzić analogiczne badanie dotyczące zależności pomiędzy czasem obsługi a rodzajem już nie tylko grupy, ale i każdego z siedmiu pól możliwych operacji bankowych. Podczas wstępnych prac nad modelem postanowiono posłużyć się danymi zbiorczymi dla dwóch kategorii operacji i na ich podstawie, wykorzystując gotowe narzę-

9 Teoria a rzeczywistość proces pozyskiwania i analizy danych dzie w pakiecie symulacyjnym o nazwie Input Analyzer, dokonać dopasowania rozkładów czasów obsługi. Posłużono się wówczas danymi empirycznymi jako podstawą do przyjęcia rozkładu teoretycznego przedstawiającego losowe procesy obsługi klientów w badanym systemie. Zdecydowanie się na rozkłady teoretyczne mogłoby znacznie usprawnić dalsze prace modelowe, choćby ze względu na stosunkowo łatwe ich zmodyfikowanie w zależności od zmieniających się warunków eksperymentów. Istniało tu oczywiście niebezpieczeństwo zbytniego wygładzenia analizowanych procesów pojawiające się podczas stosowania rozkładów teoretycznych. Wątpliwości zostały rozwiane przez uzyskane wyniki prac nad doborem rozkładów, gdyż dla tych zbiorczych danych próba dopasowania teoretycznego nie powiodła się. Mimo bowiem zachowania relacji w wielkościach grup klientów udających się do poszczególnych pól, poprzestanie tylko na tym i posługiwanie się jedynie rozkładami zbiorczymi dla dwóch grup pól nie dało zadowalających rezultatów. Nie tylko bowiem napotkano na znaczne trudności w dobraniu rozkładów do zgromadzonych danych (zbyt niska wartość wskaźnika zwanego p-value), ale także po zdecydowaniu się na rozkłady empiryczne oparte na bezpośrednich obserwacjach systemu zbudowany model nie był w stanie zrealizować zaplanowanej ilości eksperymentów. Sytuacja ta została dokładnie opisana jako jeden z przeprowadzonych eksperymentów w dalszej części artykułu. Aby móc zbudować model symulacyjny, który pomyślnie przeszedłby proces weryfikacji oraz walidacji i mógłby zostać wykorzystany do przeprowadzenia eksperymentów symulacyjnych, zdecydowano się na pozyskanie dodatkowych danych, tym razem dotyczących czasów obsługi klientów osobno dla każdego z siedmiu pól. Ze względu na różne czynniki, m.in. ograniczony okres czasu przeprowadzanego wówczas badania czy znaczny wzrost skali badania wynikający ze zwiększenia jego szczegółowości, dane dotyczące czasów obsługi w poszczególnych polach pozyskano jedynie za okres 3 dni. Odpowiadająca temu okresowi ilość danych mogłaby być niewystarczająca do budowy modelu symulacyjnego, który miałby funkcjonować jako poprawne pod względem statystycznym narzędzie do wspomagania decyzji. Jednakże dla celów realizowanych w pracy [Uziałko 2005], gdzie skupiono się na możliwościach symulacji w usprawnianiu procesu obsługi klientów banku oraz w niniejszym artykule, w którym nacisk położono na omówienie skutków zastosowania różnych sposobów przedstawienia i analizy danych wejściowych, przyjęto wspomnianą długość okresu badania. Należy tu oczywiście mieć świadomość, że w zbiorze składającym się z niewielkiej ilości dni zgromadzone mogą być przez przypadek dane z okresów nietypowych dla całości procesu i w związku z tym przy doborze rozkładów zdecydować się, czy analizować dane ze wszystkich 3 dni. Takie modyfikacje również świadczą za tym, by nie traktować budowanego modelu jak dokładnego obrazu analizowanego banku, a jedynie jako system poglądowy, który mógłby zaistnieć w rzeczywistości. Na podstawie uzyskanych danych można było stworzyć albo rozkłady empiryczne w arkuszu kalkulacyjnym, albo rozkłady teoretyczne, używając do tego narzędzia

10 42 Justyna Uziałko Input Analyzer. W pierwszym przypadku proces dopasowywania rozkładów polegał na stworzeniu dystrybuanty empirycznej dla każdego z pól, w drugim natomiast próbowano dobrać różne rozkłady teoretyczne. Ten ostatni można było zrealizować na dwa sposoby: albo samodzielnie wybrać kilka rozkładów i sprawdzić jak zostaną one ocenione przez wspomniane narzędzie, albo też zdecydować się na opcję Fit All i oczekiwać, że program sam dokona optymalnego wyboru. Uzyskane wyniki dla prawie wszystkich pól okazały się zadowalające. Jedynie w polu o największej liczebności klientów zaistniała konieczność posłużenia się empirycznym rozkładem dyskretnym. Natomiast powodem zaakceptowania rozkładów w sześciu polach od B do G była wysoka wartość wskaźnika p-value albo dla testu Kołomogorowa-Smirnowa, albo dla testu chi-kwadrat, albo dla obydwu. Wskaźnik ten określa poprawność dopasowania danego rozkładu do zebranych danych poprzez ocenę wyników obydwu wspomnianych testów. Może on przyjmować wartości od 0 do 1 i im wyższą osiągnie wartość, tym dobranie rozkładu do danych okazuje się trafniejsze (przy czym wartość p-value na poziomie 0,05 lub niższym powoduje odrzucenie danego rozkładu). Oczywiście należy mieć świadomość, że w przypadku przeprowadzania badania symulacyjnego na potrzeby zbudowania modelu w pełni obrazującego analizowany system i stanowiącego podstawę do podejmowania różnych decyzji, opieranie się jedynie na wartości p-value może nie być wystarczające. W związku z tym, że rozkłady są tworzone w oparciu o losowo wybraną próbkę, wskaźnik ten może przyjmować różne wielkości dla różnych próbek wybranych z jednej populacji. Jednakże, jak już wielokrotnie zaznaczano, dla potrzeb prowadzonego badania zdanie się na tego typu statystykę testową uznano za wystarczające. Po takim przygotowaniu danych możliwe było zbudowanie modelu symulacyjnego procesu obsługi klientów banku, sprawdzenie poprawności jego działania i przeprowadzenie eksperymentów symulacyjnych, które dotyczyły różnych propozycji usprawnień funkcjonowania badanego systemu (naczelne kryterium odnosiło się do zwiększenia satysfakcji klientów z obsługi); wybrane eksperymenty zostały omówione w pracy [Uziałko 2005]. 5. PRZEPROWADZENIE EKSPERYMENTÓW SYMULACYJNYCH Dla potrzeb niniejszego artykułu zrealizowano trzy eksperymenty, których celem było przedstawienie wpływu stopnia szczegółowości pozyskiwanych danych wejściowych oraz wyboru różnych metod dopasowania do nich rozkładów prawdopodobieństwa na uzyskane z eksperymentów wyniki. Dane wykorzystane do przeprowadzenia kolejnych eksperymentów zostały zebrane z tego samego okresu losowo wybrano dni od poniedziałku do piątku w roku 2004/2005 i dotyczyły one tego samego procesu obsługi klientów banku. Należy tu także wspomnieć, że analizie pod-

11 Teoria a rzeczywistość proces pozyskiwania i analizy danych dano dane z pominięciem rzadko się pojawiających, najdłuższych czasów obsługi (stanowiły ostatnie 3% całości danych). Oczywiste jest, że w przypadku budowania modelu symulacyjnego służącego do wspomagania procesu podejmowania decyzji, należałoby się zastanowić nad braniem pod uwagę także tzw. ogonów rozkładów, czyli ekstremalnych zachowań systemu. Trudno jednak mówić o wyłapywaniu tego typu zjawisk w przypadku danych za okres trzech dni; w tej sytuacji nawet uwzględnianie takich resztkowych danych mogłoby negatywnie wpłynąć na relację pomiędzy poprawnością przedstawienia działania systemu, a zbudowanym dla niego rozkładem. Analiza wyników z przeprowadzonych eksperymentów powinna dać odpowiedź na pytanie, czy sposób przedstawienia danych wejściowych w kwestii stopnia ich szczegółowości oraz procedura określania dla nich rozkładu spowoduje różnice w otrzymywanych wynikach. W związku z charakterem pracy zaprezentowano jedynie dane wygenerowane z modelu dotyczące takich wartości, dla których istnieje możliwość porównania z wielkościami rzeczywistymi, czyli przedstawiające liczbę obsłużonych klientów w poszczególnych polach. Inne grupy danych wyjściowych, które zbudowany model jest w stanie wygenerować, takie jak m.in. wykorzystanie poszczególnych stanowisk roboczych czy średnie czasy oczekiwania w kolejkach do poszczególnych pól zostały przedstawione w artykule [Uziałko 2005]. Tab. 3. Przedstawienie średniej liczby osób obsłużonych w poszczególnych polach modelu (wraz z przypadkami rezygnacji z obsługi) Poszczególne pola Średnia liczba osób obsłużonych w modelu Przedział ufności i rezygnujących z obsługi (*) (Eksp.1) POLE A 597,90 7,89 POLE B 30,57 2,42 POLE C 60,53 3,19 POLE D 181,67 3,97 POLE E 11,93 1,33 POLE F 77,13 2,70 POLE G 13,37 1,63 POLE A* 80,33 10,93 POLE D* 34,60 5,21 Eksperyment 1 W celu otrzymania rozkładu prawdopodobieństwa opisującego proces obsługi klientów w banku posłużono się narzędziem Input Analyzer. Dopasowania rozkładów dokonywano w podziale nie tylko na grupy operacji, ale też na poszczególne pola. W wyniku analizy danych i dobierania do nich różnych rozkładów teoretycznych zadowalające wyniki otrzymano dla sześciu z siedmiu pól od B do G. W przypadku natomiast pola A, z powodu zbyt niskiej wartości wskaźnika p-value w proponowanych

12 44 Justyna Uziałko dla niego rozkładach, zdecydowano się na empiryczny rozkład dyskretny. Po dopasowaniu rozkładów przeprowadzono 30 powtórzeń symulacyjnych. Eksperyment 2 Podobnie, jak w poprzednim eksperymencie, dopasowania rozkładów dokonywano w podziale nie tylko na grupy operacji, ale też na poszczególne pola. W tym przypadku jednak, aby uzyskać rozkład prawdopodobieństwa charakteryzujący proces obsługi klientów w banku, wykorzystano arkusz kalkulacyjny i stworzono dystrybuanty rozkładu empirycznego dla każdego z siedmiu pól. Po dopasowaniu rozkładów przeprowadzono 30 powtórzeń symulacyjnych. Tab. 4. Przedstawienie średniej liczby osób obsłużonych w poszczególnych polach modelu (wraz z przypadkami rezygnacji z obsługi) Poszczególne pola Średnia liczba osób obsłużonych w modelu Przedział ufności i rezygnujących z obsługi (*) (Eksp.2) POLE A 593,30 7,88 POLE B 32,67 2,04 POLE C 59,93 2,94 POLE D 172,90 4,03 POLE E 11,83 1,27 POLE F 74,57 2,13 POLE G 13,77 1,42 POLE A* 86,40 8,81 POLE D* 43,17 5,38 Wyniki otrzymane w dwóch pierwszych eksperymentach można porównać testem dla dwóch prób zależnych [Nawojczyk 2002], gdzie analizie będą poddane różnice pomiędzy wszystkimi parami średnich z próby. Zagadnienie, które będzie tu rozpatrywane to wpływ sposobu analizy danych na uzyskane wyniki końcowe; przyjęcie hipotezy H 0 wskazywałoby na brak różnicy pomiędzy sposobami analizy danych w obydwu eksperymentach na otrzymane wyniki ( µ D = 0 ), a hipotezy alternatywnej H na jej istnienie. Zastosowana w teście statystyka ma postać: 1 t = s D D µ / N 1 p D (2) gdzie N p to ilość par w próbie, D średnia różnic wskazań w próbie, s D odchylenie standardowe różnic wskazań w próbie, wyliczane na podstawie wzoru:

13 Teoria a rzeczywistość proces pozyskiwania i analizy danych ( D D) sd = N p 2 (3) D to różnica pomiędzy wartościami z obydwu eksperymentów; w naszym przypadku różnice dla każdego z pól, natomiast µ D to średnia różnic wskazań dla możliwych par w populacji (przy postawionej w powyższy sposób hipotezie H 0 założono, że parametr ten będzie równy zero), ponadto ilość stopni swobody wynosi df N 1. = p Tab. 5. Analiza wyników z eksperymentów nr 1 oraz nr 2 Eksperyment 1 Eksperyment 2 D D D 2 ( D D) 597,90 593,30-4,6000-4, , ,57 32,67 2,1000 2,0448 4, ,53 59,93-0,6000-0,6552 0, ,67 172,90-8,7700-8, , ,93 11,83-0,1000-0,1552 0, ,13 74,57-2,5666-2,6218 6, ,37 13,77 0,4000 0,3448 0, ,33 86,40 6,0667 6, , ,60 43,17 8,5667 8, ,44563 Na tej podstawie wyliczono statystykę t=0,032 i wobec przyjętego zbioru krytycznego (, 2,306 > < 2,306, ) (dla 025 α 2 = 0, oraz 8 stopni swobody) można stwierdzić, że nie ma podstaw do odrzucenia hipotezy H 0, czyli w tym przypadku wybór jednego z dwóch przedstawionych sposobów analizy danych nie wpływa istotnie na otrzymane wyniki dotyczące średniej liczby osób opuszczających określone pola obsługi klientów. Eksperyment 3 W przeciwieństwie do dwóch poprzednich eksperymentów, w tym przypadku dopasowania rozkładów dokonano jedynie w podziale na dwie zbiorcze grupy operacji, bez uwzględniania obsługi w poszczególnych polach. Do zbudowania rozkładów prawdopodobieństwa opisujących proces obsługi klientów w banku, wykorzystano arkusz kalkulacyjny i stworzono dystrybuanty empiryczne dla jednej i drugiej kategorii operacji (rozkład wspólny dla pól A-C oraz rozkład wspólny dla pól D-G). Po dopasowaniu rozkładów tak jak we wcześniejszych eksperymentach planowano przeprowadzić 30 powtórzeń symulacyjnych. Niestety, udało się wykonać jedy-

14 46 Justyna Uziałko nie 23 pełne powtórzenia, podczas wykonywania powtórzenia nr 24, program zakomunikował błąd przeciążenia modelu. Tab. 6. Przedstawienie średniej liczby osób obsłużonych w poszczególnych polach modelu (wraz z przypadkami rezygnacji z obsługi) Poszczególne pola Średnia liczba osób obsłużonych w modelu Przedział ufności i rezygnujących z obsługi (*) (Eksp. 3) POLE A 550,29 12,33 POLE B 30,04 2,50 POLE C 61,17 2,98 POLE D 175,00 5,43 POLE E 12,37 1,23 POLE F 60,29 4,03 POLE G 12,87 1,92 POLE A* 126,38 10,63 POLE D* 36,37 6,18 Porównując wyniki otrzymane w powyższych badaniach symulacyjnych, przede wszystkim widać znaczną różnicę pomiędzy liczbą osób, które zrezygnowały z obsługi (szczególnie w polu A) w modelach z dwóch pierwszych eksperymentów w porównaniu z liczbą tego typu osób w eksperymencie ostatnim. Ma to też oczywiście przełożenie na mniejszą liczbę osób obsłużonych w tym polu w modelu z eksperymentu trzeciego w porównaniu z analogicznymi rezultatami dwóch pierwszych eksperymentów. Nie bez znaczenia jest również fakt, że model z ostatniego eksperymentu nie był w stanie wykonać wszystkich zaplanowanych powtórzeń, co przyczyniło się do większych niż w poprzednich badaniach przedziałów ufności i w efekcie mniej dokładnych wyników. 6. PODSUMOWANIE PRZEPROWADZONYCH EKSPERYMENTÓW Zrealizowane eksperymenty podkreślają wagę etapu gromadzenia i analizy danych wejściowych. W wyniku ich przeprowadzenia okazało się, że uzyskane wyniki zależą nie tyle od rodzaju użytego narzędzia wykorzystanego w procesie doboru rozkładów (w tym przypadku wybór pomiędzy gotowym narzędziem z pakietu symulacyjnego a arkuszem kalkulacyjnym), a od dogłębnego poznania badanego systemu. Ogromnie ważne w przypadku analizowanego w niniejszej pracy modelu było rozpoznanie, że czasy obsługi ściśle zależą od rodzaju pola, w którym są świadczone. Nie wystarczyło tu tylko rozgraniczenie realizowanych operacji bankowych na dwie kategorie (A-C oraz D-G); kluczowe dla możliwości wykorzystania modelu okazało się pozyskanie danych osobno dla każdego z pól i ujęcie wynikających z tego faktu różnic pomiędzy rozkładami w budowanym modelu.

15 Teoria a rzeczywistość proces pozyskiwania i analizy danych Ponadto, należy też mieć świadomość, że nie mniej ważne od samego procesu gromadzenia i analizy danych jest także odpowiednie sformułowanie celu realizowanego badania symulacyjnego, tak by przeprowadzone badania i uzyskane wyniki spełniły nasze oczekiwania. LITERATURA GORDON, G Symulacja systemów. WNT, Warszawa. HOOVER, S.V., PERRY, R.F Simulation. A Problem-Solving Approach. Addison-Wesley Publishing Company, Inc., New York. KELTON, W. D., SADOWSKI, R. P., SADOWSKI, D. A Simulation with Arena. McGraw- Hill Companies, Inc., New York. LAW, A. M., KELTON, W. D Simulation modeling & analysis. McGraw-Hill, Inc., New York. NAWOJCZYK, M Przewodnik po statystyce dla socjologów. SPSS Polska, Kraków. SADOUN, B Applied system simulation: a review study; [w:] Information Sciences 124; ss SEILA, A.F., CERIC, V., TADIKAMALLA, P Applied simulation modeling. Thomson Learning Inc. USA, Belmont. UZIAŁKO, J Zastosowanie modelowania symulacyjnego w usprawnieniu zarządzania procesem obsługi klientów banku. Praca magisterska. Wydział Informatyki i Zarządzania Politechniki Wrocławskiej. UZIAŁKO, J Zastosowanie modelowania symulacyjnego w usprawnieniu procesu obsługi klientów banku; [w:] Symulacja systemów społeczno-gospodarczych. Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław, ss

ZASTOSOWANIE MODELOWANIA SYMULACYJNEGO W USPRAWNIENIU PROCESU OBSŁUGI KLIENTÓW BANKU

ZASTOSOWANIE MODELOWANIA SYMULACYJNEGO W USPRAWNIENIU PROCESU OBSŁUGI KLIENTÓW BANKU Prace Naukowe Instytutu Organizacji i Zarządzania Nr 77 Politechniki Wrocławskiej Nr 77 Studia i Materiały Nr 19 2005 Justyna UZIAŁKO * ss. 45 60 ZASTOSOWANIE MODELOWANIA SYMULACYJNEGO W USPRAWNIENIU PROCESU

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY

Bardziej szczegółowo

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH WERYFIKACJA HIPOTEZ STATYSTYCZNYCH I. TESTY PARAMETRYCZNE II. III. WERYFIKACJA HIPOTEZ O WARTOŚCIACH ŚREDNICH DWÓCH POPULACJI TESTY ZGODNOŚCI Rozwiązania zadań wykonywanych w Statistice przedstaw w pliku

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Zawartość. Zawartość

Zawartość. Zawartość Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją

Bardziej szczegółowo

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie. STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis Elementy składowe sylabusu Nazwa jednostki prowadzącej kierunek Nazwa kierunku studiów Poziom kształcenia Profil studiów Forma studiów Kod przedmiotu Język przedmiotu Rodzaj przedmiotu Dziedzina i dyscyplina

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wprowadzenie

Testowanie hipotez statystycznych. Wprowadzenie Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,

Bardziej szczegółowo

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych 1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407 Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi

Bardziej szczegółowo

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N = HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki

Bardziej szczegółowo

Wykład 9 Testy rangowe w problemie dwóch prób

Wykład 9 Testy rangowe w problemie dwóch prób Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora

Bardziej szczegółowo

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Kilka uwag o testowaniu istotności współczynnika korelacji

Kilka uwag o testowaniu istotności współczynnika korelacji 341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności

Bardziej szczegółowo

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański KARTA KURSU (do zastosowania w roku akademickim 2015/16) Nazwa Statystyka 2 Nazwa w j. ang. Statistics 2 Kod Punktacja ECTS* 3 Koordynator Dr hab. Tadeusz Sozański (koordynator, konwersatorium) Zespół

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych. Wykład 14 Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych. Rozkład chi-kwadrat Suma kwadratów n-zmiennych losowych o rozkładzie normalnym standardowym ma rozkład

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

Definicje PN ISO Definicje PN ISO 3951 interpretacja Zastosowanie normy PN-ISO 3951:1997

Definicje PN ISO Definicje PN ISO 3951 interpretacja Zastosowanie normy PN-ISO 3951:1997 PN-ISO 3951:1997 METODY STATYSTYCZNEJ KONTROI JAKOŚCI WG OCENY ICZBOWEJ ciągła seria partii wyrobów sztukowych dla jednej procedury analizowana jest tylko jedna wartość, która musi być mierzalna w skali

Bardziej szczegółowo

1 Estymacja przedziałowa

1 Estymacja przedziałowa 1 Estymacja przedziałowa 1. PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanym parametrze µ i znanym σ. Przedział ufności: [ ( µ x u 1 α ) ( σn ; x + u 1 α

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na

Bardziej szczegółowo

laboratoria 24 zaliczenie z oceną

laboratoria 24 zaliczenie z oceną Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji gkrol@mail.wz.uw.edu.pl #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji 1 Ryzyko błędu - powtórzenie Statystyka niczego nie dowodzi, czyni tylko wszystko mniej lub bardziej prawdopodobnym

Bardziej szczegółowo

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Statystyka matematyczna. Wykład VI. Zesty zgodności

Statystyka matematyczna. Wykład VI. Zesty zgodności Statystyka matematyczna. Wykład VI. e-mail:e.kozlovski@pollub.pl Spis treści 1 Testy zgodności 2 Test Shapiro-Wilka Test Kołmogorowa - Smirnowa Test Lillieforsa Test Jarque-Bera Testy zgodności Niech x

Bardziej szczegółowo

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.

Bardziej szczegółowo

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1). PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem

Bardziej szczegółowo

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej, Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1 Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy

Bardziej szczegółowo

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna Ćwiczenie 4 ANALIZA KORELACJI, BADANIE NIEZALEŻNOŚCI Analiza korelacji jest działem statystyki zajmującym się badaniem zależności pomiędzy rozkładami dwu lub więcej badanych cech w populacji generalnej.

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Zadanie 1. Analiza Analiza rozkładu

Zadanie 1. Analiza Analiza rozkładu Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja

Bardziej szczegółowo

Matematyka i statystyka matematyczna dla rolników w SGGW

Matematyka i statystyka matematyczna dla rolników w SGGW Było: Testowanie hipotez (ogólnie): stawiamy hipotezę, wybieramy funkcję testową f (test statystyczny), przyjmujemy poziom istotności α; tym samym wyznaczamy obszar krytyczny testu (wartość krytyczną funkcji

Bardziej szczegółowo