I KONFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW
|
|
- Rafał Szczepaniak
- 9 lat temu
- Przeglądów:
Transkrypt
1 Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach I KONFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI 28 kwietnia 2005
2 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI 2
3 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 "Mogą nie być odległe takie czasy, w których zrozumie się, że do całkowitego wtajemniczenia dojrzałego obywatela (...), zdolność obliczania, myślenia w kategoriach wartości średnich, maksimów i minimów jest tak konieczna, jak teraz zdolność czytania i pisania" /Herbert G. Wells/ Coraz częściej można spotkać się na uczelniach wyższych z nauczaniem statystyki przy wykorzystaniu sprzętu komputerowego. Istniejące na rynku pakiety statystyczne, takie jak Statistica, SPSS, R, dają ogromne możliwości przeprowadzania różnego typu analiz statystycznych, a tym samym pogłębiania wiedzy z tego zakresu. Najczęściej jednak podczas zajęć ze statystyki wykorzystywany jest arkusz kalkulacyjny Excel, który choć nie posiada takich możliwości jak wspomniane wcześniej pakiety, to jednak ma tę przewagę, że pozwala przeprowadzać kolejne obliczenia krok po kroku, a tym samym zrozumieć całą ideę danego zagadnienia. Arkusz kalkulacyjny Excel posiada wbudowany moduł Analiza danych, przy użyciu którego można bardzo szybko otrzymać interesujące nas informacje. Moduł ten zawiera narzędzia między innymi do analizy regresji, korelacji, wariancji, otrzymania statystyk opisowych i inne. Podczas spotkań Koła Naukowego Statystyków zdecydowaliśmy się na rozbudowę modułu Analizy danych o dodatkowe narzędzia, które mogłyby być z powodzeniem wykorzystywane podczas zajęć ze statystyki. Członkowie koła przygotowali aplikacje, stworzone w języku Visual Basic for Application, dotyczące takich zagadnień jak: schematy losowania prób, klasyfikacja danych, metody wnioskowania na podstawie podprób, analiza bayesowska, wskaźnikowa analiza dynamiki zjawisk, testy sekwencyjne oraz wybrane testy parametryczne i nieparametryczne. Konferencja Wykorzystanie metod informatycznych w nauczaniu statystyki ma na celu zapoznanie jej Uczestników z pracami członków Koła. Koło Naukowe Statystyków powstało w roku 2002 z inicjatywy studentów kierunku Statystyka i Ekonometria na Akademii Ekonomicznej im. Karola Adamieckiego w Katowicach. Na naszych spotkaniach poruszane są różnorodne zagadnienia związane ze statystyczną analizą danych, a rezultaty naszej pracy prezentowane na konferencji stanowią jedynie tę część poruszanej na spotkaniach Koła problematyki, która jest związana z wykorzystaniem narzędzi programistycznych VBA w zagadnieniach statystycznych. 3
4 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI Program konferencji Koła Naukowego Statystyków Zastosowanie narzędzi informatycznych w procesie nauczania statystyki Katowice 28 kwietnia 2005 Akademia Ekonomiczna w Katowicach - Aula P 14:00 Otwarcie konferencji przez opiekuna Koła Naukowego Statystyków dr G.Kończaka 14:05 Wystąpienie kierownika Katedry Statystyki prof. dr hab. J.Wywiała 14:10 Bogdan Sokalski Wprowadzenie, Schematy losowania prób 14:30 Joanna Tomanek, Piotr Nowak Test zgodności chi kwadrat 14:45 Maria Czogała Wnioskowanie bayesowskie 15:00 Piotr Nowak Testy oparte na rangach 15:15 Joanna Tomanek Indeksy agregatowe wielkości absolutnych 15:30 Przerwa 15:50 Jan Acedański Testy sekwencyjne 16:05 Maria Czogała Metody wnioskowania na podstawie podprób 16:20 Bogdan Sokalski Metody klasyfikacji 16:35 Piotr Nowak Indeksy agregatowe wielkości stosunkowych 16:50 Maria Czogała System kontroli jakości w firmie produkcyjnej 17:05 Bogdan Sokalski Analiza danych program w języku Visual C++ 17:20 Zamknięcie konferencji 4
5 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 Analiza KNS dodatek do arkusza kalkulacyjnego Microsoft Excel Analiza KNS, przygotowana przez studentów Koła Naukowego Statystyków Akademii Ekonomicznej w Katowicach, jest dodatkiem do arkusza kalkulacyjnego Excel. Aby skorzystać z funkcji dostępnych w tym dodatku należy go zainstalować w arkuszu kalkulacyjnym. W tym celu w arkuszu kalkulacyjnym w menu Narzędzia wybieramy polecenie Dodatki (por. rys. 1) i w oknie dialogowym Dodatki wybieramy Przeglądaj. Rysunek 1. Okno dialogowe Dodatki Po wybraniu polecenia Przeglądaj wskazujemy położenie dodatku kns.xla (por. rys. 2). Rysunek 2. Okno dialogowe Przeglądaj wybór dodatku do zainstalowania 5
6 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI Po wykonaniu powyższych czynności dodatek Analiza KNS jest dostępny w menu Narzędzia programu Excel (por. rys. 3) Rysunek 3. Wybór Analizy KNS w menu programu Excel Po wybraniu polecenia Analiza KNS pojawia się okno dialogowe z dostępnymi dodatkowymi modułami analizy statystycznej (por. rys. 4). W tym oknie dialogowym dostępnych jest 9 następujących poleceń: 1. Indeksy agregatowe wielkości absolutnych 2. Indeksy agregatowe wielkości stosunkowych 3. Losowanie próby 4. Metody klasyfikacji 5. Metody wnioskowania na podstawie podprób 6. Test zgodności chi kwadrat 7. Testy sekwencyjne 8. Testy oparte na rangach 9. Wnioskowanie bayesowskie Po wybraniu interesującego nas modułu w pojawiającym się odpowiednim oknie dialogowym wprowadzamy (zaznaczamy) dane. Umieszczone w dodatku moduły zostały opisane w dalszej części niniejszego opracowania. 6
7 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 Rysunek 4.Okno dialogowe Analiza KNS wybór procedury Po wybraniu polecenia O programie (por. rys. 4) uzyskujemy informacje o osobach, które opracowały i przygotowały moduły składowe Analizy KNS. (por. rys. 5) Rysunek 5. Informacja o programie Dodatek Analiza KNS będzie zamieszczony na stronie internetowej Koła Naukowego Statystyków Akademii Ekonomicznej w Katowicach (kns.ae.katowice.pl) 7
8 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI Bogdan Sokalski Schematy losowania prób Obserwacja poziomów cech w bardzo licznych populacjach jest często niemożliwa i zawsze niesie za sobą ogromne nakłady czasu i kosztów. Z tego też powodu powstała teoria pozwalająca na wnioskowanie o populacjach na podstawie niewielkiej w stosunku do populacji grupy elementów. Problem polega na odpowiednim dobraniu grupy, aby wnioski na podstawie niej wyciągnięte mogły być przeniesione na całą populację. Wyróżnia się dwa sposoby wyodrębniania prób: Dobór celowy odbywa się na podstawie racjonalnych przesłanek, nie pozwala jednak na ocenę błędów oszacowania Dobór losowy odbywa się na podstawie schematu losowania, pozwala na ocenę błędów oszacowania Aby wystąpiła możliwość losowania próby trzeba dysponować spisem elementów populacji lub przynajmniej spisem ich rozłącznych podzbiorów zwanych zespołami Planem losowania nazywamy układ prawdopodobieństw, z którym powinny być wybierane zestawy elementów populacji do próby. Mechanizm losowania realizujący plan wyboru elementów populacji do próby według prawdopodobieństw warunkowych określonych na podstawie planu losowania nazywamy schematem losowania. Schematy losowania próby prostej możemy podzielić na dwa rodzaje: 1. Wariant zwrotny polega on na zwrotnym wylosowaniu elementów z stałym prawdopodobieństwem ich doboru do próby 2. Wariant bezzwrotny polega na bezzwrotnym wylosowaniu elementów z stałym prawdopodobieństwem ich doboru do próby 3. Wariant systematyczny spośród k pierwszych elementów losuje się jedne, a następnie wybiera się co k-ty element Podstawowe złożone schematy losowania można podzielić na 1. Grupowy losuje się grupy obiektów tak jak próbę prostą, każdy element wylosowanej grupy wchodzi do próby 8
9 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE Warstwowy proporcjonalny z każdej warstwy losowane jest taki odsetek elementów, jaki udział ma dana warstwa w liczebności całej populacji 3. Dwustopniowy na początku przeprowadza się losowanie grup, a drugi stopień losowania polega na wylosowaniu elementów spośród wylosowanych wcześniej grup. Procedura schematy losowania napisana w VBA dla arkusza kalkulacyjnego Excela pozwala losować próbę według następujących schematów: 1. Nieograniczone zależne (wariant bezzwrotny) 2. Nieograniczone niezależne (wariant zwrotny) 3. Systematyczne 4. Grupowe 5. Warstwowe proporcjonalne 6. Dwustopniowe Joanna Tomanek, Piotr Nowak Test zgodności chi kwadrat Test zgodnosci Chi kwadrat pozwala na sprawdzenie hipotezy, że populacja ma określony typ rozkładu. Dane: dana jest populacja o nieznanej dystrybuancie F(x) dana jest próba losowa o liczebności n pobrana z tej populacji Hipotezy: Hipoteza zerowa Badana zmienna ma rozkład typu W F(x) Ω Hipoteza alternatywna Badana zmienna nie ma rozkładu typu W 9
10 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI F(x) Ω Do weryfikacji postawionej hipotezy stosujemy statystykę: 2 χ = r i= 1 ( n np ) i np i i 2 gdzie: n wielkość próby r liczba klas wartości cechy n i liczebności klas wartości p i prawdopodobieństwa odpowiadające wartościom obserwowanym w próbie, zgodne Statystyka z testowym typem rozkładu 2 χ ma rozkład chi kwadrat z r-k-1 stopniami swobody, gdzie k jest liczbą szacowanych parametrów rozkładu. Obliczenia: obszar krytyczny w teście jest budowany prawostronnie 2 2 χ χ hipotezę zerową odrzucamy, gdy α 2 Moduł testu zgodności χ : Rysunek 1. Okno wprowadzania danych modułu 10
11 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 Rysunek 2. Przykładowy arkusz po wykonaniu testu Maria Czogała Wnioskowanie bayesowskie W ostatnich kilkudziesięciu latach, obok klasycznych metod statystycznych bardzo silnie rozwijał się nurt podejścia bayesowskiego. W odróżnieniu od wnioskowania klasycznego, które pozwala na szacowanie parametrów jedynie na podstawie informacji pochodzących z próby, wnioskowanie bayesowskie wykorzystuje dodatkowo informacje o rozkładach a priori badanych cech. Rozkłady a priori mogą być wyrazem subiektywnych odczuć statystyka, lub też mogą zostać uzyskane na podstawie informacji pochodzących z przeprowadzanych wcześniej badań lub eksperymentów. Dysponując rozkładami a priori oraz informacjami pochodzącymi z próby możemy wyznaczyć prawdopodobieństwa a posteriori wyróżnionych cech. Prawdopodobieństwa a posteriori otrzymujemy na podstawie wzoru Bayesa: P ( Θ / x) = n i= 1 P ( x / Θ) P( Θ) P ( x / Θ ) P( Θ ) i i 11
12 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI APLIKACJA Po uruchomieniu aplikacji Wnioskowanie bayesowskie pojawia się okno główne programu, w którym wyróżnione są dwie zakładki. Pierwsza z nich Rozkład empiryczny dotyczy sytuacji, gdy znane są empiryczne rozkłady a priori wyróżnionych cech. Jej wygląd przedstawia Rysunek 1. Rysunek 1 Po wybraniu tej zakładki użytkownik zaznacza obszar zawierający dane dotyczące frakcji ( Frakcja ) oraz obszar zawierający dane dotyczące empirycznych rozkładów a priori ( Prawdopodobieństwa a priori ). W kolejnym kroku określa on liczebność próby, na podstawie której otrzymał informacje dodatkowe ( Liczebność ). Liczebność próby jest wstępnie ustalona na 100 elementów, ale użytkownik może wpisać dowolną inną wartość. Ponadto użytkownik określa liczbę elementów wyróżnionych w próbie ( Liczba wyróżnionych ). Zakładka Rozkład teoretyczny powinna być wykorzystywana w sytuacjach, gdy zakładamy, że wartości cechy charakteryzują się określonym rozkładem a priori (program daje możliwość wyboru pomiędzy rozkładem równomiernym oraz dwumianowym, choć oczywiście wartości cechy mogą mieć również inne rozkłady). 12
13 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 Rysunek 2 Użytkownik po wybraniu zakładki Rozkład teoretyczny określa rodzaj rozkładu charakteryzującego wyróżnione cechy. W przypadku wyboru rozkładu równomiernego użytkownik zaznacza jedynie zakres zawierający dane oraz określa liczebność próby i liczbę wyróżnionych w próbie elementów (Rysunek 2). W przypadku wyboru rozkładu dwumianowego, użytkownik musi dodatkowo określić w uaktywnionym okienku ( p ) wartość parametru p (Rysunek 3). Rysunek 3 13
14 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI Po naciśnięciu przycisku Oblicz użytkownik otrzymuje wyniki przedstawione w postaci tabeli zawierającej rozkłady a priori oraz a posteriori. Dodatkowo wykreślone zostaną wykresy dla tych rozkładów. Piotr Nowak Testy oparte na rangach Dane: k populacji o ciągłych rozkładach, o nieznanych dystrybuantach F1(x), F2(x),..., Fk(x) próby losowe o liczebnościach ni (i = 1, 2,..., k) pobrane z tych populacji Hipotezy: Hipoteza zerowa H0:F1(x)= F2(x)=...= Fk(x) Hipoteza alternatywna rozkład badanej cechy nie we wszystkich populacjach jest taki sam Rangowanie: uporządkowanie wyników wszystkich prób od najmniejszego do największego wyniki numerujemy kolejnymi liczbami naturalnymi przy jednakowych wynikach przypisujemy średnią arytmetyczną odpowiednich liczb naturalnych Możliwe testy do wyboru: test Kruskala-Wallisa (k=3) test Kruskala-Wallisa (k>3) test Friedmana (n1= n2=...=nk) test rangowanych znaków Wilcoxona Obliczenia: obszar krytyczny w trzech pierwszych testach jest budowany prawostronnie hipotezę zerową odrzucamy, gdy 2 2 χ χ α 14
15 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 Moduł rangowych testów zgodności: Rysunek 1. Okno wprowadzania danych modułu testów rangowych Rysunek 2. Wygląd przykładowego arkusza z wynikami testu 15
16 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI Joanna Tomanek Indeksy agregatowe wielkości absolutnych Indeksy agregatowe wielkości absolutnych są wykorzystywane do statystycznego opisu dynamiki zjawisk gospodarczo-społecznych. W przeciwieństwie do wskaźników indywidualnych dają możliwość badania zjawisk złożonych i niejednorodnych. Przykładowo badając dynamikę ceny każdego artykułu oddzielnie (indeksy proste) nie ocenimy łącznej zmiany cen wszystkich artykułów danej grupy, a jest to istotne z punktu widzenia popytu i podaży. Wśród agregatowych indeksów wielkości absolutnych wyróżniamy: INDEKS WARTOŚCI I w Σwt = Σw Informuje o łącznych zmianach wartości wszystkich produktów w momencie badanym w stosunku do momentu podstawowego (wynikających zarówno ze zmian ilości jak i cen). INDEKS AGREGATOWY CEN Określa wpływ zmian cen na dynamikę wartości. INDEKS AGREGATOWY ILOŚCI Określa wpływ zmian ilości na dynamikę wartości. o I p / q = c Σ I q / p = c Σ Σp q p q t o Σq t o q c p c p c c W zależności od wyboru danej formuły standaryzacyjnej czynnik stały (q c lub p c ) przyjmowany jest z okresu podstawowego (formuła Laspeyresa) lub z okresu badanego (formuła Paaschego). Formuła Fishera to średnia geometryczna z indeksów wyznaczonych wg formuły Laspeyresa i Paaschego. Rys.1 przedstawia okno dialogowe pojawiające się przy wyborze opcji Indeksy agregatowe wielkości absolutnych. Użytkownik powinien tu zaznaczyć, jakie indeksy chce obliczyć oraz wprowadzić dane. Aby uzyskać dodatkowe wyjaśnienia wystarczy kliknąć na dane pole. Użytkownik może wprowadzić nazwę arkusza, w którym pojawią się odpowiednie wyniki, jeżeli tego nie zrobi program użyje nazwy domyślnej INDEKSY A. 16
17 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 Rysunek 1 Jan Acedański Testy sekwencyjne Moduł Testy sekwencyjne służy do weryfikacji hipotez statystycznych w oparciu o postępowanie sekwencyjne. Zgodnie z nim elementy do próby pobiera się stopniowo, za każdym razem badając, czy przy założonych prawdopodobieństwach popełnienia błędu I oraz II rodzaju α i β możliwe jest przyjęcie hipotezy podstawowej H 0 lub też odrzucenie jej na korzyść hipotezy alternatywnej H 1. Statystki testowe oparte są o ilorazową funkcję wiarygodności. Jej małe wartości świadczą na korzyść hipotezy H 0, duże na korzyść hipotezy alternatywnej. W praktyce dokonuje się przekształceń, tak by sprawdzian był prostą funkcją kolejnych elementów z próby, a wartości krytyczne zależały tylko od liczebności próby. Najważniejszą zaletą testów sekwencyjnych jest znaczne zmniejszenie liczebności próby, a więc i kosztów badania, stąd też ich szerokie stosowanie w statystycznej kontroli jakości oraz eksperymentach medycznych. Moduł pozwala na weryfikację 3 rodzajów hipotez prostych dotyczących wskaźnika struktury, średniej w rozkładzie normalnym oraz wariancji w rozkładzie normalnym. Dane wprowadzane mogą być na 2 sposoby: w naturalny dla testów sekwencyjnych sposób interaktywny (po kolei podawane są wartości kolejnych obserwacji), bądź też w postaci szeregu. 17
18 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI Konieczne jest też zadeklarowanie wielkości błędów α i β, specyfikacja hipotez oraz podanie wartości dodatkowego parametru w przypadku rozkładu normalnego. Efektem procedury jest decyzja odnośnie przyjęcia jednej z postawionych hipotez, bądź jej brak w przypadku zbyt małej próby. Dodatkowo możliwe jest wyznaczenie przeciętnej liczby obserwacji potrzebnych do podjęcia obu decyzji, a także prezentacja szczegółowych obliczeń dla kolejnych elementów próby. Na rys. 1 przedstawiono okno dialogowe modułu Testy sekwencyjne oraz rezultaty w arkuszu kalkulacyjnym otrzymywane po wykonaniu obliczeń. Rysunek 1 Maria Czogała Metody wnioskowania na podstawie podprób METODA BOOTSTRAP Coraz częściej do szacowania parametrów wykorzystywane są metody opierające się na algorytmach Monte Carlo. Jedną z takich metod jest metoda bootstrap, która po raz pierwszy została zaproponowana w pracach Efrona. Nazwa metody pochodzi z angielskiego wyrażenia to pull oneself up by one s bootstrap co można tłumaczyć jako wydobyć się z opresji z pomocą własnych sił. Wyrażenie to w bardzo dobry sposób ilustruje niejako działanie tej metody. 18
19 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 Metoda bootstrap polega na tym, że mając pewną próbę pochodzącą z populacji, dokonujemy n-krotnego losowania ze zwracaniem spośród elementów tej próby. Losowane podpróby są równoliczne. Liczba losowań podprób powinna wynosić co najmniej Jak łatwo zauważyć oryginalna próba traktowana jest tym sposobem jako populacja, z której losowane są n razy k-elementowe próby proste. Bootstrapowym estymatorem parametru Θ rozkładu zmiennej losowej X jest statystyka postaci: gdzie: ) n * 1 ) Θ = Θ n jest pewną ustaloną liczbą naturalną ( n 1000 ) Θ = Θ( *, ) dla k=1, 2,..., n, przy czym ) * k x k F n k = 1 * k * x k to k-ta próba bootstrapowa. Metoda bootstrap umożliwia również estymację przedziałową nieznanego parametru Θ. Znanych jest wiele podejść do tego zagadnienia. W tej aplikacji przedziały ufności wyznaczane są przy pomocy metody percentyli. METODA JACKKNIFE Inną metodą wykorzystującą algorytmy Monte Carlo jest metoda jackknife. Metoda ta pozwala na oszacowanie wariancji estymatora parametru. Polega ona na tym, że pochodzącą z populacji próbę dzielimy na zależne grupy o jednakowych liczebnościach. Dla każdej grupy obliczana jest wartość estymatora Θˆ parametru Θ, według tej samej reguły funkcyjnej, co estymator dla całej grupy, ale bazujący na obserwacjach nie należących do grupy. Dla każdej grupy są następnie wyznaczane pseudowartości według reguły funkcyjnej: gdzie: G- liczba zależnych grup, Θˆ - estymator parametru, ˆ ( g ) Θ - estymator parametru dla grupy. Θ ˆ Estymatorem jackknife nazywamy funkcję: g = GΘˆ ( G 1) Θˆ ( g ) Θˆ JK 1 = G G Θ ˆ g g = 1 19
20 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI Wariancję tego estymatora możemy określić na dwa sposoby: ) V JK1 ) V JK 2 1 = G G ( 1) 1 = G G ( 1) G ( Θˆ Θˆ g JK ) g= 1 G ( Θˆ g Θˆ ) g = APLIKACJA Po uruchomieniu aplikacji pojawia się okno główne programu. Wyróżnione są dwie zakładki - pierwsza pozwala na estymację parametru metodą bootstrap, druga służy do estymacji metodą jackknife. Rysunek 1 Na rysunku 1 przedstawiona jest zakładka programu służąca do estymacji metodą bootstrap. Użytkownik zaznacza zakres z danymi, następnie określa liczbę generowań próby bootstrapowej (Liczba powtórzeń) oraz jej liczebność (Próba bootstrap). Użytkownik może zdecydować o wyznaczeniu również przedziału ufności. Wystarczy wówczas zaznaczyć pole Przedział ufności i określić poziom ufności (poprzez wybranie odpowiedniej wartości z rozwijalnej listy lub wpisaniu wartości przez użytkownika). Rysunek 2 przedstawia zakładkę programu służącą do estymacji parametru metodą jackknife. 20
21 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 Rysunek 2 Użytkownik zaznacza obszar z danymi oraz określa liczbę grup, na którą oryginalna próba zostanie podzielona. Może on zdecydować również o wyznaczeniu wariancji estymatora jackknife, poprzez zaznaczenie odpowiedniego pola. Po wybraniu przycisku Wykonaj w nowym arkuszu użytkownik otrzyma wyniki przeprowadzonych analiz. Warto również podkreślić, że w aplikacji dostępne jest okienko pomocy, które na każdym etapie informuje użytkownika o tym, jakich informacji oczekuje program w kolejnym kroku. Bogdan Sokalski Metody klasyfikacji Metody klasyfikacji mają szerokie zastosowanie w dzisiejszym świecie. Stosuje się przede wszystkim w celu zredukowania dużej ilości informacji do kilku podstawowych kategorii, co pozwala na zmniejszenie nakładów czasu i kosztów badań oraz określenie jednorodnych przedmiotów analizy. Problem klasyfikacji sprowadza się do podziału całej populacji na niepuste zbiory elementów podobnych do siebie i zarazem istotnie różnych od elementów innych klas. Wyróżniamy trzy grupy metod klasyfikacji: 1. Metody hierarchiczne 2. Metody podziału 21
22 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI 3. Metody prezentacji graficznej Wśród metod hierarchicznych można wyróżnić dwie grup: 1. Metody aglomeracyjne wyjściem są jednoelementowe skupienia a wynikiem jeden zbiór zawierający wszystkie elementy 2. Metody deglomeracyjne wyjściem jest jedno skupienie a wynikiem są jednoelementowe zbiory Algorytm metod hierarchicznych opiera się na każdym etapie na połączeniu dwóch najbliższych obiektów wedle ustalonego kryterium dopóki nie otrzyma się zbioru zawierającego wszystkie elementy. Wśród kryteriów łączenia obiektów wyróżnia się: 1. Metodę najbliższego sąsiedztwa (single linkage) 2. Metodę najdalszego sąsiedztwa (complete linkage ) 3. Średniej odległości (group average linkage ) 4. Ważonej średniej odległości (weighted average linkage ) 5. Warda (incremental sum of squares) 6. Środka ciężkości (centroid) 7. Medianowa (median) Kryteria te często są rozbieżne tworząc różne schematy klasyfikacji. W literaturze jako najbardziej skuteczną zauważ się kryterium Warda oparte na sprawdzaniu w każdym kroku sumy kwadratów odległości od środków ciężkości i łącząc te obiekty, które tą sumę najmniej powiększają. Problemem metod hierarchicznych jest to, że nie wskazują optymalnej liczby klas. Stosując jednak proste miary oparte na średnim poziomie połączenia klas można tą optymalną liczbę klas wyznaczyć. Procedura klasyfikacja napisana w VBA dla arkusza kalkulacyjnego Excel zawiera następujące funkcje: 1. Pozwala na wybór rodzaju danych (dane ilościowe, binarne lub w postaci tablicy odległości) 2. Przekształca dane wejściowe w celu wyrównania wpływu każdej zmiennej na wynik klasyfikacji. Do wyboru są następujące przekształcenia: standaryzacja, normalizacja, unitaryzacja oraz przekształcenie ilorazowe. 3. Pozwala na wybór metody wyznaczania odległości: a) Dla danych ilościowych dostępne są : euklidesowa, kwadrat euklidesowej, miejska, Czebyszewa, Minkowskiego, Braya Curtisa, Canberra, Clarka 22
23 I KOFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW KATOWICE 2005 b) Dla danych biarnych dostępne są : Sokala i Michenera, Jaccarda, Czekanowskiego, Rogersa i Tanimoto 4. Wybór kryterium klasyfikacji. Dostępne są następujące kryteria: najbliższego sąsiedztwa, najdalszego sąsiedztwa, średniej odległości, ważonej średniej odległości, Warda, środka ciężkości, medianowa. 5. Wynik w postaci tablicy odległości, dendrogramu oraz poziomu połączenia klas na każdym z etapów. Piotr Nowak Indeksy agregatowe wielkości stosunkowych Wielkości stosunkowe są wskaźnikami natężenia wyrażającymi stosunek dwóch zjawisk logicznie ze sobą powiązanych. Przykładami mogą być: wydajność pracy (iloraz produkcji i czasu pracy) koszt jednostkowy (iloraz nakładów i wielkości produkcji) Każdą wielkość stosunkową można rozpatrywać jako ogólną (zespołową) lub cząstkową (jednostkową). Na przykład: stosunek liczby zgonów do ogólnej liczby ludności jest wielkością ogólną, iloraz liczby zgonów w grupie wiekowej lat do liczby ludności w tym wieku to wielkość cząstkowa Wielkości stosunkowe cząstkowe zapisujemy w postaci ułamka: X = a x = b Wielkości stosunkowe całkowite zapisujemy w postaci ułamka: Wartość indeksu wszechstronnego jest wypadkową działania dwóch czynników: A B dynamiki cząstkowych wielkości stosunkowych zmian w strukturze czynnika a lub czynnika b = a b 23
24 ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI Istnieją trzy sposoby liczenia indeksów wielkości stosunkowych ze względu na dane przyjęte jako podstawowe: formuła Laspeyresa formuła Paaschego formuła Fischera (średnia geometryczna wyników obu tych formuł) Moduł indeksów agregatowych wielkości stosunkowych: Rysunek 1 Rysunek 2 Rysunek 3 Rysunek 4 Rysunki 1,2,3 kolejne strony modułu indeksów agregatowych wielkości stosunkowych Rysunek 4 przykładowa zawartość arkusza danych po uruchomieniu modułu na zadanych danych 24
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Spis treści 3 SPIS TREŚCI
Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15
IV WYKŁAD STATYSTYKA 26/03/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 4 Populacja generalna, próba, losowanie próby, estymatory Statystyka (populacja generalna, populacja próbna, próbka mała, próbka duża, reprezentatywność,
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów
Wstęp do probabilistyki i statystyki Wykład 4. Statystyki i estymacja parametrów dr hab.inż. Katarzyna Zakrzewska, prof.agh, Katedra Elektroniki, WIET AGH Wstęp do probabilistyki i statystyki. Wykład 4
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną
Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia
TESTOWANIE HIPOTEZ STATYSTYCZNYCH
TETOWANIE HIPOTEZ TATYTYCZNYCH HIPOTEZA TATYTYCZNA przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści
Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, 2018 Spis treści Przedmowa 13 O Autorach 15 Przedmowa od Tłumacza 17 1. Wprowadzenie i statystyka opisowa 19 1.1.
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Wykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW
Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa
Zawartość. Zawartość
Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański
KARTA KURSU (do zastosowania w roku akademickim 2015/16) Nazwa Statystyka 2 Nazwa w j. ang. Statistics 2 Kod Punktacja ECTS* 3 Koordynator Dr hab. Tadeusz Sozański (koordynator, konwersatorium) Zespół
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.
Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy
Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2017/2018 STATYSTYKA
Grupowanie materiału statystycznego
Grupowanie materiału statystycznego Materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji statystycznej lub pomiaru, należy odpowiednio usystematyzować i pogrupować. Doskonale nadają się do
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1
Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1 Przykład wprowadzający Wiadomo, Ŝe 40% owoców ulega uszkodzeniu podczas pakowania automatycznego.
KARTA KURSU. Kod Punktacja ECTS* 1
KARTA KURSU Nazwa Nazwa w j. ang. Wprowadzenie do statystyki Introduction to statistics Kod Punktacja ECTS* 1 Koordynator Prof. dr hab. Jerzy Wołek Zespół dydaktyczny Prof. dr hab. Jerzy Wołek doktoranci
Z poprzedniego wykładu
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22
Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Przykład 1. (A. Łomnicki)
Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele
WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO
Zał. nr 4 do ZW WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA STOSOWANA Nazwa w języku angielskim APPLIED STATISTICS Kierunek studiów (jeśli dotyczy): Specjalność
SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA
SPIS TEŚCI PRZEDMOWA...13 CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA 1. ZDARZENIA LOSOWE I PRAWDOPODOBIEŃSTWO...17 1.1. UWAGI WSTĘPNE... 17 1.2. ZDARZENIA LOSOWE... 17 1.3. RELACJE MIĘDZY ZDARZENIAMI... 18 1.4.
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Statystyka opisowa. Wykład I. Elementy statystyki opisowej
Statystyka opisowa. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Elementy statystyku opisowej 1 Elementy statystyku opisowej 2 3 Elementy statystyku opisowej Definicja Statystyka jest to nauka o
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Testowanie hipotez statystycznych
Temat Testowanie hipotez statystycznych Kody znaków: Ŝółte wyróŝnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Idea i pojęcia teorii testowania hipotez
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.
Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej
laboratoria 24 zaliczenie z oceną
Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne
1 Estymacja przedziałowa
1 Estymacja przedziałowa 1. PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ (a) MODEL I Badana cecha ma rozkład normalny N(µ, σ) o nieznanym parametrze µ i znanym σ. Przedział ufności: [ ( µ x u 1 α ) ( σn ; x + u 1 α
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 2 1 / 20 MIARY ROZPROSZENIA, Wariancja Wariancją z próby losowej X
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407
Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde badanie naukowe rozpoczyna
LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.
LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja
Statystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
5. Model sezonowości i autoregresji zmiennej prognozowanej
5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =
Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14
Statystyka #6 Analiza wariancji Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2015/2016 1 / 14 Analiza wariancji 2 / 14 Analiza wariancji Analiza wariancji jest techniką badania wyników,
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych
Wnioskowanie statystyczne i weryfikacja hipotez statystycznych Wnioskowanie statystyczne Wnioskowanie statystyczne obejmuje następujące czynności: Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków
Weryfikacja hipotez statystycznych za pomocą testów statystycznych
Weryfikacja hipotez statystycznych za pomocą testów statystycznych Weryfikacja hipotez statystycznych za pomocą testów stat. Hipoteza statystyczna Dowolne przypuszczenie co do rozkładu populacji generalnej