METODY PROBABILISTYCZNE I STATYSTYKA SYLLABUS Opracował: prof. nadzw. dr hab. inŝ. Marek Cieciura Rozkład jazdy w zaświaty zawsze jest niedogodny - Jan Czarny, polski poeta, fraszkopisarz, prozaik, satyryk, tłumacz, autor scenariuszy filmów animowanych, plastyk Warszawa, wrzesień 2015
SPIS TREŚCI 1. ROZLICZENIE GODZINOWE...3 2. CELE ZAJĘĆ Z PRZEDMIOTU...3 3. ORGANIZACJA ZAJĘĆ...3 3.1. KLUCZOWE ZAŁOśENIA...3 3.2. TEMATY WYKŁADÓW...4 3.3. TEMATY ĆWICZEŃ...5 4. DODATKOWE MATERIAŁY ELEKTRONICZNE...5 4.1. KRZYśÓWKA...5 4.2. TEST 1...5 4.3. TEST 2...6 4.4. ZADANIA Z LUKAMI...6 4.5. ZADANIA OPISOWE...7 5. OCENA POSTĘPÓW STUDENTA...7 5.1. ĆWICZENIA...7 5.2. PORTAL ZAWIERAJĄCY DODATKOWE MATERIAŁY ELEKTRONICZNE...8 5.3 EGZAMINY...9 5.3.1. Zaliczenie przedmiotu na podstawie aktywności w semestrze...9 5.3.2. Egzamin w terminie podstawowym...9 5.3.3. Egzaminy poprawkowe...10 6. LITERATURA...10 6.1. PODSTAWOWA...10 6.2. DODATKOWA...10 7. PODSUMOWANIE...10 7.1. KLUCZOWY CEL PRZEDMIOTU...10 7.2. ŹRÓDŁA INFORMACJI...10 7.3. PUNKTY DODATKOWE...10 2
1. ROZLICZENIE GODZINOWE Rodzaj studiów Razem Wykłady Ćwiczenia Stacjonarne 60 30 30 Niestacjonarne 36 16 2. CELE ZAJĘĆ Z PRZEDMIOTU Przyswojenie wiedzy w zakresie: Podstawowych pojęć i metod rachunku prawdopodobieństwa i statystyki. Formułowania problemów w kategoriach rachunku prawdopodobieństwa i statystyki, zasad wyboru i stosowania odpowiednich metod do ich rozwiązywania oraz umiejętności interpretacji uzyskiwanych wyników. Funkcjonalności narzędzi obliczeniowych dla potrzeb rachunku prawdopodobieństwa i statystyki. Opanowanie umiejętności w zakresie: Obliczania prawdopodobieństw Estymacji parametrów rozkładu Weryfikacji hipotez statystycznych. Oceny zaleŝności statystycznej i korelacji dwóch zmiennych. Wykorzystania arkusza Excel w rozwiązywaniu zadań z rachunku prawdopodobieństwa i statystyki. 3. ORGANIZACJA ZAJĘĆ 3.1. Kluczowe załoŝenia W ramach procesu dydaktycznego występują następujące elementy: Wykłady, których tematy podano w punkcie 3. 2. Dwa repetytoria, których tematy podano w punkcie 3.2. Ćwiczenia rachunkowe, których tematy podano w punkcie 3.3. Laboratoria, których tematy podano w punkcie 3.3. Ankiety dotyczące: przedmiotu, wykładów, ćwiczeń i portalu - dostępne w portalu cieciura.net/ua i uwzględniane w terminie podstawowym Dodatkowe materiały elektroniczne, opisane w rozdziale 4 Oceny postępów studenta, których zasady opisano w rozdziale 5 Zadania domowe, których zawartość podano w punkcie 5.1. 3
3.2. Tematy wykładów Lp Temat ST NS 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. SPRAWY ORGANIZACYJNE: Rodzaje zajęć, Podręcznik, Portal, ebook, Zasady oceny postępów studenta, POJĘCIA WSTĘPNE: Populacja i jej cechy, Szeregi statystyczne, Metody badań statystycznych, Próba losowa, Części przedmiotu (statystyka opisowa, rachunek prawdopodobieństwa, statystyka matematyczna, przykłady zastosowań) PODSTAWY STATYSTYKI OPISOWEJ: Zadania statystyki opisowej, Szeregi statystyczne, Określanie miar opisowych zbiorowości, MoŜliwości obliczania miar opisowych zbiorowości, Ocena korelacji ZDARZENIA LOSOWE I PRAWDOPODOBIEŃSTWO: Zdarzenia elementarne, Relacje między zdarzeniami, Definicje prawdopodobieństwa, Prawdopodobieństwo warunkowe, P-stwo całkowite i wzór Bayesa, Zdarzenia niezaleŝne ZMIENNE LOSOWE JEDNOWYMIAROWE I DWUWYMIAROWE, SKOKOWE I CIĄGŁE: Określenie zmiennej losowej, Rodzaje zmiennych los., Określanie rozkładu zmiennej losowej, Rozkłady łączne, warunkowe i brzegowe PARAMETRY ROZKŁADU ZMIENNYCH LOSOWYCH: Wartość oczekiwana, Wariancja, Kowariancja i współczynnik korelacji WYBRANE ROZKŁADY ZMIENNYCH LOSOWYCH: Rozkłady skokowej zmiennej losowej (dwupunktowy, dwumianowy, geometryczny, Poissona), Rozkłady ciągłej zmiennej losowej (jednostajny, normalny, wykładniczy, chi-kwadrat, Studenta, Snedecora) TWIERDZENIA GRANICZNE: Twierdzenia integralne, Twierdzenia lokalne, Prawa wielkich liczb PODSTAWOWE STATYSTYKI I ICH ROZKŁADY: Pojęcie statystyki, Podstawowe statystyki dla jednej cechy populacji i ich rozkłady (średnia z próby, wariancje z próby), Podstawowe statystyki dla dwóch cech populacji i ich rozkłady (unormowane róŝnice średnich, iloraz wariancji) ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA: Zasady punktowej estymacji parametru rozkładu, Ocena estymatorów, Przykłady estymatorów, Metody wyznaczania estymatorów, Poziom ufności, Budowanie przedziału ufności, Przykłady przedziałów ufności WERYFIKACJA PARAMETRYCZNYCH I NIEPARAMETRYCZNYCH HIPOTEZ STATYSTYCZNYCH: Rodzaje hipotez, Konstrukcja i ocena testu, Przykłady testów parametrycznych (testy do weryfikacji hipotezy o wartości oczekiwanej, testy do weryfikacji hipotezy o równości 2 wartości oczekiwanych, Przykłady testów parametrycznych (test zgodności chi-kwadrat, test niezaleŝności chikwadrat, test zgodności rozkładów dla prób niepowiązanych test Wilcoxona) ANALIZA KORELACJI I REGRESJI: Szacowanie współczynnika korelacji (oszacowanie punktowe i przedziałowe), Weryfikacja hipotezy o współczynniku korelacji, Równanie regresji, Szacowanie współczynników regresji ZAAWANSOWANE METODY STATYSTYCZNE: Regresja wielokrotna, Analiza korelacji kanonicznej, Analiza skupień, Analiza czynnikowa, Wielowymiarowa analiza wariancji i analiza dyskryminacji 1 1 1 1 3 1 3 1 3 2 3 2 14. REPETYTORIUM Razem 30 16 4
Lp 3.3. Tematy ćwiczeń Temat Liczba godzin ST NS Rachunkowe (ręcznie) Laboratoryjne (arkusz Excel) 1. Statystyka opisowa 6 2 + + 2. Zdarzenia losowe i prawdopodobieństwo 3 1 + + 3. Zmienne losowe 3 1 + 4. Parametry rozkładu zmiennych losowych 3 2 + + 5. Wybrane rozkłady zmiennych losowych 3 2 + + 6. Praca kontrolna 1 1 + 7. Estymacja punktowa i przedziałowa 2 2 + + 8. Test t dla 1 próby, test t dla 2 prób niezaleŝnych, test t dla 2 prób zaleŝnych, Test nieparametryczny 3 2 + + dla 2 prób niezaleŝnych 9. Korelacja Pearsona i Spearmana, analiza regresji jednej zmiennej 3 2 + + Analiza algorytmów pod względem średniego zachowania, Obliczania niezawodności prostych 10. układów sprzętowych i systemów programowych, 2 0 + Analiza wydajności prostych układów sprzętowoprogramowych 11. Praca kontrolna 1 1 + + Razem 30 16 W extranecie w materiałach dydaktycznych będą sukcesywnie zamieszczane pliki z przykładowymi danymi do analizy statystycznej. 4. DODATKOWE MATERIAŁY ELEKTRONICZNE Dodatkowe materiały elektroniczne dostępne są pod adresem http://www.cieciura.net/mp Z wykorzystaniem zamieszczonych tam narzędzi komunikacji moŝna będzie uzyskać punkty dodatkowe, uwzględniane przy zaliczaniu przedmiotu patrz punkt 5.3. 4.1. KrzyŜówka Na wstępie zamieszczono w trybie NAUKA oddzielne krzyŝówki dla czterech części przedmiotu: STATYSTYKA OPISOWA, RACHUNEK PRAWDOPODOBIEŃSTWA, STATYSTYKA MATEMATYCZNA, ZASTOSOWANIA PROBABILISTYYKI, składające się w sumie z 139 haseł. KaŜda krzyŝówka udostępniana jest w 2 wersjach: elektronicznej i papierowej. Wersja elektroniczna moŝe być rozwiązywana bezpośrednio podczas wyświetlania na ekranie monitora - w kaŝdym momencie moŝna sprawdzić poprawność podanych haseł i procent wypełnienia krzyŝówki. Wersja papierowa składa jest z 2 plików zawierających szablon i objaśnienia haseł, które naleŝy wcześniej wydrukować. Dodatkowo udostępniono krzyŝówki w postaci elektronicznej dla trybu SPRAWDZANIE. KrzyŜówki są takŝe dostępne na urządzenia przenośne instrukcja. 5
4.2. Test 1 Test składa się z 23 pytań jednokrotnego i wielokrotnego wyboru. W pytaniach jednokrotnego wyboru przy kaŝdej z wyświetlanych odpowiedzi (oznaczanej małymi literami) występuje przycisk ze znakiem?. W pytaniach wielokrotnego wyboru przy kaŝdej z wyświetlanych odpowiedzi (oznaczanej duŝymi literami) występuje pole wyboru. W kaŝdym momencie moŝna uzyskać ocenę poprawności wybranych odpowiedzi. 4.3. Test 2 Test składa się z 51 pytań klasyfikacji, porządkowania i przyporządkowania - pogrupowanych w 4 działy: 1. Rachunek prawdopodobieństwa. 2. Statystyka matematyczna. 3. Procesy stochastyczne i zastosowania metod probabilistycznych w informatyce. 4. Uzupełnienia. Pytania testu sprawdzają opanowanie wiedzy w zakresie zgrupowanych logicznie pojęć. W pytaniach klasyfikacji, aby udzielić odpowiedzi dla pozycji wyświetlanej w I rzędzie nale- Ŝy rozwinąć menu dostępne w II rzędzie i wybrać jedną z pozycji. Pytania przyporządkowania i porządkowania przygotowano w wersji "Przeciągnij i upuść" (ang. drag and drop). W kaŝdym momencie moŝna uzyskać ocenę poprawności wybranych odpowiedzi. 4.4. Zadania z lukami W wersji SPRAWDZANIE zamieszczono 20 zadań (16 teoretycznych + 4 zadania są oznaczone). STATYSTYKA OPISOWA 1. Charakterystyki liczbowe 2. Opracowanie danych statystycznych 3. Charakterystyki liczbowe - zadanie RACHUNEK PRAWDOPODOBIEŃSTWA 4. Zdarzenia losowe 5. Zmienne losowe 6. Parametry rozkładu zmiennych losowych 7. Przykłady skokowych zmiennych losowych 8. Przykłady ciągłych zmiennych losowych 9. Twierdzenia graniczne STATYSTYKA MATEMATYCZNA 10. Pojęcia podstawowe statystyki matematycznej 11. Parametryczna estymacja punktowa 12. Parametryczna estymacja przedziałowa 13. Estymacja przedziałowa - zadanie 14. Weryfikacja hipotez parametrycznych 15. Weryfikacja hipotez nieparametrycznych 16. Weryfikacja hipotez statystycznych - zadanie 17. Analiza korelacji i regresji dwóch zmiennych 18. Ocena korelacji i analiza regresji - zadanie 6
ZASTOSOWANIA PROBABILISTYKI 19. Operacje na sygnałach ciągłych 20. Ocena wydajności oprogramowania metodami teorii masowej obsługi Zadania rozwiązywane z wykorzystaniem arkusza Excel W kaŝdym z zadań naleŝy ustawić kursor na kolejno wybierane luki i wypełniać je wpisując stosowny tekst. W kaŝdym momencie moŝna kliknąć na przycisk "Sprawdź". Podawany jest wtedy % prawidłowo wypełnionych luk. MoŜna zobaczyć teŝ treść poprawnych wypełnień, napisanych czcionką pogrubioną. 4.5. Zadania opisowe Zamieszczono 6 tematów: 1. Zmienne losowe i ich rozkłady. 2. Pojęcia wstępne statystyki. 3. Estymacja. 4. Weryfikacja hipotez. 5. Przegląd metod statystycznych. 6. Procesy stochastyczne i zastosowania. NaleŜy sporządzić charakterystyki zamieszczonych tematów z wykorzystaniem dostępnych słów kluczowych w postaci haseł pochodzących z krzyŝówki i testów, wybieranych z przewijanej listy. Wybrane słowa kluczowe naleŝy uzupełnić odpowiednim tekstem (w tym objaśnieniami haseł z krzyŝówki i testów), tak aby uzyskać wyczerpujący, spójny i logiczny opis o wymaganej objętości. Opisy wykonywane są w trybie on line, są one wyświetlane na bieŝąco na ekranie monitora. Po zakończeniu opisu wyświetlana jest "formalna" ocena opisu, bazująca na procencie wykorzystanych haseł i objętości opisu. Formalną ocenę pozytywną warunkuje wykorzystanie co najmniej 51% haseł, ocena ta nie uwzględnia "sensowności" opisu - co moŝe dokonać przysłowiowy expert. 4.6. ebook Opracowanie zawiera krótką charakterystykę 16 tematów metod probabilistycznych. 5. OCENA POSTĘPÓW STUDENTA 5.1. Ćwiczenia Na ćwiczeniach będą rozwiązywane zadania i pytania testowe z podręcznika podstawowego oraz udostępnionych materiałów. KaŜdą nieobecność naleŝy rozliczyć według ustaleń prowadzącego. Zadania domowe I) Dla zmiennej losowej X ciągłej o podanej gęstości obliczyć: a) dystrybuantę zmiennej losowej X, b) wartość oczekiwaną i wariancję zmiennej losowej X, c) Prawdopodobieństwo uzyskania wartości zmiennej losowej z podanego przedziału [a,b]. II) Zbadano opłaty za kupno przez telefon akcji o ustalonej wartości X wylosowanych biurach maklerskich (cecha X populacji) i otrzymano, Ŝe średnia opłata wynosi x zł, zaś odchylenie standardowe s zł. Zakładamy, Ŝe cecha X ma rozkład normalny. a) Znajdź przedział ufności dla wartości oczekiwanej opłaty za kupno akcji przez telefon, na poziomie ufności 1-α 1. b) Na poziomie istotności 0,05 sprawdź hipotezy: zerową, Ŝe wartość oczekiwana opłaty za kupno akcji przez telefon jest równa m 0 i alternatywną, Ŝe jest róŝna od m 0. 7
c) Znajdź przedział ufności dla wariancji opłaty za kupno akcji przez telefon, na poziomie ufności α 2. KaŜdy student otrzyma zadanie o róŝnych wartościach x, s, m 0, α 1 i α 2. Podstawa przyznawania punktów na ćwiczeniach Liczba punktów Obecność i aktywność i na ćwiczeniach 6 Sprawozdania z ćwiczeń laboratoryjnych 6 Zadania domowe 8 Dwie prace kontrolne 20 Razem 40 Warunkiem zaliczenia ćwiczeń jest uzyskanie co najmniej 21 punktów. Ocena z ćwiczeń określana jest zgodnie z poniŝsza tabelą: Ocena ndst dst dst½ db db½ bdb Punkty [0,21) [21-27) [27-31) [31-35) [35-38) [38-40) Za zaliczenie ćwiczeń moŝna uzyskać liczbę punktów dodatkowych równą: Ocena*4, czyli minimalnie 3*4=12 punktów, a maksymalnie 5*4=20 punktów 5.2. Portal zawierający dodatkowe materiały elektroniczne Podczas semestru moŝna uzyskać punkty dodatkowe za korzystanie z pomocy dydaktycznych i narzędzi komunikacji, udostępnionych w portalu według zasad podanych poniŝej. 1) Za rozwiązywanie zamieszczonych zadań: krzyŝówek i zadań z lukami Złota odznaka Srebrna odznaka : Procent poprawnych haseł 90 15 pkt : 80 Procent poprawnych haseł <90 10 pkt Brązowa odznaka : 70 Procent poprawnych haseł < 80-5 pkt Procent poprawnych haseł < 70: 2 pkt Procent poprawnych haseł określany jako iloraz sumy procentów prawidłowych odpowiedzi z 4 krzyŝówek i 20 zadań z lukami wi oraz maksymalnej wartości tej sumy (4+20)*100 = 24*100=2400 Uzyskane wyniki UWAGA: Dla stymulowania systematycznej nauki przyjęto następujące rozwiązanie. Dla poszczególnych narzędzi podany jest preferowany czas nauki - w tym okresie rejestrowane jest 100% poprawnie podanych odpowiedzi/haseł, podane okresy będą obowiązywać przez cały semestr. Poza podanymi okresami rejestrowane jest 50% poprawnie podanych odpowiedzi/haseł. Dla niektórych narzędzi na bieŝąco podawane będą krótkie okresy przyjazne studentowi (happy hour) w których rejestrowane będzie 75% poprawnie podanych odpowiedzi/haseł. 2) Za wykorzystanie narzędzi komunikacji Złota odznaka : Wpis do księgi gości i wypełnienie 4 ankiet - 5 pkt Srebrna odznaka : Wpis do księgi gości i wypełnienie 3 ankiet lub wypełnienie 4 ankiet - 4 pkt 8
Brązowa odznaka : Wpis do księgi gości i wypełnienie 2 ankiet lub wypełnienie 3 ankiet - 3 pkt Inna pozycja w zestawieniu 1 pkt Uzyskane wyniki 5.3 Egzaminy Warunkiem uczestnictwa w kaŝdym egzaminie jest wcześniejsze zaliczenie ćwiczeń. Uwzględnia się w/w punkty dodatkowe. 5.3.1. Zaliczenie przedmiotu na podstawie aktywności w semestrze Zaliczenie przedmiotu na ocenę 4 Warunki: Zaliczenie ćwiczeń co najmniej na ocenę 4 Złota odznaka za rozwiązywanie krzyŝówek i zadań z lukami : Procent poprawnych haseł 90 Złota odznaka za wykorzystanie narzędzi komunikacji : Wpis do księgi gości i wypełnienie 4 ankiet MoŜliwość poprawy w terminie podstawowym wystawiana jest wyŝsza z ocen. Zestawienie zbiorcze punktów dodatkowych i zaliczenie przedmiotu 5.3.2. Egzamin w terminie podstawowym Warunkiem uczestnictwa w egzaminie jest wcześniejsze zaliczenie ćwiczeń. Egzamin będzie się składał z dwóch części. Część I - w laboratorium komputerowym Zakres: 1 krzyŝówka + 2 zadania z lukami za kaŝde zadanie max. 20 punktów KrzyŜówka z całości terminologii 1 zadanie z lukami z teorii 1 zadanie z lukami z wykorzystania arkusza Excel Określenie wyniku I części egzaminu 1. Oblicza się premię uzyskaną za zaliczenia ćwiczeń, wyniki w rankingu oraz wykorzystanie narzędzi komunikacji - max 20 +15 + 5 = 40 punktów 2. Ocenia się składowe egzaminu x 1 liczba punktów za krzyŝówkę, max 20 punktów x 2 liczba punktów za zadania z lukami, za kaŝde max 20 punktów, zatem łącznie max 2*20=40 punktów Maksymalna liczba punktów x = x 1 + x 2 wynosi więc 20 + 40 = 60. 3. Na podstawie premii (0 p 40) i wyniku I części egzaminu x (0 x 60) oblicza się podstawę obliczenia oceny z = p + x (0 x 100) oraz określa ocenę zgodnie z tabelą: Ocena ndst dst dst½ db db½ bdb Punkty [0,50) [50-60) [60-70) [70,80] [80,90) [90,100] Warunkiem oceny pozytywnej jest otrzymanie co najmniej 50% z krzyŝówki Część II dla chętnych osób, które uzyskały z I części ocenę bdb. rozmowa w zakresie terminologii i podstawowych zagadnień 9
pozostałe sprawdziany (test1, test2, rozsypanki) oraz podstawy teoretyczne metod probabilistycznych i statystyki matematycznej, łącznie z dowodami wybranych twierdzeń w oparciu o własne notatki w przypadku niezgłoszenia lub słabej odpowiedzi ocena db½. 5.3.3. Egzaminy poprawkowe Warunkiem uczestnictwa jest wcześniejsze zaliczenie ćwiczeń Laboratorium komputerowe Zakres: jak cz. I egz. w terminie podstawowym + testy + rozsypanki udostępnione w portalu + dodatkowe zadania obliczeniowe 6. LITERATURA 6.1. Podstawowa [1] Marek Cieciura, Janusz Zacharski: Podstawy probabilistyki z przykładami zastosowań w informatyce (udostępniony w postaci elektronicznej w portalu http://cieciura.net/mp/ Pomoce Podręcznik) 6.2. Dodatkowa [2] Witold Konecki: Statystyka dla inŝynierów, PWN, Warszawa 1999. [3] Janusz Sosnowski: Testowanie i niezawodność systemów komputerowych, Exit, Warszawa 2005. [4] Oleg Tikhonenko: Metody probabilistyczne analizy systemów informacyjnych, Exit, Warszawa 2006. [5] Herman Kopetz: Niezawodność oprogramowania, WNT, Warszawa 1980 [6] Walenty Oniszczuk: Metody modelowania, Wydawnictwa Politechniki Białostockiej, Białystok 1995. [7] Krystyna Regina Bąk (red.): Statystyka wspomagana Excelem 2007, Oficyna Wydawnicza WyŜszej Szkoły Handlu i Prawa im. Ryszarda Łazarskiego w Warszawie, Warszawa 2010 [8] Thomas W.Pavkov, Kent A. Pierce: Wprowadzenie do SPSS dla Windows, Gdańskie Wydawnictwo psychologiczne, Gdańsk 2005 [9] Portal Studia informatyczne http://wazniak.mimuw.edu.pl Rachunek prawdopodobieństwa i statystyka. 7. PODSUMOWANIE 7.1. Kluczowy cel przedmiotu Zapoznanie się z wybranymi metodami analizy statystycznej oraz z przykładowymi pakietami statystycznymi w których są zaimplementowane. 7.2. Źródła informacji Wykłady Podręczniki Portal internetowy ebook 7.3. Punkty dodatkowe Nie jest obowiązkowe: Rozwiązywanie krzyŝówek i zadań z lukami Wypełnienie ankiet Wpisywanie się do Księgi gości Przyznawane za to punkty dodatkowe mogą spowodować zaliczenie przedmiotu bez egzaminu, a takŝe uzyskanie wyŝszej oceny z egzaminu. 10