METODY PROBABILISTYCZNE I STATYSTYKA SYLLABUS Opracował: prof. nadzw. dr hab. inŝ. Marek Cieciura Rozkład jazdy w zaświaty zawsze jest niedogodny - Jan Czarny, polski poeta, fraszkopisarz, prozaik, satyryk, tłumacz, autor scenariuszy filmów animowanych, plastyk Warszawa, wrzesień 2017
SPIS TREŚCI 1. ROZLICZENIE GODZINOWE... 3 2. CELE ZAJĘĆ Z PRZEDMIOTU... 3 3. ORGANIZACJA ZAJĘĆ... 3 3.1. KLUCZOWE ZAŁOśENIA... 3 3.2. TEMATY WYKŁADÓW... 4 3.3. TEMATY ĆWICZEŃ... 5 4. SYSTEM WSPOMAGAJĄCY KSZTAŁCENIE... 5 5. OCENA POSTĘPÓW STUDENTA... 6 5.1. SAMODZIELNE OPANOWYWANIE WIEDZY PODCZAS SEMESTRU... 6 5.2. ĆWICZENIA... 7 5.3. NARZĘDZIA KOMUNIKACJI... 7 5.4. ZALICZENIE PRZEDMIOTU NA PODSTAWIE AKTYWNOŚCI W SEMESTRZE... 8 5.5. EGZAMIN W TERMINIE PODSTAWOWYM... 8 5.6. EGZAMINY W 1 I 2 TERMINIE POPRAWKOWYM... 8 5.7. PODSUMOWANIE... 9 6. LITERATURA... 9 6.1. PODSTAWOWA... 9 6.2. DODATKOWA... 9 2
1. ROZLICZENIE GODZINOWE Rodzaj studiów Razem Wykłady Ćwiczenia Stacjonarne 60 30 30 Niestacjonarne 36 16 2. CELE ZAJĘĆ Z PRZEDMIOTU Przyswojenie wiedzy w zakresie: Podstawowych pojęć i metod rachunku prawdopodobieństwa i statystyki. Formułowania problemów w kategoriach rachunku prawdopodobieństwa i statystyki, zasad wyboru i stosowania odpowiednich metod do ich rozwiązywania oraz umiejętności interpretacji uzyskiwanych wyników. Funkcjonalności narzędzi obliczeniowych dla potrzeb rachunku prawdopodobieństwa i statystyki. Opanowanie umiejętności w zakresie: Obliczania prawdopodobieństw Estymacji parametrów rozkładu Weryfikacji hipotez statystycznych. Oceny zaleŝności statystycznej i korelacji dwóch zmiennych. Wykorzystania arkusza Excel w rozwiązywaniu zadań z rachunku prawdopodobieństwa i statystyki. 3. ORGANIZACJA ZAJĘĆ 3.1. Kluczowe załoŝenia W ramach procesu dydaktycznego występują następujące elementy: Wykłady, których tematy podano w punkcie 3. 2. Ćwiczenia rachunkowe, których tematy podano w punkcie 3.3. Laboratoria, których tematy podano w punkcie 3.3. Pomoce i materiały dydaktyczne udostępnione w systemie wspomagającym kształcenie http://e-nauka.net/, opisanym w punkcie 4 Oceny postępów studenta, których zasady opisano w rozdziale 5 3
3.2. Tematy wykładów Lp Temat ST NS 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. SPRAWY ORGANIZACYJNE: Rodzaje zajęć, Podręcznik, Portal, ebook, Zasady oceny postępów studenta, POJĘCIA WSTĘPNE: Populacja i jej cechy, Szeregi statystyczne, Metody badań statystycznych, Próba losowa, Części przedmiotu (statystyka opisowa, rachunek prawdopodobieństwa, statystyka matematyczna, przykłady zastosowań) PODSTAWY STATYSTYKI OPISOWEJ: Zadania statystyki opisowej, Szeregi statystyczne, Określanie miar opisowych zbiorowości, MoŜliwości obliczania miar opisowych zbiorowości, Ocena korelacji ZDARZENIA LOSOWE I PRAWDOPODOBIEŃSTWO: Zdarzenia elementarne, Relacje między zdarzeniami, Definicje prawdopodobieństwa, Prawdopodobieństwo warunkowe, P-stwo całkowite i wzór Bayesa, Zdarzenia niezaleŝne ZMIENNE LOSOWE JEDNOWYMIAROWE I DWUWYMIAROWE, SKOKOWE I CIĄGŁE: Określenie zmiennej losowej, Rodzaje zmiennych los., Określanie rozkładu zmiennej losowej, Rozkłady łączne, warunkowe i brzegowe PARAMETRY ROZKŁADU ZMIENNYCH LOSOWYCH: Wartość oczekiwana, Wariancja, Kowariancja i współczynnik korelacji WYBRANE ROZKŁADY ZMIENNYCH LOSOWYCH: Rozkłady skokowej zmiennej losowej (dwupunktowy, dwumianowy, geometryczny, Poissona), Rozkłady ciągłej zmiennej losowej (jednostajny, normalny, wykładniczy, chi-kwadrat, Studenta, Snedecora) TWIERDZENIA GRANICZNE: Twierdzenia integralne, Twierdzenia lokalne, Prawa wielkich liczb PODSTAWOWE STATYSTYKI I ICH ROZKŁADY: Pojęcie statystyki, Podstawowe statystyki dla jednej cechy populacji i ich rozkłady (średnia z próby, wariancje z próby), Podstawowe statystyki dla dwóch cech populacji i ich rozkłady (unormowane róŝnice średnich, iloraz wariancji) ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA: Zasady punktowej estymacji parametru rozkładu, Ocena estymatorów, Przykłady estymatorów, Metody wyznaczania estymatorów, Poziom ufności, Budowanie przedziału ufności, Przykłady przedziałów ufności WERYFIKACJA PARAMETRYCZNYCH I NIEPARAMETRYCZNYCH HIPOTEZ STATYSTYCZNYCH: Rodzaje hipotez, Konstrukcja i ocena testu, Przykłady testów parametrycznych (testy do weryfikacji hipotezy o wartości oczekiwanej, testy do weryfikacji hipotezy o równości 2 wartości oczekiwanych, Przykłady testów parametrycznych (test zgodności chi-kwadrat, test niezaleŝności chikwadrat, testy zgodności rozkładów: (test Manna-Whitneya i test Wilcoxona) ANALIZA KORELACJI I REGRESJI: Szacowanie współczynnika korelacji (oszacowanie punktowe i przedziałowe), Weryfikacja hipotezy o współczynniku korelacji, Równanie regresji, Szacowanie współczynników regresji ZAAWANSOWANE METODY STATYSTYCZNE: Regresja wielokrotna, Analiza korelacji kanonicznej, Analiza skupień, Analiza czynnikowa, Wielowymiarowa analiza wariancji i analiza dyskryminacji 1 1 1 1 3 1 3 1 3 2 3 2 14. REPETYTORIUM Razem 30 16 4
Lp 3.3. Tematy ćwiczeń Temat Liczba godzin ST NS Rachunkowe (ręcznie) Laboratoryjne (arkusz Excel) 1. Statystyka opisowa 6 2 + + 2. Zdarzenia losowe i prawdopodobieństwo 3 1 + + 3. Zmienne losowe 3 1 + 4. Parametry rozkładu zmiennych losowych 3 2 + + 5. Wybrane rozkłady zmiennych losowych 3 2 + + 6. Praca kontrolna 1 1 + 7. Estymacja punktowa i przedziałowa 2 2 + + 8. Test t dla 1 próby, test t dla 2 prób niezaleŝnych, test t dla 2 prób zaleŝnych, Test nieparametryczny 3 2 + + dla 2 prób niezaleŝnych 9. Korelacja Pearsona i Spearmana, analiza regresji jednej zmiennej 3 2 + + Analiza algorytmów pod względem średniego zachowania, Obliczania niezawodności prostych 10. układów sprzętowych i systemów programowych, 2 0 + Analiza wydajności prostych układów sprzętowoprogramowych 11. Praca kontrolna 1 1 + + Razem 30 16 W extranecie w materiałach dydaktycznych będą sukcesywnie zamieszczane pliki z przykładowymi danymi do analizy statystycznej. 4. SYSTEM WSPOMAGAJĄCY KSZTAŁCENIE System dostępny jest pod adresem: http://e-nauka.net/ Za wykorzystanie udostępnianych w ramach systemu pomocy dydaktycznych oraz narzędzi komunikacji moŝna uzyskać zaliczanie przedmiotu patrz punkt 5.3. Udostępnia się trzy rodzaje pomocy dydaktycznych: krzyŝówki, zadania z lukami i testy w sumie 36 pomocy:. KrzyŜówki K1. Statystyka opisowa K2. Rachunek prawdopodobieństwa K3. Statystyka matematyczna K4. Informatyczne zastosowania probabilistyki K5. Podstawowa terminologia Zadania z lukami - teoria L01. Charakterystyki liczbowe L02. Opracowanie danych statystycznych L03. Zdarzenia losowe L04. Zmienne losowe L05. Parametry rozkładu zmiennych losowych L06. Przykłady skokowych zmiennych losowych L07. Przykłady ciągłych zmiennych losowych 5
L08. Twierdzenia graniczne L09. Podstawowe pojęcia statystyki matematycznej L10. Parametryczna estymacja punktowa L11. Parametryczna estymacja przedziałowa L12. Weryfikacja hipotez parametrycznych L13. Weryfikacja hipotez nieparametrycznych L14. Analiza korelacji i regresji dwóch zmiennych L15. Operacje na sygnałach ciągłych L16. Teoria masowej obsługi Zadania z lukami - zadania LZ01. Charakterystyki liczbowe LZ02. Prawdopodobieństwo sumy i iloczynu zdarzeń LZ03. Twierdzenie o prawdopodobieństwie całkowitym LZ04. Rozkład dyskretnej zmiennej losowej LZ05. Rozkład ciągłej zmiennej losowej LZ06. Przedział ufności LZ07. Test dla wartości oczekiwanej rozkładu normalnego LZ08. Test do porównywania wartości oczekiwanych dla prób niezaleŝnych LZ09. Test do porównywania wartości oczekiwanych dla prób zaleŝnych LZ10. Test Manna-Whitneya LZ11. Test Wilcoxona LZ12. Współczynnik korelacji i równanie regresji Testy T1. Statystyka opisowa T2. Rachunek prawdopodobieństwa T3. Statystyka matematyczna Dodatkpwo udostępnia się e-book zawierający krótką charakterystykę 16 tematów metod probabilistycznych. 5. OCENA POSTĘPÓW STUDENTA 5.1. Samodzielne opanowywanie wiedzy podczas semestru Podczas semestru moŝna uzyskać wirtualne odznaki za korzystanie z pomocy dydaktycznych oraz narzędzi komunikacji, według zasad podanych poniŝej. 1) Rozwiązywanie zamieszczonych zadań: krzyŝówek, zadań z lukami oraz zadań testowych udostępnionych w systemie - Ranking Procent prawidłowych odpowiedzi [80;100] - Złota odznaka Procent prawidłowych odpowiedzi [60; 80) - Srebrna odznaka Procent prawidłowych odpowiedzi [40;60) - Brązowa odznaka Procent prawidłowych odpowiedzi obliczany jest według wzoru: xi yi i= 1 % prawidłowych odpowiedzi = 100% 36 z gdzie: 36 liczba pomocy x i liczba prawidłowych odpowiedzi (haseł, pytań) podanych czy udzielonych w i- tej pomocy 36 i i= 1 6
1 odpowiedzi w i-tej pomocy udzielone w okresie preferowanym y = 0,5 odpowiedzi w i-tej pomocy udzielone w okresie niepreferowanym i 0,75 odpowiedzi w i-tej pomocy udzielone w okresie happy hours z i suma haseł czy pytań w i-tej pomocy Uwaga W powyŝszym wzorze dla kaŝdej pomocy (i=1,,36) uwzględnia się wyniki, dla których iloczyn x y jest największy. Przykładowo, jeśli w jednej z pomocy udzielano odpowiedzi w okresie preferowanym uzyskując 50 % oraz w okresie Happy hours, uzyskując i i 80% to zarejestruje się 60% odpowiedzi (80 0,75 = 60 > 50). 5.2. Ćwiczenia Na ćwiczeniach będą rozwiązywane zadania i pytania testowe z podręcznika podstawowego oraz udostępnionych materiałów. KaŜdą nieobecność naleŝy rozliczyć według ustaleń prowadzącego. Zadania domowe I) Dla zmiennej losowej X ciągłej o podanej gęstości obliczyć: a) dystrybuantę zmiennej losowej X, b) wartość oczekiwaną i wariancję zmiennej losowej X, c) Prawdopodobieństwo uzyskania wartości zmiennej losowej z podanego przedziału [a,b]. II) Zbadano opłaty za kupno przez telefon akcji o ustalonej wartości X wylosowanych biurach maklerskich (cecha X populacji) i otrzymano, Ŝe średnia opłata wynosi x zł, zaś odchylenie standardowe s zł. Zakładamy, Ŝe cecha X ma rozkład normalny. a) Znajdź przedział ufności dla wartości oczekiwanej opłaty za kupno akcji przez telefon, na poziomie ufności 1-α 1. b) Na poziomie istotności 0,05 sprawdź hipotezy: zerową, Ŝe wartość oczekiwana opłaty za kupno akcji przez telefon jest równa m 0 i alternatywną, Ŝe jest róŝna od m 0. c) Znajdź przedział ufności dla wariancji opłaty za kupno akcji przez telefon, na poziomie ufności α 2. KaŜdy student otrzyma zadanie o róŝnych wartościach x, s, m 0, α 1 i α 2. Podstawa przyznawania punktów na ćwiczeniach Liczba punktów Obecność i aktywność i na ćwiczeniach 6 Sprawozdania z ćwiczeń laboratoryjnych 6 Zadania domowe 8 Dwie prace kontrolne 20 Razem 40 Warunkiem zaliczenia ćwiczeń jest uzyskanie, co najmniej 21 punktów. Ocena z ćwiczeń określana jest zgodnie z poniŝsza tabelą: Ocena ndst dst dst½ db db½ bdb Punkty [0,21) [21-27) [27-31) [31-35) [35-38) [38-40) Za zaliczenie ćwiczeń moŝna uzyskać liczbę punktów równą: Ocena*10, czyli minimalnie 3*10=30 punktów, a maksymalnie 5*10=50 punktów 5.3. Narzędzia komunikacji Złota odznaka Srebrna odznaka Brązowa odznaka Wpis do księgi gości i wypełnienie 3 ankiet : Wpis do księgi gości i wypełnienie 2 ankiet lub wypełnienie 3 ankiet : Wpis do księgi gości i wypełnienie 1 ankiety lub 2 ankiet 7
5.4. Zaliczenie przedmiotu na podstawie aktywności w semestrze Zasady zaliczenia podano w poniŝszej tabeli. Komunikacja Ranking Inne aktywności Ocena Złota odznaka Złota odznaka Srebrna odznaka Brązowa odznaka Złota odznaka 4 Srebrna odznaka 4 Brązowa odznaka 3,5 Złota odznaka 4 Srebrna odznaka 3,5 Brązowa odznaka 3 Złota odznaka 3,5 Srebrna odznaka 3 Brązowa odznaka 3 Inne aktywności obejmują ćwiczenia rachunkowe oraz zgłaszanie uwag i propozycji punkty przydzielane przez prowadzącego wykłady max 8 punktów Odznaki przyznawane będą na podstawie sumy w/w punktów Złota odznaka : Liczba punktów 45 Srebrna odznaka : 40 Liczba punktów < 45 Brązowa odznaka : 30 Liczba punktów < 40 Studenci, którzy uzyskali ocenę 4 mogą ją poprawić w umówionym terminie podczas semestru w sposób następujący, przy czym warunkiem jest obecność na wykładach: Studia stacjonarne dopuszczalne 3 nieobecności Studia niestacjonarne dopuszczalne 2 nieobecności 5.5. Egzamin w terminie podstawowym Egzamin będzie przeprowadzany dla studentów, którzy zaliczyli ćwiczenia, ale: nie zaliczyli przedmiotu na podstawie aktywności w semestrze zaliczyli przedmiot na podstawie aktywności w semestrze na ocenę 3 lub 3 ½ i chcą ja poprawić. Zakres egzaminu: KrzyŜówka z całości terminologii - max. 25 punktów Zadanie z lukami z całości materiału - max 50 punktów Test z całości materiału max. 25 punktów Ocenę zaliczenia przedmiotu określa się zgodnie z poniŝszą tabelą: Ocena ndst dst dst½ db Punkty [0,40) [40-60) [60-80) [80,100] Nie ma moŝliwości poprawienia uzyskanej oceny. 5.6. Egzaminy w 1 i 2 terminie poprawkowym Zakres i przebieg: jak w terminie podstawowym 8
5.7. Podsumowanie 6. LITERATURA 6.1. Podstawowa [1] Marek Cieciura, Janusz Zacharski: Podstawy probabilistyki z przykładami zastosowań w informatyce (udostępniony w postaci elektronicznej w portalu http://cieciura.net/mp/ Pomoce Podręcznik) 6.2. Dodatkowa [2] Witold Konecki: Statystyka dla inŝynierów, PWN, Warszawa 1999. [3] Janusz Sosnowski: Testowanie i niezawodność systemów komputerowych, Exit, Warszawa 2005. [4] Herman Kopetz: Niezawodność oprogramowania, WNT, Warszawa 1980 [5] Krystyna Regina Bąk (red.): Statystyka wspomagana Excelem 2007, Oficyna Wydawnicza WyŜszej Szkoły Handlu i Prawa im. R. Łazarskiego w Warszawie, Warszawa 2010 [6] Thomas W.Pavkov, Kent A. Pierce: Wprowadzenie do SPSS dla Windows, Gdańskie Wydawnictwo psychologiczne, Gdańsk 2005 [7] Portal Studia informatyczne http://wazniak.mimuw.edu.pl Rachunek prawdopodobieństwa i statystyka. 9