STATYSTYCZNE METODY WSPOMAGANIA DECYZJI

Wielkość: px
Rozpocząć pokaz od strony:

Download "STATYSTYCZNE METODY WSPOMAGANIA DECYZJI"

Transkrypt

1 STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 1 Cel: wybrane rozkłady prawdopodobieństwa; statystyka opisowa danych jakościowych Zadanie 1 Utworzyć wykresy gęstości, dystrybuanty i funkcji przeżycia dla zmiennych losowych o rozkładzie normalnym z parametrami: a) N (0,1), N (1,1 ), N (2,1) b) N (0,1), N (0,0.5), N (0,2). Zadanie 2 Wyznaczyć wartości następujących kwantyli: a) kwantyl rzędu 0,95 rozkładu standardowego normalnego b) kwantyl rzędu 0,975 rozkładu standardowego normalnego c) kwantyl rzędu 0,95 rozkładu t-studenta o 10 stopniach swobody d) kwantyl rzędu 0,99 rozkładu t-studenta o 20 stopniach swobody e) kwantyl rzędu 0,9 rozkładu chi-kwadrat o 4 stopniach swobody f) kwantyl rzędu 0,95 rozkładu chi-kwadrat o 10 stopniach swobody g) kwantyl rzędu 0,95 rozkładu F-Snedecora o (2, 10) stopniach swobody h) kwantyl rzędu 0,99 rozkładu F-Snedecora o (3, 18) stopniach swobody. Zadanie 3 Wzrost pewnej grupy osób opisany jest rozkładem normalnym o wartości oczekiwanej 173 cm i odchyleniu standardowym 6 cm. a) Jakie jest prawdopodobieństwo, że losowo wybrana osoba ma nie więcej niż 179 cm wzrostu? b) Jaka jest frakcja osób mających wzrost pomiędzy 167 i 180 cm? c) Jakie jest prawdopodobieństwo, że losowo wybrana osoba ma więcej niż 181 cm wzrostu? d) Wyznaczyć wartość wzrostu, której nie przekracza 60% badanej populacji osób. Zadanie 4 Utworzyć wykresy gęstości zmiennych losowych o rozkładzie t-studenta z 1, 5 i 30 stopniami swobody. Porównać otrzymane wykresy z wykresem gęstości zmiennej losowej o rozkładzie normalnym. Zadanie 5 Instalacja przeciwpożarowa w pewnym budynku składa się z pięciu działających niezależnie czujników, a niezawodność każdego z nich wynosi 0,95. Jakie jest prawdopodobieństwo, że w przypadku pożaru a) zadziałają wszystkie czujniki b) zadziałają co najmniej trzy czujniki c) nie zadziała żaden czujnik? Zadanie 6 Oddział banku otrzymuje w ciągu tygodnia około 300 wniosków o wydanie karty kredytowej. Stwierdzono, że około 1% wniosków nie zostaje rozpatrzonych pozytywnie. Obliczyć prawdopodobieństwo odrzucenia w danym tygodniu trzech lub więcej wniosków o wydanie karty kredytowej. Zadanie 7 Czas poprawnej pracy aparatu telefonicznego ma rozkład wykładniczy, którego oczekiwany czas poprawnej pracy wynosi godzin. a) Obliczyć prawdopodobieństwo, że aparat ten nie uszkodzi się w ciągu: 1000, 10000, godzin pracy. b) Ile godzin powinien przepracować bezawaryjnie ten aparat z prawdopodobieństwem 0,90?

2 Zadanie 8 Z dotychczasowych obserwacji wynika, że liczba klientów przybywających w ciągu godziny do oddziału banku ma rozkład Poissona o średniej 4 (klientów na godzinę). a) Jaki jest rozkład prawdopodobieństwa czasu między przyjściem kolejnych klientów? b) Jaki jest średni czas oraz odchylenie standardowe czasu pomiędzy chwilami przybycia kolejnych klientów? c) Jeżeli w danej chwili do oddziału wszedł klient, to jakie jest prawdopodobieństwo, że w ciągu najbliższych 30 minut kolejny klient przybędzie do oddziału? d) Jakie jest prawdopodobieństwo, że w ciągu godziny do oddziału banku nie przyjdzie ani jeden klient? Zadanie 9 Badania demograficzne przeprowadzone w 1988 roku w USA wykazały, że wśród kobiet (mających 18 i więcej lat) było: tyś. panien, tyś. mężatek, tyś. wdów i 8170 tyś. rozwódek. a) Utworzyć wykres kołowy dla stanu cywilnego danej grupy kobiet. Porównać różne formy opisu wykresu. b) Utworzyć wykres słupkowy dla stanu cywilnego danej grupy kobiet. Porównać różne rodzaje wykresów i formy ich opisu. Zadanie 10 Koncern paliwowy planuje otworzyć nową stację benzynową w pewnym mieście. Rozważane są cztery możliwe lokalizacje stacji w południowej, północnej, zachodniej i wschodniej dzielnicy miasta (oznaczenia dzielnic: S południowa, N północna, W zachodnia i E wschodnia). W ramach badania opinii społecznej odnośnie preferowanej lokalizacji stacji zapytano o to tysiąc kierowców. Ich odpowiedzi znajdują się w pliku stacje.csv. Utworzyć wykres słupkowy i wykres kołowy dla badanych preferencji.

3 STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 2 Cel: statystyka opisowa danych ilościowych: metody graficzne prezentacji danych i wyznaczanie podstawowych statystyk próbkowych Zadanie 1 Wytrzymałość na ciśnienie wewnętrzne szkła butelek jest ich ważną charakterystyką jakościową. W celu zbadania wytrzymałości butelek umieszcza się je w maszynie hydrostatycznej, po czym zwiększa się ciśnienie aż do zniszczenia butelki. Plik butelki.csv zawiera dane opisujące graniczną wytrzymałość na ciśnienie wewnętrzne szkła badanej partii butelek (mierzone w psi). a) Utworzyć zmienną o nazwie cisnienie, opisującą wytrzymałość na ciśnienie wewnętrzne szkła butelek mierzone w MPa Wskazówka: 1psi = 0, MPa b) Utworzyć histogram dla danych opisujących wytrzymałość butelek. Prześledzić wpływ liczby klas na kształt histogramu. Porównać różne rodzaje histogramów. c) Utworzyć wykres łodygowo-liściowy. d) Utworzyć i zinterpretować wykres skrzynkowy dla wytrzymałości butelek. e) Wyznaczyć i zinterpretować podstawowe statystyki próbkowe dla danych opisujących wytrzymałość butelek. f) Obliczyć i zinterpretować 5, 10, 25, 50, 75, 90 i 95 percentyl dla rozważanych danych. Zadanie 2 W pliku samochody.csv zamieszczono dane dotyczące parametrów samochodów kilku wybranych marek. a) Zmienna mpg zawiera dane odpowiadające liczbie mil, przejechanych przez dany samochód na galonie paliwa. Utworzyć zmienną zp opisującą zużycie paliwa mierzone w litrach na 100 kilometrów. Wskazówka: 1 mila = 1609 m 1 galon (amerykański) = 3,785 l b) Utworzyć wykres łodygowo-liściowy dla zużycia paliwa. c) Utworzyć histogram dla danych opisujących zużycie paliwa. d) Utworzyć wykres skrzynkowy dla zużycia paliwa. e) Wyznaczyć i zinterpretować podstawowe statystyki próbkowe dla danych opisujących zużycie paliwa (takie jak: średnia, mediana, wariancja, odchylenie standardowe, rozstęp, kwartyle, rozstęp międzykwartylowy, wartości ekstremalne, współczynnik asymetrii, kurtoza, współczynnik zmienności). f) Obliczyć i zinterpretować 5, 10, 90 i 95 percentyl dla rozważanych danych. Zadanie 3 Analizowane w poprzednim zadaniu dane dotyczące zużycia paliwa postanowione poddać kategoryzacji tworząc następujące klasy: Zużycie paliwa [litry na 100 km] nie więcej niż 7 więcej niż 7 ale nie więcej niż 10 więcej niż 10 Kod opisujący kategorię zużycia paliwa mało średnio dużo Utworzyć wykres słupkowy dla wyznaczonych w ten sposób kategorii i wskazać, jaki procent badanych samochodów należy do każdej kategorii. Zadanie 4 Obliczyć przeciętne zużycie paliwa oraz odchylenie standardowe zużycia paliwa oddzielnie dla samochodów produkowanych w Europie, Ameryce i Japonii (wykorzystać zmienne producent i legenda). Zestawić wykresy skrzynkowe zużycia paliwa dla samochodów produkowanych w Europie, Ameryce i Japonii.

4 Zadanie 5 Porównać zużycie paliwa przez samochody o jednakowej liczbie cylindrów (dane dotyczące liczby cylindrów znajdują się w zmiennej cylindry). Zadanie 6 Porównać przyspieszenie samochodów produkowanych w Ameryce i Japonii (dane dotyczące przyspieszenia znajdują się w zmiennej przysp). Zadanie 7 Obliczyć średnie zużycie paliwa, medianę, wariancję, odchylenie standardowe, i współczynnik asymetrii zużycia paliwa wyłącznie dla samochodów ważących mniej niż 2500 funtów (wykorzystać zmienną waga). Zadanie 8 Przeprowadzić analizę mocy silników samochodów wyprodukowanych w latach (wykorzystać zmienne: rok i moc), a w szczególności: a) Utworzyć i opisać szczegółowo wykres skrzynkowy dla badanej próbki. b) Utworzyć histogram. c) Podać moc silnika, której nie przekracza 95% wybranych samochodów. Zadanie 9 Przeprowadzić analizę przyspieszenia samochodów o wadze większej niż 2500 funtów, ale mniejszej niż 3000 funtów (wykorzystać zmienne: przysp i waga), a w szczególności: a) Utworzyć i opisać szczegółowo wykres skrzynkowy dla wybranej próbki. b) Utworzyć histogram. c) Podać wartość przyspieszenia, którą przekracza 25% wybranych samochodów. Zadanie 10 Przeprowadzić analizę wagi samochodów, które przejeżdżają na jednym galonie więcej niż 26 mil (wykorzystać zmienne mpg i waga), a w szczególności: a) Utworzyć i opisać szczegółowo wykres skrzynkowy dla wagi wybranych samochodów. b) Utworzyć histogram. c) Podać wagę, której nie przekracza 95% wybranych samochodów. Zadanie 11 Poniższe dane odpowiadają notowaniom pewnej spółki (w PLN) w kolejnych 20 dniach: 23,30 24,50 25,30 25,30 24,30 24,80 25,20 24,50 24,60 24,10 24,30 26,10 23,10 25,50 22,60 24,60 24,30 25,40 25,20 26,80 Utworzyć wykres cen akcji jako funkcję czasu (szereg czasowy). Zadanie 12 Zamieszczone poniżej dane przedstawiają wysokość czynszu płaconego w pewnej spółdzielni mieszkaniowej przez 30 losowo wybranych lokatorów: a) Utworzyć histogram dla wysokość czynszu płaconego w tej spółdzielni. b) Obliczyć wartości miar tendencji centralnej dla powyższych danych. c) Obliczyć wartości charakterystyk rozproszenia dla powyższych danych. d) Obliczyć wartości charakterystyk kształtu dla powyższych danych. e) Obliczyć i zinterpretować 5, 10, 90 i 95 percentyl dla rozważanych danych. f) Utworzyć wykres skrzynkowy wysokość czynszu płaconego w tej spółdzielni mieszkaniowej.

5 STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 3 Cel: estymacja przedziałowa Zadanie 1 Średnia cena 50 losowo wybranych podręczników akademickich wyniosła zł. Wiadomo, że odchylenie standardowe cen podręczników wynosi 4.75 zł. Wyznaczyć 95% przedział ufności dla średniej ceny podręcznika akademickiego zakładając, że rozkład cen jest rozkładem normalnym. Zadanie 2 Przeprowadzono 18 niezależnych pomiarów temperatury topnienia ołowiu i otrzymano następujące wyniki (w o C): Zakładamy, że temperatura topnienia ołowiu ma rozkład normalny. Wyznaczyć dwustronny przedział ufności dla wartości oczekiwanej i odchylenia standardowego temperatury topnienia ołowiu na poziomie ufności Zadanie 3 Pojemność 10 losowo wybranych baterii wyniosła (w ampero-godzinach): 140, 136, 150, 144, 148, 152, 138, 141, 143, 151. Zakładając, że pojemność baterii ma rozkład normalny, wyznaczyć 99% przedział ufności dla wariancji pojemności. Zadanie 4 W sondażu przeprowadzonym przez magazyn Time ( Time, 22 czerwca 1987) 578 spośród 1014 dorosłych respondentów stwierdziło, że dla dobra dzieci lepiej jest, gdy matka nie pracuje poza domem. Wyznaczyć 95% przedział ufności dla odsetka dorosłych podzielających ten pogląd. Zadanie 5 Wyznaczyć liczność próby, jaką należy pobrać, aby z maksymalnym błędem 2.5% oszacować na poziomie ufności 0.95 odsetek dorosłych Polaków czytających codziennie przynajmniej jedną gazetę. Uwzględnić rezultaty wstępnych badań, z których wynika, że interesująca nas wielkość jest rzędu 20%. Porównać otrzymaną liczność próby z licznością, jaka byłaby wymagana, gdyby pominąć rezultaty badań wstępnych. Zadanie 6 W celu oszacowania liczby nadgodzin w pewnym przedsiębiorstwie, wylosowano niezależnie próbę 25 pracowników, dla której otrzymano następujące wyniki (liczba nadgodzin przepracowanych w ubiegłym roku): Liczba nadgodzin Liczba pracowników Zakładając, że rozkład liczby nadgodzin jest normalny, wyznaczyć przedział ufności dla średniej oraz odchylenia standardowego liczby nadgodzin przepracowanych w ubiegłym roku w tym przedsiębiorstwie. Przyjąć poziom ufności 0,95.

6 Zadanie 7 Dla grupy 180 rodzin wylosowanych niezależnie w pewnym mieście otrzymano następujący rozkład dochodów przypadających na jedną osobę: Dochód (w tys. zł) Liczba rodzin 0,0 0,4 25 0,4 0,8 50 0,8 1,2 40 1,2 1,6 35 1,6 2,0 30 Wyznaczyć przedział ufności dla wysokości średniego miesięcznego dochodu oraz odchylenia standardowego dochodu przypadającego na jednego członka rodziny. Przyjąć poziom ufności 0,9. Zadanie 8 Dział kontroli jakości w zakładach chemicznych chce oszacować średnią wagę proszku do prania sprzedawanego w pudełkach o nominalnej wadze 3 kg. Jak liczną próbkę pudełek proszku należy pobrać, aby z maksymalnym błędem 100g wyznaczyć 99% przedział ufności dla średniej wagi pudełka proszku do prania? Wiadomo, że rozkład wagi pudełka proszku do prania jest normalny z odchyleniem standardowym 150g. Zadanie 9 Poniższa tabela przedstawia rozkład miesięcznego wynagrodzenia brutto 150 wylosowanych niezależnie pracowników pewnego przedsiębiorstwa: Wynagrodzenie (zł) Liczba pracowników Poniżej Powyżej Czy wielkość próby jest wystarczająca, aby oszacować odsetek pracowników zarabiających powyżej 1200 zł z dokładnością ± 2%? Przyjąć poziom ufności 0,95. Zadanie 10 Wygenerować próbek 10-elementowych z rozkładu normalnego. Następnie zakładając, iż o próbkach wiemy tylko tyle, ze pochodzą one z rozkładu normalnego o nieznanych parametrach, wyznaczyć dla każdej próbki przedział ufności dla wartości oczekiwanej na poziomie ufności 0,95. Porównać frakcję pokryć przez przedział ufności faktycznej wartości oczekiwanej z założonym poziomem ufności. Zadanie 11 Zmienne Species oraz Petal.Length (znajdujące się w ramce danych iris) opisują, odpowiednio, gatunek oraz długość płatków kwiatów. Zakładamy, że rozkład długości płatków jest normalny. a) Zbudować 99% przedział ufności dla średniej długości płatków z gatunku virginica. b) Zbudować 95% przedział ufności dla odchylenia standardowego długości płatków z gatunku virginica. Zadanie 12 Przypuszcza się, że w jednym z województw podatnicy bezprawnie korzystają z pewnej ulgi podatkowej. Wylosowano 150 podatników i wykazano, że 19 z nich niesłusznie korzystało ze wspomnianej ulgi. Wyznaczyć 96% przedział ufności dla procentu podatników bezprawnie korzystających z tej ulgi. Zadanie 13 Zmienna weight znajdująca się w ramce danych chickwts opisuje wagę kurczaków, natomiast zmienna feed rodzaj użytej paszy. Zakładamy, że waga kurczaków ma rozkład normalny. Zbudować 93% przedział ufności dla wariancji wagi kurczaków karmionych paszą soybean.

7 Zadanie 14 Ramka danych faithful zawiera dane dotyczące czasu trwania erupcji gejzera Old Faithful (zmienna eruptions) oraz czasu oczekiwania na kolejną erupcję (zmienna waiting). Utworzyć 99% przedział ufności dla średniego czasu oczekiwania na kolejną erupcję. Zadanie 15 Ramka danych Orange zawiera między innym dane dotyczące obwodu drzewek pomarańczowych (zmienna circumference). Zakładając, że zmienna ta ma rozkład normalny, wyznaczyć przedział ufności dla odchylenia standardowego obwodu drzewek. Przyjąć poziom ufności 0,99. Zadanie 16 Ramka danych Pima.te z biblioteki MASS zawiera dane dotyczące zdrowia kilkuset Indianek z plemienia Pima mających co najmniej 21 lat. Zmienna type zawiera informację, czy kobieta jest chora na cukrzycę, czy nie. Utworzyć 95% przedział ufności dla odsetka Indianek dotkniętych cukrzycą. Utworzyć taki przedział dla Indianek mających co najmniej 35 lat.

8 STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 4 Cel: weryfikacja hipotez w modelach parametrycznych jedno- i dwupróbkowych Zadanie 1 Wytrzymałość na ciśnienie wewnętrzne szkła butelek jest ich ważną charakterystyką jakościową. Pewna rozlewnia 2 zainteresowana jest butelkami, których średnia wytrzymałość przewyższa 1,20 N / mm. Na podstawie dotychczasowych doświadczeń wiadomo, że rozkład ciśnienia jest normalny z odchyleniem standardowym N / mm. Pobrano próbę losowa 20 butelek, które następnie umieszczono w maszynie hydrostatycznej, zwiększając 2 ciśnienie aż do zniszczenia butelki. Otrzymano następujące wyniki (w N / mm ): 1.36, 1.14, 1.27, 1.15, 1.20, 1.29, 1.27, 1.18, 1.23, 1.36, 1.38, 1.37, 1.30, 1.21, 1.33, 1.28, 1.32, 1.29, 1.33, Na poziomie istotności 0.04 stwierdzić, czy dana partia butelek spełnia postawione wymagania jakościowe. Zadanie 2 Nominalna waga netto kawy sprzedawanej w opakowaniu szklanym winna wynosić 150 g. Występuje jednakże dużą zmienność wagi. Istotnie, próba losowa siedmiu słoiczków kawy konkretnej marki wykazała następujące wagi netto (w gramach): 142, 151, 148, 151, 145, 150, 141. a) Zakładając normalność rozkładu wagi, przetestować hipotezę głoszącą, że waga netto tej marki kawy wynosi faktycznie 150 g. Przyjąć poziom istotności α = b) Sprawdzić, czy odchylenie standardowe wagi netto słoika kawy różni się istotnie od 4g. Zadanie 3 Wylosowana niezależnie z partii żarówek 12 elementowa próba dała następujące wyniki pomiarów czasu świecenia (w godzinach): 2852, 3060, 2631, 2819, 2805, 2835, 2955, 2595, 2690, 2723, 2815, a) Zakładając normalność rozkładu czasu świecenia żarówek wyznaczyć 97% przedział ufności dla średniego czasu świecenia żarówek oraz dla odchylenia standardowego czasu świecenia żarówek. b) Czy średni czas świecenia żarówek jest istotnie krótszy od 2900 godzin? Przyjąć poziom istotności Zadanie 4 W czasie poprawnej pracy maszyny frakcja wytwarzanych przez nią elementów wadliwych nie powinna przekraczać 4%. Jeżeli frakcja elementów wadliwych przekroczy 4%, wówczas należy podjąć czynności mające na celu wyregulowanie procesu produkcji. Pracownik zajmujący się kontrolą jakości pobrał próbkę losową 200 elementów i znalazł w niej 14 elementów wadliwych. Czy zaistniała sytuacja wymaga wyregulowania procesu produkcji? Zweryfikować odpowiednią hipotezę na poziomie istotności Zadanie 5 Przeprowadzono ankietę wśród pracowników naukowych pewnej uczelni dotyczącą stażu pracy. Stwierdzono, że wśród 140 respondentów znalazło się 47 osób o stażu krótszym niż 10 lat, 53 osoby pracujące co najmniej 10, ale nie dłużej niż 15 lat oraz 40 osób o stażu pracy dłuższym niż 15 lat. Zweryfikować hipotezę, że 30% pracowników tej uczelni legitymuje się stażem pracy przekraczającym 15 lat. Przyjąć poziom istotności 0.05.

9 Zadanie 6 Badania dotyczące stażu pracy pracowników naukowych pewnego wydziału dały następujące rezultaty: Staż pracy (lata) Liczba pracowników a) Zakładając, że rozkład stażu pracy jest normalny, zweryfikować hipotezę, że średnia stażu pracy na tym wydziale przekracza 8 lat. Przyjąć poziom istotności b) Wyznaczyć 95% przedział ufności dla średniego stażu pracy na tym wydziale. c) Wyznaczyć 95% przedział ufności dla odchylenia standardowego stażu pracy na tym wydziale. Zadanie 7 W pewnym towarzystwie ubezpieczeniowym wylosowano niezależnie 300 polis, z których wypłacono odszkodowanie w ramach ubezpieczenia OC. Otrzymano następujące wyniki: Wysokość odszkodowania (w tys. zł) Liczba polis a) Zweryfikować hipotezę, że średnia wysokość odszkodowania wynosi mniej niż trzy tysiące złotych. Przyjąć poziom istotności b) Wyznaczyć 95% przedział ufności dla średniej wysokości odszkodowania. c) Wyznaczyć 95% przedział ufności dla odchylenia standardowego wysokości odszkodowania. d) Wyznaczyć 95% przedział ufności dla wariancji wysokości odszkodowania. Zadanie 8 W stopie metalicznym pewnego typu zastosowano dwa różne pierwiastki utwardzające. Wyniki pomiarów twardości przeprowadzonych później na próbkach tego stopu utwardzanych obiema metodami wyglądają następująco: Metoda I Metoda II Przyjmuje się, że twardość ma rozkład normalny oraz że odchylenia standardowe σ 1 i σ 2 dla obu metod są równe. Czy na podstawie przeprowadzonych pomiarów można stwierdzić, że średnia twardość stopu utwardzanego drugą metodą przewyższa średnią twardość stopu utwardzanego pierwszą metodą? Zadanie 9 Dokonano po 5 niezależnych pomiarów ciśnienia w komorze spalania silnika dla dwóch gatunków paliwa. Otrzymano następujące rezultaty (w kg/cm 2 ): pierwszy gatunek drugi gatunek Zakładamy, że ciśnienie w komorze spalania ma rozkład normalny. Na poziomie istotności 0.05 zweryfikować hipotezę o jednakowej wariancji ciśnienia dla obu gatunków badanego paliwa. Zadanie 10 Spośród pracowników pewnego przedsiębiorstwa wylosowano niezależnie 15 pracowników fizycznych i 9 pracowników umysłowych. Otrzymano następujące dane dotyczące stażu pracy (w latach): pracownicy umysłowi pracownicy fizyczni Wiadomo, że rozkład stażu pracy w przedsiębiorstwie jest normalny. Zweryfikować hipotezę, że średni staż pracy pracowników fizycznych jest istotnie krótszy niż staż pracy pracowników umysłowych.

10 Zadanie 11 Grupę 10 dzieci poddano testowi pamięci. Po pewnym czasie, w którym dzieci wykonywały w domu ćwiczenia usprawniające pamięć, poddano je ponownie testowi. Na podstawie wyników zamieszczonych w tabeli stwierdzić, czy zaproponowane ćwiczenia w istotny sposób usprawniają pamięć. Założyć, że liczba zapamiętywanych przedmiotów ma rozkład normalny. Dziecko Liczba przedmiotów zapamiętanych przed serią ćwiczeń Liczba przedmiotów zapamiętanych po serii ćwiczeń Zadanie 12 Na podstawie danych dotyczących parametrów kilku wybranych marek samochodów (plik samochody.csv) stwierdzić, czy występuje statystycznie istotna różnica w przyspieszeniu samochodów produkowanych w USA i w Japonii. Zadanie spośród 700 wylosowanych studentów Politechniki, będących absolwentami techników i 517 spośród 1320 wylosowanych studentów będących absolwentami liceów, nie zdało egzaminu z matematyki na zakończenie pierwszego semestru. Czy na podstawie powyższych wyników można stwierdzić, że absolwenci techników są słabiej przygotowani z matematyki niż absolwenci liceów? Zadanie 14 W pewnym przedsiębiorstwie wylosowano niezależnie 100 kobiet i 200 mężczyzn, dla których uzyskano następujące dane dotyczące stażu pracy: Liczba pracowników Staż pracy Kobiety Mężczyźni Zweryfikować hipotezę, że odsetek kobiet pracujących w tym przedsiębiorstwie krócej niż 10 lat jest mniejszy niż odsetek mężczyzn o tym samym stażu pracy. Przyjąć poziom istotności Zadanie 15 Zmienne age oraz height (znajdujące się w ramce danych Loblolly) opisują, odpowiednio, wiek (w latach) oraz wysokość drzew (w stopach). Zakładamy, że rozkład wysokości jest normalny. Na poziomie istotności 0.05 zweryfikować hipotezę, że średnia wysokość 15-letnich drzew wynosi 40 stóp. Zadanie 16 W poniższej tabeli zamieszczono dane dotyczące liczby zadań rozwiązanych podczas ostatniego egzaminu z RPS przez 120 losowo wybranych studentów: Liczba rozwiązanych zadań Liczba studentów Na poziomie istotności 0.03 zweryfikować hipotezę, że odsetek studentów, którzy podczas egzaminu rozwiązali poprawnie co najwyżej jedno zadanie przekracza 35%. Zadanie 17 Zmienna weight znajdująca się w ramce danych chickwts opisuje wagę kurczaków, natomiast zmienna feed rodzaj używanej paszy. Zeryfikować hipotezę, że średnia waga kurczaków karmionych paszą meatmeal jest większa niż średnia waga kurczaków karmionych paszą casein. Zakładamy, że obie zmienne mają rozkład normalny z tymi samymi odchyleniami standardowymi. Przyjąć poziom istotności 0.05.

11 Zadanie 18 Ramka danych Orange zawiera między innym dane dotyczące obwodu drzewek pomarańczowych (zmienna circumference). Zakładając, że zmienna ta ma rozkład normalny, zweryfikować hipotezę, że średni obwód drzew jest mniejszy niż 130mm. Przyjąć poziom istotności 0.1. Zadanie 19 Ramka danych Pima.te z biblioteki MASS zawiera dane dotyczące zdrowia kilkuset Indianek z plemienia Pima mających co najmniej 21 lat. Zmienna glu zawiera wynik testu glukozowego, natomiast zmienna type zawiera informację, czy kobieta jest chora na cukrzycę, czy nie ( Yes oznacza, że dana osoba ma cukrzycę, zaś No oznacza, że jest zdrowa). Zweryfikować na poziomie istotności 0.05 hipotezę mówiącą, że wariancja wyniku testu glukozowego dla osób zdrowych jest taka sama jak w przypadku osób chorych. Zakładamy, że w obu przypadkach zmienna glu ma rozkład normalny. Zadanie 20 Ramka danych crabs z biblioteki MASS zawiera dane dotyczące krabów, a w szczególności zmienna sp opisuje gatunek kraba, zaś zmienna CW szerokość pancerza danego kraba. Zweryfikować na poziomie istotności 0.04 hipotezę mówiącą, że średnia szerokość pancerza krabów z gatunku oznaczanego literą B jest mniejsza niż średnia szerokość pancerza krabów z gatunku oznaczanego literą O. Zakładamy, że w obu przypadkach szerokość pancerza jest zmienną losową o rozkładzie normalnym i że wariancje w obu populacjach są równe. Zadanie 21 W losowej próbie 500 mieszkańców pewnego rejonu 226 wyraziło chęć oddania głosu w wyborach parlamentarnych. Na poziomie istotności 0.05 zweryfikować hipotezę, że w tym rejonie deklarowana frekwencja wyborcza wynosi ponad 45%. Zadanie 22 Zmienne Species oraz Petal.Length (znajdujące się w ramce danych iris) opisują, odpowiednio, gatunek oraz długość płatków kwiatów. Na poziomie istotności 0.02 zweryfikować hipotezę, że wariancja długości płatków gatunku virginica jest większa niż wariancja długości płatków gatunku versicolor. Zakładamy, że w obu przypadkach długość płatka jest zmienną losową o rozkładzie normalnym. Zadanie 23 Spośród studentów Wydziału Informatyki wylosowano niezależnie 6 studentów III roku i obliczono średnie z ocen uzyskanych przez nich na I i na II roku studiów: Student A B C D E F I rok II rok Czy uzyskane rezultaty potwierdzają hipotezę, że średnie wyniki uzyskiwane na II roku studiów są istotnie lepsze od uzyskiwanych na I roku? Przyjąć założenie, że rozkład ocen jest normalny, a poziom istotności wynosi 0.1.

12 STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 5 Cel: testowanie zgodności, jednorodności i niezależności Zadanie 1 Wygenerować 200 elementowe próbki z rozkładów: normalnego N (0,1), Cauchy'ego C (0,1), jednostajnego U [0,1] oraz wykładniczego Exp (1), zapisując je, odpowiednio, jako zmienne n, c, u i w. Utworzyć zmienną aw mnożąc zmienną w przez ( 1). Utworzyć dla zmiennych n, c, u, w i aw wykresy normalności. Zwrócić uwagę na kształt wykresu w zależności od typu rozkładu. Zadanie 2 Badania grupy krwi 200 osób dały następujące wyniki: grupę O miały 73 osoby, grupę A 74 osoby, grupę B 34 osoby, natomiast grupę AB miało 19 osób. a) Czy na podstawie tych wyników można przyjąć hipotezę o równomiernym rozkładzie wszystkich grup krwi? b) Zweryfikować hipotezę, że grupa krwi O występuje średnio u 36,7% ludzi, grupa A u 37,1%, B u 18,6%, natomiast grupa AB występuje u 7,6% ogółu ludzi. Zadanie 3 W losowo wziętym tygodniu wydarzyło się w Warszawie 414 wypadków i kolizji drogowych, przy czym ich rozkład w poszczególnych dniach tygodnia wyglądał następująco: Dzień Poniedziałe k Wtorek Środa Czwartek Piątek Sobota Niedziela Liczba wypadków Stwierdzić, czy rozkład liczby wypadków w poszczególne dni tygodnia jest równomierny. Zadanie 4 Na podstawie danych dotyczących preferowanego miejsca spędzania wakacji (plik wakacje.csv) stwierdzić, czy rozkład preferencji jest równomierny. Zadanie 5 Zmierzono czas trwania siedmiu rozmów telefonicznych i otrzymano (w minutach): Na poziomie istotności 0,01 zweryfikować hipotezę, że czas trwania rozmowy ma rozkład wykładniczy o wartości średniej 4 minuty. Zadanie 6 Spośród studentów czterech wydziałów, na których pan Iksiński wykłada najciekawszy przedmiot świata (nie trzeba chyba dodawać, iż mowa tu o statystyce), pobrano próbki losowe i zliczono studentów (zwanych dalej szczęśliwcami ), których udało się zdać egzamin z tego przedmiotu. Wyniki zamieszcza poniższa tabela: Wydział Liczność próbki Liczba szczęśliwców Nauk niepotrzebnych Mniemanologii stosowanej Nauk ciekawych Nauk przydatnych Czy w świetle zebranych danych można stwierdzić, że występują istotne różnice między odsetkami osób na poszczególnych wydziałach, które zdały statystykę?

13 Zadanie 7 W celu zbadania, czy istnieje związek pomiędzy dochodem i posiadanym wykształceniem przeprowadzono badanie na 450 osobowej próbie losowej i otrzymano następujące wyniki: Roczny dochód (w tyś. PLN) poniżej powyżej 250 Wykształcenie wyższe Brak ukończonych studiów Zweryfikować odpowiednią hipotezę na poziomie istotności 1%. Zadanie 8 Na podstawie wyników badania 200 losowo wybranych osób (plik wakacje.csv) stwierdzić, czy istnieje zależność między płcią a preferowanym miejscem spędzania wakacji. Zadanie 9 Psycholog pracujący w poradni rodzinnej zebrał dane dotyczące powodów kryzysów małżeńskich, które wymieniane były przez przychodzące do poradni pary. Dane te, zamieszczone w poniższej tabeli, pokazują źródła kryzysu postrzegane przez każde z małżonków. Przyczyny kryzysu wymieniane przez mężów Pieniądze Dzieci Zainteresowania Inne Przyczyny Pieniądze kryzysu Dzieci wymieniane Zainteresowania przez żony Inne Czy na podstawie zebranych danych można stwierdzić, że istnieje zależność poglądów mężów i żon, co do przyczyn kryzysu w ich małżeństwach? Zadanie 10 Firma rozważa pięć projektów nazw swojego nowego produktu. Przed wybraniem jednej z nich firma postanowiła sprawdzić, czy wszystkie pięć nazw równie silnie przyciąga klientów. Wybrano losową próbę 100 osób i każdą z nich poproszono o wskazanie najlepszej z nazw. Liczby osób, które wybrały kolejne nazwy są podane niżej: Nazwa A B C D E Liczba dokonanych wyborów Zweryfikować odpowiednią hipotezę na poziomie istotności 0.1. Zadanie 11 Analityk w branży napojów orzeźwiających chce przeprowadzić test statystyczny w celu określenia, czy istnieje zależność między preferencjami konsumenta co do rodzaju napoju (Coke, Pepsi, 7Up i Dr Pepper) oraz faktem, czy osoba ta pija napoje zwykłe czy wersję light. Wybrano w tym celu próbę losową 330 osób, a ich preferencje przedstawiono w poniższej tablicy. Coke Pepsi 7Up Dr Pepper Wersja Light Wersja normalna Przeprowadzić odpowiedni test na poziomie istotności Zadanie 12 Poniższa tabela zawiera wyniki ankiety dotyczącej czytelnictwa czterech periodyków uważanych za opniotwórcze, przeprowadzonej na losowej próbie 500 osób (pytani mogli wskazać tylko jeden tygodnik). Czy na ich podstawie można stwierdzić, że 30% osób wybiera Monotykę, 25% Newbzik, 20% Wstecz, a 25% Wykrój? Przyjąć poziom istotności Czasopismo Monotyka Newsbzik Wstecz Wykrój Liczba czytelników

14 Zadanie 13 W kampanii prezydenckiej komitet wyborczy kandydata A zbierał informacje o poparciu społecznym dla tego kandydata. Uzyskano następujące wyniki Poparcie Brak poparcia Kobiety Mężczyźni Na poziomie istotności 0.05 stwierdzić, czy istnieje zależność między płcią respondenta a poparciem dla kandydata A. Zadanie 14 Zweryfikować hipotezę, że poniższe dane pochodzą z rozkładu chi-kwadrat o 5 stopniach swobody. Przyjąć poziom istotności 0.1.

15 STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 6 Cel: jednoczynnikowa i wieloczynnikowa analiza wariancji (ANOVA) Zadanie 1 Dokonano po cztery niezależne pomiary wytrzymałości na ściskanie trzech rodzajów betonu. Otrzymano następujące wyniki (w kg/cm 2 ): I II III Stwierdzić, czy badane gatunki betonu różnią się istotnie pod względem wytrzymałości na ściskanie. Przyjąć poziom istotności Zadanie 2 Zbadano czas reakcji trzech rodzajów układów stosowanych w kalkulatorach elektronicznych i otrzymano następujące wyniki (w milisekundach): Typ układu Czas reakcji I II III Stwierdzić, czy istnieje statystycznie istotna różnica między czasami reakcji badanych trzech układów. Przyjąć poziom istotności Zadanie 3 Plik zarobki.csv zawiera dane dotyczące wysokości miesięcznych zarobków wybranych losowo osób w czterech miastach: w Warszawie, Krakowie, Wrocławiu i Katowicach. Stwierdzić, czy wysokość miesięcznych zarobków w tych miastach różni się istotnie (przyjąć poziom istotności 0.05). Zadanie 4 W celu porównania trzech metod nauki stenografii przeprowadzono sprawdzian na losowych próbach osób szkolonych poszczególnymi metodami. Otrzymano następujące wyniki: metoda maksymalna liczba słów zapisanych w ciągu jednej minuty A 147, 188, 162, 144, 157, 179, 165, 180 B 153, 161, 157, 155, 163, 160, 154 C 173, 152, 194, 186, 166, 194, 178, 192, 186 Zbadać, czy te trzy metody są tak samo efektywne. Zadanie 5 Na podstawie danych dotyczących parametrów kilku wybranych marek samochodów (plik samochody.csv) stwierdzić, czy istnieją istotne różnice w zużyciu paliwa przez samochody produkowane w USA, w Europie i w Japonii. Zadanie 6 Zamieszczony poniżej zbiór danych zawiera obserwacje plonów pszenicy ozimej (w kwintalach na hektar) zebranych z poletek nawadnianych dwiema metodami, przy zastosowaniu czterech dawek nawożenia azotem (zmienne woda i azot zawierają, odpowiednio, kody metod nawadniania i dawek nawożenia):

16 woda azot plon woda azot plon Na podstawie tych danych ocenić doboru metody nawadniania poletek i sposobu nawożenia azotem na wielkość plonu ziarna pszenicy ozimej. Oprócz oceny istotności wpływu pojedynczych czynników zbadać istotność interakcji (współdziałania) nawadniania i nawożenia azotem. Przyjąć poziom istotności Zadanie 7 W pewnych zakładach lotniczych stosuje się dwie metody nakładania farby podkładowej na części aluminiowe: malowanie zanurzeniowe i natryskowe. Czyni się to w celu zwiększenia przylegania właściwej farby nawierzchniowej, którą później są malowane owe części. We wspomnianych zakładach stosowano do tej pory trzy rodzaje farb podkładowych. Inżynier technolog, odpowiedzialny za ten etap produkcji, postanowił zbadać, czy rodzaj farby podkładowej oraz sposób jej nakładania na detal mają istotny wpływ na siłę przylegania właściwej farby nawierzchniowej. W tym celu przeprowadzono eksperyment, w którym zmierzono siłę przylegania farby nawierzchniowej do kilku detali malowanych wpierw różnymi farbami podkładowymi, nanoszonymi obiema metodami. Wyniki pomiarów zamieszczono w poniższej tabeli. Jakie wnioski powinien wyciągnąć inżynier na podstawie owych wyników? Rodzaj farby Malowanie zanurzeniowe Malowanie natryskowe A B C Zadanie 8 Przeprowadzono następujące doświadczenie: 18 mężczyzn i 18 kobiet rozmieszczono losowo w 9 pokojach w ten sposób, że w każdym pokoju były po dwie osoby tej samej płci. W pokojach tych utrzymywano stałą temperaturę: 18 0 C, 21 0 C albo 24 0 C (przydział temperatur poszczególnym pokojom był także losowy). Po upływie trzech godzin oceniano samopoczucie każdej z badanych osób (zastosowano ocenę punktową, w której 1 = zbyt zimno, 8 = idealna temperatura, 15 = zbyt ciepło). Pokój 1 Pokój 2 Pokój C M. 5 4 M. 5 4 M. 4 2 K 1 2 K 5 5 K 1 3 Pokój 4 Pokój 5 Pokój C M. 8 8 M. 6 3 M. 5 7 K 10 7 K 8 8 K 7 8 Pokój 7 Pokój 8 Pokój C M M. 8 7 M. 6 6 K K 8 8 K 6 7 Zbadać wpływ temperatury panującej w pokoju na samopoczucie. Czy ocena samopoczucia zależy od płci? Czy występują tu istotne interakcje między oboma badanymi czynnikami (tzn. temperaturą i płcią)?

17 Zadanie 9 Przeprowadzono eksperyment mający na celu porównanie prędkości transmisji danych przez pewien model telefaksu wyposażony w trzy rodzaje podzespołów elektronicznych (oznaczonych przez A, B i C), pochodzących od różnych producentów. Wspomnianą próbę przeprowadzono na trzech rodzajach druków: zawierających sam tekst, same ilustracje oraz tekst z ilustracjami. Ustalić, czy ujawniły się istotne różnice w przeciętnym czasie transmisji między telefaksami wyposażonymi w różne rodzaje podzespołów. A B C Tekst Ilustracje Tekst z ilustracjami Zadanie 10 W celu zbadania wpływu czterech dawek nawożenia azotowego (w ilościach 0, 40, 80 i 120 kg/ha) na plonowanie lucerny przy trzech sposobach siewu (siew czysty C oraz dwa rodzaje wsiewu M i P w jęczmień jary) założono doświadczenie w czterech powtórzeniach. Dla każdej kombinacji nawożenia ze sposobem siewu zmierzono plon zielonej masy (w kg z poletka). W pierwszym pokosie uzyskano następujące obserwacje: C M P Ustalić, który z badanych czynników miał istotny wpływ na plon masy zielonej.

18 STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka Zadanie 1 W zamieszczonej poniżej tabeli podano wysokość rocznego dochodu i wartość posiadanego domu dziewięciu rodzin wybranych w sposób losowy spośród mieszkańców pewnego okręgu: Roczny dochód ($ 1000) Wartość domu ($ 1000) a) Wyznaczyć prostą regresji wartości domu względem dochodu. b) Przeanalizować dopasowanie modelu. c) Oszacować wartość domu rodziny, której roczny dochód wynosi $ d) Wyznaczyć 95% przedział ufności dla szacowanej wartości domu tej rodziny. Zadanie 2 Wyznaczyć prostą regresji poziomu cholesterolu względem wieku dziesięciu losowo wziętych mężczyzn. Zweryfikować dopasowanie modelu. Wiek Poziom cholesterolu Zadanie 3 W poniższej tabeli podano liczbę ludności USA (w mln) w latach : Rok Ludność a) Przyjmując wykładniczy model wzrostu populacji, oszacować parametry tego modelu i zweryfikować jego dopasowanie. b) Oszacować przewidywaną wielkość populacji USA w 2015 i w 2020 roku. Zadanie 4 Niech X oznacza przeciętną liczbę samochodów poruszających się autostradą w ciągu dnia, natomiast Y liczbę wypadków samochodowych, która ma miejsce w ciągu miesiąca na autostradzie. Na podstawie danych zamieszczonych w poniższej tabeli wyznaczyć następujący model regresji Y = a + b X, opisujący zależność liczby wypadków od natężenia ruchu na autostradzie. Oszacować liczbę wypadków, jakiej można się spodziewać przy natężeniu ruchu odpowiadającemu 3500 samochodom poruszającym się autostradą w ciągu dnia. X Y

19 Zadanie 5 Dokonano osiem niezależnych pomiarów wielkości drgań pionowych gruntu powstałych w wyniku trzęsienia ziemi w różnej odległości od epicentrum trzęsienia. Otrzymano następujące wyniki: Odległość od epicentrum (km) Wielkość drgań pionowych (cm) a) Wyznaczyć funkcję regresji wielkości drgań gruntu względem odległości od epicentrum. b) Zweryfikować dopasowanie modelu. c) Oszacować wielkość drgań w odległości 100 km od epicentrum. Zadanie 6 Korzystając z danych zawartych w poniższej tabeli wyznaczyć funkcję regresji, opisującą zależność między liczbą cykli do zniszczenia pewnego detalu a wywieranym na ten detal naprężeniem. Oszacować liczbę cykli do zniszczenia detalu, pracującego pod naprężeniem 40 tys. psi. Naprężenie (w tys. psi) Liczba cykli do zniszczenia (w mln cykli) Zadanie 7 Pewna firma, chcąc sprawdzić jak liczba reklam zamieszczanych w gazetach w ciągu miesiąca wpływa na zainteresowanie klientów pewnym towarem, przeprowadziła badania otrzymując następujące wyniki: liczba reklam odsetek zainteresowanych klientów a) Wyznaczyć liniowy model regresji dla odsetka klientów zainteresowanych tym towarem w zależności od liczby reklam. b) Zweryfikować dopasowanie modelu. c) Na podstawie dobranego modelu oszacować odsetek klientów zainteresowanych tym towarem, jeżeli firma zamieści w ciągu tygodnia 19 reklam. Podać 95%-owy przedział ufności dla tej prognozy. Zadanie 8 Badano zależność jednostkowego kosztu produkcji pewnego wyrobu od wielkości jego rocznej produkcji. Otrzymano następujące dane: wielkość produkcji (w tys. sztuk) koszt jednostkowy (w zł.) a) Wyznaczyć liniowy model regresji opisujący badaną zależność. b) Zweryfikować dopasowanie modelu. c) Na podstawie dobranego modelu podać prognozę jednostkowego kosztu produkcji tego wyrobu przy produkcji wynoszącej 40 tys. sztuk. Podać 95%-owy przedział ufności dla tej prognozy Zadanie 9 W pewnej firmie postanowiono zbadać zależność między wielkością tygodniowej sprzedaży produktów chemicznych tej firmy, a wydatkami poniesionymi na reklamę radiowo-telewizyjną oraz wydatkami poniesionymi na pokazy w sklepach. Oto dane (w tyś. $) pochodzące z 10 tygodni: Wartość tygodniowej sprzedaży Wydatki na reklamę radiowo-telewizyjną Wydatki na pokazy w sklepach a) Wyznaczyć liniową funkcję regresji opisującą badaną zależność. b) Zweryfikować dopasowanie modelu. c) Wykorzystać uzyskane równanie regresji do prognozy wielkości sprzedaży, gdy wydatki na reklamę radiowotelewizyjną wyniosą 8000$, natomiast wydatki na pokazy w sklepach 12000$.

20 Zadanie 10 Pośrednik w handlu nieruchomościami jest zainteresowany oszacowaniem wpływu powierzchni budynku i jego odległości od centrum miasta na wartość budynku. Poniższa tabela zawiera informacje o dziewięciu losowo wybranych budynkach. Wartość budynku (tys. $) Powierzchnia (m 2 ) Odległość od centrum (km) a) Wyznaczyć liniową funkcję regresji opisującą zależność, którą interesuje się ów pośrednik. b) Zweryfikować dopasowanie modelu. c) Podać przewidywaną wartość domu o powierzchni 160 m 2, położonego w odległości 3 km od centrum miasta. Zadanie 11 Onkolodzy postanowili przetestować na myszach skuteczność nowego leku antyrakowego. W tym celu 10 myszom mającym guz o wadze 4g podawano różne dawki owego leku. Po ustalonym czasie zmierzono stopień redukcji wielkości nowotworu. Wyniki badania zamieszcza poniższa tabela. Wielkość dawki Redukcja wagi nowotworu Wyznaczyć kwadratowy model regresji opisujący zależność stopnia redukcji wagi guza od wielkości dawki nowego leku. Zadanie 12 Dane zamieszczone w pliku geodezja.csv zawierają wyniki doświadczenia, którego celem było zbadania wpływu środowiska na dokładność pomiarów geodezyjnych. Kolejne kolumny odpowiadają następującym pomiarom: kat kąt refrakcji temp temperatura powietrza wilg wilgotność względna powietrza (w %) cis ciśnienie atmosferyczne (w mm Hg) odl odległość pomiędzy stanowiskiem a celem (w m) wys średnia wysokość celowania (w m). Znaleźć najlepszy model (liniowy) opisujący zależność kąta refrakcji od cech geodezyjnych (odległość i wysokość celowania) i atmosferycznych (kwadrat temperatury, wilgotność, ciśnienie). Zadanie 13 Na podstawie danych zawartych w pliku cardata.csv wyznaczyć model liniowy najlepiej opisujący zależność zużycia paliwa od przyśpieszenia, mocy silnika, liczby cylindrów, wagi i roku produkcji samochodu.

a) Utworzyć wykres kołowy dla stanu cywilnego danej grupy kobiet. Porównać różne formy opisu wykresu.

a) Utworzyć wykres kołowy dla stanu cywilnego danej grupy kobiet. Porównać różne formy opisu wykresu. Zadanie 1 Badania demograficzne przeprowadzone w 1988 roku w USA wykazały, że wśród kobiet (mających 18 i więcej lat) było: 17364 tyś. panien, 56128 tyś. mężatek, 11239 tyś. wdów i 8170 tyś. rozwódek.

Bardziej szczegółowo

Zestaw 6 (jednoczynnikowa i wieloczynnikowa analiza wariancji (ANOVA))

Zestaw 6 (jednoczynnikowa i wieloczynnikowa analiza wariancji (ANOVA)) Zestaw 6 (jednoczynnikowa i wieloczynnikowa analiza wariancji (ANOVA)) ANOVA Hipoteza: H: µ 1(mi) = µ 2 = µ 3 = = µ r (Czynnik nie wpływa na zmienną objaśnianą) (Czynnik wpływa) Założenia ANOVY: 0) Próby

Bardziej szczegółowo

Seria 7 1. 18 studentów drugiego roku zapytano na ilu wykładach z RPiS byli w ciagu semestru. Uzyskano nastepujace odpowiedzi: 12,15,9,13,15, 13, 1~ 10, 13, 1, 12, 1~ 1~ ~ 1~ 11, 13,1 Sporządzić wykres

Bardziej szczegółowo

Teoria Estymacji. Do Powyżej

Teoria Estymacji. Do Powyżej Teoria Estymacji Zad.1. W pewnym przedsiębiorstwie wylosowano niezależnie próbę 25 pracowników. Staż pracy (w latach) tych pracowników w 1996 roku był następujący: 37; 34; 0*; 5; 17; 17; 0*; 2; 24; 33;

Bardziej szczegółowo

Zadanie 1. Analiza Analiza rozkładu

Zadanie 1. Analiza Analiza rozkładu Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja

Bardziej szczegółowo

zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE

zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka Przebieg regresji liniowej: 1. Znaleźć funkcję y=f(x) (dopasowanie modelu) 2. Sprawdzić: a) Wsp. determinacji R 2 b) Test istotności

Bardziej szczegółowo

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6 Zad. 1. Zbadano wydajność odmiany pomidorów na 100 poletkach doświadczalnych. W wyniku przeliczeń otrzymano przeciętną wydajność na w tonach na hektar x=30 i s 2 x =7. Przyjmując, że rozkład plonów pomidora

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

ESTYMACJA. Przedział ufności dla średniej

ESTYMACJA. Przedział ufności dla średniej ESTYMACJA Przedział ufności dla średniej W grupie 900 losowo wybranych pracowników przedsiębiorstwa średnia liczba dni nieobecności w pracy wynosiła 30, a odchylenie standardowe 3 dni. a) Przyjmując współczynnik

Bardziej szczegółowo

Estymacja przedziałowa

Estymacja przedziałowa Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski Metody analizy danych ćwiczenia Estymacja przedziałowa Program ćwiczeń obejmuje następująca zadania: 1. Dom handlowy prowadzący

Bardziej szczegółowo

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów LISTA 4 1.Na pewnym obszarze dokonano 40 pomiarów grubości warstwy piasku otrzymując w m.: 54, 58, 64, 69, 61, 56, 41, 48, 56, 61, 70, 55, 46, 57, 70, 55, 47, 62, 55, 60, 54,57,65,60,53,54, 49,58,62,59,55,50,58,

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego Przedziały ufności Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego czyli P( μ [a,b] ) = 1 α P( μ < a ) = α/2 P( μ > b ) =

Bardziej szczegółowo

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA LISTA 10 1.Dokonano 8 pomiarów pewnej odległości (w m) i otrzymano: 201, 195, 207, 203, 191, 208, 198, 210. Wiedząc,że błąd pomiaru ma rozkład normalny

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH WERYFIKACJA HIPOTEZ STATYSTYCZNYCH I. TESTY PARAMETRYCZNE II. III. WERYFIKACJA HIPOTEZ O WARTOŚCIACH ŚREDNICH DWÓCH POPULACJI TESTY ZGODNOŚCI Rozwiązania zadań wykonywanych w Statistice przedstaw w pliku

Bardziej szczegółowo

ESTYMACJA PARAMETRYCZNA I WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

ESTYMACJA PARAMETRYCZNA I WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH ESTYMACJA PARAMETRYCZNA I WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH ZESTAW ZADAŃ ZALECANYCH DO PRZEROBIENIA PRZED PRZYSTĄPIENIEM DO EGZAMINU ZE STATYSTYKI 1 Oznaczenia: E estymacja, W weryfikacja, µ, σ, p, n

Bardziej szczegółowo

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści

Bardziej szczegółowo

WYKŁAD 5 TEORIA ESTYMACJI II

WYKŁAD 5 TEORIA ESTYMACJI II WYKŁAD 5 TEORIA ESTYMACJI II Teoria estymacji (wyznaczanie przedziałów ufności, błąd badania statystycznego, poziom ufności, minimalna liczba pomiarów). PRÓBA Próba powinna być reprezentacyjna tj. jak

Bardziej szczegółowo

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej 1 Statystyka opisowa Statystyka opisowa zajmuje się porządkowaniem danych i wstępnym ich opracowaniem. Szereg statystyczny - to zbiór wyników obserwacji jednostek według pewnej cechy 1. szereg wyliczający

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie

Bardziej szczegółowo

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

STATYSTYKA zadania do ćwiczeń. Weryfikacja hipotez część I.

STATYSTYKA zadania do ćwiczeń. Weryfikacja hipotez część I. STATYSTYKA zadania do ćwiczeń Weryfikacja hipotez część I Zad 1 W pewnej firmie postanowiono zbadać staż pracy pracowników W tym celu wylosowano prostą próbę losową z populacji pracowników i otrzymano,

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Zmienne losowe zadania na sprawdzian

Zmienne losowe zadania na sprawdzian Zmienne losowe zadania na sprawdzian Zad. 1. Podane poniżej dane dotyczą zawartości suchej masy (w %) i sosu (w %) w 24 konserwach ze śledzia w pomidorach: Zawartość suchej masy: 12,0 13,0 14,5 14,0 12,0

Bardziej szczegółowo

Porównanie dwóch rozkładów normalnych

Porównanie dwóch rozkładów normalnych Porównanie dwóch rozkładów normalnych Założenia: 1. X 1 N(µ 1, σ 2 1), X 2 N(µ 2, σ 2 2) 2. X 1, X 2 są niezależne Ocena µ 1 µ 2 oraz σ 2 1/σ 2 2. Próby: X 11,..., X 1n1 ; X 21,..., X 2n2 X 1, varx 1,

Bardziej szczegółowo

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy Elektrotechnika II [ Laboratorium Grupa ] 206/207 Zimowy Lp Numer indeksu Pkt Kol Suma Popr Ocena Data Uwagi 97574 6 7 Db + 2 9758 ++0,9 5 7,9 Db + 3 99555 0,9+0,9 2,8 Dst + 4 97595 0,8++ 0 2,8 Dst + 5

Bardziej szczegółowo

Estymatory i testy statystyczne - zadania na kolokwium

Estymatory i testy statystyczne - zadania na kolokwium Estymatory i testy statystyczne - zadania na kolokwium Zad. 1. Cecha X populacji ma rozkład N(µ, σ), gdzie µ jest znane, a σ nieznane. Niech X 1,...,X n będzie n-elementową próbą prostą pobraną z tej populacji.

Bardziej szczegółowo

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp. Zadanie 1 budżet na najbliższe święta. Podać 96% przedział ufności dla średniej przewidywanego budżetu świątecznego jeśli otrzymano średnią z próby równą 600 zł, odchylenie standardowe z próby równe 30

Bardziej szczegółowo

4.Zmienne losowe X 1, X 2,..., X 100 są niezależne i mają rozkład wykładniczy z α = 0.25 Jakie jest prawdopodobieństwo, że 1

4.Zmienne losowe X 1, X 2,..., X 100 są niezależne i mają rozkład wykładniczy z α = 0.25 Jakie jest prawdopodobieństwo, że 1 LISTA 7 W rozwiązaniu zadań 1-4 wykorzystać centralne twierdzenie graniczne. 1.Prawdopodobieństwo, że aparat zepsuje się w czasie jego konserwacji wynosi 0.02. Jakie jest prawdopodobieństwo, że w trakcie

Bardziej szczegółowo

Wykład 3 Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

L.Kowalski zadania ze statystyki matematycznej-zestaw 2 ZADANIA - ZESTAW 2

L.Kowalski zadania ze statystyki matematycznej-zestaw 2 ZADANIA - ZESTAW 2 L.Kowalski zadania ze statystyki matematycznej-zestaw ZADANIA - ZESTAW Zadanie.1 Badano maksymalną prędkość pewnego typ samochodów osobowych (cecha X poplacji. W 5 pomiarach tej prędkości otrzymano x 195,8

Bardziej szczegółowo

Zadania z Zasad planowania eksperymentu i opracowania wyników pomiarów. Zestaw 3

Zadania z Zasad planowania eksperymentu i opracowania wyników pomiarów. Zestaw 3 Zestaw 3 Zadanie. 1. Dla zmiennej losowej o rozkładzie normalnym N (100; 10) obliczyć: a) P(X

Bardziej szczegółowo

Statystyki opisowe i szeregi rozdzielcze

Statystyki opisowe i szeregi rozdzielcze Statystyki opisowe i szeregi rozdzielcze - ćwiczenia ĆWICZENIA Piotr Ciskowski ramka-wąsy przykład 1. krwinki czerwone Stanisz W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0 Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA, LISTA 3

STATYSTYKA MATEMATYCZNA, LISTA 3 STATYSTYKA MATEMATYCZNA, LISTA 3 1. Aby zweryfikować hipotezę o symetryczności monety; H: p = 0.5 przeciwko K: p 0.5 wykonano nią n = 100 rzutów. Wyznaczyć obszar krytyczny i zweryfikować hipotezę H gdy

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Kolokwium ze statystyki matematycznej

Kolokwium ze statystyki matematycznej Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę

Bardziej szczegółowo

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na

Bardziej szczegółowo

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Statystyka. Zadanie 1.

Statystyka. Zadanie 1. Statystyka Zadanie 1. W przedsiębiorstwie Statexport pracuje 100 pracowników fizycznych i 25 umysłowych. Typowy wiek pracownika fizycznego kształtuje się w przedziale od 30 do 40 lat. Średnia wieku pracowników

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;

Bardziej szczegółowo

Estymacja parametro w 1

Estymacja parametro w 1 Estymacja parametro w 1 1 Estymacja punktowa: średniej, odchylenia standardowego i frakcji µ - średnia populacji h średnia z próby jest estymatorem średniej populacji = - standardowy błąd estymacji średniej

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014 Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI 1. Test dla dwóch średnich P.G. 2. Testy dla wskaźnika struktury 3. Testy dla wariancji DECYZJE Obszar krytyczny od pozostałej

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Opis przedmiotu: Probabilistyka I

Opis przedmiotu: Probabilistyka I Opis : Probabilistyka I Kod Nazwa Wersja TR.SIK303 Probabilistyka I 2012/13 A. Usytuowanie w systemie studiów Poziom Kształcenia Stopień Rodzaj Kierunek studiów Profil studiów Specjalność Jednostka prowadząca

Bardziej szczegółowo

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich

Bardziej szczegółowo

Estymacja punktowa i przedziałowa

Estymacja punktowa i przedziałowa Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41 Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna

Bardziej szczegółowo

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki Maszyna ustawiona jest tak, by produkowała kulki łożyskowe o średnicy 1 cm. Pomiar dziesięciu wylosowanych z produkcji kulek dał x = 1.1 oraz s 2 = 0.009. Czy można uznać, że maszyna nie rozregulowała

Bardziej szczegółowo

Wnioskowanie statystyczne. Statystyka w 5

Wnioskowanie statystyczne. Statystyka w 5 Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających

Bardziej szczegółowo

Prawdopodobieństwo Odp. Odp. 6 Odp. 1/6 Odp. 1/3. Odp. 0, 75.

Prawdopodobieństwo Odp. Odp. 6 Odp. 1/6 Odp. 1/3. Odp. 0, 75. Prawdopodobieństwo 2.1. Rzucamy dwukrotnie kostką do gry. Obliczyć prawdopodobieństwo, że suma oczek będzie większa od 9, jeżeli za pierwszym razem wypadło 6 oczek? Odp. 1 2. 2.2. W skrzyni znajduje się

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej próbki losowej. Hipotezy

Bardziej szczegółowo

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15 VII WYKŁAD STATYSTYKA 30/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 7 (c.d) WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności,

Bardziej szczegółowo

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach. Zadanie 1.Wiadomo, że dominanta wagi tuczników jest umiejscowiona w przedziale [120 kg, 130 kg] i wynosi 122,5 kg. Znane są również liczebności przedziałów poprzedzającego i następnego po przedziale dominującym:

Bardziej szczegółowo

Estymacja parametrów rozkładu cechy

Estymacja parametrów rozkładu cechy Estymacja parametrów rozkładu cechy Estymujemy parametr θ rozkładu cechy X Próba: X 1, X 2,..., X n Estymator punktowy jest funkcją próby ˆθ = ˆθX 1, X 2,..., X n przybliżającą wartość parametru θ Przedział

Bardziej szczegółowo

Hipotezy statystyczne

Hipotezy statystyczne Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o którego prawdziwości lub fałszywości wnioskuje się na podstawie pobranej

Bardziej szczegółowo

Wydział Matematyki. Testy zgodności. Wykład 03

Wydział Matematyki. Testy zgodności. Wykład 03 Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria Wykład 11 Anna Skowrońska-Szmer lato 2016/2017 Powtórzenie materiału 2 Zadanie 1 Wykład 1 Eksperyment polega na pojedynczym rzucie symetryczną kostką. Przestrzeń zdarzeń

Bardziej szczegółowo

Rozkłady statystyk z próby

Rozkłady statystyk z próby Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny

Bardziej szczegółowo

Zmienne losowe dyskretne i Zmienne losowe ciągłe Rozkład Normalny

Zmienne losowe dyskretne i Zmienne losowe ciągłe Rozkład Normalny Zmienne losowe dyskretne i Zmienne losowe ciągłe Rozkład Normalny 1. Wyprodukowanie określonej liczby wyrobów przez jednego pracownika w ciągu godziny jest zmienną losową o następującym rozkładzie prawdopodobieństwa:

Bardziej szczegółowo

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące

Bardziej szczegółowo

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu Kod przedmiotu TR.SIK303 Nazwa przedmiotu Probabilistyka I Wersja przedmiotu 2015/16 A. Usytuowanie przedmiotu w systemie studiów Poziom kształcenia Studia I stopnia Forma i tryb prowadzenia studiów Stacjonarne

Bardziej szczegółowo

Zad. 1. Wartość pożyczki ( w tys. zł) kształtowała się następująco w pewnym banku:

Zad. 1. Wartość pożyczki ( w tys. zł) kształtowała się następująco w pewnym banku: Zad. 1. Wartość pożyczki ( w tys. zł) kształtowała się następująco w pewnym banku: Kwota Liczba pożyczek pożyczki 0 4 0 4 8 8 12 40 12 16 16 Zbadać asymetrię rozkładu kwoty pożyczki w tym banku. Wynik

Bardziej szczegółowo

Statystyka Matematyczna Anna Janicka

Statystyka Matematyczna Anna Janicka Statystyka Matematyczna Anna Janicka wykład I, 22.02.2016 STATYSTYKA OPISOWA, cz. I Kwestie techniczne Kontakt: ajanicka@wne.uw.edu.pl Dyżur: strona z materiałami z przedmiotu: wne.uw.edu.pl/azylicz akson.sgh.waw.pl/~aborata

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

1.1 Wstęp Literatura... 1

1.1 Wstęp Literatura... 1 Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33 Statystyka Wykład 4 Magdalena Alama-Bućko 19 marca 2018 Magdalena Alama-Bućko Statystyka 19 marca 2018 1 / 33 Analiza struktury zbiorowości miary położenia ( miary średnie) miary zmienności (rozproszenia,

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K.

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K. TEMAT 1: WYBRANE ROZKŁADY TYPU SKOKOWEGO ROZKŁAD DWUMIANOWY (BERNOULLIEGO) Zadanie 1-1 Prawdopodobieństwo nieprzekroczenia przez pewien zakład pracy dobowego limitu zużycia energii elektrycznej (bez konieczności

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja

Bardziej szczegółowo

Elementarne metody statystyczne 9

Elementarne metody statystyczne 9 Elementarne metody statystyczne 9 Wybrane testy nieparametryczne - ciąg dalszy Test McNemary W teście takim dysponujemy próbami losowymi z dwóch populacji zależnych pewnej cechy X. Wyniki poszczególnych

Bardziej szczegółowo

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych cd. Temat Testowanie hipotez statystycznych cd. Kody znaków: żółte wyróżnienie nowe pojęcie pomarańczowy uwaga kursywa komentarz 1 Zagadnienia omawiane na zajęciach 1. Przykłady testowania hipotez dotyczących:

Bardziej szczegółowo

Testowanie hipotez. 1 Testowanie hipotez na temat średniej

Testowanie hipotez. 1 Testowanie hipotez na temat średniej Testowanie hipotez Poziom p Poziom p jest to najmniejszy poziom istotności α, przy którym możemy odrzucić hipotezę zerową dysponując otrzymaną wartością statystyki testowej. 1 Testowanie hipotez na temat

Bardziej szczegółowo