RPiSM zajęcia 6 i 7 Zadanie 1 Błędem pierwszego rodzaju nazywamy sytuację, w której test statystyczny odrzuca hipotezę zerową pomimo jej prawdziwości. Prawdopodobieństwo popełnienia tego błędu jesteśmy w stanie narzucić przed przeprowadzeniem testu określa go poziom istotności (α). Wygenerować 1000 prób o liczebności 15 z rozkładu N(10,5). Dla każdej z próby przeprowadzić test jednej średniej (H0: m=10, H1 m 10). W ilu przypadkach H0 będzie odrzucona, jeśli poziom istotności ustalimy na 5% (1% lub 10%)? Zadanie 2 Błędem drugiego rodzaju nazywamy sytuację, w której test statystyczny nie odrzuca hipotezy zerowej, która w rzeczywistości jest fałszywa. O jakości rozważanego testu mówi moc testu, która właśnie informuje nas o tym, jak często jest popełniany błąd drugiego rodzaju. Na przykładzie trzech testów normalności: test chikwadrat, test KołomogorowaSmirnowa i test ShapiroWilka, wymyśleć prostą procedurę intuicyjnie odpowiadającą na pytanie o moc w/w testów. Test jednego parametru Zadanie 3 W pewnej firmie zastanawiano się, czy przeciętny PH przejeżdża rocznie więcej niż 50 000 km. W celu zweryfikowania tej hipotezy zebrano dane dotyczące 8 samochodów służbowych (założono, że rozkład jest normalny) i uzyskano: 53 021, 47 532, 61 252, 41 714, 74 086, 59 456, 53 012 i 50 726. Czy przypuszczenia analityka okazały się słuszne? Zadanie 4 Dwóch informatyków w firmie X zastanawia się, czy jest prawdą przeczytana przez nich informacja, że przynajmniej 40% wezwań do naprawienia sprzętu IT w ich firmie jest wynikiem niedouczenia personelu. Analizując notatki z ostatnich 3 miesięcy zauważyli, że w tym czasie zgłoszenia 84, z których 40 było bezpodstawnych. Czy przeczytana przez nich informacja jest zgodna z sytuacją w ich firmie? Zadanie 5 W trakcie przygotowania się do egzaminu z rachunku prawdopodobieństwa, student dotarł do obiegowych opinii, że przeciętny wynik z egzaminu jest na poziomie 50%. Nie dowierzając tym informacjom zebrał dane od przypadkowo spotkanych 32 kolegów z wyższych lat. Okazało się, że w tej próbie średnia wynosiła 43%, a odchylenie standardowe (z próby) wynosiło 25%. Czy w świetle tego badania pogłoski można uznać za wiarygodne.
Zadanie 6 Pracujący w kawiarni student IiE przeczytał, że ekspres do kawy parzy kawę o objętości opisanej rozkładem (200ml, 5ml). Nie dowierzając tym danym przeprowadził eksperyment i zmierzył objętość 11 nalewanych kaw. Uzyskał następujące pomiary: 182, 190, 203, 180, 187, 205, 196, 183, 195, 200, 194. Czy jego badanie potwierdziło dane z instrukcji obsługi? Zadanie 7 Pewna maszyna pakuje sól do torebek. W celu zbadania prawidłowości tego procesu zważono 38 torebek z cukrem. W wyniku tych ważeń uzyskano następujące wyniki: śr. waga torebki = 0.89 kg, a odch. st. = 0.14. Na poziomie istotności 0.01 zweryfikować hipotezę, że maszyna sypie przeciętnie 1 kg soli. Jaką hipotezę alternatywną należy przyjąć? Dlaczego? Zadanie 8 Wiadomo, że cena litra benzyny E95 na stacjach benzynowych w Krakowie rozkład normalny o odchyleniu standardowym 8 gr. Pewien student jadący na zajęcia statystyki zauważył, że ceny benzyny w mijanych przez niego stacjach były następujące: 4.68, 4.72, 4.80, 4,79, 4.71 i zastanawiał się, czy jest prawdą, że przeciętna cena litra benzyny w Krakowie wynosi 4.70 zł (taką informację usłyszał w lokalnym radio). Odpowiedzieć na powyższe pytanie przy założeniu, że α = 1%. Zadanie 9 Producent pewnego smartfonu twierdzi, że czas pracy telefonu (podczas rozmowy 3G) na jednym ładowaniu baterii wynosi co najmniej 30h. Przebadano losową próbę 100 smarftonów i uzyskano średni czas pracy 28h i 20 minut przy odchyleniu standardowym 7h i 25 minut. Na poziomie istotności α = 1% sprawdzić, czy producent mówi prawdę. Test dwóch parametrów Zadanie 10 Dwie partie polityczne postanowiły sprawdzić, jak Polacy oceniają prace rządu dot. zwalczania smogu. Poniżej uzyskane wyniki: Partia rządowa: 73 (dobrze) 112 (źle) Partia opozycyjna: 49 (dobrze) 128 (źle) Czy na poziomie istotności 5% można powiedzieć, że oba badania przyniosły takie same rezultaty? Zadanie 11 Dwóch czołowych skoczków narciarskich spierało się, który z nich jest lepszy. Zdecydowali się poddać próbie polegającej na oddaniu po 5 skoków. Uzyskano wyniki: Skoczek A: 132m, 141m, 136.5m, 142m, 138m Skoczek B: 128m, 137m, 140m, 132m, 131m.
Jakie musimy nałożyć założenia do zweryfikowania postawionej przez skoczków hipotezy? Jakie będą wyniki, jeśli założymy poziom istotności 1%? Zadanie 12 Dwóch konstruktorów chciało sprawdzić dokładność stworzonych przez siebie maszyn do napełniania tuszem drukarek. Postanowili sprawdzić to na próbie po 7 pojemników. Uzyskali następujące informacje Maszyna A: 48 ml, 49 ml, 46 ml, 49 ml, 51 ml, 50 ml, 48 ml Maszyna B: 51 ml, 46 ml, 47 ml, 50 ml, 53 ml, 51 ml, 54 ml Przyjmując poziom istotności 10% zweryfikować hipotezę o równości wariancji? Co będą oznaczały wyniki? Zadanie 13 Istnieje powszechna opinia mówiąca o tym, że panowie lepiej od kobiet zdają egzamin z RPiSM. W związku tym prowadzący przedmiot zebrał średnie wyniki egzaminu z ostatnich 6 lat: kobiety: 3.2, 2.7, 3.3, 3.6, 3.4, 3.2 mężczyźni: 3.4, 2.9, 3.5, 3.1, 3.6, 3.5 Zweryfikować postawioną hipotezę przy założeniu, że α = 5%. Zadanie 14 Wysunięto hipotezę mówiącą o tym, że studenci AGH palą papierosy częściej niż studenci UJ. Do jej zweryfikowania przebadano grupę studentów obu uczelni i uzyskano następujące wyniki: AGH: palący: 34 osoby, niepalący: 49 osób UJ: palący: 17 osób, niepalący: 35 osób Jakie będą wyniki, jeśli przyjmiemy α = 10%? Zadanie 15 Student pewnego inżynierskiego kierunku na AGH uzyskał następujące średnie ocen kolokwiów z matematyki i statystyki:, Przy obliczaniu średnich uwzględniono wszystkie stopnie uzyskane przez niego w trakcie ostatniego roku akademickiego. Liczby tych stopni były następujące: Czy na poziomie istotności 5% można powiedzieć, że wartości średnie ocen uzyskanych z obu przedmiotów są jednakowe? Proszę założyć, że obie rozważane populacje mają rozkład normalny, a ich teoretyczne odchylenia standardowe są równe. test zgodności chikwadrat Pearsona Zadanie 16 W literaturze przedmiotu mówi się o tym, że liczba strzelonych bramek w meczu jest dobrze opisana rozkładem Poissona. Poniżej przedstawiono dane dotyczące liczby strzelonych bramek przez cztery
wybrane drużyny z ligi angielskiej w ciągu ostatnich 10 sezonów. Czy na poziomie istotności 5% można powiedzieć, że te dane są dobrze opisane rozkładem Poissona? drużyna/bramki 0 1 2 3 4 5 6 7 8 Everton 35 61 72 37 9 2 1 1 0 Hull 38 35 23 5 0 0 2 0 0 Man City 32 51 47 43 27 9 7 2 0 Southampton 22 29 30 9 11 0 1 0 1 Zadanie 17 Wykładowca AGH postanowił sprawdzić, czy wyniki egzaminu ze statystyki mają rozkład normalny. W tym celu stworzył poniższą tabelę i zebrał wyniki studentów z ostatniego roku. Do jakich doszedł wniosków? Zadanie 18 drużyna/bramki 0.0% 12.5% 12.5% 25% 25.0% 37.5% 37.5% 50% 50.0% 62.5% 62.5% 75.0% 75.0% 87.5% 87.5% 100% Everton 4 7 21 36 26 14 5 2 Prowadzący ćwiczenia zarzeka się, że w ich trakcie wybiera do odpowiedzi losowo. Niedowierzający student postanowił notować, kogo ów prowadzący pyta. W tym celu każdemu uczestnikowi kursu przyporządkował numery od 1 do 10 i uzyskał wyniki przedstawione w tabeli: Osoba 1 2 3 4 5 6 7 8 9 10 N 12 11 12 14 7 8 6 12 10 8 Czy, przyjmując poziom istotności α = 1%, student miał słuszne przypuszczenia? Zadanie 19 Pewna maszyna losująca podobna do ruletki ma dokładnie cztery równe pola: dwa czerwone, jedno białe i jedno czarne. Uruchomiono ją 100 razy i zaobserowowano, że 60 razy wypadło pole czerwone, 29 razy pole białe i tylko 11 razy pole czarne. Zweryfikuj hipotezę, że owa maszyna jest uczciwa. Przyjąć założenie, że poziom istotności wynosi 0.1. Zadanie 20 W badaniach warunków życia mieszkańców pewnego miasta zebrano m. in. informacje o wysokości dochodów przypadających na 1 członka gospodarstwa domowego. Dla losowej próby 200 gospodarstw uzyskano następujące wyniki badań: DOCHÓD NA 1 OS. GOSPODARSTWA 250 450 5 450 650 25 650 850 80 850 1050 70 1050 1250 15 1250 1450 5
Zadanie 21 Test niezależności chikwadrat Przeprowadzono badanie, na ile wyniki na studiach (z matematyki) zależą od rodzaju ukończonej szkoły średniej. Czy na poziomie istotności 5% można powiedzieć, że ukończona szkoła średnia determinuje postępy na studiach? Zadanie 22 LO (mat) LO Technikum Inne Wysokie 36 26 10 8 Przeciętne 21 27 15 5 niskie 17 16 7 5 Pewien wykładowca WZ AGH chciał sprawdzić, czy istnieje zależność między kierunkiem, na którym prowadzi zajęcia i terminem, w którym jego studenci zdają egzamin. Przeprowadził on krótką analizę wyników z ubiegłych kilku lat i uzyskał następujące informacje: 1 termin 2 termin 3 termin Brak IiE 27 16 8 7 ZiIP 21 30 15 36 Czy na poziomie istotności α = 1% jest on w stanie stwierdzić, że wyniki na obu kierunkach istotnie się różnią? Zadanie 23 W tabeli zawarto wyniki badań koloru oczu oraz koloru włosów wśród mężczyzn. Zbadać, czy dla poziomu istotności rozważane cechy można uznać za niezależne? Blondyn Szatyn Brunet Rudy Niebieskie 22 26 18 6 Zielone 41 30 15 5 Piwne 33 34 27 8 Szare 31 17 14 5 Zadanie 24 W badaniach efektywności szkolenia zawodowego pracowników bezpośrednio produkcyjnych w pewnym przedsiębiorstwie dla losowo wybranej próby 60 pracowników dokonano pomiaru ich wydajności pracy (w szt./zmianę) przed i po przejściu szkolenia. Uzyskano następujące dane: WYDAJNOŚĆ PRACY LICZBA PRACOWNIKÓW W SZT./ZMIANĘ przed szkoleniem po szkoleniu 10 14 28 5 14 18 18 20 18 22 12 25 22 26 2 10 Zweryfikować hipotezę, iż szkolenie zawodowe istotnie ma wpływ wydajność pracy pracowników. (To zadanie można rozwiązać także a nawet rozsądniej jest to zrobić w ten sposób za pomocą testu dwóch średnich. W jaki sposób?)
Zadanie 25 Analiza wariancji W pewnej szkole podstawowej przeprowadzono badanie dotyczące wyników testu kompetencji po SP. Uzyskano następujące wyniki: kl. 6a: 32, 37, 26, 28, 17, 23, 18, 33, 26, 15 kl. 6b: 22, 29, 36, 18, 31, 33, 19, 20, 26, 34 kl. 6c: 35, 38, 24, 22, 19, 26, 15, 35, 24, 29 Czy na poziomie istotności α = 5% można powiedzieć o tym, że klasy osiągnęły taki sam przeciętny wynik? Zadanie 26 Pan Robert zastanawiał się, gdzie aplikować o pracę w poszukiwaniu wysokich zarobków. W tym celu przeprowadził rozeznanie, które przyniosło następujące wyniki: Firma A: 5400, 3800, 4250, 3900, Firma B: 3950, 4300, 6000, 4500, 4800. Firma C: 3650, 4300, 4700, 4000, 4600. Czy na założonym przez niego 5% poziomie istotności można twierdzić, że jest firma, która płaci najlepiej? Zadanie 27 Czterej statystyce i grzybiarze zarazem sprzeczali się, który najskuteczniej szuka grzybów. Do wiarygodnej odpowiedzi na postawione przez pytanie, postanowili wykorzystać ANOVĘ (przy 1% poziomie istotności). W kolejnych trzech tygodniach 10 razy wybrali się na grzybobranie i zebrali następującą liczbę prawdziwków: Co się okazało? A B C D 12 15 18 13 21 26 18 13 19 18 18 18 30 20 11 7 25 24 12 16 21 23 17 6 11 25 22 20 23 8 11 11 11 18 17 14 25 14 18 18
Zadanie 28 W Instytucie Ziemniaka przeprowadzono badanie plonów ziemniaka w zależności od odmian rośliny i rodzaju stosowanego nawozu. Uzyskane plony zamieszczono w tabeli: Odmiana Nawóz 1 Nawóz 2 Nawóz 3 Nawóz 4 A 1.9 2.2 2.6 1.8 B 2.5 1.9 2.3 2.6 C 1.7 1.9 2.2 2.0 Przeprowadzić (dwukrotnie) ANOVĘ, by zbadać oddzielny wpływ odmiany ziemniaka i rodzaju stosowanego nawozu na uzyskane plony. Przyjąć α = 5%. (dla zainteresowanych: Jakie byłyby wyniki, gdyby tę analizę przeprowadzić w postaci dwuczynnikowej ANOVY? Co oznacza pojęcie efektu interakcji? Zadanie 29 Zadania inne (Własności rozkładów) Zmienna losowa X przyjmuje tylko trzy wartości: 0, 1 i 2. Wiadomo, że oraz. Na podstawie tych informacji należy wyznaczyć rozkład zmiennej X. Zadanie 30 (Test serii) W badaniach wyników studiowania osiąganych przez studentów pewnej uczelni z ich populacji wylosowano próbę 25 studentów, dla której ustalono następujące średnie z całego toku studiów: 3,11; 4,05; 3,75; 3,33; 4,25; 3,15; 3,96; 4,02; 2,99; 3,28; 3,65; 4,12; 3,48; 3,73; 3,26; 2,87; 4,54; 3,24; 4,15; 3,66; 3,74; 4,28; 3,90; 3,45; 4,67. Na poziomie istotności 0,10 zweryfikować hipotezę, że dobór próby był losowy. Zadanie 31 (Test zgodności Kołmogorowa) Jak sprawdzić, czy prawdziwe jest założenie o normalności rozkładu w zadaniu 20. Zadanie 32 (Test jednej średniej) Zebrano informacje dla grupy kierowców, którzy w okresie ostatnich 8 lat na terenie miasta K spowodowali wypadek drogowy znajdując się pod wpływem alkoholu. Uzyskano następujące zestawienie: POZIOM ALKOHOLU ( ) KIEROWCY 0,40 1,0 15 1,0 1,6 120 1,6 2,2 180 2,2 2,8 85 Zakładając, że badana populacja ma charakter rozkładu normalnego przy poziomie istotności 0,05 zweryfikować hipotezę, że średnie stężenie alkoholu we krwi w całej populacji nietrzeźwych kierowców, którzy spowodowali wypadek drogowy, jest większe od 2,3 promila.