STATYSTYCZNE METODY WSPOMAGANIA DECYZJI

Podobne dokumenty
a) Utworzyć wykres kołowy dla stanu cywilnego danej grupy kobiet. Porównać różne formy opisu wykresu.

Zestaw 6 (jednoczynnikowa i wieloczynnikowa analiza wariancji (ANOVA))


Teoria Estymacji. Do Powyżej

Zadanie 1. Analiza Analiza rozkładu

zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) ,5 6,6

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

ESTYMACJA. Przedział ufności dla średniej

Estymacja przedziałowa

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

ESTYMACJA PARAMETRYCZNA I WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

WYKŁAD 5 TEORIA ESTYMACJI II

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

Testowanie hipotez statystycznych.

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

STATYSTYKA zadania do ćwiczeń. Weryfikacja hipotez część I.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Zmienne losowe zadania na sprawdzian

Porównanie dwóch rozkładów normalnych

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

Estymatory i testy statystyczne - zadania na kolokwium

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

4.Zmienne losowe X 1, X 2,..., X 100 są niezależne i mają rozkład wykładniczy z α = 0.25 Jakie jest prawdopodobieństwo, że 1

Wykład 3 Hipotezy statystyczne

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

L.Kowalski zadania ze statystyki matematycznej-zestaw 2 ZADANIA - ZESTAW 2

Zadania z Zasad planowania eksperymentu i opracowania wyników pomiarów. Zestaw 3

Statystyki opisowe i szeregi rozdzielcze

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

STATYSTYKA MATEMATYCZNA, LISTA 3

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Kolokwium ze statystyki matematycznej

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

PDF created with FinePrint pdffactory Pro trial version

Statystyka. Zadanie 1.

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Estymacja parametro w 1

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Zadania ze statystyki cz.8. Zadanie 1.

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Oszacowanie i rozkład t

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Opis przedmiotu: Probabilistyka I

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Testowanie hipotez statystycznych.

Estymacja punktowa i przedziałowa

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

Wnioskowanie statystyczne. Statystyka w 5

Prawdopodobieństwo Odp. Odp. 6 Odp. 1/6 Odp. 1/3. Odp. 0, 75.

Hipotezy statystyczne

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Estymacja parametrów rozkładu cechy

Hipotezy statystyczne

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka matematyczna i ekonometria

Rozkłady statystyk z próby

Zmienne losowe dyskretne i Zmienne losowe ciągłe Rozkład Normalny

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Zad. 1. Wartość pożyczki ( w tys. zł) kształtowała się następująco w pewnym banku:

Statystyka Matematyczna Anna Janicka

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Pobieranie prób i rozkład z próby

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Testy nieparametryczne

Analizy wariancji ANOVA (analysis of variance)

1.1 Wstęp Literatura... 1

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Weryfikacja hipotez statystycznych

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Elementarne metody statystyczne 9

Testowanie hipotez statystycznych cd.

Testowanie hipotez. 1 Testowanie hipotez na temat średniej

Transkrypt:

STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 1 Cel: wybrane rozkłady prawdopodobieństwa; statystyka opisowa danych jakościowych Zadanie 1 Utworzyć wykresy gęstości, dystrybuanty i funkcji przeżycia dla zmiennych losowych o rozkładzie normalnym z parametrami: a) N (0,1), N (1,1 ), N (2,1) b) N (0,1), N (0,0.5), N (0,2). Zadanie 2 Wyznaczyć wartości następujących kwantyli: a) kwantyl rzędu 0,95 rozkładu standardowego normalnego b) kwantyl rzędu 0,975 rozkładu standardowego normalnego c) kwantyl rzędu 0,95 rozkładu t-studenta o 10 stopniach swobody d) kwantyl rzędu 0,99 rozkładu t-studenta o 20 stopniach swobody e) kwantyl rzędu 0,9 rozkładu chi-kwadrat o 4 stopniach swobody f) kwantyl rzędu 0,95 rozkładu chi-kwadrat o 10 stopniach swobody g) kwantyl rzędu 0,95 rozkładu F-Snedecora o (2, 10) stopniach swobody h) kwantyl rzędu 0,99 rozkładu F-Snedecora o (3, 18) stopniach swobody. Zadanie 3 Wzrost pewnej grupy osób opisany jest rozkładem normalnym o wartości oczekiwanej 173 cm i odchyleniu standardowym 6 cm. a) Jakie jest prawdopodobieństwo, że losowo wybrana osoba ma nie więcej niż 179 cm wzrostu? b) Jaka jest frakcja osób mających wzrost pomiędzy 167 i 180 cm? c) Jakie jest prawdopodobieństwo, że losowo wybrana osoba ma więcej niż 181 cm wzrostu? d) Wyznaczyć wartość wzrostu, której nie przekracza 60% badanej populacji osób. Zadanie 4 Utworzyć wykresy gęstości zmiennych losowych o rozkładzie t-studenta z 1, 5 i 30 stopniami swobody. Porównać otrzymane wykresy z wykresem gęstości zmiennej losowej o rozkładzie normalnym. Zadanie 5 Instalacja przeciwpożarowa w pewnym budynku składa się z pięciu działających niezależnie czujników, a niezawodność każdego z nich wynosi 0,95. Jakie jest prawdopodobieństwo, że w przypadku pożaru a) zadziałają wszystkie czujniki b) zadziałają co najmniej trzy czujniki c) nie zadziała żaden czujnik? Zadanie 6 Oddział banku otrzymuje w ciągu tygodnia około 300 wniosków o wydanie karty kredytowej. Stwierdzono, że około 1% wniosków nie zostaje rozpatrzonych pozytywnie. Obliczyć prawdopodobieństwo odrzucenia w danym tygodniu trzech lub więcej wniosków o wydanie karty kredytowej. Zadanie 7 Czas poprawnej pracy aparatu telefonicznego ma rozkład wykładniczy, którego oczekiwany czas poprawnej pracy wynosi 10000 godzin. a) Obliczyć prawdopodobieństwo, że aparat ten nie uszkodzi się w ciągu: 1000, 10000, 30000 godzin pracy. b) Ile godzin powinien przepracować bezawaryjnie ten aparat z prawdopodobieństwem 0,90?

Zadanie 8 Z dotychczasowych obserwacji wynika, że liczba klientów przybywających w ciągu godziny do oddziału banku ma rozkład Poissona o średniej 4 (klientów na godzinę). a) Jaki jest rozkład prawdopodobieństwa czasu między przyjściem kolejnych klientów? b) Jaki jest średni czas oraz odchylenie standardowe czasu pomiędzy chwilami przybycia kolejnych klientów? c) Jeżeli w danej chwili do oddziału wszedł klient, to jakie jest prawdopodobieństwo, że w ciągu najbliższych 30 minut kolejny klient przybędzie do oddziału? d) Jakie jest prawdopodobieństwo, że w ciągu godziny do oddziału banku nie przyjdzie ani jeden klient? Zadanie 9 Badania demograficzne przeprowadzone w 1988 roku w USA wykazały, że wśród kobiet (mających 18 i więcej lat) było: 17364 tyś. panien, 56128 tyś. mężatek, 11239 tyś. wdów i 8170 tyś. rozwódek. a) Utworzyć wykres kołowy dla stanu cywilnego danej grupy kobiet. Porównać różne formy opisu wykresu. b) Utworzyć wykres słupkowy dla stanu cywilnego danej grupy kobiet. Porównać różne rodzaje wykresów i formy ich opisu. Zadanie 10 Koncern paliwowy planuje otworzyć nową stację benzynową w pewnym mieście. Rozważane są cztery możliwe lokalizacje stacji w południowej, północnej, zachodniej i wschodniej dzielnicy miasta (oznaczenia dzielnic: S południowa, N północna, W zachodnia i E wschodnia). W ramach badania opinii społecznej odnośnie preferowanej lokalizacji stacji zapytano o to tysiąc kierowców. Ich odpowiedzi znajdują się w pliku stacje.csv. Utworzyć wykres słupkowy i wykres kołowy dla badanych preferencji.

STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 2 Cel: statystyka opisowa danych ilościowych: metody graficzne prezentacji danych i wyznaczanie podstawowych statystyk próbkowych Zadanie 1 Wytrzymałość na ciśnienie wewnętrzne szkła butelek jest ich ważną charakterystyką jakościową. W celu zbadania wytrzymałości butelek umieszcza się je w maszynie hydrostatycznej, po czym zwiększa się ciśnienie aż do zniszczenia butelki. Plik butelki.csv zawiera dane opisujące graniczną wytrzymałość na ciśnienie wewnętrzne szkła badanej partii butelek (mierzone w psi). a) Utworzyć zmienną o nazwie cisnienie, opisującą wytrzymałość na ciśnienie wewnętrzne szkła butelek mierzone w MPa Wskazówka: 1psi = 0,0068947 MPa b) Utworzyć histogram dla danych opisujących wytrzymałość butelek. Prześledzić wpływ liczby klas na kształt histogramu. Porównać różne rodzaje histogramów. c) Utworzyć wykres łodygowo-liściowy. d) Utworzyć i zinterpretować wykres skrzynkowy dla wytrzymałości butelek. e) Wyznaczyć i zinterpretować podstawowe statystyki próbkowe dla danych opisujących wytrzymałość butelek. f) Obliczyć i zinterpretować 5, 10, 25, 50, 75, 90 i 95 percentyl dla rozważanych danych. Zadanie 2 W pliku samochody.csv zamieszczono dane dotyczące parametrów samochodów kilku wybranych marek. a) Zmienna mpg zawiera dane odpowiadające liczbie mil, przejechanych przez dany samochód na galonie paliwa. Utworzyć zmienną zp opisującą zużycie paliwa mierzone w litrach na 100 kilometrów. Wskazówka: 1 mila = 1609 m 1 galon (amerykański) = 3,785 l b) Utworzyć wykres łodygowo-liściowy dla zużycia paliwa. c) Utworzyć histogram dla danych opisujących zużycie paliwa. d) Utworzyć wykres skrzynkowy dla zużycia paliwa. e) Wyznaczyć i zinterpretować podstawowe statystyki próbkowe dla danych opisujących zużycie paliwa (takie jak: średnia, mediana, wariancja, odchylenie standardowe, rozstęp, kwartyle, rozstęp międzykwartylowy, wartości ekstremalne, współczynnik asymetrii, kurtoza, współczynnik zmienności). f) Obliczyć i zinterpretować 5, 10, 90 i 95 percentyl dla rozważanych danych. Zadanie 3 Analizowane w poprzednim zadaniu dane dotyczące zużycia paliwa postanowione poddać kategoryzacji tworząc następujące klasy: Zużycie paliwa [litry na 100 km] nie więcej niż 7 więcej niż 7 ale nie więcej niż 10 więcej niż 10 Kod opisujący kategorię zużycia paliwa mało średnio dużo Utworzyć wykres słupkowy dla wyznaczonych w ten sposób kategorii i wskazać, jaki procent badanych samochodów należy do każdej kategorii. Zadanie 4 Obliczyć przeciętne zużycie paliwa oraz odchylenie standardowe zużycia paliwa oddzielnie dla samochodów produkowanych w Europie, Ameryce i Japonii (wykorzystać zmienne producent i legenda). Zestawić wykresy skrzynkowe zużycia paliwa dla samochodów produkowanych w Europie, Ameryce i Japonii.

Zadanie 5 Porównać zużycie paliwa przez samochody o jednakowej liczbie cylindrów (dane dotyczące liczby cylindrów znajdują się w zmiennej cylindry). Zadanie 6 Porównać przyspieszenie samochodów produkowanych w Ameryce i Japonii (dane dotyczące przyspieszenia znajdują się w zmiennej przysp). Zadanie 7 Obliczyć średnie zużycie paliwa, medianę, wariancję, odchylenie standardowe, i współczynnik asymetrii zużycia paliwa wyłącznie dla samochodów ważących mniej niż 2500 funtów (wykorzystać zmienną waga). Zadanie 8 Przeprowadzić analizę mocy silników samochodów wyprodukowanych w latach 1979-1981 (wykorzystać zmienne: rok i moc), a w szczególności: a) Utworzyć i opisać szczegółowo wykres skrzynkowy dla badanej próbki. b) Utworzyć histogram. c) Podać moc silnika, której nie przekracza 95% wybranych samochodów. Zadanie 9 Przeprowadzić analizę przyspieszenia samochodów o wadze większej niż 2500 funtów, ale mniejszej niż 3000 funtów (wykorzystać zmienne: przysp i waga), a w szczególności: a) Utworzyć i opisać szczegółowo wykres skrzynkowy dla wybranej próbki. b) Utworzyć histogram. c) Podać wartość przyspieszenia, którą przekracza 25% wybranych samochodów. Zadanie 10 Przeprowadzić analizę wagi samochodów, które przejeżdżają na jednym galonie więcej niż 26 mil (wykorzystać zmienne mpg i waga), a w szczególności: a) Utworzyć i opisać szczegółowo wykres skrzynkowy dla wagi wybranych samochodów. b) Utworzyć histogram. c) Podać wagę, której nie przekracza 95% wybranych samochodów. Zadanie 11 Poniższe dane odpowiadają notowaniom pewnej spółki (w PLN) w kolejnych 20 dniach: 23,30 24,50 25,30 25,30 24,30 24,80 25,20 24,50 24,60 24,10 24,30 26,10 23,10 25,50 22,60 24,60 24,30 25,40 25,20 26,80 Utworzyć wykres cen akcji jako funkcję czasu (szereg czasowy). Zadanie 12 Zamieszczone poniżej dane przedstawiają wysokość czynszu płaconego w pewnej spółdzielni mieszkaniowej przez 30 losowo wybranych lokatorów: 334 436 425 398 424 429 392 428 339 389 352 405 392 403 344 400 424 443 378 387 384 498 374 389 367 457 409 454 345 422 a) Utworzyć histogram dla wysokość czynszu płaconego w tej spółdzielni. b) Obliczyć wartości miar tendencji centralnej dla powyższych danych. c) Obliczyć wartości charakterystyk rozproszenia dla powyższych danych. d) Obliczyć wartości charakterystyk kształtu dla powyższych danych. e) Obliczyć i zinterpretować 5, 10, 90 i 95 percentyl dla rozważanych danych. f) Utworzyć wykres skrzynkowy wysokość czynszu płaconego w tej spółdzielni mieszkaniowej.

STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 3 Cel: estymacja przedziałowa Zadanie 1 Średnia cena 50 losowo wybranych podręczników akademickich wyniosła 28.40 zł. Wiadomo, że odchylenie standardowe cen podręczników wynosi 4.75 zł. Wyznaczyć 95% przedział ufności dla średniej ceny podręcznika akademickiego zakładając, że rozkład cen jest rozkładem normalnym. Zadanie 2 Przeprowadzono 18 niezależnych pomiarów temperatury topnienia ołowiu i otrzymano następujące wyniki (w o C): 330.0 322.0 345.0 328.6 331.0 342.0 342.4 340.4 329.7 334.0 326.5 325.8 337.5 327.3 322.6 341.0 340.0 333.0 Zakładamy, że temperatura topnienia ołowiu ma rozkład normalny. Wyznaczyć dwustronny przedział ufności dla wartości oczekiwanej i odchylenia standardowego temperatury topnienia ołowiu na poziomie ufności 0.95. Zadanie 3 Pojemność 10 losowo wybranych baterii wyniosła (w ampero-godzinach): 140, 136, 150, 144, 148, 152, 138, 141, 143, 151. Zakładając, że pojemność baterii ma rozkład normalny, wyznaczyć 99% przedział ufności dla wariancji pojemności. Zadanie 4 W sondażu przeprowadzonym przez magazyn Time ( Time, 22 czerwca 1987) 578 spośród 1014 dorosłych respondentów stwierdziło, że dla dobra dzieci lepiej jest, gdy matka nie pracuje poza domem. Wyznaczyć 95% przedział ufności dla odsetka dorosłych podzielających ten pogląd. Zadanie 5 Wyznaczyć liczność próby, jaką należy pobrać, aby z maksymalnym błędem 2.5% oszacować na poziomie ufności 0.95 odsetek dorosłych Polaków czytających codziennie przynajmniej jedną gazetę. Uwzględnić rezultaty wstępnych badań, z których wynika, że interesująca nas wielkość jest rzędu 20%. Porównać otrzymaną liczność próby z licznością, jaka byłaby wymagana, gdyby pominąć rezultaty badań wstępnych. Zadanie 6 W celu oszacowania liczby nadgodzin w pewnym przedsiębiorstwie, wylosowano niezależnie próbę 25 pracowników, dla której otrzymano następujące wyniki (liczba nadgodzin przepracowanych w ubiegłym roku): Liczba nadgodzin Liczba pracowników 0 20 3 20 40 7 40 60 9 60 80 4 80 100 2 Zakładając, że rozkład liczby nadgodzin jest normalny, wyznaczyć przedział ufności dla średniej oraz odchylenia standardowego liczby nadgodzin przepracowanych w ubiegłym roku w tym przedsiębiorstwie. Przyjąć poziom ufności 0,95.

Zadanie 7 Dla grupy 180 rodzin wylosowanych niezależnie w pewnym mieście otrzymano następujący rozkład dochodów przypadających na jedną osobę: Dochód (w tys. zł) Liczba rodzin 0,0 0,4 25 0,4 0,8 50 0,8 1,2 40 1,2 1,6 35 1,6 2,0 30 Wyznaczyć przedział ufności dla wysokości średniego miesięcznego dochodu oraz odchylenia standardowego dochodu przypadającego na jednego członka rodziny. Przyjąć poziom ufności 0,9. Zadanie 8 Dział kontroli jakości w zakładach chemicznych chce oszacować średnią wagę proszku do prania sprzedawanego w pudełkach o nominalnej wadze 3 kg. Jak liczną próbkę pudełek proszku należy pobrać, aby z maksymalnym błędem 100g wyznaczyć 99% przedział ufności dla średniej wagi pudełka proszku do prania? Wiadomo, że rozkład wagi pudełka proszku do prania jest normalny z odchyleniem standardowym 150g. Zadanie 9 Poniższa tabela przedstawia rozkład miesięcznego wynagrodzenia brutto 150 wylosowanych niezależnie pracowników pewnego przedsiębiorstwa: Wynagrodzenie (zł) Liczba pracowników Poniżej 800 20 800 1000 60 1000 1200 40 1200 1400 20 Powyżej 1400 10 Czy wielkość próby jest wystarczająca, aby oszacować odsetek pracowników zarabiających powyżej 1200 zł z dokładnością ± 2%? Przyjąć poziom ufności 0,95. Zadanie 10 Wygenerować 10000 próbek 10-elementowych z rozkładu normalnego. Następnie zakładając, iż o próbkach wiemy tylko tyle, ze pochodzą one z rozkładu normalnego o nieznanych parametrach, wyznaczyć dla każdej próbki przedział ufności dla wartości oczekiwanej na poziomie ufności 0,95. Porównać frakcję pokryć przez przedział ufności faktycznej wartości oczekiwanej z założonym poziomem ufności. Zadanie 11 Zmienne Species oraz Petal.Length (znajdujące się w ramce danych iris) opisują, odpowiednio, gatunek oraz długość płatków kwiatów. Zakładamy, że rozkład długości płatków jest normalny. a) Zbudować 99% przedział ufności dla średniej długości płatków z gatunku virginica. b) Zbudować 95% przedział ufności dla odchylenia standardowego długości płatków z gatunku virginica. Zadanie 12 Przypuszcza się, że w jednym z województw podatnicy bezprawnie korzystają z pewnej ulgi podatkowej. Wylosowano 150 podatników i wykazano, że 19 z nich niesłusznie korzystało ze wspomnianej ulgi. Wyznaczyć 96% przedział ufności dla procentu podatników bezprawnie korzystających z tej ulgi. Zadanie 13 Zmienna weight znajdująca się w ramce danych chickwts opisuje wagę kurczaków, natomiast zmienna feed rodzaj użytej paszy. Zakładamy, że waga kurczaków ma rozkład normalny. Zbudować 93% przedział ufności dla wariancji wagi kurczaków karmionych paszą soybean.

Zadanie 14 Ramka danych faithful zawiera dane dotyczące czasu trwania erupcji gejzera Old Faithful (zmienna eruptions) oraz czasu oczekiwania na kolejną erupcję (zmienna waiting). Utworzyć 99% przedział ufności dla średniego czasu oczekiwania na kolejną erupcję. Zadanie 15 Ramka danych Orange zawiera między innym dane dotyczące obwodu drzewek pomarańczowych (zmienna circumference). Zakładając, że zmienna ta ma rozkład normalny, wyznaczyć przedział ufności dla odchylenia standardowego obwodu drzewek. Przyjąć poziom ufności 0,99. Zadanie 16 Ramka danych Pima.te z biblioteki MASS zawiera dane dotyczące zdrowia kilkuset Indianek z plemienia Pima mających co najmniej 21 lat. Zmienna type zawiera informację, czy kobieta jest chora na cukrzycę, czy nie. Utworzyć 95% przedział ufności dla odsetka Indianek dotkniętych cukrzycą. Utworzyć taki przedział dla Indianek mających co najmniej 35 lat.

STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 4 Cel: weryfikacja hipotez w modelach parametrycznych jedno- i dwupróbkowych Zadanie 1 Wytrzymałość na ciśnienie wewnętrzne szkła butelek jest ich ważną charakterystyką jakościową. Pewna rozlewnia 2 zainteresowana jest butelkami, których średnia wytrzymałość przewyższa 1,20 N / mm. Na podstawie dotychczasowych doświadczeń wiadomo, że rozkład ciśnienia jest normalny z odchyleniem standardowym 0.07 2 N / mm. Pobrano próbę losowa 20 butelek, które następnie umieszczono w maszynie hydrostatycznej, zwiększając 2 ciśnienie aż do zniszczenia butelki. Otrzymano następujące wyniki (w N / mm ): 1.36, 1.14, 1.27, 1.15, 1.20, 1.29, 1.27, 1.18, 1.23, 1.36, 1.38, 1.37, 1.30, 1.21, 1.33, 1.28, 1.32, 1.29, 1.33, 1.25. Na poziomie istotności 0.04 stwierdzić, czy dana partia butelek spełnia postawione wymagania jakościowe. Zadanie 2 Nominalna waga netto kawy sprzedawanej w opakowaniu szklanym winna wynosić 150 g. Występuje jednakże dużą zmienność wagi. Istotnie, próba losowa siedmiu słoiczków kawy konkretnej marki wykazała następujące wagi netto (w gramach): 142, 151, 148, 151, 145, 150, 141. a) Zakładając normalność rozkładu wagi, przetestować hipotezę głoszącą, że waga netto tej marki kawy wynosi faktycznie 150 g. Przyjąć poziom istotności α = 0. 05. b) Sprawdzić, czy odchylenie standardowe wagi netto słoika kawy różni się istotnie od 4g. Zadanie 3 Wylosowana niezależnie z partii żarówek 12 elementowa próba dała następujące wyniki pomiarów czasu świecenia (w godzinach): 2852, 3060, 2631, 2819, 2805, 2835, 2955, 2595, 2690, 2723, 2815, 2914. a) Zakładając normalność rozkładu czasu świecenia żarówek wyznaczyć 97% przedział ufności dla średniego czasu świecenia żarówek oraz dla odchylenia standardowego czasu świecenia żarówek. b) Czy średni czas świecenia żarówek jest istotnie krótszy od 2900 godzin? Przyjąć poziom istotności 0.05. Zadanie 4 W czasie poprawnej pracy maszyny frakcja wytwarzanych przez nią elementów wadliwych nie powinna przekraczać 4%. Jeżeli frakcja elementów wadliwych przekroczy 4%, wówczas należy podjąć czynności mające na celu wyregulowanie procesu produkcji. Pracownik zajmujący się kontrolą jakości pobrał próbkę losową 200 elementów i znalazł w niej 14 elementów wadliwych. Czy zaistniała sytuacja wymaga wyregulowania procesu produkcji? Zweryfikować odpowiednią hipotezę na poziomie istotności 0.05. Zadanie 5 Przeprowadzono ankietę wśród pracowników naukowych pewnej uczelni dotyczącą stażu pracy. Stwierdzono, że wśród 140 respondentów znalazło się 47 osób o stażu krótszym niż 10 lat, 53 osoby pracujące co najmniej 10, ale nie dłużej niż 15 lat oraz 40 osób o stażu pracy dłuższym niż 15 lat. Zweryfikować hipotezę, że 30% pracowników tej uczelni legitymuje się stażem pracy przekraczającym 15 lat. Przyjąć poziom istotności 0.05.

Zadanie 6 Badania dotyczące stażu pracy pracowników naukowych pewnego wydziału dały następujące rezultaty: Staż pracy (lata) Liczba pracowników 1 5 3 5 9 5 9 13 9 13 17 4 17 21 1 a) Zakładając, że rozkład stażu pracy jest normalny, zweryfikować hipotezę, że średnia stażu pracy na tym wydziale przekracza 8 lat. Przyjąć poziom istotności 0.05. b) Wyznaczyć 95% przedział ufności dla średniego stażu pracy na tym wydziale. c) Wyznaczyć 95% przedział ufności dla odchylenia standardowego stażu pracy na tym wydziale. Zadanie 7 W pewnym towarzystwie ubezpieczeniowym wylosowano niezależnie 300 polis, z których wypłacono odszkodowanie w ramach ubezpieczenia OC. Otrzymano następujące wyniki: Wysokość odszkodowania (w tys. zł) Liczba polis 0.0 2.0 190 2.0 4.0 38 4.0 6.0 26 6.0 8.0 34 8.0 10.0 12 a) Zweryfikować hipotezę, że średnia wysokość odszkodowania wynosi mniej niż trzy tysiące złotych. Przyjąć poziom istotności 0.03. b) Wyznaczyć 95% przedział ufności dla średniej wysokości odszkodowania. c) Wyznaczyć 95% przedział ufności dla odchylenia standardowego wysokości odszkodowania. d) Wyznaczyć 95% przedział ufności dla wariancji wysokości odszkodowania. Zadanie 8 W stopie metalicznym pewnego typu zastosowano dwa różne pierwiastki utwardzające. Wyniki pomiarów twardości przeprowadzonych później na próbkach tego stopu utwardzanych obiema metodami wyglądają następująco: Metoda I 145 150 153 148 141 152 146 154 139 148 Metoda II 152 150 147 155 140 146 158 152 151 143 153 Przyjmuje się, że twardość ma rozkład normalny oraz że odchylenia standardowe σ 1 i σ 2 dla obu metod są równe. Czy na podstawie przeprowadzonych pomiarów można stwierdzić, że średnia twardość stopu utwardzanego drugą metodą przewyższa średnią twardość stopu utwardzanego pierwszą metodą? Zadanie 9 Dokonano po 5 niezależnych pomiarów ciśnienia w komorze spalania silnika dla dwóch gatunków paliwa. Otrzymano następujące rezultaty (w kg/cm 2 ): pierwszy gatunek 40.32 39.85 41.17 40.62 40.04 drugi gatunek 51.07 49.60 50.45 50.59 50.29 Zakładamy, że ciśnienie w komorze spalania ma rozkład normalny. Na poziomie istotności 0.05 zweryfikować hipotezę o jednakowej wariancji ciśnienia dla obu gatunków badanego paliwa. Zadanie 10 Spośród pracowników pewnego przedsiębiorstwa wylosowano niezależnie 15 pracowników fizycznych i 9 pracowników umysłowych. Otrzymano następujące dane dotyczące stażu pracy (w latach): pracownicy umysłowi 14 17 7 33 2 24 26 22 12 pracownicy fizyczni 13 15 3 2 25 4 1 18 6 9 20 11 5 1 7 Wiadomo, że rozkład stażu pracy w przedsiębiorstwie jest normalny. Zweryfikować hipotezę, że średni staż pracy pracowników fizycznych jest istotnie krótszy niż staż pracy pracowników umysłowych.

Zadanie 11 Grupę 10 dzieci poddano testowi pamięci. Po pewnym czasie, w którym dzieci wykonywały w domu ćwiczenia usprawniające pamięć, poddano je ponownie testowi. Na podstawie wyników zamieszczonych w tabeli stwierdzić, czy zaproponowane ćwiczenia w istotny sposób usprawniają pamięć. Założyć, że liczba zapamiętywanych przedmiotów ma rozkład normalny. Dziecko 1 2 3 4 5 6 7 8 9 10 Liczba przedmiotów zapamiętanych przed serią ćwiczeń 27 21 34 24 30 27 33 31 22 27 Liczba przedmiotów zapamiętanych po serii ćwiczeń 29 32 29 27 31 26 35 30 29 28 Zadanie 12 Na podstawie danych dotyczących parametrów kilku wybranych marek samochodów (plik samochody.csv) stwierdzić, czy występuje statystycznie istotna różnica w przyspieszeniu samochodów produkowanych w USA i w Japonii. Zadanie 13 455 spośród 700 wylosowanych studentów Politechniki, będących absolwentami techników i 517 spośród 1320 wylosowanych studentów będących absolwentami liceów, nie zdało egzaminu z matematyki na zakończenie pierwszego semestru. Czy na podstawie powyższych wyników można stwierdzić, że absolwenci techników są słabiej przygotowani z matematyki niż absolwenci liceów? Zadanie 14 W pewnym przedsiębiorstwie wylosowano niezależnie 100 kobiet i 200 mężczyzn, dla których uzyskano następujące dane dotyczące stażu pracy: Liczba pracowników Staż pracy Kobiety Mężczyźni 0 5 8 20 5 10 14 48 10 15 25 80 15 20 30 32 20 25 23 20 Zweryfikować hipotezę, że odsetek kobiet pracujących w tym przedsiębiorstwie krócej niż 10 lat jest mniejszy niż odsetek mężczyzn o tym samym stażu pracy. Przyjąć poziom istotności 0.05. Zadanie 15 Zmienne age oraz height (znajdujące się w ramce danych Loblolly) opisują, odpowiednio, wiek (w latach) oraz wysokość drzew (w stopach). Zakładamy, że rozkład wysokości jest normalny. Na poziomie istotności 0.05 zweryfikować hipotezę, że średnia wysokość 15-letnich drzew wynosi 40 stóp. Zadanie 16 W poniższej tabeli zamieszczono dane dotyczące liczby zadań rozwiązanych podczas ostatniego egzaminu z RPS przez 120 losowo wybranych studentów: Liczba rozwiązanych zadań 0 1 2 3 4 Liczba studentów 15 32 41 26 6 Na poziomie istotności 0.03 zweryfikować hipotezę, że odsetek studentów, którzy podczas egzaminu rozwiązali poprawnie co najwyżej jedno zadanie przekracza 35%. Zadanie 17 Zmienna weight znajdująca się w ramce danych chickwts opisuje wagę kurczaków, natomiast zmienna feed rodzaj używanej paszy. Zeryfikować hipotezę, że średnia waga kurczaków karmionych paszą meatmeal jest większa niż średnia waga kurczaków karmionych paszą casein. Zakładamy, że obie zmienne mają rozkład normalny z tymi samymi odchyleniami standardowymi. Przyjąć poziom istotności 0.05.

Zadanie 18 Ramka danych Orange zawiera między innym dane dotyczące obwodu drzewek pomarańczowych (zmienna circumference). Zakładając, że zmienna ta ma rozkład normalny, zweryfikować hipotezę, że średni obwód drzew jest mniejszy niż 130mm. Przyjąć poziom istotności 0.1. Zadanie 19 Ramka danych Pima.te z biblioteki MASS zawiera dane dotyczące zdrowia kilkuset Indianek z plemienia Pima mających co najmniej 21 lat. Zmienna glu zawiera wynik testu glukozowego, natomiast zmienna type zawiera informację, czy kobieta jest chora na cukrzycę, czy nie ( Yes oznacza, że dana osoba ma cukrzycę, zaś No oznacza, że jest zdrowa). Zweryfikować na poziomie istotności 0.05 hipotezę mówiącą, że wariancja wyniku testu glukozowego dla osób zdrowych jest taka sama jak w przypadku osób chorych. Zakładamy, że w obu przypadkach zmienna glu ma rozkład normalny. Zadanie 20 Ramka danych crabs z biblioteki MASS zawiera dane dotyczące krabów, a w szczególności zmienna sp opisuje gatunek kraba, zaś zmienna CW szerokość pancerza danego kraba. Zweryfikować na poziomie istotności 0.04 hipotezę mówiącą, że średnia szerokość pancerza krabów z gatunku oznaczanego literą B jest mniejsza niż średnia szerokość pancerza krabów z gatunku oznaczanego literą O. Zakładamy, że w obu przypadkach szerokość pancerza jest zmienną losową o rozkładzie normalnym i że wariancje w obu populacjach są równe. Zadanie 21 W losowej próbie 500 mieszkańców pewnego rejonu 226 wyraziło chęć oddania głosu w wyborach parlamentarnych. Na poziomie istotności 0.05 zweryfikować hipotezę, że w tym rejonie deklarowana frekwencja wyborcza wynosi ponad 45%. Zadanie 22 Zmienne Species oraz Petal.Length (znajdujące się w ramce danych iris) opisują, odpowiednio, gatunek oraz długość płatków kwiatów. Na poziomie istotności 0.02 zweryfikować hipotezę, że wariancja długości płatków gatunku virginica jest większa niż wariancja długości płatków gatunku versicolor. Zakładamy, że w obu przypadkach długość płatka jest zmienną losową o rozkładzie normalnym. Zadanie 23 Spośród studentów Wydziału Informatyki wylosowano niezależnie 6 studentów III roku i obliczono średnie z ocen uzyskanych przez nich na I i na II roku studiów: Student A B C D E F I rok 3.5 4.0 3.7 4.6 3.0 3.9 II rok 4.2 3.9 3.8 4.5 3.4 4.2 Czy uzyskane rezultaty potwierdzają hipotezę, że średnie wyniki uzyskiwane na II roku studiów są istotnie lepsze od uzyskiwanych na I roku? Przyjąć założenie, że rozkład ocen jest normalny, a poziom istotności wynosi 0.1.

STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 5 Cel: testowanie zgodności, jednorodności i niezależności Zadanie 1 Wygenerować 200 elementowe próbki z rozkładów: normalnego N (0,1), Cauchy'ego C (0,1), jednostajnego U [0,1] oraz wykładniczego Exp (1), zapisując je, odpowiednio, jako zmienne n, c, u i w. Utworzyć zmienną aw mnożąc zmienną w przez ( 1). Utworzyć dla zmiennych n, c, u, w i aw wykresy normalności. Zwrócić uwagę na kształt wykresu w zależności od typu rozkładu. Zadanie 2 Badania grupy krwi 200 osób dały następujące wyniki: grupę O miały 73 osoby, grupę A 74 osoby, grupę B 34 osoby, natomiast grupę AB miało 19 osób. a) Czy na podstawie tych wyników można przyjąć hipotezę o równomiernym rozkładzie wszystkich grup krwi? b) Zweryfikować hipotezę, że grupa krwi O występuje średnio u 36,7% ludzi, grupa A u 37,1%, B u 18,6%, natomiast grupa AB występuje u 7,6% ogółu ludzi. Zadanie 3 W losowo wziętym tygodniu wydarzyło się w Warszawie 414 wypadków i kolizji drogowych, przy czym ich rozkład w poszczególnych dniach tygodnia wyglądał następująco: Dzień Poniedziałe k Wtorek Środa Czwartek Piątek Sobota Niedziela Liczba wypadków 78 56 52 58 83 42 45 Stwierdzić, czy rozkład liczby wypadków w poszczególne dni tygodnia jest równomierny. Zadanie 4 Na podstawie danych dotyczących preferowanego miejsca spędzania wakacji (plik wakacje.csv) stwierdzić, czy rozkład preferencji jest równomierny. Zadanie 5 Zmierzono czas trwania siedmiu rozmów telefonicznych i otrzymano (w minutach): 2.5 1.8 6.0 0.5 8.75 1.2 3.75. Na poziomie istotności 0,01 zweryfikować hipotezę, że czas trwania rozmowy ma rozkład wykładniczy o wartości średniej 4 minuty. Zadanie 6 Spośród studentów czterech wydziałów, na których pan Iksiński wykłada najciekawszy przedmiot świata (nie trzeba chyba dodawać, iż mowa tu o statystyce), pobrano próbki losowe i zliczono studentów (zwanych dalej szczęśliwcami ), których udało się zdać egzamin z tego przedmiotu. Wyniki zamieszcza poniższa tabela: Wydział Liczność próbki Liczba szczęśliwców Nauk niepotrzebnych 206 61 Mniemanologii stosowanej 164 34 Nauk ciekawych 98 38 Nauk przydatnych 102 35 Czy w świetle zebranych danych można stwierdzić, że występują istotne różnice między odsetkami osób na poszczególnych wydziałach, które zdały statystykę?

Zadanie 7 W celu zbadania, czy istnieje związek pomiędzy dochodem i posiadanym wykształceniem przeprowadzono badanie na 450 osobowej próbie losowej i otrzymano następujące wyniki: Roczny dochód (w tyś. PLN) poniżej 120 120-250 powyżej 250 Wykształcenie wyższe 80 115 55 Brak ukończonych studiów 95 70 35 Zweryfikować odpowiednią hipotezę na poziomie istotności 1%. Zadanie 8 Na podstawie wyników badania 200 losowo wybranych osób (plik wakacje.csv) stwierdzić, czy istnieje zależność między płcią a preferowanym miejscem spędzania wakacji. Zadanie 9 Psycholog pracujący w poradni rodzinnej zebrał dane dotyczące powodów kryzysów małżeńskich, które wymieniane były przez przychodzące do poradni pary. Dane te, zamieszczone w poniższej tabeli, pokazują źródła kryzysu postrzegane przez każde z małżonków. Przyczyny kryzysu wymieniane przez mężów Pieniądze Dzieci Zainteresowania Inne Przyczyny Pieniądze 86 31 132 19 kryzysu Dzieci 17 64 43 13 wymieniane Zainteresowania 54 39 132 33 przez żony Inne 30 17 37 54 Czy na podstawie zebranych danych można stwierdzić, że istnieje zależność poglądów mężów i żon, co do przyczyn kryzysu w ich małżeństwach? Zadanie 10 Firma rozważa pięć projektów nazw swojego nowego produktu. Przed wybraniem jednej z nich firma postanowiła sprawdzić, czy wszystkie pięć nazw równie silnie przyciąga klientów. Wybrano losową próbę 100 osób i każdą z nich poproszono o wskazanie najlepszej z nazw. Liczby osób, które wybrały kolejne nazwy są podane niżej: Nazwa A B C D E Liczba dokonanych wyborów 15 11 24 30 20 Zweryfikować odpowiednią hipotezę na poziomie istotności 0.1. Zadanie 11 Analityk w branży napojów orzeźwiających chce przeprowadzić test statystyczny w celu określenia, czy istnieje zależność między preferencjami konsumenta co do rodzaju napoju (Coke, Pepsi, 7Up i Dr Pepper) oraz faktem, czy osoba ta pija napoje zwykłe czy wersję light. Wybrano w tym celu próbę losową 330 osób, a ich preferencje przedstawiono w poniższej tablicy. Coke Pepsi 7Up Dr Pepper Wersja Light 55 32 47 21 Wersja normalna 60 43 35 37 Przeprowadzić odpowiedni test na poziomie istotności 0.05. Zadanie 12 Poniższa tabela zawiera wyniki ankiety dotyczącej czytelnictwa czterech periodyków uważanych za opniotwórcze, przeprowadzonej na losowej próbie 500 osób (pytani mogli wskazać tylko jeden tygodnik). Czy na ich podstawie można stwierdzić, że 30% osób wybiera Monotykę, 25% Newbzik, 20% Wstecz, a 25% Wykrój? Przyjąć poziom istotności 0.05. Czasopismo Monotyka Newsbzik Wstecz Wykrój Liczba czytelników 162 128 96 114

Zadanie 13 W kampanii prezydenckiej komitet wyborczy kandydata A zbierał informacje o poparciu społecznym dla tego kandydata. Uzyskano następujące wyniki Poparcie Brak poparcia Kobiety 41 65 Mężczyźni 77 92 Na poziomie istotności 0.05 stwierdzić, czy istnieje zależność między płcią respondenta a poparciem dla kandydata A. Zadanie 14 Zweryfikować hipotezę, że poniższe dane 8.8 5.3 4.2 4.9 0.6 1.7 12.0 4.0 pochodzą z rozkładu chi-kwadrat o 5 stopniach swobody. Przyjąć poziom istotności 0.1.

STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 6 Cel: jednoczynnikowa i wieloczynnikowa analiza wariancji (ANOVA) Zadanie 1 Dokonano po cztery niezależne pomiary wytrzymałości na ściskanie trzech rodzajów betonu. Otrzymano następujące wyniki (w kg/cm 2 ): I II III 204 197 190 200 205 208 198 213 202 204 209 210 Stwierdzić, czy badane gatunki betonu różnią się istotnie pod względem wytrzymałości na ściskanie. Przyjąć poziom istotności 0.05. Zadanie 2 Zbadano czas reakcji trzech rodzajów układów stosowanych w kalkulatorach elektronicznych i otrzymano następujące wyniki (w milisekundach): Typ układu Czas reakcji I 19 22 20 18 25 21 24 17 II 20 21 33 27 29 30 22 23 III 16 15 18 26 17 23 20 19 Stwierdzić, czy istnieje statystycznie istotna różnica między czasami reakcji badanych trzech układów. Przyjąć poziom istotności 0.01. Zadanie 3 Plik zarobki.csv zawiera dane dotyczące wysokości miesięcznych zarobków wybranych losowo osób w czterech miastach: w Warszawie, Krakowie, Wrocławiu i Katowicach. Stwierdzić, czy wysokość miesięcznych zarobków w tych miastach różni się istotnie (przyjąć poziom istotności 0.05). Zadanie 4 W celu porównania trzech metod nauki stenografii przeprowadzono sprawdzian na losowych próbach osób szkolonych poszczególnymi metodami. Otrzymano następujące wyniki: metoda maksymalna liczba słów zapisanych w ciągu jednej minuty A 147, 188, 162, 144, 157, 179, 165, 180 B 153, 161, 157, 155, 163, 160, 154 C 173, 152, 194, 186, 166, 194, 178, 192, 186 Zbadać, czy te trzy metody są tak samo efektywne. Zadanie 5 Na podstawie danych dotyczących parametrów kilku wybranych marek samochodów (plik samochody.csv) stwierdzić, czy istnieją istotne różnice w zużyciu paliwa przez samochody produkowane w USA, w Europie i w Japonii. Zadanie 6 Zamieszczony poniżej zbiór danych zawiera obserwacje plonów pszenicy ozimej (w kwintalach na hektar) zebranych z poletek nawadnianych dwiema metodami, przy zastosowaniu czterech dawek nawożenia azotem (zmienne woda i azot zawierają, odpowiednio, kody metod nawadniania i dawek nawożenia):

woda azot plon woda azot plon 1 1 64.5 2 1 74.0 1 1 66.3 2 1 75.8 1 1 69.3 2 1 72.0 1 1 67.0 2 1 72.5 1 2 64.8 2 2 77.3 1 2 66.5 2 2 71.5 1 2 66.8 2 2 74.0 1 2 67.3 2 2 74.5 1 3 69.3 2 3 76.3 1 3 70.3 2 3 72.0 1 3 70.0 2 3 72.5 1 3 69.0 2 3 76.8 1 4 69.0 2 4 77.0 1 4 71.5 2 4 74.5 1 4 71.3 2 4 79.0 1 4 72.0 2 4 79.8 Na podstawie tych danych ocenić doboru metody nawadniania poletek i sposobu nawożenia azotem na wielkość plonu ziarna pszenicy ozimej. Oprócz oceny istotności wpływu pojedynczych czynników zbadać istotność interakcji (współdziałania) nawadniania i nawożenia azotem. Przyjąć poziom istotności 0.05. Zadanie 7 W pewnych zakładach lotniczych stosuje się dwie metody nakładania farby podkładowej na części aluminiowe: malowanie zanurzeniowe i natryskowe. Czyni się to w celu zwiększenia przylegania właściwej farby nawierzchniowej, którą później są malowane owe części. We wspomnianych zakładach stosowano do tej pory trzy rodzaje farb podkładowych. Inżynier technolog, odpowiedzialny za ten etap produkcji, postanowił zbadać, czy rodzaj farby podkładowej oraz sposób jej nakładania na detal mają istotny wpływ na siłę przylegania właściwej farby nawierzchniowej. W tym celu przeprowadzono eksperyment, w którym zmierzono siłę przylegania farby nawierzchniowej do kilku detali malowanych wpierw różnymi farbami podkładowymi, nanoszonymi obiema metodami. Wyniki pomiarów zamieszczono w poniższej tabeli. Jakie wnioski powinien wyciągnąć inżynier na podstawie owych wyników? Rodzaj farby Malowanie zanurzeniowe Malowanie natryskowe A 4.0 4.5 4.3 5.4 4.9 5.6 B 5.6 4.9 5.4 5.8 6.1 6.3 C 3.8 3.7 3.9 6.5 6.0 5.0 Zadanie 8 Przeprowadzono następujące doświadczenie: 18 mężczyzn i 18 kobiet rozmieszczono losowo w 9 pokojach w ten sposób, że w każdym pokoju były po dwie osoby tej samej płci. W pokojach tych utrzymywano stałą temperaturę: 18 0 C, 21 0 C albo 24 0 C (przydział temperatur poszczególnym pokojom był także losowy). Po upływie trzech godzin oceniano samopoczucie każdej z badanych osób (zastosowano ocenę punktową, w której 1 = zbyt zimno, 8 = idealna temperatura, 15 = zbyt ciepło). Pokój 1 Pokój 2 Pokój 3 18 0 C M. 5 4 M. 5 4 M. 4 2 K 1 2 K 5 5 K 1 3 Pokój 4 Pokój 5 Pokój 6 21 0 C M. 8 8 M. 6 3 M. 5 7 K 10 7 K 8 8 K 7 8 Pokój 7 Pokój 8 Pokój 9 24 0 C M. 12 8 M. 8 7 M. 6 6 K 11 13 K 8 8 K 6 7 Zbadać wpływ temperatury panującej w pokoju na samopoczucie. Czy ocena samopoczucia zależy od płci? Czy występują tu istotne interakcje między oboma badanymi czynnikami (tzn. temperaturą i płcią)?

Zadanie 9 Przeprowadzono eksperyment mający na celu porównanie prędkości transmisji danych przez pewien model telefaksu wyposażony w trzy rodzaje podzespołów elektronicznych (oznaczonych przez A, B i C), pochodzących od różnych producentów. Wspomnianą próbę przeprowadzono na trzech rodzajach druków: zawierających sam tekst, same ilustracje oraz tekst z ilustracjami. Ustalić, czy ujawniły się istotne różnice w przeciętnym czasie transmisji między telefaksami wyposażonymi w różne rodzaje podzespołów. A B C Tekst 17 19 22 Ilustracje 18 24 16 Tekst z ilustracjami 23 15 19 Zadanie 10 W celu zbadania wpływu czterech dawek nawożenia azotowego (w ilościach 0, 40, 80 i 120 kg/ha) na plonowanie lucerny przy trzech sposobach siewu (siew czysty C oraz dwa rodzaje wsiewu M i P w jęczmień jary) założono doświadczenie w czterech powtórzeniach. Dla każdej kombinacji nawożenia ze sposobem siewu zmierzono plon zielonej masy (w kg z poletka). W pierwszym pokosie uzyskano następujące obserwacje: 0 40 80 120 C 33.2 36.2 42.2 41.4 50.2 53.0 46.2 52.4 44.2 51.0 50.6 45.2 52.6 45.0 49.0 43.6 M 18.6 13.0 18.0 20.0 24.2 21.6 34.2 17.2 14.6 18.8 14.2 19.1 16.4 19.0 15.5 22.2 P 20.4 14.4 21.9 42.0 18.2 21.0 16.4 15.0 11.0 22.6 16.2 25.6 27.3 27.6 21.6 27.8 Ustalić, który z badanych czynników miał istotny wpływ na plon masy zielonej.

STATYSTYCZNE METODY WSPOMAGANIA DECYZJI zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka Zadanie 1 W zamieszczonej poniżej tabeli podano wysokość rocznego dochodu i wartość posiadanego domu dziewięciu rodzin wybranych w sposób losowy spośród mieszkańców pewnego okręgu: Roczny dochód ($ 1000) 36 64 49 21 28 47 58 19 32 Wartość domu ($ 1000) 129 310 260 92 126 242 288 81 134 a) Wyznaczyć prostą regresji wartości domu względem dochodu. b) Przeanalizować dopasowanie modelu. c) Oszacować wartość domu rodziny, której roczny dochód wynosi $40000. d) Wyznaczyć 95% przedział ufności dla szacowanej wartości domu tej rodziny. Zadanie 2 Wyznaczyć prostą regresji poziomu cholesterolu względem wieku dziesięciu losowo wziętych mężczyzn. Zweryfikować dopasowanie modelu. Wiek 58 69 43 39 63 52 47 31 74 36 Poziom cholesterolu 189 235 193 177 154 191 213 175 198 181 Zadanie 3 W poniższej tabeli podano liczbę ludności USA (w mln) w latach 1890-2010: Rok Ludność 1890 62.947 1900 75.994 1910 91.972 1920 105.710 1930 122.775 1940 131.669 1950 150.697 1960 179.323 1970 203.235 1980 226.542 1990 248.718 2000 281.422 2010 308.746 a) Przyjmując wykładniczy model wzrostu populacji, oszacować parametry tego modelu i zweryfikować jego dopasowanie. b) Oszacować przewidywaną wielkość populacji USA w 2015 i w 2020 roku. Zadanie 4 Niech X oznacza przeciętną liczbę samochodów poruszających się autostradą w ciągu dnia, natomiast Y liczbę wypadków samochodowych, która ma miejsce w ciągu miesiąca na autostradzie. Na podstawie danych zamieszczonych w poniższej tabeli wyznaczyć następujący model regresji Y = a + b X, opisujący zależność liczby wypadków od natężenia ruchu na autostradzie. Oszacować liczbę wypadków, jakiej można się spodziewać przy natężeniu ruchu odpowiadającemu 3500 samochodom poruszającym się autostradą w ciągu dnia. X 2000 2300 2500 2600 2800 3000 3100 3400 3700 3800 4000 4600 4800 Y 15 27 20 21 31 26 22 23 32 39 27 43 53

Zadanie 5 Dokonano osiem niezależnych pomiarów wielkości drgań pionowych gruntu powstałych w wyniku trzęsienia ziemi w różnej odległości od epicentrum trzęsienia. Otrzymano następujące wyniki: Odległość od epicentrum (km) 20 30 40 50 80 140 200 250 Wielkość drgań pionowych (cm) 4.8 3.2 2.5 2.5 1.5 1.8 1.2 0.8 a) Wyznaczyć funkcję regresji wielkości drgań gruntu względem odległości od epicentrum. b) Zweryfikować dopasowanie modelu. c) Oszacować wielkość drgań w odległości 100 km od epicentrum. Zadanie 6 Korzystając z danych zawartych w poniższej tabeli wyznaczyć funkcję regresji, opisującą zależność między liczbą cykli do zniszczenia pewnego detalu a wywieranym na ten detal naprężeniem. Oszacować liczbę cykli do zniszczenia detalu, pracującego pod naprężeniem 40 tys. psi. Naprężenie (w tys. psi) 55 50.5 43.5 42.5 42 41 35.7 34.5 33 32 Liczba cykli do zniszczenia (w mln cykli) 0.223 0.925 6.75 18.1 29.1 50.5 126 215 445 420 Zadanie 7 Pewna firma, chcąc sprawdzić jak liczba reklam zamieszczanych w gazetach w ciągu miesiąca wpływa na zainteresowanie klientów pewnym towarem, przeprowadziła badania otrzymując następujące wyniki: liczba reklam 8 10 12 14 15 17 20 21 23 26 odsetek zainteresowanych klientów 0.4 0.42 0.43 0.44 0.46 0.45 0.48 0.49 0.5 0.51 a) Wyznaczyć liniowy model regresji dla odsetka klientów zainteresowanych tym towarem w zależności od liczby reklam. b) Zweryfikować dopasowanie modelu. c) Na podstawie dobranego modelu oszacować odsetek klientów zainteresowanych tym towarem, jeżeli firma zamieści w ciągu tygodnia 19 reklam. Podać 95%-owy przedział ufności dla tej prognozy. Zadanie 8 Badano zależność jednostkowego kosztu produkcji pewnego wyrobu od wielkości jego rocznej produkcji. Otrzymano następujące dane: wielkość produkcji (w tys. sztuk) 10 25 35 50 70 80 95 110 koszt jednostkowy (w zł.) 25 21 20 17 14 9 4 2 a) Wyznaczyć liniowy model regresji opisujący badaną zależność. b) Zweryfikować dopasowanie modelu. c) Na podstawie dobranego modelu podać prognozę jednostkowego kosztu produkcji tego wyrobu przy produkcji wynoszącej 40 tys. sztuk. Podać 95%-owy przedział ufności dla tej prognozy Zadanie 9 W pewnej firmie postanowiono zbadać zależność między wielkością tygodniowej sprzedaży produktów chemicznych tej firmy, a wydatkami poniesionymi na reklamę radiowo-telewizyjną oraz wydatkami poniesionymi na pokazy w sklepach. Oto dane (w tyś. $) pochodzące z 10 tygodni: Wartość tygodniowej sprzedaży 72 76 78 70 68 80 82 65 62 90 Wydatki na reklamę radiowo-telewizyjną 12 11 15 10 11 16 14 8 8 18 Wydatki na pokazy w sklepach 5 8 6 5 3 9 12 4 3 10 a) Wyznaczyć liniową funkcję regresji opisującą badaną zależność. b) Zweryfikować dopasowanie modelu. c) Wykorzystać uzyskane równanie regresji do prognozy wielkości sprzedaży, gdy wydatki na reklamę radiowotelewizyjną wyniosą 8000$, natomiast wydatki na pokazy w sklepach 12000$.

Zadanie 10 Pośrednik w handlu nieruchomościami jest zainteresowany oszacowaniem wpływu powierzchni budynku i jego odległości od centrum miasta na wartość budynku. Poniższa tabela zawiera informacje o dziewięciu losowo wybranych budynkach. Wartość budynku (tys. $) 345 320 452 422 328 375 660 466 290 Powierzchnia (m 2 ) 150 180 200 160 175 180 300 170 135 Odległość od centrum (km) 5.6 1.2 2.4 7.2 2.9 2.5 5.5 4.8 1.6 a) Wyznaczyć liniową funkcję regresji opisującą zależność, którą interesuje się ów pośrednik. b) Zweryfikować dopasowanie modelu. c) Podać przewidywaną wartość domu o powierzchni 160 m 2, położonego w odległości 3 km od centrum miasta. Zadanie 11 Onkolodzy postanowili przetestować na myszach skuteczność nowego leku antyrakowego. W tym celu 10 myszom mającym guz o wadze 4g podawano różne dawki owego leku. Po ustalonym czasie zmierzono stopień redukcji wielkości nowotworu. Wyniki badania zamieszcza poniższa tabela. Wielkość dawki 1 2 3 4 5 6 7 8 9 10 Redukcja wagi nowotworu 0.50 0.90 1.20 1.35 1.50 1.60 1.53 1.38 1.21 0.65 Wyznaczyć kwadratowy model regresji opisujący zależność stopnia redukcji wagi guza od wielkości dawki nowego leku. Zadanie 12 Dane zamieszczone w pliku geodezja.csv zawierają wyniki doświadczenia, którego celem było zbadania wpływu środowiska na dokładność pomiarów geodezyjnych. Kolejne kolumny odpowiadają następującym pomiarom: kat kąt refrakcji temp temperatura powietrza wilg wilgotność względna powietrza (w %) cis ciśnienie atmosferyczne (w mm Hg) odl odległość pomiędzy stanowiskiem a celem (w m) wys średnia wysokość celowania (w m). Znaleźć najlepszy model (liniowy) opisujący zależność kąta refrakcji od cech geodezyjnych (odległość i wysokość celowania) i atmosferycznych (kwadrat temperatury, wilgotność, ciśnienie). Zadanie 13 Na podstawie danych zawartych w pliku cardata.csv wyznaczyć model liniowy najlepiej opisujący zależność zużycia paliwa od przyśpieszenia, mocy silnika, liczby cylindrów, wagi i roku produkcji samochodu.