CZĘŚĆ 5. ZMIENNA DWUWYMIAROWA ORAZ BADANIE ZALEŻNOŚCI Zadanie. Dla wylosowanych z pewne populaci gospodarstw domowych w dużym mieście definiuemy zmienne: X-miesięczne dochody gospodarstwa domowego (zaokrąglone do tys. zł) oraz Y- miesięczne wydatki na żywność (zaokrąglone do tys. zł). Łączny rozkład zmiennych przedstawia się następuąco: X\Y 3 3 0, 0, 0 4 0, 0, 0, 5 0 0, 0, Wyznacz rozkłady brzegowe obu zmiennych i oblicz dla nich wartości oczekiwane i odchylenia standardowe. Określ funkcę prawdopodobieństwa rozkładu wydatków na żywność pod warunkiem, że dochody w gospodarstwie domowym wynosiły 4 tys. zł. Jaka est wartość oczekiwana wydatków w te grupie dochodowe. A akie odchylenie standardowe wydatków? Oblicz kowariancę i współczynnik korelaci obu zmiennych. Co oznaczaą uzyskane wyniki? Zadanie. Dany est rozkład zmienne losowe dwuwymiarowe (X,Y), proszę: X\Y 3 0 0,0 0,0??? 0,00 0,0 0,0 0,00 0,05 0,5 Zadanie 3. Zmienna losowa X przymue dwie wartości: x = 0 oraz x = 5 z ednakowym prawdopodobieństwem. Zmienna losowa Y przymue wartość : y = z prawdopodobieństwem 0,3, y = 3 z prawdopodobieństwem 0,4 oraz y 3 = 4 z prawdopodobieństwem 0,3. a) wiedząc, że zmienne losowe X I Y są niezależne, wyznacz łączny rozkład prawdopodobieństwa realizaci zmienne losowe (X, Y).; b) określ wartość kowarianci dla rozkładu zmienne (X, Y) oraz siłę i kierunek zależności korelacyne. Zadanie 4. Zmienna losowa X przymue wartości 0 i 5. Druga ze zmiennych (Y) przymue wartości: i 4. Wiadomo także, że: - P(Y= X=0) = /4, P(Y=4 X=5)=3/4 - P(X=0) = /3, P(X=5) = /3 Wiedząc, że zmienne X i Y są niezależne, proszę określić łączny rozkład zmienne (X,Y) oraz podać E(XY), E(X), E(Y), cov(xy). Zadanie 5. Dla akiego c poniższa funkca est funkcą prawdopodobieństwa zmienne losowe dwuwymiarowe X,Y? X\Y - 0 4 c 0,5 0, 8 0,5 0, 0,5 Zadanie 6. Dany est dwuwymiarowy rozkład zmienne losowe (X Y): X Y - 0 0,3 0, 0, 4 0, 0, 0,3 a) wyznacz rozkłady brzegowe zmiennych losowych (X, Y); b) wyznacz momenty zwykłe rzędu pierwszego dwuwymiarowe zmienne losowe (X, Y); c) wyznacz momenty zwykłe rzędu drugiego zmienne X oraz Y; d) wyznacz rozkłady warunkowe zmienne Y i oblicz wartości oczekiwane E(Y X) dla tych rozkładów. Zadanie 7. Dwuwymiarowa zmienna losowa (XY) posiada następuący rozkład: Y X 0 4 7 0, 0, 0,0 a) uzupełnić tabelkę b) wyznaczyć rozkłady brzegowe zmiennych c) wyznaczyć EX i DX d) uzasadnić czy istniee zależność stochastyczna i korelacyna między tymi zmiennymi Proszę sprawdzić, czy zmienne X,Y są niezależne. a. Wyznaczyć wartość oczekiwaną zmienne losowe X oraz Y. b. Wyznaczyć wartość oczekiwaną E(X Y=0). Zadanie 8. Łączny rozkład zmienne losowe dwuwymiarowe (X, Y) charakteryzuą następuące wartości: P = 0,5; P = 0,35; P = 0,5; P = 0,35. Czy zmienne losowe X i Y są niezależne? Zadanie 9. 0, 0, 0,5
Zmienna losowa Y przymue wartości y =0 i y =, natomiast zmienna losowa X przymue wartości x = 4 i x = 8. Dane są ponadto prawdopodobieństwa warunkowe: P(Y=0 X=4)=0,5; P(Y= X=8)=0,75; P(X=4 Y=0)=0,8, P(X=8 Y=)=0,. Wiedząc, że zmienne X i Y są niezależne, proszę określić łączny rozkład zmienne (X,Y). Zadanie 0. Dany est następuący rozkład zmienne dwuwymiarowe (X, Y): Wartości zmiennych y xi 3 4 0, 0,3 0,4 0,0 0, 0, a. Wyznaczyć kowariancę zmiennych losowych X i Y. b. Wyznaczyć rozkłady warunkowe zmienne losowe X Zadanie. Dane są następuące rozkłady: X = x I P(X Y=0) P(X Y=) P(X Y=) - /4 / /0-3/4 / 8/0 Y = y p. 0 /8 /4 5/8 Wyznacz: a) łączny rozkład dwuwymiarowe zmienne losowe (X, Y); b) wartości oczekiwane i wariance dla rozkładów warunkowych zmienne X. Zadanie. Dany est następuący rozkład zmienne dwuwymiarowe (X,Y): Wartości zmiennych y xi 4 6 8 0,5 0,33 0,7 3 0,00 0,05 0,0 a. Wyznaczyć rozkłady brzegowe obu zmiennych. b. Wyznaczyć rozkłady warunkowe obu zmiennych. c. Wyznaczyć parametry rozkładów brzegowych, łącznych i warunkowych. d. Określić siłę zależności korelacyne posługuąc się współczynnikiem korelaci liniowe. Zadanie 3. Dany est rozkład zmienne losowe (X,Y) Y 3 X 3 0, 0, 0 4 0, 0, 0,3 a) Znaleźć rozkłady brzegowe i obliczyć E(X) i D(X). b) Wyznaczyć rozkład warunkowy P(X/Y=) i obliczyć wartość oczekiwaną w tym rozkładzie. O czym świadczy porównanie wyników E(X) i E(X/Y=)? Zadanie 4. Dwuwymiarowa zmienna losowa (XY) posiada następuący rozkład: x i y 0 0, 0, 4 0, 0, 7 0,0 0,5 a) Wyznaczyć momenty zwykłe rzędu pierwszego zmienne losowe X oraz (X/Y=0). Jaki wniosek wynika z porównania obliczonych wartości? b) Wyznaczyć wartość oczekiwaną zmienne losowe (XY). c) Wiedząc, że E(Y)=0,8 obliczyć kowariancę w tym rozkładzie. Czy e wynik potwierdza wniosek z punktu a)? Zadanie 5. Dany est następuący rozkład zmienne dwuwymiarowe: wartości zmiennych y x i 3 4 0,5 0 6 0,3 0 8 0, 0, a) Proszę wyznaczyć wartość oczekiwaną, wariancę oraz kowariancę zmienne dwuwymiarowe (X,Y); b) Proszę wyznaczyć regresę pierwszego rodzau zmienne losowe Y względem zmienne X.
DWUWYMIAROWY ROZKŁAD EMPIRYCZNY miary zależności Zad.. Dyrektor programu szkoleniowego dla menedżerów chce sprawdzić czy istniee dodatni związek między wynikiem egzaminu kandydata na szkolenie a wynikami te same osoby w trakcie szkolenia. Dyrektor ułożył ranking 5 uczestników według ich wyników na egzaminie wstępnym i oddzielny ranking według ich wyników w trakcie szkolenia: Uczestnik 3 4 5 6 7 8 9 0 3 4 5 Ranga wstępna 8 9 4 3 0 5 6 5 3 4 7 Ranga końcowa 7 5 9 6 8 0 5 4 4 3 3 Korzystaąc z tych danych przeprowadź test dodatnie korelaci rang między wynikiem egzaminu wstępnego i wynikami w trakcie szkolenia. Zad.. Analityk w firmie reklamowe postanowił sprawdzić, czy istniee akikolwiek związek między intensywnością koloru reklamy prasowe a e siłą oddziaływania. Losowo wybranym grupom respondentów pokazano 0 reklamo różnych stopniach intensywności kolorów, ale identycznych pod innymi względami. Respondenci ocenili reklamy pod względem ogólnego wrażenia, akie wywoływały. Respondenci zostali podzieleni na grupy; każda z grup oceniała inną reklamę. Oceny zagregowano w ramach grup. Ranking rezultatów przedstawia się następuąco: Intensywność koloru: 8, 7,,, 3, 4, 0, 6, 5, 9. Ocena oddziaływania:, 3, 4,, 5, 8, 7, 6, 9, 0. Czy istniee korelaca rang między intensywnością kolorów reklam a siłą ich oddziaływania? Zad. 3. Na podstawie poniże prezentowanego zestawienia o liczbie użytkowanych samochodów osobowych (w tys.) oraz liczbie wypadków drogowych (w tys.) w 8 losowo wybranych kraach europeskich w 000 r. oceń za pomocą współczynnika korelaci liniowe - kierunek i siłę zależności korelacyne między obu zmiennymi: Kra Liczba samochodów Liczba wypadków Austria 4097 4 Belgia 4676 49 Dania 87 7 Finlandia 35 7 Franca 7480 Niemcy 4840 383 Szwacaria 3545 4 Włochy 3953 Zad. 4. Jednostkowy koszt produkci (w USD) oraz wielkość produkci pewnego dobra (w tys. sztuk) w konkuruących ze sobą pięciu firmach przedstawiono w poniższym zestawieniu: Wielkość produkci 3 30 4 45 50 Jednostkowy koszt produkci 50 38 34 30 8. Określić i zinterpretować współczynnik korelaci liniowe Pearsona. Czy est on istotny przy α=0,05. O czym świadczyłaby wartość r o przeciwnym znaku? Zad. 5. Dla losowo wybranych 0 klientów supermarketu zareestrowano dane o liczbie pozyci na rachunku i czasie obsługi przy kasie (w min), otrzymuąc: X 5 8 0 5 5 36 40 46 Y,5 3 3 5,5 4 6 6,5 7,5 6 8 Oblicz na te podstawie współczynnik korelaci liniowe. Sprawdź na poziomie istotności 0,05 hipotezę o nieskorelowaniu obu cech w populaci. Zad. 6. Z zapisów kliniki położnicze wylosowano 0 przypadków urodzeń, reestruąc długość w cm (X) i wagę w dkg (Y) noworodków: X 58 55 5 60 56 54 46 5 49 59 Y 440 340 30 400 360 300 40 350 300 360 W trakcie przetwarzania powyższych danych uzyskano ponadto (sumowanie po wszystkich obserwacach): x = 540, = 9344 x, y = 330, y = 4400, xy = 8490. Oblicz kowariancę i współczynnik korelaci liniowe. Jak silna est korelaca między badanymi cechami? Sprawdź na poziomie istotności 0,05 hipotezę o nieskorelowaniu obu cech w populaci. Zad. 7. Czy istniee zależność między Y- rodzaem opinii o nowym systemie nauczania w 500 osobowe losowe próbie a X- miescem zamieszkania, eśli 50 respondentów pochodziło z miast oraz 50 ze wsi. W mieście uzyskano 00 odpowiedzi pozytywnych, na wsi zaś edynie 3/5 zapytanych osób wypowiedziało się za reformą. Zad. 8. (egz.) Analitycy rynku nieruchomości twierdzą, że na warszawskim Tarchominie cena metra kwadratowego nowego mieszkania (X w PLN) est uemnie skorelowana z całkowitą powierzchnią mieszkania (Y w m ). Wylosowano 30 mieszkań i uzyskano następuące informace: 30 = 345 30 x y, = 379 i i i= x, = 7, 4 y, s = 7869, s = 509 Czy dane te potwierdzaą słowa analityków? Zweryfiku odpowiednią hipotezę na poziomie istotności 0,05. x y 3
Zad. 9. Badanie różnic w wysokości średnie kwartalne premii w grupie kobiet i mężczyzn w zakładzie A dostarczyło następuących danych: Wyszczególnienie Liczba osób Średnia premia w tys. zł Mężczyźni 50 000 Kobiety 50 800 Wiedząc dodatkowo, że odchylenie standardowe wysokości premii dla ogółu pracowników wyniosło 380 zł, za pomocą odpowiednie miary określ siłę zależności wysokości premii względem płci pracowników. Zad. 0. Zbadano 80 hurtowni ze względu na: X-liczbę zatrudnionych i Y- wartość sprzedaży (tys.zł). Uzyskano następuące informace: x i =440; y i =3 400; x i y i =60 000; S x = 0,8; S y = 8. Następnie pogrupowano uzyskane informace dzieląc hurtownie na trzy grupy (po 60 hurtowni) ze względu na liczbę zatru - 4 -dnionych osób: małe, średnie i duże. W małych przeciętna wartość sprzedaży wyniosła 60 tys. zł., w średnich 80 tys. zł, w dużych 00 tys. zł. Jednocześnie wiadomo, że (y i - y ) n. = 58 000. Za pomocą dwóch różnych miar oceń siłę zależności wartości sprzedaży względem liczby zatrudnionych. O czym świadczą uzyskane wyniki? Zad.. Grupie 0 studentów zadano następuące pytania: - poda swoą średnią ocen z poprzedniego semestru studiów? - czy w poprzednim semestrze poza studiowaniem pracowałeś zawodowo? Badanie dostarczyło następuących informaci: Czy poza studiowaniem pracowałeś zawodowo? Liczba studentów (n) Nie, nigdy 800 4,40 Tak, dorywczo 300 4,0 Tak, na stałe 0 4,9 Wiadomo również, że: ( y y ) n = 59, 36 Średnia ocen w poprzednim semestrze ( y ). Proszę ocenić, czy rodza aktywności zawodowe ma wpływ na oceny uzyskiwane przez studentów. Zad.. Agenca badawcza XYZ zbadała czas spędzany przed telewizorem w czasie pierwszego dnia świąt Bożego Narodzenia. Zbadano losowo wybranych 50 osób w wieku 4 5 lat, 400 osób w wieku 6 45 lat i 30 osób w wieku powyże 45 lat. Z badania uzyskano następuące informace: Grupy wieku Średni czas spędzony przed telewizorem (w minutach) ( y ) 4 5 lat 43 6 45 lat 5 Powyże 45 lat 350 Dodatkowo wiadomo, że: ( y y ) n = 6693500. Proszę ocenić, czy występue wpływ wieku na czas oglądania telewizi w pierwszy dzień świąt Bożego Narodzenia. Zad. 3. O poziomie miesięcznych wydatków na kosmetyki w zależności od płci klienta na podstawie obserwaci wśród 000 losowo wybranych klientów wiadomo, że: - średnie miesięczne wydatki na kosmetyki w grupie 400 kobiet wyniosły 30 zł, - średnie miesięczne wydatki na kosmetyki w grupie 600 mężczyzn wyniosły 0 zł, - zmienność miesięcznych wydatków na kosmetyki wśród wszystkich respondentów wyniosła 60%. W akim zakresie płeć klienta determinue poziom miesięcznych wydatków na kosmetyki? Czy wynik ten można uznać za istotny? Zad. 4. (egz.) Badaąc wpływ typu własności na koszty produkci w 50 firmach otrzymano następuące informace ( X typ własności, Y koszty w tys. zł): Koleność (i) Typ własności Średnie liczebności Źródła zmienności Suma kwadratów Prywatna Państwowa warunkowe 4 7 0 30 zmienne Y Zmienność międzygrupowa Zmienność ogólna odchyleń 08,0 38,75 W oparciu o przedstawione dane: a) sprawdzić hipotezę o ednakowym średnim koszcie według typu własności przymuąc poziom istotności 0,; b) zmierzyć siłę związku korelacynego Y względem X. Zad. 5. Dla 50 wylosowanych studentów pewne uczelni otrzymano następuące dane o wynikach w nauce i o nałogu palenia papierosów: Przeciętna ocena Studenci palący -3 8 3-4 6 4 niepalący Czy wyniki w nauce zależą od nałogu palenia? Oblicz odpowiedni wskaźnik korelacyny. Czy est on w populaci generalne równy zeru? 4
4-5 8 Zad. 6. Rozkład liczby zatrudnionych (X) i wysokości tygodniowych obrotów w tys. zł (Y) dla 40 sklepów obuwniczych est następuący: Y X 35-45 45-55 55-65 8 - - 3-8 8 Zad. 7. Nauczyciel oceniał 0 uczniów ze względu na zdolności ęzykowe i matematyczne. Następnie uszeregował uczniów ze względu na uzyskane noty każde ze zdolności. Proszę ocenić, czy istniee zależność w te grupie uczniów między zdolnościami ęzykowymi a matematycznymi. Uczeń A B C D E F G H I J Rangi zdolności 4 6 3 0 8 7 5 9 ęzykowych Rangi zdolności 3 7 4 0 8 9 5 6 matematycznych Zad. 8. (egz.) Wybrano w sposób losowy 6 osób pracuących w Polsce w leśnictwie i zapytano o staż pracy i liczbę zachorowań na choroby układu ruchowego w ciągu ostatniego roku otrzymuąc następuące informace: Staż pracy (lata) 4,5 3,5 5 7 9 Liczba zachorowań 0 3 3 4 Na podstawie odpowiednich miar i analiz należy ustosunkować się do następuących stwierdzeń:. Korelaca liczby zachorowań względem stażu pracy wśród badanych pracowników charakteryzue się dużą siłą i dodatnim kierunkiem.. Korelacę liczby zachorowań względem stażu pracy w populaci osób pracuących w leśnictwie w Polsce można uznać za istotną zakładaąc prawdopodobieństwo błędu I rodzau na poziomie %. 3. Jeżeli zmnieszymy zakładane prawdopodobieństwo błędu I rodzau do poziomu to decyza podęta w poprzednim punkcie ulegnie zmianie. Zad. 9. (egz.) Wybrano w sposób losowy próbę pracowników zakładu produkcynego XXX. Wartość współczynnika korelaci liniowe Pearsona czasu doazdu do pracy i czasu spędzanego w stołówce pracownicze w ciągu dnia wyniosła 0,48. Na te podstawie oceń:. Jaka est korelaca pomiędzy czasem doazdu do pracy a czasem spędzanym w stołówce (interpretaca słowna).. Czy korelaca pomiędzy czasem doazdu a czasem spędzanym w stołówce est istotna na poziomie istotności O, l. Zad. 0. Związek Kynologiczny I Towarzystwo Muzyki Francuskie zbadało wpływ utworów Eryka Satie na zdrowie psów domowych. Próbie poddano 00 wylosowanych zwierząt, spośród których 80 słuchało przez miesiąc kompozyci E.Satie. 6,5% słuchaących psów zachorowało w ciągu następnego roku, podczas gdy 50 niesłuchaących było w tym czasie zdrowych. Przy poziomie istotności 0,05 sprawdzić, czy powyższe informace upoważniaą do stwierdzenia związku między słuchaniem muzyki Eryka Satie i stanem zdrowia wśród ogółu psów. Zad.. W próbie 0 pacentów cierpiących na pewną chorobę zastosowano dwie metody leczenia (metodę A i B). Przy stosowaniu metody A zaobserwowano poprawę w 60 przypadkach i brak zmian u 30 osób. Spośród pozostałych pacentów, którzy byli leczeni metodą B 80 czuło się lepie, zaś u innych nie zauważono zmian. a) Wyznaczyć dwuwymiarowy rozkład empiryczny dla zmiennych metoda leczenia i wynik leczenia ; b) Podać rozkład wyników leczenia przy zastosowaniu metody B; c) Wyznaczyć hipotetyczną liczbę osób, u których zaobserwowano poprawę przy zastosowaniu metody A przymuąc, że metoda leczenia nie wpływa na wynik leczenia; d) Czy istniee zależność (stochastyczna) między metodą leczenia i wynikiem leczenia - w próbie - w populaci generalne Zad.. Na podstawie rozkładu empirycznego przebiegu samochodu (w tys. km) i wieku samochodu (w latach ukończonych) postaci: Przebieg Wiek Na podstawie tych danych oblicz wskaźniki korelacyne i sprawdź, czy są one w populaci generalne równe zeru? 0-3-5 6-8 9-0-40 9 6 0 0 40-80 3 4 7 80-0 8 5 8 0-60 3 6 a) wyznaczyć średni wiek oraz średni przebieg samochodu; b) ocenić, ze względu na którą cechę badane samochody były bardzie zróżnicowane; c) obliczyć średni wiek samochodów o przebiegu od 40 do 80 tys. km oraz odchylenie standardowe wieku samochodów o tym przebiegu; d) obliczyć średni przebieg samochodu 6-8 letniego; e) zbadać czy istniee zależność liniowa między badanymi zmiennymi w te próbie oraz w populaci generalne 5
Zad. 3. Analizuąc sytuacę materialną rodzin wieskich na podstawie badania sondażowego, przeprowadzonego na próbie 300 gospodarstw zamieszkałych w okolicach miasta woewódzkiego o wysokie stopie bezrobocia, uzyskano następuącą tablicę korelacyną: Gospodarstwa domowe o liczbie osób Dochody na osobę - 3-4 5 i więce Do 300 3 35 46 300-500 8 3 5 500-700 3 0 5 Powyże 700 8 3 Proszę odpowiedzieć na pytanie ak silna est w badane próbie zależność (stochastyczna) między badanymi cechami? Zweryfikować hipotezę, iż badane zmienne są niezależne stochastycznie. Zad. 4. Czy istniee zależność (stochastyczna) między opinią, pozytywną lub negatywną, na temat istnieące skali podatkowe w pewnym krau europeskim a miescem zamieszkania, eśli kwestionariusze zostały dostarczone do dwóch regionów (A, B)? W pierwszym regionie w badaniu wzięło udział 300 osób, pozytywnie wyraziło się zaledwie 00. W regionie B zaś na 50 respondentów ocenę pozytywną przyznało istnieącemu systemowi 0 Zad. 5. (egz.). Na próbie losowe 000 respondentów przeprowadzono sondaż opinii społeczne dotyczący skuteczności negocaci rządowych ze związkami zawodowymi. Na podstawie uzyskanych wyników ustalono siłę zależności stochastyczne, między oceną skuteczności i płcią respondentów w te próbie. Miarę te zależności stanowił współczynnik Cramera V = 0,38. Czy zależność tę można uznać za statystycznie istotną, eśli możliwe odpowiedzi respondentów to: negocace były skuteczne, negocace były nieskuteczne, nie mam zdania na ten temat? Zad. 6. Losowo wybrane 0 osób zapytano o wydatki na książki (cecha X w złotych) w ciągu ostatniego miesiąca oraz o to, czy w ubiegłym roku były w teatrze (cecha Y). Dane z sondażu zostały pogrupowane według przedziałów klasowych cechy X: 0-40; 40-80; powyże 80 oraz cechy Y: tak; nie. Na podstawie uzyskanych danych wyznaczono współczynnik zbieżności Cramera równy 0,. Czy związek między zmiennymi można uznać za statystycznie istotny (przymi α = 0,0)? Zad. 7. Przeprowadzono badanie zależności między wyborem koloru nowe bielizny (produkowane w czterech kolorach) a wykształceniem (podstawowe, średnie, wyższe). Sprawdź, przy poziomie istotności 0,05, czy występue stochastyczna zależność między wykształceniem a wybranym kolorem bielizny, eśli na podstawie losowe próby 00 ankietowanych osób otrzymano wartość współczynnika zbieżności Cramera równą 0,4. Zad. 8. 00 osób zapytano o preferowany przez nich termin (do 5 lat i powyże 5 lat) spłaty kredytu samochodowego i mieszkaniowego. Okazało się, że spośród 00 osób, którym udzielono kredyt samochodowy 78 preferowało termin do 5 lat, natomiast spośród 00 osób, którym udzielono kredyt mieszkaniowy, 87 preferowało termin powyże 5 lat. Należy ocenić siłę zależności między preferowanym terminem spłaty i rodzaem udzielonego kredytu. Zad. 9. W badaniu dotyczącym popularności ednego z częście oglądanych programów typy reality show następuące informace o oglądalności tego programu: Oglądam Często Oglądam Nie oglądam razem regularnie oglądam czasami wcale kobieta 73 6 mężczyzna 45 36 4 9 4 razem 8 57 40 0 35 Czy na podstawie powyższych informaci można uznać, że oglądalność badanego programu zależy od płci? Zmierzyć siłę tego związku i uzasadnić wybór zastosowane miary. Zad. 30.W anonimowe ankiecie zadano 00 wybranym losowo studentom (zachowuąc równy podział obu płci) pytanie, czy akceptuą stawki podatkowe obowiązuące w 005 roku. Twierdząco odpowiedziało 60 studentek i 80 studentów. Czy występue zależność między płcią a rodzaem opinii (przyąć poziom istotności równy 0,05)? Zad. 3. Badaąc powiązanie między czasem doazdu do pracy (w minutach) a liczbą spóźnień w próbie 00 osób zatrudnionych w przedsiębiorstwie Z uzyskano następuące informace: Czas doazdu Liczba spóźnień 0-3-5 Ogółem 0-5 8 5-5 6 54 5-40 6 4 Ogółem Oceń występowanie zależności stochastyczne pomiędzy badanymi cechami: a) w populaci (przymi poziom istotności 0,0); b) w próbie. Zad. 3. Na podstawie zaprezentowanych w poniższe tablicy danych o potrzebie posiadania samochodu oraz potrzebie mieszkania a płcią 00 losowo wybranych kobiet i mężczyzn w wieku 0-5 lat oceń: a) Czy zależność ta est istotna statystycznie przy poziomie istotności 0,05? b) Jaka est siła te zależności? Płeć Tak Nie Kobiety 0 0 Mężczyźni 50 0 6
Zad. 33. Jeśli liczebności brzegowe wynoszą odpowiednio: - dla cech X: 30, 50, 0, - dla cechy Y: 50, 30, 0, wyznaczyć liczebności rozkładu łącznego eśli wiadomo, że V = 0. Zad. 34. Badaąc związek miedzy oglądalnością programu publicystycznego i wykształceniem respondentów otrzymano na podstawie próby losowe następuącą postać rozkładu odpowiedzi: Kategorie cech Program: Poziom wykształcenia A B C D Podstawowe 0 5 5 50 Średnie 30 5 0 30 Wyższe 50 5 40 5 Określić siłę zależności statystyczne badanych cech. Zad. 35. Na podstawie wyniku sondażu opinii społeczne dotyczącego skuteczności negocaci rządowych ze związkami zawodowymi ustalono dla wyników próby losowe 000 respondentów siłę zależności stochastyczne, między oceną skuteczności i płcią respondentów, mierzoną współczynnikiem Cramera, na poziomie V = 0,38. Czy zależność tę można uznać za statystycznie istotną, eśli możliwe odpowiedzi respondentów to: negocace były skuteczne, negocace były nieskuteczne, nie mam zdania na temat? Odp.: χ =44,4 χ 0,05= 5,99 H0 odrzucamy. Zad. 36. W sondażu na temat przystąpienia Polski do Unii Europeskie w pewnym woewództwie dla 00 wylosowanych niezależnie osób uzyskano następuące wyniki w zależności od miesca zamieszkania respondentów: Miesce Akceptaca akcesi Ogółem zamieszkania Tak Nie Miasto Wieś 80 40 0 60 00 00 Razem 0 80 00 Czy akceptaca przystąpienia Polski do Unii Europeskie zależy od miesca zamieszkania? Odp.: χ =33,3 χ 0,05= 5,99 H0 odrzucamy. Zad. 37. Międzyuczelniane Biuro Śledcze zbadało przebieg studiów 00 wylosowanych absolwentów wyższych uczelni. Wśród zbadanych 30% przyznało, że ściągało podczas egzaminów. Czterdziestu ściągaących weszło potem w konflikt z prawem. Stu zbadanych zawsze pisało egzaminy uczciwie i nigdy w przyszłości nie weszło w konflikt z prawem. Czy powyższe informace upoważniaą do twierdzenia, że wśród młodzieży akademickie występue zależność między faktem ściągania w trakcie egzaminów i kolizą z prawem w przyszłości? Odp.: χ =3,65 χ 0,05= 3,84 H0 odrzucamy. Zad. 38. Kierownik reklamy w ednym z czasopism sugerue zwiększenie wydatków na reklamę telewizyną w celu podniesienia przychodów firmy. Przypuszcza on, ze korelaca tych cech est istotna. Wyniki dla losowo wybranych 6 firm były następuące: Wydatki na reklamę (w mln zł),0 3,0 4,0 7,0 7,0 8,0 Przychody (w mln zł) 40 70 90 0 00 0 a) Proszę obliczyć i zinterpretować współczynnik korelaci liniowe Pearsona wiedząc, że: x = 5, S ( x) = 6,3, y = 90, S ( x) = 800. b) Proszę zweryfikować przypuszczenie o istotnie różne od zera korelaci między w wydatkami na reklamę a przychodami firm. Odp: r(xy)=0,96 t = 6,95 ν=4, H0 odrzucamy Zad. 39. 00 losowo wybranych punktów sprzedaży zbadano ze względu na kategorię wydatków na reklamę oraz zmianę obrotów w ostatnim kwartale. Wynik badania przedstawia poniższa tabela: wydatki na reklamę Zmiana obrotów Wydatki na reklamę uliczną prasową w ostatnim kwartale Spadek 8 Stabilizaca 0 0 Wzrost 8 Z akim ryzykiem błędu pierwszego rodzau można uznać zależność stochastyczną między kategorią wydatków na reklamę a zmianą obrotów za statystycznie istotną? Odp.: χ =0,6,4 ν=3, α poniże 0, Zad. 40. Na podstawie obserwaci 00 losowo wybranych mieszkańców Warszawy ustalono następuący rozkład poglądów na temat przystąpienia Polski do UE z uwzględnieniem płci respondenta: Opinia Kobiety Mężczyźni Tak 30 0 Nie 5 5 Jeśli uzyskane wyniki wskazuą, że występue zależność stochastyczna między płcią respondenta i wyrażaną opinią proszę określić e siłę? Odp.: χ=5 χ 0,05= 3,84, odrzucamy H0. 7
Zad. 4. Zbadano opinię 400 studentów (po 00 każde płci) i ustalono, że 60 mężczyzn i 40 kobiet, negatywnie wypowiedziało się na temat możliwości dostępu do internetu na uczelni. Opinię pozytywną wyraziło 40 % studentek i 50 % studentów. Pozostałe pytane osoby nie miały zdania na ten temat. Zweryfikować hipotezę o niezależności opinii od płci (przyąć α = 0,05). Zbadać siłę zależności między opinią na ten temat a płcią za pomocą odpowiedniego wskaźnika. Zad. 4. Wysunięto przypuszczenie, że absenca na wykładach ( ilość wykładów opuszczonych w ciągu roku) zależy od roku studiów. W losowe próbie 000 studentów pierwszego i drugiego roku pewnego uniwersytetu stwierdzono: Płeć I rok II rok Absenca 0-0 300 500-0 80 70-40 0 30 a) Zweryfikować hipotezę, że absenca na wykładach zależy od roku studiów. Przyąć α=0, b) Czy zależność ta est istotna przy poziomie istotności α =0,05? c) Ile wynosi wartość wskaźnika V-Cramera? d) Na podstawie danych z zadania 4 oblicz wskaźnik korelacyny będący miarą skorelowania absenci na wykładach z rokiem studiów. Czy wskaźnik ten est oznacza istotną zależność przy poziomie istotności 0,0? Zad. 43. W grupie 00 inwestorów przeprowadzono badanie zależności między skłonnością do ryzyka (x) i przeciętną stopą zwrotu z inwestyci w minionym roku (y). Badanie dostarczyło następuących informaci: Poziom skłonności do ryzyka (x) Liczba inwestorów(n i. ) Przeciętna realna stopa zwrotu (%) ( y i ) Niski 30.0 Średni 40 4.0 Duży 30 6.0 Wiedząc, że ( y) n. = 375 y wyznacz i zinterpretu miernik siły zależności między badanymi zmiennymi. Zad. 44. W badaniu miesięcznych dochodów (Y w tys. zł) 00 absolwentów SGH, UW i SGGW otrzymano następuące wyniki: SGH 50 osób y =,8, UW 00 osób y =,, SGGW 50 osób y 3 =,4. Ponadto wiadomo, że warianca dochodów 00 badanych studentów wyniosła 0,4. Zbadać zależność poziomu dochodów od typu ukończone uczelni. Czy zależność ta est istotna przy poziomie istotności 0,05? Zad. 45. Obserwuąc proces zamarzania pewnego produktu dokonano 5 obserwaci dawki substanci chłodzące (cecha X) oraz osiągane przez produkt temperatury (cecha Y). Oblicz współczynnik korelaci liniowe pomiędzy dawką substanci chłodzące i osiąganą temperaturą. Czy uzyskane wyniki pozwalaą przy poziomie istotności α =0,05 stwierdzić, że współczynnik korelaci est istotnie uemny? Xi 3 4 5 Yi 0 - - Zad. 46. Zbadano 80 hurtowni ze względu na: x - liczbę zatrudnionych osób i y -wartość sprzedaży (tys.zł). Uzyskano następuące informace: x i = 440; y i = 3 400; x i y i =60 000; S x = 0,8; S y =0. Hurtownie te podzielono na trzy grupy (po 60 hurtowni) ze względu na liczbę zatrudnionych osób: małe, średnie i duże. W małych przeciętna wartość sprzedaży wynosiła 60 tys.zł., w średnich - 80 tys.zł., w dużych - 00 tys.zł. Równocześnie wiadomo, że ( y y) n. = 80000 Za pomocą dwóch różnych miar ocenić siłę zależności wartości sprzedaży względem liczby zatrudnionych. O czym świadczą uzyskane wyniki? Zad Które układy danych są nieprawdziwe i dlaczego? a) V=0, cov(xy)=35 ; b)r(xy)=-, e(xy)=0 ; c) r(xy)= -, e(xy)=; d) r(xy)=0,, e(xy)=0,9 Zad. 47. Wyniki badania losowe próby 00 osób, pytanych o zamiar wzięcia udziału w nabliższych wyborach przedstawiały się następuąco: ze 00 badanych kobiet 60 twierdziło, że decydue się głosować natomiast w próbie mężczyzn, znadowało się 60 takich, którzy nie zamierzali iść na wybory. Czy zależność między powyższymi zmiennymi est istotna statystycznie? Zad. 48. 00 losowo wybranych dystrybutorów zbadano ze względu na rodza wydatków inwestycynych oraz zakres prowadzone działalności w ostatnim kwartale. Wynik badania przedstawia poniższa tabela: Zakres prowadzone działalności Inwestyce w kapitał ludzki Inwestyce w środki produkci Lokalna 0 0 Regionalna 0 0 Ogólnokraowa 0 30 Z akim ryzykiem błędu pierwszego rodzau można uznać zależność stochastyczną między rodzaem wydatków inwestycynych oraz zakres prowadzone działalności za statystycznie istotną? Zad. 49. Zbadano losową grupę kierowców ze względu na płeć kierowcy (X) i liczbę stłuczek (Y). Otrzymano następuący rozkład: x \ y 0 n i. m 4 8 3 k 6 0 9 χ =4,67 n. 50 a) Poda rozkład warunkowy Y X=k oraz ego interpretacę; b) Czy hipotetyczna liczba mężczyzn, którzy mieli stłuczkę est wyższa od hipotetyczne liczby kobiet które miały stłuczki? (proszę uzasadnić). 8
c) Czy na podstawie wyników z próby, można twierdzić, że kobiety prowadzą ostrożnie samochód? Zad. 50. Proszę dwukrotnie wypełnić poniższą tablicę tak, aby: a) współczynnik Cramera równał się 0; b) S ( y) = S ( y) = S ( y) 0 oraz proszę podać i zinterpretować wartość wskaźnika korelaci cechy Y względem cechy 3 = X, aki musi nastąpić w tym przypadku. a) y b) y x i 0 n i. x i 0 n i. 0 0 3 50 3 50 4 30 4 30 n. 0 50 30 00 n. 0 50 30 00 Zad. 5. (egz. 003) Badaąc zależność między wydatkami na promoce (w tys. zł) -X, a wartością sprzedaży (w tys. zł) -Y w losowo wybranych punktach sprzedaży pewne sieci dystrybuci uzyskano następuące dane: x i 3 4 5 6 y i 4 6 8 0 a) Proszę ocenić siłę i kierunek korelaci liniowe pomiędzy zmiennymi eśli obliczone na podstawie próby nieobciążone odchylenia standardowe wynoszą: S ˆ( x ) =,58, S ˆ ( y) = 3,6. b) Czy badana zależność est istotna statystycznie? (Należy przyąć poziom istotności 0,0 i założyć normalność rozkładu obu zmiennych.) Zad. 5. (egz. 003) Czy w populaci siedleckich przedsiębiorstw obroty (Y w mln zł) są dodatnio skorelowane z nakładami na informatykę (X w tys. zł), eśli wiadomo, że obliczona na podstawie wyników 8 elementowe losowe próby suma iloczynów obu zmiennych wyniosła 30700 (mln zł * tys. zł), średnie obroty 9 mln zł, średnie nakłady 88 tys. zł a współczynniki zmienności odpowiednio 0% i 5%?. Dodatkowe informace: rozkład obu zmiennych est normalny, wariance obliczono ako realizace obciążonych estymatorów warianci. Zad. 53. Dla 00 punktów gastronomicznych zbadanych ze względu na dzienny utarg (X, w tys. zł) i liczbę zatrudnionych osób (Y) otrzymano wyniki: y 4 6 8 0 Oceń siłę zależności utargu względem liczby zatrudnionych. x 5 7 9 0 Wykreśl odpowiednią empiryczną krzywą regresi. Jakie informace są niezbędne by wykreślić drugą empiryczną krzywą regresi? S (x),6,4,6 3 n. 0 40 30 0 Zad. 54. Badanie zależności między zdolnościami matematycznymi (X) a oceną uzyskaną na dyplomie ukończenia studiów (Y) 00 losowo wybranych studentów SGH dostarczyło następuących danych: Poziom zdolności Liczba studentów średnia ocena uzyskana na dyplomie słabe 0 3 średnie 50 4 duże 30 5 Wiedząc, że warianca w próbie S (y) = 0,8 proszę ocenić zależność między badanymi zmiennymi. Czy zależność ta est istotna statystycznie? Zad. 55. Przypuszcza się, że ryzyko rozwodu est związane z wiekiem zawarcia związku małżeńskiego. Dla grupy 400 mężczyzn zbadane w roku t, którzy zawarli małżeństwo 5 lat wcześnie, uzyskano następuące dane: Stan cywilny wiek w momencie zawarcia małżeństwa do 8 lat 9-5 ponad 5 lat Rozwiedziony 00 80 0 nie rozwiedziony 80 70 50 Proszę ocenić, czy ryzyko rozwodu est zależne od wieku w momencie zawarcia małżeństwa. Jak silna est badana zależność? Zad. 56. Badaąc zależność stawki godzinowe w zł (Y) od stażu pracy w latach (X) administratorów danych, dla losowe próby 5 administratorów danych otrzymano następuące wyniki: y 0-3-5 6-8 9- x = 95,8 x 46,7 76 07,4 8,6 S (x) = 6,3 y = 6, S (y) = 9, xi y ni = 84040 i n. 5 40 35 35 a) Jak silna est zależność stawki godzinowe w zł (Y) od stażu pracy w latach (X)? (Proszę wyznaczyć i zinterpretować odpowiedni miernik). Czy zależność ta est statystycznie istotna? b) Czy na podstawie powyższych wyników można powiedzieć, że w populaci generalne administratorów danych średnia stawka za godzinę rośnie wraz ze wzrostem stażu? Zad. 57.Ranking 5 nawiększych uczelni w Polsce w opinii pracowników i studentów tych uczelni przedstawia się następuąco: uczelnia A B C D E Ranking według pracowników 4 3 5 studentów 5 4 3 Na podstawie podanych informaci proszę: a) zmierzyć siłę współzależności pomiędzy ocenami pracowników i studentów, b) ocenić czy otrzymany wynik est statystycznie istotny. 9