Joanna Konieczna Repetytorium ze statystyki opisowej (materiał roboczy)

Podobne dokumenty
STATYSTYKA 2. Katarzyna Abramczuk

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Podstawy statystyki - ćwiczenia r.

KURS STATYSTYKA. Lekcja 5 Analiza współzależności ZADANIE DOMOWE. Strona 1

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Rozkłady statystyk z próby

Rozkłady statystyk z próby. Statystyka

Miary statystyczne w badaniach pedagogicznych

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję.

Zadania ze statystyki, cz.6

Matematyka podstawowa I. Liczby rzeczywiste, zbiory

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Porównywanie populacji

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) ,5 6,6

STATYSTYKA MATEMATYCZNA

Statystyka opisowa. dr inż. Aleksandra Czupryna-Nowak 1

Rozkłady zmiennych losowych

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Wartość danej Liczebność

STATYSTYKA MATEMATYCZNA

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Aby przygotować się do kolokwiów oraz do egzaminów należy ponownie przeanalizować zadania

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

STATYSTYKA MATEMATYCZNA

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Wybrane rozkłady zmiennych losowych. Statystyka

Metody Statystyczne. Metody Statystyczne.

Egzamin ze Statystyki, Studia Licencjackie Stacjonarne czerwiec 2007 Temat A

STATYSTYKA wykład 5-6

Zadanie Punkty Ocena

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

Centralne twierdzenie graniczne

Przykładowe zadania na egzamin z matematyki - dr Anita Tlałka - 1

Wartość danej Liczebność

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD STATYSTYK Z PRÓBY

KURS STATYSTYKA. Lekcja 2 Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE. Strona 1

Okręgowa Komisja Egzaminacyjna w Warszawie WSTĘPNA INFORMACJA O WYNIKACH PISEMNEGO EGZAMINU MATURALNEGO Z JĘZYKA ANGIELSKIEGO.

Wnioskowanie statystyczne. Statystyka w 5

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Matematyka 2. dr inż. Rajmund Stasiewicz

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

Wybrane rozkłady zmiennych losowych. Statystyka

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Rozkłady prawdopodobieństwa zmiennych losowych

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Dystrybuanta i funkcja gęstości

Wykład 5: Statystyki opisowe (część 2)

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

STATYSTYKA POWTÓRZENIE WIADOMOŚCI

Emerytury nowosystemowe wypłacone w grudniu 2018 r. w wysokości niższej niż wysokość najniższej emerytury (tj. niższej niż 1029,80 zł)

2 Ustalamy długość klasy, dzieląc rozstęp R przez liczbę klas, czyli przez 6. Klasy mają więc długość

Rachunek Prawdopodobieństwa i Statystyka

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Statystyka i eksploracja danych

Pozyskiwanie wiedzy z danych

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Oszacowanie i rozkład t

Analiza struktury i przeciętnego poziomu cechy

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa i jej rozkład

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Xi B ni B

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Wartość danej Liczebność

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

KURS PRAWDOPODOBIEŃSTWO

Zad. 1. Wartość pożyczki ( w tys. zł) kształtowała się następująco w pewnym banku:

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Ćwiczenia 1-2 Analiza rozkładu empirycznego

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Dokładne i graniczne rozkłady statystyk z próby

Statystyka. Zadanie 1.

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Zmienne losowe dyskretne i Zmienne losowe ciągłe Rozkład Normalny

LOGIKA MATEMATYCZNA. Poziom podstawowy. Zadanie 2 (4 pkt.) Jeśli liczbę 3 wstawisz w miejsce x, to które zdanie będzie prawdziwe:

Żródło:

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Skrypt 29. Statystyka. Opracowanie L2

Kolokwium ze statystyki matematycznej

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

ESTYMACJA. Przedział ufności dla średniej

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Transkrypt:

1. Dana jest niekompletna macierz danych surowych zawierająca informację o zmiennych X i Y oraz rozkłady zmiennych X i Y. Uzupełnij macierz tak, aby zmienne X i Y miały w tej populacji taki rozkład, jak przedstawiają tabelki. Nr kolejny obiektu X Y Rozkład X Rozkład Y 1 50 1 x i P(X=x i ) y i P(Y=y i ) 2 60 0 45 0,2 0 0,3 3 50 0,4 1 0,5 4 50 60 0,4 2 0,2 5 0 RAZEM 1,0 RAZEM 1,0 6 1 7 60 0 8 60 9 50 1 10 50 1 2. Dana jest macierz zawierająca informację o zmiennej X rok urodzenia respondenta. Dodaj do macierzy zmienną Y wiek respondenta, a następnie oblicz średni wiek osób biorących udział w tym badaniu. Nr kolejny resp. X 1 1944 2 1954 3 1944 4 1954 5 1974 6 1984 7 1984 8 1974 9 1954 10 1974 Y 3. Średni wzrost uczniów pewnej klasy wynosi 152 cm, a mediana wzrostu 151 cm. a. Jakiego wzrostu powinien być nowy uczeń przyjmowany do tej klasy, aby nie zmienił się średni wzrostu uczniów w klasie? b. Jakiego wzrostu powinien być nowy uczeń, aby nie zmieniła się mediana wzrostu uczniów w klasie? Rozważ wszystkie przypadki. 4. Dany jest niekompletny rozkład zmiennej X. Uzupełnij ten rozkład w taki sposób, aby błąd modalnej był maksymalny. x i P(X=x i ) 1 2 0,2 3 4 1

5. Dane są następujące parametry zmiennej X liczba opuszczonych dni pracy: Mo(X)=1; Me(X)=2; E(X)=1,5; b(x)=0,7; d(x)=0,8; D2(X)=1,1. Za opuszczone dni pracy pracodawca zmniejsza pracownikom wynagrodzenie według następującej reguły: - osoby, które opuściły co najwyżej 1 dzień otrzymują pełne wynagrodzenie (nic nie tracą); - osoby, które opuściły 2 dni tracą po 30 zł za każdy dzień; - osoby, które opuściły 3 dni i więcej tracą po 25 zł za każdy dzień. Ile będą wynosiły te same parametry (tj. modalna, mediana, średnia, błąd modalnej, odchylenie przeciętne i wariancja) zmiennej Y utracone dochody? Odpowiedzi należy uzasadnić poprzez podanie odpowiednich obliczeń. Jeśli któregoś parametru nie da się wyznaczyć należy to wyraźnie napisać. 6. W 15-osobowej zbiorowości zmienna X przyjmuje wszystkie wartości ze zbioru {0;1;2}. a. Jakie mogą być maksymalne wartości średniej i wariancji tej zmiennej? b. Podaj przykładowe rozkłady zmiennej X, dla których średnia i wariancja przyjmują maksymalne wartości. c. Czy możliwe jest aby jednocześnie średnia i wariancja były maksymalne? Uzasadnij odpowiedź. 7. Zmienna X przyjmuje w pewnej zbiorowości jedynie dwie wartości 0 i 1. Odchylenie przeciętne od mediany tej zmiennej wynosi 0,3. Ile wynoszą błąd modalnej i wariancja tej zmiennej? 8. Zmienna X przyjmuje w 50-osobowej zbiorowości wszystkie wartości ze zbioru {1;2;3;4;5}. Podaj taki przykładowy rozkład tej zmiennej, aby różnica między średnią a medianą była ujemna, a wartość bezwzględna tej różnicy możliwie największa. 9. Dany jest rozkład zmiennej X. Podaj rozkłady następujących funkcji zmiennej X: a. W=2X-1; b. Y=(X-1) 2 ; c. V= X-1 x i P(X=x i ) 0 0,3 1 0,2 2 0,4 3 0,1 10. W pewnej zbiorowości określone są zmienne X i Y. O każdym z niżej podanych zapisów powiedz, czy określa on stałą, czy zmienną: a. E(X Y) b. Me(X Y=1) c. D 2 (Y X=2) d. D 2 (Y) 11. Zbadano 10 par małżeńskich. Średnia zarobków żon wynosiła 1000 zł., a wariancja 400 zł 2. Wiadomo, że w tej zbiorowości każdy mąż zarabia o 20% więcej od swojej żony. Wyznacz średnią i wariancję różnicy dochodów męża i żony. 2

12. Dana jest rodzina rozkładów warunkowych zmiennych X i Y oraz brzegowy rozkład zmiennej Y. Wyznacz rozkład łączny liczebności tych zmiennych przy założeniu, że badana zbiorowość liczyła 100 osób. X\Y 1 2 y i P(Y=y i ) 0 0,3 0,2 1 0,7 1 0,1 0,4 2 0,3 2 0,1 0,2 razem 1,0 3 0,5 0,2 razem 1,0 1,0 13. O każdym z wymienionych niżej zdań wypowiedz się, czy jest ono prawdziwe,m czy też nie. Zmienna statystyczna to funkcja, której argumentami są jednostki obserwacji Zmienna statystyczna to odwzorowanie przyporządkowujące elementom badanej populacji liczby naturalne Zmienna statystyczna to funkcja określona na zbiorze liczb rzeczywistych Zmienna statystyczna to funkcja, której jedną z wartości jest modalna tej zmiennej 14. Zmienna przyjmuje z jednakowymi częstościami cztery wartości. Czy dla innych rozkładów zmiennej przyjmującej te same cztery wartości modalnych mogłoby być więcej (tak, czy nie?) wariancja mogłaby być większa (tak, czy nie?) błąd modalnej mógłby być większy (tak, czy nie?) entropia mogłaby być większa (tak, czy nie?) 15. W pewnej grupie liczącej 25 osób średnia, mediana i modalna wieku były równe po 22 lata, a odchylenie standardowe - 2 lata. Do grupy dołączyło pięć osób - jedna mająca 18 lat, dwie po 22 lata i 2 po 24 lata. Czy wynika z tego, że średnia wzrosła (tak, czy nie?) modalna nie zmieniła się (tak, czy nie?) odchylenie standardowe wzrosło (tak, czy nie?) mediana wzrosła (tak, czy nie?) 16. W pewnym zakładzie pracuje 2 razy więcej mężczyzn niż kobiet. Średnia wysokość dodatku rodzinnego pobieranego przez kobiety wynosi 350 zł, a przez mężczyzn 300 zł. Jaka jest średnia wysokość tego dodatku w całym zakładzie? Ile wynosiłaby ta średnia dla całego zakładu, gdyby z zakładu zwolniono połowę kobiet, a średnia wysokość dodatku rodzinnego w grupie pozostałych kobiet była na początkowym poziomie? 17. W Ministerstwie Powszechnej Szczęśliwości są dwa departamenty o identycznej strukturze i identycznej liczbie pracowników: Departament Uciech Cielesnych (DUC) oraz Departament Rozkoszy Duchowych (DRD). W DUC średnie zarobki wynoszą 500 sybarytów, mediana 482 sybaryty, wariancja 2500 sybarytów kwadratowych, a odchylenie przeciętne od mediany 30 sybarytów. W DRD każdy pracownik zarabia o 40% więcej niż jego odpowiednik z DUC. Oszacuj najdokładniej jak potrafisz średnią, medianę, wariancję i odchylenie przeciętne od mediany zarobków całego Ministerstwa Powszechnej Szczęśliwości. 3

TRANSLACJE 1. Zbadano 100-osobową grupę studentów. Niech X rok studiów, Y liczba niezdanych egzaminów; Z płeć (0 kobieta, 1 mężczyzna). A. Objaśnij osobie nieznającej statystyki, co oznaczają poniższe zapisy: P(Y=2 X>1) > P(Y=2 X=1) E(Z X=1) < E(Z X=4) P[Z=0 Y>E(Y)] > P[Z=0] B. Zapisz używając symboli statystycznych: W grupie osób, które nie zdały tylko jednego egzaminu najliczniejszy jest trzeci rok studiów Nieco ponad połowa mężczyzn nie zdała co najwyżej jednego egzaminu i jednocześnie ponad połowa mężczyzn nie zdała co najmniej jednego egzaminu. Na piątym roku studiów kobiety są liczniejsze niż mężczyźni. 2. W pewnej zbiorowości określono 2 zmienne: X płeć (0 mężczyzna; 1 kobieta) oraz Y wykształcenie (1 podstawowe; 2 średnie; 3 wyższe). A. Zinterpretuj podane niżej zapisy symboliczne, to znaczy napisz, czym charakteryzuje się zbiorowość, w której zachodzi podana relacja. P(X=1 & Y=1)=0,1 P(Y=3)=P(Y=3 X=0) E(X Y<2)<E(X Y 2) Mo(X Y=3)>Mo(X Y 2) B. Zapisz symbolicznie następujące zdania: Osoby z wykształceniem co najmniej średnim stanowią 50% badanej populacji 30% kobiet ma wykształcenie podstawowe W grupie mężczyzn częściej zdarzają się osoby ze średnim wykształceniem niż wśród kobiet osoby z wykształceniem podstawowym; Mężczyzn mających wyższe wykształcenie było w tej zbiorowości więcej niż kobiet ze średnim wykształceniem 3. Zbadano grupę studentów. Niech X oznacza rok studiów, a Y płeć (0 kobieta, 1 mężczyzna). Zapisz używając symboli statystycznych: 1. Najliczniejszy jest trzeci rok studiów. 2. Na trzecim roku kobiety stanowią większość. 3. Połowa mężczyzn studiuje na drugim roku. 4. Udział mężczyzn wśród studentów czwartego roku jest dwukrotnie mniejszy niż wśród studentów pierwszego roku. 4

4. W zbiorowości czytelniczek prasy kobiecej określono następujące zmienne: X ile różnych gazet ( tytułów ) kupuje regularnie Y ulubiony dział (1-życie gwiazd; 2-moda; 3-horoskopy; 4-porady intymne; 5-przepisy kulinarne) Z- czy ogląda seriale w TV (0-nie; 1-tak) W wykształcenie Poniżej przytoczone zostały stwierdzenia dotyczące badanej zbiorowości oraz propozycje zapisów symbolicznych tych stwierdzeń. O każdym z podanych zapisów symbolicznych wypowiedz się, czy jest on poprawny. W odpowiednią kratkę tabeli wpisz T (tak) lub N (nie). a. Czytelniczki z wykształceniem przynajmniej średnim rzadziej oglądają seriale w TV, niż czytelniczki z wykształceniem podstawowym. E (Z W=2 W=3) < E (Z W=1) E (Z W 2) > E(Z) P(Z=1 W 2) < P(Z=0 W 2) P(W=2 W=3 Z=1) < P (W=1 Z=1) b. Większość czytelniczek, które najbardziej lubią horoskopy i kupują regularnie więcej niż 2 tytuły, ma wykształcenie średnie. P (W=2 Y=3 X>2) > 0,5 Me (W Y=3 X>2) = 2 P (Y 3 X>2 W=2) < 0,5 P (W=2 Y=3 X>2) > P(W=2 Y 3 X 2) Dopasuj zdania do podanych zapisów symbolicznych. Przy każdym zdaniu wpisz T (tak) lub N (nie) w zależności od tego, czy odpowiada ono czy też nie podanemu zapisowi symbolicznemu> P (Y=1 W=3) = P (Y=5 W=1) Wśród czytelniczek z wyższym wykształceniem, najbardziej zainteresowane życiem gwiazd zdarzają się tak samo często, jak osoby z wykształceniem podstawowym wśród czytelniczek zainteresowanych przepisami kulinarnymi. Tak samo często zdarzają się czytelniczki z wyższym wykształceniem najbardziej zainteresowane życiem gwiazd, co czytelniczki z wykształceniem podstawowym, dla których najciekawsze są przepisy kulinarne. Wśród czytelniczek z wyższym wykształceniem, najbardziej zainteresowane życiem gwiazd zdarzają się tak samo często, jak zainteresowane przepisami kulinarnymi wśród czytelniczek z wykształceniem podstawowym. Wśród czytelniczek najbardziej zainteresowanych życiem gwiazd, osoby z wyższym wykształceniem zdarzają się tak samo często, jak osoby z wykształceniem podstawowym wśród czytelniczek zainteresowanych przepisami kulinarnymi. 5

E (Z W=3 X > 1) > 0,5 Większość czytelniczek z wyższym wykształceniem, kupujących regularnie więcej niż jeden tytuł, ogląda seriale. Wśród osób oglądających seriale, ponad połowa ma wykształcenie wyższe i kupuje regularnie więcej niż jeden tytuł. Ponad połowę tej zbiorowości stanowią osoby z wyższym wykształceniem, kupujące regularnie więcej niż jeden tytuł i oglądające seriale. Jest więcej czytelniczek oglądających seriale, wśród osób z wyższym wykształceniem, które kupują regularnie więcej niż jeden tytuł, niż wśród osób z wykształceniem najwyżej średnim, kupujących regularnie tylko jedną gazetę. 5. Zbadano 100 par małżeńskich. Określono zmienne: X wiek męża, Y wiek żony oraz Z posiadanie dzieci (2 nie ma dzieci, 4 są dzieci). 1. Objaśnij osobie nieznającej statystyki, co oznaczają następujące zapisy. a. D 2 (X Y)=0 b. Me(Z X<27)<Me(Z X>27) 2. Zapisz używając symboli statystycznych a. Najmłodszy mąż jest starszy od najmłodszej żony; b. Większość małżeństw, w których żona jest starsza od męża nie ma dzieci. 6