TECHNIKI ANALITYCZNE W BIZNESIE SPRAWDZIAN NR 1 Autor pracy ROBERT KOPERCZAK, ID studenta : k4342 Kraków, 22 Grudnia 2009
2 Spis treści 1 Zadanie 1... 3 1.1 Szereg rozdzielczy wag kobiałek.... 4 1.2 Histogram szeregu rozdzielczego wag kobiałek... 4 1.3 Dystrybuanta empiryczna (względna częstość skumulowana)... 5 1.4 Wnioski wynikające z analizy rozkładu danych.... 5 1.5 Miary położenia i rozrzutu.... 6 1.6 Wnioski dla plantatora.... 7 2 Zadanie 2... 7 2.1 Prawdopodobieństwo pracy po rozpoczęciu konferencji... 8 2.2 Prawdopodobieństwo awarii w trakcie konferencji... 8 2.3 Prawdopodobieństwo pracy po zakończeniu konferencji... 8 2.4 Wyznacz µ, aby niezawodność w trakcie konferencji była > 95%... 8 3 Zadanie 3... 9 4 Wykaz źródeł... 10
3 1 Zadanie 1 W sezonie truskawkowym właściciele plantacji sprzedają truskawki na kobiałki, zakładając, Ŝe kobiałka truskawek waŝy mniej więcej 2 kg. Pewien młody plantator postanowił sprawdzić, ile w rzeczywistości waŝą sprzedawane przez jego pracowników truskawki. Oto wyniki zwaŝenia przypadkowych kobiałek : 1980 1995 2010 2010 1900 2015 1990 2134 1978 2012 2032 2109 2067 2115 1967 2056 1998 2056 2110 2039 2100 2038 2134 1998 1996 1978 2000 2008 2038 2109 2115 1950 1963 2000 1998 2110 1835 2080 1950 2008 2050 2012 1990 2134 1963 2039 1967 2134 2067 2080 1990 2039 2065 2056 1978 2150 2200 2100 2000 1990 a) Sporządź (wykorzystując funkcję CZĘSTOŚĆ) szereg roździelczy wag kobiałek truskawek, a następnie utwórz histogram oraz dystrybuantę empiryczną, przedstawiając graficznie rozkład danych. Skomentuj otrzymane wyniki. b) Wyznacz bezpośrednio z danych, a następnie z szeregu rozdzielczego, miary połoŝenia i rozrzutu dla badanych danych. Porównaj i skomentuj wyniki otrzymane z bezpośrednich danych z wynikami otrzymanymi z szeregu rozdzielczego. c) Biorąc pod uwagę, Ŝe właściciel planuje zebrać z pola tonę truskawek, przedstaw wnioski wynikające z przeprowadzonej analizy statystycznej.
4 1.1 Szereg rozdzielczy wag kobiałek. Aby utworzyć szereg rozdzielczy wag kobiałek, naleŝy najpierw wyznaczyć liczbę k ilości przedziałów, taką, by 2^k była większa od ilości próbek N. Najmniejszą liczbą k, gdzie 2^k > 60 jest k=8 (2^8=64 > 60). PoniewaŜ rozstęp próbki wynosi 365, najpraktyczniej będzie, aby pierwszy przedział klasowy rozpoczynał się na 1800 gram i miał szerokość 50 gram, kaŝdy kolejny równieŝ miałby szerokość 50 gram, ostatni przedział kończyłby się na 2200 gram. W ten sposób 8 przedziałów obejmuje wszystkie próbki 1. Przedziały wagowe kobiałek [gram] większa od.. mniejsza lub równa od.. Częstość 1800 1850 1 1850 1900 1 1900 1950 2 1950 2000 20 2000 2050 14 2050 2100 10 2100 2150 11 2150 2200 1 Tabela nr 1 : Częstość próbek w poszczególnych przedziałach klasowych szeregu roździelczego 1.2 Histogram szeregu rozdzielczego wag kobiałek 25 Histogram szeregu roździelczego wag kobiałek 20 15 10 Częstość 5 0... - 1850 1900 1950 2000 2050 2100 2150 2200 - Wykres nr 1 : Histogram szeregu roździelczego 1 Wyliczenie danych w tabelce arkusz Excel
5 1.3 Dystrybuanta empiryczna (względna częstość skumulowana) Przedziały wagowe kobiałek [gram] większa od.. mniejsza lub równa od.. Częstość skumulowana Dystrybuanta empiryczna [%] 1800 1850 1 1,7% 1850 1900 2 3,3% 1900 1950 4 6,7% 1950 2000 24 40,0% 2000 2050 38 63,3% 2050 2100 48 80,0% 2100 2150 59 98,3% 2150 2200 60 100,0% Tabela nr 2 : Dystrybuanta empiryczna (względna częstość skumulowana) szeregu rozdzielczego wag kobiałek 100,0% 90,0% 80,0% 70,0% 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% Względna częstość skumulowana[%] szeregu roździelczego wagi kobiałek... - 1850 1900 1950 2000 2050 2100 2150 2200 - Dystrybuanta empiryczna [%] Wykres nr 2 : Dytrybuanta empiryczna szeregu rozdzielczego wag kobiałek. 1.4 Wnioski wynikające z analizy rozkładu danych. Najogólniejszym wnioskiem jest fakt, Ŝe w zwaŝonej próbce 40% kobiałek ma wagę poniŝej normy 2 kg, a 60% ma wagę powyŝej normy. W grupie kobiałek poniŝej normy zaledwie 3,3% ma wagę poniŝej 1900 gram, czyli nie powinno być wiele reklamacji ze względu na zaniŝoną
6 wagę. Z kolei w grupie powyŝej normy aŝ 20% kobiałek przekracza wagę 2100 gram, co oznacza, ze plantator moŝe nie osiągnąć planowanego zysku (przy załoŝeniu, Ŝe sprzedaje truskawki na kobiałki ). Niestety nie wiadomo, czy waga została wytarowana przed dokonaniem waŝenia. Jeśli nie została wytarowana, to fakt, Ŝe średnia waga jest wyŝsza od normy moŝe zostać zinterpretowana jako udział tary w pomiarze. Jest jeszcze jedno moŝliwe wytłumaczenie takiego stanu rzeczy być moŝe plantator zakłada pewne ubytki wagowe i jakościowe (np. przykład podczas transportu i przechowywania) i świadomie zalecił pracownikom lekkie przewaŝanie kobiałek. Jeśli tak, to wyniki rozkład częstości wagi w poszczególnych przedziałach klasowych wagi kobiałek pokazują, Ŝe zalecenia plantatora zostały wykonane prawidłowo. 1.5 Miary położenia i rozrzutu. Najpierw dokonano wyliczeń pomocniczych dla szeregu rozdzielczego (szczegóły w arkuszu Excel). Podsumowanie wyliczeń przedstawia się następująco 2 Miary położenia [gram] Wyliczona z danych Wyliczona z szeregu roździelczego Średnia 2 033,1 2 028,3 Mediana 2 013,5 I kwartyl (Q1) 1 990,0 III kwartyl 2 080,0 Moda 1 990,0 Miary rozrzutu Rozstęp 365,0 350,0 Odchylenie stand. (populacja) Odchylenie stand. (próbka) 65,8 69,4 66,4 70,0 Tabela nr 3 : Miary połoŝenia i rozrzutu(z danych i szeregu roździeczego) dla analizowanych danych Średnia waga dla próbki wyliczona dla wszystkich elementów próbki wynosi 2033,1 gram, i jest ok. 5 gram niŝsza od średniej wyliczonej z szeregu rozdzielczego. Rozstęp wyliczony ze średnich dla skrajnych przedziałów jest z kolei o 15 gram wyŝszy dla wszystkich elementów próbki niŝ dla szeregu rozdzielczego. JeŜeli chodzi o wartości odchyleń standardowych (zarówno liczonych jak dla próbki oraz jak dla populacji) jest większy o 3,6 gram w przypadku wyliczenia dla szeregu rozdzielczego w stosunku do wyliczeń bezpośrednio z danych. Występujące róŝnice biorą się stąd, Ŝe elementy wchodzące w skład poszczególnych przedziałów klasowych nie są równomiernie rozłoŝone w ramach przedziału. 2 Wyliczenie danych w tabelce arkusz Excel
7 1.6 Wnioski dla plantatora. ZałoŜenie do poniŝszych wniosków jest takie, Ŝe waga była przed dokonaniem waŝenia wytarowana, więc pomiary dotyczą wyłącznie wagi owoców. Zakładamy teŝ, Ŝe rozkład wag kobiałek jest rozkładem normalnym N(µ,σ) o wartości oczekiwanej µ=2033,1 gram i odchyleniu standardowym σ (liczonym jak dla próbki) 66,4 gram. Jeśli plantator zamierza sprzedać 1000 kg truskawek, oznacza to Ŝe musi zebrać 500 kobiałek. Pierwszy wniosek jest taki, Ŝe średnia waga 1 kobiałki wyniesie 2,0331kg, co oznacza, Ŝe plantator faktycznie zbierze 500 * 2,0331 kg = 1016,55 kg. Czyli plantator straci na transakcji 1,65%. MoŜna teŝ wyliczyć prawdopodobieństwo, Ŝe plantator nie poniesie straty. NaleŜy w tym celu wyliczyć prawdopodobieństwo, Ŝe średnia waga nie przekroczy 2000 gram. W tym celu naleŝy najpierw wystandaryzować rozkład N według wzoru : z = (x µ) / σ = - 0,498, gdzie x = 2000. P ( Z < - 0,498 ) = P( Z > 0,498 ) = 30,9%. Zatem plantator moŝe liczyć tylko na 30,9 % prawdopodobieństwo, Ŝe nie straci na sprzedaŝy, jeśli nie zmieni standardu napełniania kobiałek truskawkami. Innym wnioskiem, ilościowym, jest to, Ŝe 68,2 % kobiałek, czyli 341 kobiałek będzie zawierało się w przedziale : < 2033,1-66,4 ; 2033,1 + 66,4 > czyli od 1966,7 do 2099,4 gram. W przedziale wyznaczonym przez 2 * σ, czyli od 1900,4 do 2165,8 gram będzie znajdować się 95,4%, czyli 477 kobiałek. W przedziale wyznaczonym przez 3 * σ, czyli od 1834 do 2232,1 gram będzie znajdować się 99,7%, czyli 499 kobiałek. 2 Zadanie 2 Czas pomiędzy kolejnymi awariami serwera internetowego utrzymującego łączność firmy ze światem tworzy rozkład wykładniczy. Awarie średnio zdarzają się co 1200 godzin. Ostatnia awaria miała miejsce około miesiąca temu (720 godzin). Aktualnie rozpoczyna się wideokonferencja z uŝyciem tego serwera. Będzie ona trwała 6 dni (6x24 godziny). a) Jakie jest prawdopodobieństwo pracy serwera po momencie rozpoczęcia konferencji? b) Jakie jest prawdopodobieństwo awarii serwera w czasie trwania video konferencji? c) Jakie jest prawdopodobieństwo bezawaryjnej pracy serwera po zakończeniu wideokonferencji? d) Jaki powinien być średni odstęp czasu pomiędzy awariami, Ŝeby mieć 95% pewności, Ŝe serwer nie zepsuje się w czasie konferencji?
8 2.1 Prawdopodobieństwo pracy po rozpoczęciu konferencji Wskaźnik awaryjności serwera λ wynosi 1 na 1200 godzin, czyli λ = 1/1200 = 0,000833. Prawdopodobieństwo pracy po czasie t = 720 godzin (inaczej niezawodność po czasie 720 godzin) liczymy jako : R (720) = P (T>720) = e λ * t = e 0,000833 * 720 = e 0,6 = 54,9% 3 2.2 Prawdopodobieństwo awarii w trakcie konferencji Prawdopodobieństwo awarii w czasie od 720-ej do 864-ej godziny pracy wyznaczymy jako róŝnicę pomiędzy niezawodnością R (720) i R (864). Zatem P (awaria_konf) = R (720) R (864) = e 0,000833 * 720 - e 0,000833 * 864 = = 54,88% 48,68% = 6,2% 4 2.3 Prawdopodobieństwo pracy po zakończeniu konferencji NaleŜy wyznaczyć niezawodność po czasie zakończenia konferencji, czyli R (720 + 6*24) czyli R (864). R (864) = P (T>864) = e λ * t = e 0,000833 * 864 = e 0,72 = 48,7% 5 2.4 Wyznacz µ, aby niezawodność w trakcie konferencji była > 95% Niezawodność, czyli prawdopodobieństwo prawidłowej pracy serwera w czasie od 720 do 864 godziny to odwrotność prawdopodobieństwa awarii, które wyznaczono w punkcie powyŝej. Zatem przed optymalizacją, R (720 ; 864) = 1 6,2% = 93,8% Aby znaleźć µ, dla którego R (720;864) = 95% uŝyłem funkcji Analiza symulacji / szukaj wyniku programu Excel 2007. MoŜna było równieŝ przekształcić równanie poprzez zlogarytmowanie obu stron. Po dokonaniu symulacji µ = 1.871 Odpowiedź : Aby mieć 95% pewności, Ŝe serwer nie zepsuje się w trakcie konferencji, średni czas pomiędzy awariami powinien wynosić co najmniej 1.871 godzin 3 Wyliczenia w arkuszu Excel 4 Wyliczenia w arkuszu Excel 5 Wyliczenia w arkuszu Excel
9 3 Zadanie 3 Podaj niezawodność układów A i B. Wszystkie elementy układów działają niezaleŝnie, a ich niezawodności wynoszą odpowiednio: X = 0,86; Y = 0,93; Z = 0,92 X Z X Z Y Y X Układ A Dokonajmy najpierw wydzielenia : Podukład A1 szeregowe połączenie elementów X,Z,X,Z Podukład A2 szeregowe połączenie elementów Y,Y Podukład A3 równoległe połączenie podukładów A1 i A2 Niezawodność układu A obliczymy jako niezawodność szeregowego połączenia podukładu A3 i elementu X R(A1) = R(X)^2 * R(Z)^2 = 0,86^2 * 0,92^2 = 0,626 R(A2) = R(Y)^2 = 0,8649 R(A3) = 1 (1 - R(A1)) * (1 R(A2)) = 0,9495 R(A) = R(A3) * R(X) = 81,65% Z Y Y X X X Układ B Podukład B1 szeregowe połączenie elementów Y,Y Podukład B2 szeregowe połączenie elementów X,X,X
10 Niezawodność układu B obliczymy jako niezawodność równoległego połączenia podukładu B1, podukładu B2 i elementu Z R(B1) = R(Y)^2 = 0,8649 R(B2) = R(X)^3 = 0,63606 R(B) = 1 (1 - R(B1)) * (1 R(B2)) * (1 R(Z)) = 0,99607 4 Wykaz źródeł 1. Podręcznik WSZ POU Techniki Analityczne w Biznesie (Warszawa 2009, wyd. PRET S.A.)