Janusz Woch Instytut Transportu Politechniki Śląskiej w Katowicach Statystyka procesów transportowych Katowice maj 2000
Wstęp 2 SPIS TREŚCI 2 WSTĘP 4 1. Zakres Statystyki Procesów Transportowych 13 1.1 Założenia ogólne przedmiotu zintegrowanego 13 1.2 Potoki ruchu transportowego 15 1.3 Jak badać pojedynczy potok ruchu 17 1.4 Intuicyjne pojęcie prawdopodobieństwa 19 1.5 Model przejścia dla pieszych jednego pasa ruchu (jednokierunkowego) jako schemat Bernoulli ego 22 1.6 Wartość oczekiwana i wariancja 24 1.7 Wartość średnia i odchylenie kwadratowe 25 Problemy rozdziału 1 26 2. Inne rozkłady dyskretne 29 2.1 Rozkład dwumianowy kontynuacja 29 2.2 Rozkład Poissona 30 2.3 Wartość oczekiwana i wariancja w rozkładzie Poissona są równe λ 33 Problemy rozdziału 2 37 3. Znaczenie rozkładu Poissona i ciągłe zmienne losowe 39 3.1 Związki między rozkładem dwumianowym oraz Poissona 39 3.2 Rozkład geometryczny 42 3.3 Ciągłe zmienne losowe 43 3.4 Rozkład jednostajny 46 3.5 Rozkład jednopunktowy 48 Problemy rozdziału 3 49 4. Znaczenie rozkładu wykładniczego 51 4.1 Rozkład wykładniczy 51 4.2 Przesunięty rozkład wykładniczy 55 Problemy rozdziału 4 60 5. Kardynalna zasada badań statystycznych 61 5.1 Dwie różnice między organizacją i regulacją ruchu samochodowego w miastach a ruchu kolejowego 61 5.2 Rozkład Erlanga rzędu n 66 5.3 Rozkład gamma 67
Wstęp 3 5.4 Przykłady stawiania hipotez statystycznych na podstawie wyników obserwacji potoków ruchu samochodowego 68 Problemy rozdziału 5 71 6. Różnice między obserwacjami statystycznymi ruchu kolejowego a samochodowego 73 6.1 Obserwacje odstępów między kolejnymi wjazdami na stację rozrządową 73 6.2 Rozkład normalny 77 Problemy rozdziału 6 81 7. Modele luki krytycznej i akceptowalnej 83 7.1 Przypomnienie o różnicach w obrazie statystycznym ruchu samochodowego a kolejowego 83 7.2 Rząd rozkładu Erlanga jako wskaźnik równomierności potoku ruchu 88 7.3 Związek między rozkładem Poissona a wykładniczym oraz Erlanga 89 7.4 Rozkład luki krytycznej 90 7.5 Inne modele wyboru luki dopuszczalnej 92 Problemy rozdziału 7 94 8. Weryfikacja hipotez statystycznych dwa rodzaje testów statystycznych parametryczne i zgodności 95 8.1 Rodzaje testów oraz etapy badań statystycznych 95 8.2 Testy parametryczne 102 Problemy rozdziału 8 112 9. Testy zgodności 113 9.1 Różne sytuacje praktyczne 113 9.2 Test λ Kołmogorowa 114 9.3 Test Kołmogorowa-Smirnowa 121 Problemy rozdziału 9 127 10. Korelacja 129 10.1 Wartość oczekiwana funkcji zmiennej losowej wielowymiarowej Momenty zmiennej losowej wielowymiarowej 129 10.2 Współczynnik korelacji 132 Problemy rozdziału 10 138 11. Regresja 139 11.1 Regresja pierwszego rodzaju 139 11.2 Regresja drugiego rodzaju 144
Wstęp 4 Problemy rozdziału 11 148 12. Wartość przedsiębiorstwa i papiery wartościowe 149 12.1 Wartość przedsiębiorstwa 149 12.2 Papiery wartościowe i ich ceny 153 12.3 Ryzyko a stopa zysku 157 Problemy rozdziału 12 163 13. Jak grać na giełdzie? 165 13.1 Portfel papierów wartościowych 165 13.2 Zbiór efektywnych portfeli 172 13.3 Wycena aktywów na giełdzie 176 Problemy rozdziału 13 182 Literatura 183 Tablice statystyczne 189-200
Wstęp 5 WSTĘP Statystyka procesów transportowych jest nową pozycją literaturową w zakresie modelowania matematycznego procesów transportowych w czasach powszechności dostępu do techniki komputerowej w obliczeniach statystycznych. Możliwości dzisiejszych komputerów są podwajane co półtora roku, dając nową generację komputerową, o nowej jakości zastosowań informatyki. Można więc zaplanować proces dydaktyczny w zakresie elementarnej statystyki matematycznej, nie martwiąc się niskim poziomem wiedzy o statystyce matematycznej, zakładając wykorzystanie bogatego oprogramowania komputerów. Studenci kierunków transportowych powinni przyswoić sobie techniczne możliwości oprogramowania statystycznego bez znajomości głębokich podstaw matematycznych. Jest to niezwykle odpowiedzialne zadanie, bowiem nie powinno się dopuszczać do wykorzystywania oprogramowania statystycznego komputerów bez żadnych podstaw matematycznych, ponieważ grozi to brakiem umiejętności rozumienia istoty badań procesów transportowych, jakie odbywają się w różnych okolicznościach działalności systemów transportowych, a więc grozi opacznymi wnioskami analizy systemów transportowych. W ten sposób dochodzi się do problemu określenia minimum wiedzy inżyniera transportu o elementarnej statystyce. Zakres tej książki jest próbą nowego określenia tego minimum w czasach powszechnego dostępu do oprogramowania statystycznego komputerów. Związki statystyki z matematyką są wyjątkowe. Według powszechnego przekonania wnioskowanie matematyczne jest wnioskowaniem dedukcyjnym, a więc od ogółu do szczegółu, natomiast istotą wnioskowania statystycznego jest wnioskowanie indukcyjne, od szczegółu do ogółu. Wnioskowanie statystyczne jako takie jest bardziej naturalnym procesem myślowym niż dedukcja, co pozwala na łatwe przyswojenie procedur wnioskowania statystycznego, bez głębokich podstaw matematycznych, jak to się zwykle uważa. To jest podstawowa przesłanka tego przedmiotu, oparta również na obserwacjach powszechnej akceptacji komputerów, jako narzędzia rozrywki. Te przesłanki pozwoliły na wprowadzenie tego przedmiotu w roku 1993/94 w Instytucie Transportu Politechniki Śląskiej w Katowicach do programu kształcenia kierunku TRANSPORT wraz z odpowiednim laboratorium komputerowym.
Wstęp 6 Oprócz prawie całkowitego potwierdzenia słuszności powyższych założeń w ośmioletniej praktyce, dały się również zaobserwować pewne niewłaściwe elementy w procesie dydaktycznym. Na przykład, stwierdzono, że powszechność komputerów i kalkulatorów wśród uczniów szkół przygotowujących naszych studentów daje również ujemny efekt: braku jakichkolwiek doświadczeń obliczeniowych bez wspomagania technicznego, co powoduje całkowitą bezradność studentów w sytuacjach konieczności przeprowadzania obliczeń bez wspomagania technicznego oraz zupełny brak wyobraźni obliczeniowej, pozwalającej na krytyczną ocenę wyników obliczeń statystycznych. Dlatego podczas wszystkich wykładów podane są elementarne obliczenia statystyczne trochę to spowalnia wykład, jednak z drugiej strony, pozwala na kształcenie wyobraźni obliczeniowej studentów, co dzisiaj w dobie powszechnego dostępu do komputerów jest niezbędne. Uwaga, jaką student poświęci na zdobycie wyobraźni obliczeniowej podczas badania procesów transportowych, daje później właściwy efekt kształcenia w zakresie statystyki oraz informatyki, jak również pozwala wprowadzić elementarną wiedzę w zakresie badań przepustowości sieci transportowych. Tak dzisiaj wygląda słuszna idea przedmiotów zintegrowanych, łączących treści z wielu dziedzin, dzięki wykorzystaniu współczesnych narzędzi informatycznych. W rozdziale 1 przedstawione zostały założenia ogólne przedmiotu zintegrowanego statystyka procesów transportowych oraz podstawowe pojęcia opisujące potoki ruchu transportowego, jak również podstawowe sposoby badania pojedynczego potoku ruchu. W drugiej części przypomina się intuicyjne pojęcie prawdopodobieństwa oraz przedstawia model przejścia dla pieszych jako schemat Bernoullie go, gdzie przypomina się pojęcia histogramu i dystrybuanty rozkładu prawdopodobieństwa od strony graficznej, jako podstawowe charakterystyki probabilistyczne. Następnie zdefiniowane są pojęcia wartości oczekiwanej i wariancji oraz ich statystycznych odpowiedników: wartości średniej i odchylenia kwadratowego. W rozdziale 2 przedstawiono kontynuację rozważań dwumianowego rozkładu prawdopodobieństwa na przykładach modeli zapotrzebowania na energię. Następnie wprowadzono pojęcie rozkładu Poissona, jako granicy rozkładów dwumianowych, przy pewnych mocnych założeniach pozwalających na taką aproksymację. Przykład modelu niezawodności elementów jest ilustracją zastosowań rozkładu Poissona. Z faktu, że wartość oczekiwana i wariancja są sobie równe, można zbudować metodę statystycznego testowania hipotezy o rozkładzie Poissona. Na przykładzie badań liczby
Wstęp 7 pojazdów skręcających w prawo na skrzyżowaniu ulic ilustruje się takie badanie statystyczne. Narysowany jest histogram oraz przedstawiona tablica obliczeń statystycznych ułatwiająca obliczenia statystyczne. Podano również szereg rozdzielczy opisujący liczby zgłoszeń w poszczególnych minutach do centrali telefonicznej, ze sformułowaniem hipotezy o rozkładzie Poissona tych obserwacji. W rozdziale 3 kontynuowane są badania związków między rozkładem dwumianowym oraz Poissona. Okazuje się, że rozkład Poissona jest najbardziej losowym zjawiskiem. Natomiast, gdy stałe traktuje się jako skrajny przypadek zmiennych losowych, to rozkład ten jest modelowym wyrazem zjawiska najmniej losowego. Tak więc, wskaźnikiem tak rozumianej losowości jest wartość wariancji zmiennej losowej, co pozwala na usystematyzowanie rozkładów prawdopodobieństwa. Wprowadzono rozkład geometryczny i ujemny dwumianowy. W drugiej części wprowadzono pojęcie ciągłych zmiennych losowych na przykładzie wykresu ruchu, będącego podstawowym pojęciem teorii potoków ruchu, po zdefiniowaniu wartości oczekiwanej i wariancji ciągłych zmiennych losowych opisanych dystrybuantami oraz funkcjami gęstości rozkładu prawdopodobieństwa. Następnie wprowadzono pojęcie rozkładu jednostajnego oraz jednopunktowego, jako skrajnego przypadku rozkładu jednostajnego. Stałe odstępy między pociągami i samochodami są rozkładem jednopunktowym (o zerowej wariancji). W rozdziale 4 wprowadzone zostało pojęcie rozkładu wykładniczego, ilustrowanego modelem centrali telefonicznej, modelem niezawodności urządzeń oraz przykładem losowych czasów czekania na tramwaj. W dalszej treści wprowadzono pojęcie przesuniętego rozkładu wykładniczego, jako dobrego modelu odstępu czasu między pojazdami w potokach ruchu transportowego, z uwagi na tendencję do zachowania bezpiecznego odstępu. Na przykładzie z inżynierii ruchu kolejowego ilustrowana jest struktura odstępu czasu między pociągami na torze szlakowym. Przedstawione są wyniki wielu badań statystycznych w inżynierii ruchu kolejowego, które pozwalają na znaczne uproszczenie badań statystycznych ruchu kolejowego. W rozdziale 5 przedstawiono dwie różnice między organizacją i regulacją ruchu samochodowego a ruchu kolejowego. Ruch samochodowy jest ruchem samoorganizującym się oraz samoregulującym się, natomiast ruch kolejowy jest organizowany oraz regulowany. W ruchu kolejowym straty czasu podczas regulacji ruchu przenoszone są w inne odległe od kolizji miejsce. Wprowadzono pojęcie dobrego histogramu, bez pustych klas, jako podstawowego narzędzia badań statystycznych. Zwrócono uwagę na psychologiczne
Wstęp 8 uwarunkowania statystyka. Zdefiniowano rozkład Erlanga rzędu n, który okazuje się rozkładem sumy n niezależnych zmiennych losowych o tym samym rozkładzie wykładniczym. Traktując parametr n jako wskaźnik losowości dochodzimy do paradoksu,bowiem suma wielu (bardzo) losowych zmiennych daje rozkład jednopunktowy (a więc stałą o wariancji zero). Wprowadzono pojęcie rozkładu Γ, który jest rozszerzeniem rozkładu Erlanga. Zdefiniowano podstawowe pojęcia do badań potoku ruchu samochodowego: odstęp, luka oraz odstęp resztowy. Następnie przedstawiono przykłady badań statystycznych odstępów w potoku głównym zakończonych postawieniem hipotezy. Wprowadzono kardynalną zasadę badań statystycznych: każde badanie powinno być przeprowadzone w dwóch etapach stawianie hipotezy oraz testowanie. Każdy z tych etapów powinien być przeprowadzony na niezależnych próbkach. Przedyskutowano analizowane przykłady statystyczne z teorii potoków ruchu. W rozdziale 6 wprowadzono modelowe ujęcie procesu technologicznego stacji rozrządowej. Badania statystyczne J. Węgierskiego w latach 60. i doskonalenie modelu symulacyjnego stacji rozrządowych J. Wocha w latach 70. i 80, pozwoliły sformułować ogólne wnioski o modelach statystycznych ruchu kolejowego, które podano w rozdziale 6. Zdefiniowano rozkład normalny oraz zilustrowano tak zwane prawo 3 σ. Przedstawiono przykłady badań statystycznych procesu technologicznego stacji rozrządowej: czasu przygotowania składu do rozrządzania oraz czasu rozrządzania stawiając hipotezy o rozkładzie normalnym badanych operacji ruchowych. Przykłady pozwalają na komentarze i dyskusję uzyskanych hipotez statystycznych. W rozdziale 7 stwierdzono, że największe różnice w obrazie statystycznym ruchu samochodowego i kolejowego powstają w miejscach tworzenia się kolejek, gdzie są zsumowane wpływy dużej liczby opóźnień. Dla rzadkiego potoku ruchu dobrym modelem jest przesunięty rozkład wykładniczy. Natomiast dla gęstego potoku ruchu dobrym modelem statystycznym jest przesunięty rozkład Erlanga. Dla potoku pieszych wchodzących do sklepu jest przesunięty rozkład wykładniczy. W dalszym ciągu przedstawiono związki drogowoczasowe na drodze ekspresowej podczas manewru włączania się do ruchu. Zdefiniowano podstawowe pojęcia teorii potoków ruchu oraz statystykę akceptowalnych i odrzuconych luk na odcinku przyśpieszeń. Zdefiniowano pojęcie luki krytycznej, a następnie obliczono luki krytyczne dla pojazdów zatrzymanych, w ruchu oraz dla wszystkich pojazdów. Zdefiniowano różne wskaźniki równomierności potoku ruchu: rząd rozkładu Erlanga odstępu oraz iloraz minimalnego odstępu do średniego odstępu. W dalszym ciągu przedstawiono graficzną
Wstęp 9 ilustrację związków między rozkładami Poissona a wykładniczym i Erlanga na przykładzie procesu Poissona. W potokach ruchu transportowego występuje tendencja do utrzymywania bezpiecznych odstępów, co przy dużym ruchu jest tendencją do wyrównywania odstępów, a z drugiej strony wyjaśnia, dlaczego potoki ruchu nie są strumieniami Poissona. W dalszym ciągu zdefiniowane zostały cztery modele probabilistyczne luki krytycznej, a następnie zdefiniowano cztery modele luki dopuszczalnej, które pozwalają na wyjaśnienie różnych idei modelowania skrzyżowań uprzywilejowanych. Rozdział 8 zawiera wprowadzenie narzędzi statystycznych: testów parametrycznych i zgodności. Na wstępie przypomina się Czytelnikowi o niebezpieczeństwach manipulacji statystycznych, które także zdarzają się w nauce. Z tych względów statystyka ma również złą sławę i zawsze z dużą ostrożnością powinno się podchodzić do niejasnych źródeł badań statystycznych. Zdefiniowano pojęcie hipotezy parametrycznej oraz hipotezy rozkładowej, wprowadzono pojęcie hipotezy zerowej oraz alternatywnej. Przedstawiono przykład testowania nowego materiału w produkcji, przy założeniu rozkładu normalnego mierzonych różnic obserwacji o znanej wariancji. Zdefiniowano zbiór krytyczny testu oraz poziom istotności testu. W dalszym ciągu przedstawione są testy parametryczne. Przedstawiono weryfikację hipotezy o wartości oczekiwanej przy znanej wariancji oraz nieznanej wariancji. Następnie zweryfikowano hipotezę o wariancji w rozkładzie normalnym oraz hipotezy o równości wartości oczekiwanych o rozkładach normalnych z jednakową nieznaną wariancją, jak również zweryfikowano hipotezę o wartości oczekiwanej na podstawie próbek o dużej liczebności. W rozdziale 9 jeszcze raz apeluje się o przeźroczystość testów statystycznych, pozwalającą na łatwą kontrolę obliczeń statystycznych. Następnie wprowadzono trzy testy zgodności: test 2 χ Pearsona, test λ Kołmogorowa oraz test Kołmogorowa-Smirnowa do porównywania dwóch próbek tej samej populacji. Omówiono przykład badania trwałości opon z dwóch fabryk. W rozdziale 10 poświęconym korelacji wprowadzono pojęcia wartości oczekiwanej funkcji zmiennej losowej wielowymiarowej oraz momenty zmiennej losowej wielowymiarowej, jak również pojęcie kowariancji dwóch zmiennych. Wprowadzono następnie pojęcie współczynnika korelacji, służącego zaprzeczaniu tezie o niezależności dwóch zmiennych losowych oraz stwierdzaniu zależności liniowej dwóch zmiennych
Wstęp 10 losowych. Przedstawiono dwa przykłady obliczeń współczynnika korelacji dwóch zmiennych losowych o znanym rozkładzie dwuwymiarowym. W rozdziale 11 poświęconym regresji zdefiniowano regresję pierwszego rodzaju oraz przeprowadzono dyskusję rożnych sposobów funkcyjnego opisu zależności dwóch zmiennych, na podstawie dwuwymiarowych obserwacji statystycznych. Następnie wprowadzono pojęcie regresji drugiego rodzaju, jako prostej najlepiej przybliżającej dwuwymiarowe obserwacje statystyczne. Przedstawiono przykład obliczeń linii regresji pierwszego oraz drugiego rodzaju dla zadanej dwuwymiarowej zmiennej losowej o danym dwuwymiarowym rozkładzie prawdopodobieństwa. W rozdziale 12 wprowadzono pojęcia wartości przedsiębiorstwa oraz papierów wartościowych. Z oceną wartości przedsiębiorstwa wiąże się wiele emocji oraz nieporozumień w naszym już ponad dziesięcioletnim okresie przekształcania gospodarki. Wprowadzono trzy różne pojęcia wartości przedsiębiorstwa: księgowej, odtworzeniowej oraz likwidacyjnej. Zrozumienie znaczenia papierów wartościowych pozwala nam zrozumieć działająca od 1991 roku giełda warszawska. Obliczenie wartości rynkowej obligacji nie jest zbyt złożonym zagadnieniem matematycznym, jednak dopiero uczymy się takich analiz w teorii, jak i w praktyce. W dalszym ciągu przedstawia się analizę ryzyka i stopy zysku dla prezentacji tych pojęć na historycznych przykładach z różnych giełd światowych. W rozdziale 13 przedstawione zostały statystyczne narzędzia służące grze na giełdzie. Miarą ryzyka, jaką ekonomiści używają, jest wariancja lub jej pierwiastek kwadratowy dyspersja, której statystycznym odpowiednikiem jest odchylenie standardowe. Im wyższe ryzyko tkwiące w walorze, tym większym oczekiwanym zyskiem powinno być wynagrodzone w przyszłości. Gdy stosujemy łączenie walorów skorelowanych ujemnie, można zmniejszyć oczekiwane ryzyko. Jest to podstawowy wniosek z analizy statystycznej, który dotychczas był intuicyjnie stosowany przez rolników łączących ujemnie skorelowane uprawy. Oczywiście rolnicy nie mieli takich różnorodnych możliwości, jak gracze giełdowi. Następnie zdefiniowano zbiór efektywnych portfeli oraz przeanalizowano wycenę na giełdzie warszawskiej w roku 1992, co jest wyjątkową wartością historyczną i humorystyczną. Zdefiniowano współczynniki β charakteryzujące ryzyko papieru w danym portfelu rynkowym. Autor ma nadzieję, że niniejsza publikacja znajdzie czytelników wśród studentów politechnik, w szczególności kierunków transportowych. Uwagi Czytelników są niezwykle
Wstęp 11 cenne dla doskonalenia następnych publikacji, dlatego autor będzie niezmiernie wdzięczny za uwagi przesłane pod adresem e-mail: janusz.woch@polsl.pl. http://www.systemytransportowe.pl http://www.polsl.pl