METODY APROKSYMACJI MATEUSZ WAGA Gimazjum im. Jaa Matejki w Zabierzowie
SPIS TREŚCI 1 WSTĘP... 2 2 MODEL MATEMATYCZNY... 3 3 UOGÓLNIENIE MODELU MATEMATYCZNEG... 6 4 MODEL INFORMATYCZNY... 7 5 PRZYKŁADY ZASTOSOWAŃ... 8 5.1 Progozowaie ilości telefoów komórkowych... 8 5.2 Progozowaie ilość ludzi a świecie... 9 6 ZAKOŃCZENIE... 10 7 BIGLIOGRAFIA... 11 str. 1
1 WSTĘP W aukach statystyczych a podstawie pomiarów otrzymujemy pary liczb, które jak przypuszczamy, są ze sobą powiązae jakąś zależością fukcyją lub korelacją, p. średia oce w klasie w zależości od długości auczaia, wielkości produkcji w zależości od miesięcy itp. Sesowym posuięciem jest zalezieie takiej krzywej, która w możliwie ajlepszy sposób przybliża puktu uzyskae w wyiku pomiarów. Zajdowaie takich krzywych jest celem teorii aproksymacji. Bazując a wyzaczoej krzywej, która określa tred rozwojowy daego zjawiska możemy progozować przyszłe wartości (p. wielkość produkcji czy średią oce w klasie). Podobe problemy spotykamy w wielu iych dziedziach auki. Ekoometria, która zajmuje się mierzeiem i przewidywaiem zjawisk zachodzących w gospodarce, w dużej mierze korzysta z teorii aproksymacji. W politologii wyzaczeie tredów poparcia dla poszczególych partii polityczych ma kluczowe zaczeie przy ustalaiu strategii wyborczych. Także w aukach przyrodiczych wykoujemy często eksperymety polegające a pomiarach par wielkości, które, jak przypuszczamy, są ze sobą powiązae jakąś zależością fukcyją, p. wydłużeie sprężyy w zależości od wiszącego a iej ciężaru. Metody aproksymacyje sprawdzają się także w aalizowaiu procesów demograficzych, w których progozujemy ilość mieszkańców w daych krajach. Przedmiotem bieżącego opracowaia będzie metoda ajmiejszych kwadratów, która staowi szczególy przypadek teorii aproksymacji. Wyiki uzyskae z daych statystyczych będziemy aproksymować liią prostą. Jest to ajprostsza metoda, która dobrze się sprawdza kiedy a podstawie daych moża wyzaczyć liie tredu. W przypadku kiedy dae ie układają się wzdłuż liii prostej ależy zastosować ie bardziej skomplikowae metody p. aproksymacje wielomiaową. str. 2
Produkcja Mateusz Waga 2 MODEL MATEMATYCZNY Załóżmy, że mamy trzy pary daych pochodzących z pomiarów statystyczych przedstawioych poiżej w tabeli r 1 (p. pomiary mogą reprezetować wielkość produkcji w kolejych miesiącach). Chcielibyśmy ustalić progozowaą wartość produkcji w czwartym miesiącu: Tabela r 1 Numer miesiąca Wielkość produkcji 1 10 2 15 3 30 Wykres r 1 Jeśli wykreślimy te pukty, otrzymamy Rysuek 1. 35 30 25 20 15 10 5 0 Wielkość produkcji w zależości od kolejych miesięcy [WARTOŚĆ Y] [WARTOŚĆ Y] [WARTOŚĆ Y] 0 0,5 1 1,5 2 2,5 3 3,5 Miesiące Widać, że chociaż pukty są ieco porozrzucae a skutek, różych czyików które miały wpływ a wielkość produkcji w kolejych miesiącach, to jedak moża wyróżić tred wzrostowy. Rówaie prostej, która będzie wyzaczać tred ma astępującą postać:, gdzie to współczyiki, których chwilowo ie zamy, wielkość produkcji, umer miesiąca. Poszukiwaie parametrów takiej prostej, która by przechodziła możliwie ajbliżej wszystkich puktów (, ) (gdzie i ozacza umer kolejych pomiarów) polega a miimalizacji kwadratu sumy: Wzór r 1 S a b y i f x i 2 i=1 str. 3
gdzie dae statystycze, w aszym przypadku rzeczywista wielkości produkcji, wartości fukcji szukaej, w aszym przypadku progozowaa wartość produkcji, koleje umery daych statystyczych, - dae statystycze, w aszym przypadku umery miesięcy, ilość pomiarów statystyczych, w aszym przypadku ilość miesięcy. poieważ, wzór r 1 przyjmuje astępującą postać: Wzór r 2 2 =1 Różice między dokładymi wartościami oraz wartościami obliczoymi z rówaia prostej są podoszoe do kwadratu, aby uikąć sytuacji, że będą się awzajem zosiły a skutek różicy zaków. Z tego też względu przedstawioa metoda postępowaia osi azwę metody ajmiejszych kwadratów. Dla aszego przypadku wzór r. 2 przyjmuje postać ( 3. 3 2 =1 Dla daych z tabeli 1 wielkość fukcji będzie rówa: S a b [10 1 a b ] 2 [15 2a b ] 2 [30 3a b ] 2 Formalie rzecz biorąc jest to fukcja dwóch zmieych. Iteresują as takie wartości tych zmieych, dla których jest miimala. Wiadomo, że fukcja wielu zmieych ma miimum w pukcie, dla którego pochode cząstkowe tej fukcji po wszystkich zmieych są rówe zeru. Zatem w tym przypadku muszą być spełioe astępujące waruki: Wzór r 3 S a b a S a b b 0 0 Czyli w aszym przypadku wzór r 3 przyjmuje postać: str. 4
Produkcja Mateusz Waga S a b a S a b b 2 [10 1 a b ] 1 2 [15 2a b ] 2 2 [30 3a b ] 3 2 [10 1 a b ] 1 2 [15 2a b ] 1 2 [30 3a b ] 1 Po uproszczeiach dostajemy astępujący układ rówań: 28a 12b 260 12a 6b 110 Którego rozwiązaiem jest a 10 b Zatem otrzymujemy wzór aszej fukcji: f xi 10x i 5/3 5 3 ; Na wykresie r 2, zostały pokazay wykres fukcji statystyczych. i pukty otrzymae z pomiarów Wykres r 2 Aproksymacja 45 40 35 30 25 20 15 10 5 0-5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 Miesiące W powyższej aalizy wyika, że progozoway wzrost produkcji w czwartym miesiącu będzie wyosił około 38 produktów. str. 5
3 UOGÓLNIENIE MODELU MATEMATYCZNEG Nauczyliśmy się już a podstawie prostej aproksymacji (opartej a trzech puktach ) wyzaczać fukcję tredu a podstawie której obliczyliśmy progozowaą wartość produkcji w czwartym miesiącu. Powyższe zagadieie możemy uogólić dla większej liczby pomiarów. Moża założyć, że dae statystycze lub dae pomiarowe, które są przedmiotem aproksymacji są z reguły obarczoe błędami losowymi (p. załamaie pogody mogło mieć decydujący wpływ a obiżeie produkcji w miesiącu r 2). Przy pomocy metody ajmiejszych kwadratów szeregi statystycze oczyszcza się z błędów losowych. Mając szereg puktów empiryczych 1 1 2 2 ależy a priori ustalić postać fukcji, a astępie a podstawie puktów empiryczych tak dobrać wartości parametrów, aby fukcja możliwie ajlepiej "pasowała" do zaobserwowaych puktów. Rozważaia oparte a rachuku prawdopodobieństwa pozwalają uzać za ajlepsze takie wartości parametrów, dla których suma kwadratów odchyleń zaobserwowaych wartości od wartości teoretyczych jest możliwie ajmiejsza, tz.: i=1 [y i f x i a b ] 2 miimum Podstawowym warukiem przyjęcia przez powyższe wyrażeie wartości miimum jest to, aby pierwsze pochode (pochoda) względem, były rówe zeru. Korzystając z tych waruków wyzacza się wartości zależie od puktów zaobserwowaych. W szczególym przypadku fukcji liiowej, tz. gdy, otrzymuje się: Wzory 4 a i=1 i=1 i=1 x i i=1 x 2 i=1 i x i y i y i 2 x i b 2 i=1 x i i=1 y i x i 2 i=1 x i x 2 i=1 i i=1 i=1 x i y i liczba pomiarów str. 6
4 MODEL INFORMATYCZNY Uogólioy model matematyczy moża w bardzo prosty sposób przełożyć a język iformatyczy. Poiższy kod programu apisaego w języku C++ służy do obliczeia parametrów fukcji liiowej oraz obliczeia progozy dla dowolej wartości. Program z klawiatury wczytuje ilość pomiarów oraz pary daych będących przedmiotem aproksymacji. #iclude <iostream> #iclude <math.h> usig amespace std; float suma1(float *x,float *y,float ) float suma=0; for(it i=1;i<=;i++) suma+=*x**y; x++; y++; retur suma; float suma2(float *y,float ) float suma=0; for(it i=1;i<=;i++) suma+=*y; y++; retur suma; float suma3(float *x,float ) float suma=0; for(it i=1;i<=;i++) suma+=*x; x++; retur suma; float suma4(float *x,float ) float suma=0; for(it i=1;i<=;i++) suma+=pow(*x,2); x++; retur suma; it mai() it c; cout<<"podaj ilosc daych"<<edl; ci>>c; float x[c],y[c],a,b,d,p; float s1,s2,s3,s4; for(it i=0;i<c;i++) cout<<"podaj "<<i+1<<" x:"; ci>>x[i]; cout<<"podaj "<<i+1<<" y:"; ci>>y[i]; d=c; float *wsk_x=&x[0]; float *wsk_y=&y[0]; s1=suma1(wsk_x,wsk_y,d); s2=suma2(wsk_y,d); s3=suma3(wsk_x,d); s4=suma4(wsk_x,d); a=(c*s1-s2*s3)/(c*s4-pow(s3,2)); b=(s4*s2-s3*s1)/(c*s4-pow(s3,2)); cout<<"a jest rowe:"<<a<<edl; cout<<"b jest rowe:"<<b<<edl; cout<<"podaj wartosc x dla jakiej ma byc oblicza proboza:"<<edl; ci>>p; cout<<"proboza jest rowa:"<<a*p+b<<edl; retur 0; Poiższe wzory zostały zapisae w kodzie programu Wzory matematycze: a b i=1 i=1 i=1 x i i=1 x 2 i=1 i x i y i y i 2 x i 2 i=1 x i i=1 y i x i 2 i=1 x i x 2 i=1 i Wzory z programu: i=1 i=1 x i y i a=(c*s1-s2*s3)/(c*s4-pow(s3,2)) b=(s4*s2-s3*s1)/(c*s4-pow(s3,2)) gdzie: c liczba pomiarów s1 s2 s3 s4 koleje sumy pow s3 2 potęga kwadratowa z sumy s3 str. 7
aktywe karty sim Mateusz Waga 5 PRZYKŁADY ZASTOSOWAŃ 5.1 Progozowaie ilości telefoów komórkowych Z Iteretu odczytałem ilość aktywych kart SIM w astępujących latach: liczba pomiarów data Ilość telefoów [ tys.] 1 Grudzień -2015 56 253,00 2 Grudzień -2014 57 595,00 3 Grudzień - 2013 55 979,00 4 Grudzień - 2012 54 267,00 5 Grudzień - 2011 50 695,00 Bazując a metodzie ajmiejszych kwadratów, wyzaczyłem parametry fukcji liiowej zależość pomiędzy ilością aktywych kart SIM a kolejymi latami., która podaje Korzystając ze wzoru r 4 obliczamy parametry fukcji liiowej dla 5. 1 444 4; 2 832 619 (obliczeia wykoałem z wykorzystaiem programu Excel oraz programu apisaego w języku C++ przedstawioym w rozdziale 4) 1 444 4 2 832 619 koleje pomiary. Progoza ilości kart SIM 2016 60000 59000 58000 57000 56000 55000 54000 53000 52000 51000 50000 2010 2011 2012 2013 2014 2015 2016 2017 lata Bazując a fukcji tredu moża stwierdzić, że w grudiu 2016 prawdopodoba ilość aktywych kart SIM będzie wyosił 59 291 (w tys.). W tym kokretym przypadku a podstawie metody ajmiejszych kwadratów moża obliczyć wiarygode wartości progoz. str. 8
ilośd ludzi w ml Mateusz Waga 5.2 Progozowaie ilość ludzi a świecie Z Iteretu odczytałem zmiaę ilości ludzi zamieszkujących powierzchie ziemi a przestrzei wieków. liczba pomiarów lata Ilość ludzi w [ml] 1 1500 450 2 1700 600 3 1800 978 4 1900 1650 5 2000 6118 6 2012 7022 Na podstawie obliczeń (własym programem, oraz w programie Excel) obliczyłem parametry fukcji liiowej (która aproksymuje wielkość ludzi a świecie) oraz obliczyłem progozę ludości w roku 2050. Otrzymałem astępujące wyiki 12 27 19 514 50 Progoza ilości ludzi a świecie w 2050 obliczoa a podstawie powyższego modelu wyosi 5 639,92 ( w milioach). Wyiki zaprezetowao a poiższym wykresie. 8000 7000 6000 5000 4000 3000 2000 1000 0-1000 Progozowaa liczba ludości -2000 1400 1500 1600 1700 1800 1900 2000 2100 lata Na podstawie aalizy wykresu moża uzać, że otrzymae wyiki progozy opartej a metodzie ajmiejszych kwadratów są błęde. W roku 2050 liczba ludości przekroczy 7 mld (aktualą liczbę ludości). Przed rokiem 1500 liczba ludości była większa od zera. Ze względu a charakter daych metoda ajmiejszych kwadratów się ie sprawdza (brak zależości liiowej) i trzeba zastosować ia metodę aproksymacji co będzie przedmiotem dalszych aaliz. str. 9
6 ZAKOŃCZENIE Bardzo lubię poszerzać swoją wiedzę z matematyki. Szczególie iteresują mie zagadieia które moża zastosować w praktyce i które adają się do przełożeia a język programowaia. Aby zrealizować iemiejszy projekt musiałem zapozać się z pojęciem fukcji liiowej, pochodych cząstkowych liczoych względem dwóch zmieych oraz pozać jedą z metod aproksymacji (metodę ajmiejszych kwadratów). Szczególą satysfakcje sprawił mi fakt że mój program (apisay w języku C++) poprawie liczy parametry fukcji liiowej i wyiki są porówywale z programem Excel. Największy problem sprawiło mi zrozumieie iterpretacji pochodych (czyli wyzaczaie mi lub max fukcji). Po raz pierwszy apisałem pracę pisemą, która odosiła się do problemów matematyczych. Mam pełą świadomość że aproksymacja w oparciu o metodę ajmiejszych kwadratów ie sprawdza się w odiesieiu do wszystkich zagadień/daych i w przyszłości będę jeszcze pracował ad iymi metodami aproksymacji (p. metodą wielomiaową, wykładiczą). str. 10
7 BIGLIOGRAFIA http://gsmolie.pl/artykuly/peetracja-telefoii-komorkowej-w-polsce-i-kw-2016 dae o ilości telefoów komórkowych. https://pl.wikipedia.org/wiki/ludo%c5%9b%c4%87_%c5%9bwiata dae ilość ludzi a świecie str. 11
Page i