Wykład z okazji dnia liczby π O regresji symbolicznej Andrzej Odrzywołek Zakład Teorii Względności i Astrofizyki, Instytut Fizyki UJ 3.14
Czy potrafisz rozpoznać liczby? 3.141592653589793 2.718281828459045 1.414213562373095 1.442695040888963 1.444667861009766 3.645751311064591
Zadanie wydaje się łatwe... π 3.141592653589793 e 2.718281828459045 2 1.4142135623730951 1 ln 2 1.4426950408889634 e 1/e 1.444667861009766? 3.645751311064591
Historia liczby 3.645751311064591 Rozwiąż równanie: 4 2 3 2 14 42 = 0.
Historia liczby 3.645751311064591 Rozwiąż równanie: 4 2 3 2 14 42 = 0.
Historia liczby 3.645751311064591 Rozwiąż równanie: 4 2 3 2 14 42 = 0.
Historia liczby 3.645751311064591 Rozwiąż równanie: 4 2 3 2 14 42 = 0.
Historia liczby 3.645751311064591 Rozwiąż równanie: 4 2 3 2 14 42 = 0. 1 Przy użyciu kalkulatora można było w kilka minut ustalić, że rozwiązaniem równania jest: 3.645751311064591. 2 domyślając się, że powyższe równanie 4 stopnia zawiera ukryte r. kwadratowe spodziewany się wyniku postaci: = a b 3 wstawiamy po kolei: a = 1, b = 1, a = 1, b = 2,... b=1 b=2 b=3 b=4 b=5 b=6 b=7 b=8 a=1 2.0 2.41421 2.73205 3.00000 3.23607 3.44949 3.64575 3.82843 a=2 3.0 3.41421 3.73205 4.00000 4.23607 4.44949 4.64575 4.82843 a=3 4.0 4.41421 4.73205 5.00000 5.23607 5.44949 5.64575 5.82843 a=4 5.0 5.41421 5.73205 6.00000 6.23607 6.44949 6.64575 6.82843 a=5 6.0 6.41421 6.73205 7.00000 7.23607 7.44949 7.64575 7.82843 a=6 7.0 7.41421 7.73205 8.00000 8.23607 8.44949 8.64575 8.82843 a=7 8.0 8.41421 8.73205 9.00000 9.23607 9.44949 9.64575 9.82843 a=8 9.0 9.41421 9.73205 10.0000 10.2361 10.4495 10.6458 10.8284
Historia liczby 3.645751311064591 Rozwiąż równanie: 4 2 3 2 14 42 = 0. 4 3.645751311064591 = 1 7 5 z własności r. kwadratowych = 1 ± 7 6 ( 1 7)( 1 7) = 2 2 6 7 dzielimy wielomiany: 4 2 3 2 14 42 2 2 6 8 końcowy wynik 1 = 1 7, 2 = 1 7: = 2 7 4 2 3 2 14 42 = ( 2 2 6)( 2 7) = ( 1 7)( 1 7)( 2 7)
Przykłady szukania rozwiązań metodą systematycznego przeszukiwania Plan wykładu 1 liczby naturalne (trywialny przykład) 2 liczby wymierne (rozwiązany nietrywialny przykład) 3 przybliżanie i rozpoznawanie rozpoznawanie stałych przestępnych (działający trudny przykład)
Liczby naturalne/całkowite Zadanie (trywialne) Dla jakiego naturalnego n otrzymamy najlepsze przybliżenie liczby:? π 3.1415926535897932384626433832795... Oczywista metoda to wstawianie po kolei: 0,1,2,3,4,... UWAGA! Gdyby chodziło o rozwiązania całkowite, wstawiamy po kolei: 0, 1, 1, 2, 2, 3, 3... Idiotyczny błąd, formalnie możliwy do popełnienie, to wstawianie najpierw liczb dodatnich, potem ujemnych, lub wstawianie w kolejności, która pomija pewne liczby, np: ( 1) k 1 ( 1) k (2k 1) k zamiast. 4 O ile dla liczb całkowitych tego typu pomyłka byłaby absurdalna, w przypadku np: funkcji elementarnych podobny błąd łatwo popełnić i przeoczyć.
Liczby wymierne Zadanie Dla jakiego wymiernego r otrzymamy najlepsze przybliżenie liczby π:? r = n m π Cantor podał metodę wyliczania liczb wymiernych n o rosnących n, m. Liczby m powtarzają się (np: 2 4 = 1 ), ale redundancja jest niewielka, asymptotycznie dąży do 2 złotego podziału. Jak generować liczby wymierne bez powtórzeń? Już od połowy XIX w. znane są lepsze sposoby wyliczania liczb wymiernych: 1 drzewo Sterna-Brocota (przeszukiwanie binarne przedziału [0, ] ) 2 ciąg Fareya 3 ułamki łańcuchowe 4 składanie funkcji Najciekawsze okazuje się podejście funkcyjne.
Funkcyjne generowanie liczb wymiernych Jak wypisać wszystkie liczby wymierne po kolei bez powtórzeń? Istnieje funkcja, której składanie generuje po kolei wszystkie liczby wymierne bez powtórzeń. Jest ona złożeniem dwóch funkcji odwrotnych do samych siebie: inv(r) = 1 r, lad(r) = F loor[] 1 F ractionalp art[]
Wykres funkcji lad(r) lad() = F loor[] 1 F ractionalp art[] 8 6 4 2 0 2 4 6 8
Generowanie ułamków poprzez składanie funkcji Okazuje się, że składając wielokrotnie funkcję: 1 f() = F loor[] 1 F ractionalp art[] otrzymujemy wszystkie liczby wymierne (w tym naturalne), w określonej kolejności, bez powtórzeń! 0, 1, 1 2, 2, 1 3, 3 2, 2 3, 3, 1 4, 4 3, 3 5, 5 2, 2 5, 5 3, 3 4, 4, 1 5, 5 4, 4 7, 7 3, 3 8, 8 5, 5 7, 7 2, 2 7, 7 5, 5 8, 8 3, 3 7, 7 4, 4 5, 5,... Można w ten sposób wygenerować wszystkie możliwe przybliżenia wymierne π: Wartość Złożoność Przybliżenie Błąd bezwzględny numeryczna Kołmogorowa 3/1 3.0 7-0.1415926535 13/4 3.25 71 0.1084073464 16/5 3.2 135 0.0584073464 19/6 3.1666(6) 263 0.025074 22/7 3.142857142857143 519 0.00126449 179/57 3.14035087719 261 127-0.0012417763 201/64 3.140625 523 271-0.0009676535 223/71 3.1408450704225355 1 047 559-0.0007475831 245/78 3.141025641025641 2 096 135-0.0005670125 267/85 3.1411764705882352 4 193 287-0.0004161830 289/92 3.141304347826087 8 387 591-0.0002883057 311/99 3.1414(14) 16 776 199-0.0001785121 333/106 3.141509433962264 33 553 415-0.0000832196 355/113 3.141592920353982 67 107 847 0.0000002667...
Własności kolejnych przybliżeń wymiernych π Przybliżenie zerowe : Przybliżenie pierwsze : 13 4 Przybliżenie drugie: 179 57 π 3 1 plus 3 najlepsze przybliżenie zerowe: π 22 7 = 13 3 3 3 4 1 1 1 plus 8 najlepsze przybliżenie poprzednie: π 335 179 22 22 22 22 22 22 22 22 = 113 57 7 7 7 7 7 7 7 7.
Jak wyjść poza przybliżenia ułamkowe? Jak szukać kolejnych przybliżeń zawierających np:? π 2 3, π 2 1 1 1, π 1 4 2 1 1 2 Lub logarytm naturalny ln? π 1 1 ln 2 ln 2, π ( 1 ) 11 log 8 A może liczbę e... π 2e 3
Sposób generacji dowolnych wyrażeń matematycznych
Elementarna algebra wg. Tarskiego Oryginalnie, minimalny (startowy) zbiór symboli Tarskiego to: Zero i 1 są redundantne: 1, 0, 1, y, y,, y, z,... 1 = ( 1) ( 1), 0 = 1 1 Wygenerowanie wszystkich możliwych wyrażeń elementarnej algebry, polega na rekurencyjnym stosowaniu symboli i operacji bazowych. Tradycyjne symbole matematyczne traktujemy jako skróty myślowe np: 5 = 1 1 1 1 1, 2 1 = ( 1) ( 1),.... -1-1 -1-1 -1-1 = 2, ( 1) = 1, ( 1)( 1) = 2, = 2, ( 1) =, ( 1) ( 1) = 1 Lista pierwszych wyrażeń:, 1, 2, 1, 2, 2,, 1, 3, 2 1, 4, 2 1, 2, 3 1, 2( 1), 2, 3, 2( 1), 3,
Elementarna algebra wg. Tarskiego -1-1 -1-1 -1-1 -1-1 -1-1 -1-1 -1-1 -1-1 -1-1
Zagadnienie zepsutego kalkulatora Broken calculator problem Czy jeżeli w kalkulatorze zostały nam tylko klawisze, EXP, LN możemy nadal mnożyć i potęgować? Praktyka pokazuje, że klawiszy nie można wyrywać w zupełnie dowolny sposób. Jest to główne źródło niepowodzeń i kiepskiej/losowej skuteczności istniejących metod regresji symbolicznej. Przykłady zadań: czy dysponując klawiszami, ep, log,, 1 możemy obliczyć π? czy dysponując symbolami,,, ln, e możemy uzyskać 1? Konieczne jest wydzielenie spośród zbioru wszystkich symboli tych, których nie wolno usunąć, pod groźbą ostatecnego zepsucia naszego kalkulatora.
Przykłady minimalnego zbioru funkcji/operatorów Zbiór minimalny botton-up 1 dodawanie, y 2 f. wykładnicza ep, e 3 logarytm naturalny ln, ln 4 odwrotność (brak symbolu) 1 Zbiór minimalny up-bottom 1 potęgowanie, y 2 logarytm dwuargumentowy (o dowolnej podstawie) log y 3 liczba E (podstawa logarytmu naturalnego) lub π Dla porównania: Mathematica 1 potęgowanie Power, mnożenie Times, dodawanie Plus (wieloargumentowe!) 2 logarytm naturalny Log 3 liczba -1 oraz spory zestaw redundantnych stałych przestępnych (E, Pi,... ) 4 liczby całkowite Integer, wymierne Rational, zespolone Comple, algebraiczne Root 5 skróty typu Sin, ArcTan, LegendereP... rozwijane przez FunctionEpand, TrigToEp,... Powyższe pozwala generować liczby. Aby generować funkcje, trzeba dodać zmienne i parametry, y, z,... a, b, c.... Ewentualnie dodać stałe, np: π, 2, 2, ln 2,....
Minimalne zbiory funkcji i operatorów podstawowych Mathematica y -1 log (y) e y y ln e 1 up-bottom bottom-up
Pierwsze przybliżenia π w bazie, ln, ep, 1/, 1 Minimalny (zepsuty) kalkulator I Jedyne klawisze jakimi dysponujemy to: LN EXP INV (czyli 1/) 1 Pierwsze przybliżenia π 1 0 1 1 1. e 5 2 1,EXP 2.71828 3 2600 5 1,1,,1, 3. 1 e 13180 6 1,EXP,INV,1,EXP, 3.08616 e 1 e e e 2 20225 7 1,1,,EXP,INV,EXP,EXP 3.14219 Reprezentacja operacji arytmetycznych ( y = e ln ln y, y ln yln ln = ep e )
Pierwsze przybliżenia w bazie y, log y, e Minimalny (zepsuty) kalkulator II Jedyne klawisze jakimi dysponujemy to: E (liczba e, podstawa logarytmu naturalnego) LOG (dwurgumentowy logarytm, czyli o dowolnej podstawie) POW (potęgowanie) Pierwsze przybliżenia π e 0 1 E 2.71828 3 67716 11 E,E,E,E,POW,POW,POW,E,LOG,E,LOG 3.0 1 e e e 2 132597 11 E,E,E,E,POW,POW,LOG,E,POW,E,POW 3.14219 e 2 log(e e ln 2) 3.14191 ln (e e ln (e ln 2e)) 3.14132 e e ln ( e e 1 ln(ln(e 1)) ) 3.14159197551
Reprezentacja operacji arytmetycznych y = log (( ) y ), y = Liczba π wyliczona dokładnie z liczby e π = log[ ( ) ] [ log[ln (e log (loge e e) e e e ) e ] [e] log e] (loge e e)
π = log e i ( 1), i = 1 π = log e i ( 1) = ln 1 ln e i = iπ i ln e = π
Hierarchia operatorów: top-bottom czy bottom-up? Pokazano, że zbiór symboli startowych i operacji jest w zasadzie dowolny, jeżeli zawiera zbiór minimalny. 1 bramka logiczna NAND 2 zeracja (sukcesor) 1 1 1 1 1... 1 1 = n 3 dodawanie/odejmowanie... = n 4 mnożenie/dzielenie... = n 5 potęgowanie/logarytm = n 6 tetracja/superlogarytm/superpierwiastek Dla teoretyka informatyki cyfrowej operacje logiczne i dodawanie są pierwotne, dla fizyka czy cybernetyka: potęgowanie i logarytmy. Operatory wyższe niż potęgowanie są nadal słabo zbadane Nie ma zgody co do kontynuacji analitycznej na płaszczyźnie liczb zespolonych Nie wiadomo np: czy 4 π jest liczbą naturalną! Potencjał generowania π, e,... lub/i funkcji specjalnych, liczb algebraicznych itp?
Rozpoznawanie stałych: praktyka Najpopularniejszym aktualnie zastosowaniem regresji symbolicznej jest dopasowanie wzoru analitycznego do zadanej liczby zmiennoprzecinkowej. 1 Maple ( identify ) 2 Mathematica (FindFormula, FindSequenceFunction, RootApproimant), WolframAlpha 3 Inverse Symbolic Calculator (https://isc.carma.newcastle.edu.au/), PSLQ 4 RIES (http://mrob.com/pub/ries/ ) 5 nsimplify (SymPy) 6 A.O. https://github.com/va00/symbolicregressionpackage
Test 3.6457513110645905905016157536393 WolframAlpha Maple/identify ISC RIES Google Symbolic Regression 16645819107519422 1 7 6 2 4565813103324017 2 log 2 ( 1) = log 4 7 TAK? 2 1 3 1 sqrt(7) -1-7 (1/2) =sqrt(7)1 2 5 11 π sin 2 6395557 3 10703844 7531744375π 6490204838 (11*sqrt(7))/1 = 2 log 4 7 1 1 7
Podsumowanie: zastosowania regresji symbolicznej matematyka rekreacyjna generowanie losowych zadań matematycznych testowanie oprogramowania matematycznego szukanie rozwiązań specjalnych równań różniczkowych, funkcyjnych, całek, itp. przemysłowe generowanie modeli matematycznych i teorii sztuczna inteligencja programowanie genetyczne