Sławomir Breiter. Matematyczne podstawy mechaniki nieba. I r. Astron. (II st.) wersja

Podobne dokumenty
Wykład 2 - zagadnienie dwóch ciał (od praw Keplera do prawa powszechnego ciążenia i z powrotem..)

3. KINEMATYKA Kinematyka jest częścią mechaniki, która zajmuje się opisem ruchu ciał bez wnikania w jego przyczyny. Oznacza to, że nie interesuje nas

Mechanika. Wykład 2. Paweł Staszel

Równa Równ n a i n e i ru r ch u u ch u po tor t ze (równanie drogi) Prędkoś ędkoś w ru r ch u u ch pros pr t os ol t i ol n i io i wym

III. Układy liniowe równań różniczkowych. 1. Pojęcie stabilności rozwiązań.

Zagadnienie dwóch ciał

W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora.

KINEMATYKA I DYNAMIKA CIAŁA STAŁEGO. dr inż. Janusz Zachwieja wykład opracowany na podstawie literatury

Równania dla potencjałów zależnych od czasu

Elementy rachunku różniczkowego i całkowego

Definicje i przykłady

Mechanika ogólna. Kinematyka. Równania ruchu punktu materialnego. Podstawowe pojęcia. Równanie ruchu po torze (równanie drogi)

Symetrie i prawa zachowania Wykład 6

II. Równania autonomiczne. 1. Podstawowe pojęcia.

Metody Lagrange a i Hamiltona w Mechanice

Ćwiczenie M-2 Pomiar przyśpieszenia ziemskiego za pomocą wahadła rewersyjnego Cel ćwiczenia: II. Przyrządy: III. Literatura: IV. Wstęp. l Rys.

Konrad Słodowicz sk30792 AR22 Zadanie domowe satelita

Tydzień nr 9-10 (16 maja - 29 maja), Równania różniczkowe, wartości własne, funkcja wykładnicza od operatora - Matematyka II 2010/2011L

Fizyka 11. Janusz Andrzejewski

mechanika analityczna 1 nierelatywistyczna L.D.Landau, E.M.Lifszyc Krótki kurs fizyki teoretycznej

DRGANIA SWOBODNE UKŁADU O DWÓCH STOPNIACH SWOBODY. Rys Model układu

Jan Awrejcewicz- Mechanika Techniczna i Teoretyczna. Statyka. Kinematyka

RÓWNANIA RÓŻNICZKOWE ZWYCZAJNE

Podstawy fizyki sezon 1 VII. Ruch drgający

MiBM sem. III Zakres materiału wykładu z fizyki

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

Obliczanie pozycji obiektu na podstawie znanych elementów orbity. Rysunek: Elementy orbity: rozmiar wielkiej półosi, mimośród, nachylenie

METODY MATEMATYCZNE I STATYSTYCZNE W INŻYNIERII CHEMICZNEJ

lim Np. lim jest wyrażeniem typu /, a

RÓWNANIA RÓŻNICZKOWE WYKŁAD 4

Wykład 5 - całki ruchu zagadnienia n ciał i perturbacje ruchu keplerowskiego

Promieniowanie dipolowe

Rachunek wektorowy - wprowadzenie. dr inż. Romuald Kędzierski

Drgania i fale II rok Fizyk BC

SIMR 2016/2017, Analiza 2, wykład 1, Przestrzeń wektorowa

MECHANIKA OGÓLNA (II)

Geometria. Rozwiązania niektórych zadań z listy 2

Rozdział 2. Krzywe stożkowe. 2.1 Elipsa. Krzywe stożkowe są zadane ogólnym równaniem kwadratowym na płaszczyźnie

Wstęp. Ruch po okręgu w kartezjańskim układzie współrzędnych

Kinematyka: opis ruchu

MECHANIKA 2 KINEMATYKA. Wykład Nr 5 RUCH KULISTY I RUCH OGÓLNY BRYŁY. Prowadzący: dr Krzysztof Polko

3a. Wstęp: Elementarne równania i nierówności

Prawa ruchu: dynamika

3. Macierze i Układy Równań Liniowych

MECHANIKA 2. Wykład Nr 3 KINEMATYKA. Temat RUCH PŁASKI BRYŁY MATERIALNEJ. Prowadzący: dr Krzysztof Polko

MECHANIKA II. Dynamika ruchu obrotowego bryły sztywnej

Rozdział 2. Liczby zespolone

13. Równania różniczkowe - portrety fazowe

1.1 Przegląd wybranych równań i modeli fizycznych. , u x1 x 2

OPISY PRZESTRZENNE I PRZEKSZTAŁCENIA

Geometria w R 3. Iloczyn skalarny wektorów

Całki nieoznaczone. 1 Własności. 2 Wzory podstawowe. Adam Gregosiewicz 27 maja a) Jeżeli F (x) = f(x), to f(x)dx = F (x) + C,

Wektory, układ współrzędnych

PODSTAWY RACHUNKU WEKTOROWEGO

Geometria analityczna - przykłady

ZASADY DYNAMIKI. Przedmiotem dynamiki jest badanie przyczyn i sposobów zmiany ruchu ciał.

dr inż. Ryszard Rębowski 1 WPROWADZENIE

Wstęp do równań różniczkowych

MECHANIKA 2 RUCH POSTĘPOWY I OBROTOWY CIAŁA SZTYWNEGO. Wykład Nr 2. Prowadzący: dr Krzysztof Polko

Rachunek całkowy - całka oznaczona

Z52: Algebra liniowa Zagadnienie: Zastosowania algebry liniowej Zadanie: Operatory różniczkowania, zagadnienie brzegowe.

1 Równania różniczkowe zwyczajne o rozdzielonych zmiennych

WYBRANE DZIAŁY ANALIZY MATEMATYCZNEJ. Wykład II

Wstęp do równań różniczkowych

Znaleźć wzór ogólny i zbadać istnienie granicy ciągu określonego rekurencyjnie:

Wykład FIZYKA I. 5. Energia, praca, moc. Dr hab. inż. Władysław Artur Woźniak

Układy równań liniowych

MECHANIKA 2. Prowadzący: dr Krzysztof Polko

dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;

III. Wstęp: Elementarne równania i nierówności

Zajmijmy się najpierw pierwszym równaniem. Zapiszmy je w postaci trygonometrycznej, podstawiając z = r(cos ϕ + i sin ϕ).

Wykład 16. P 2 (x 2, y 2 ) P 1 (x 1, y 1 ) OX. Odległość tych punktów wyraża się wzorem: P 1 P 2 = (x 1 x 2 ) 2 + (y 1 y 2 ) 2

Zagadnienia brzegowe dla równań eliptycznych

BADANIE DRGAŃ TŁUMIONYCH WAHADŁA FIZYCZNEGO

Sztuczny satelita Ziemi. Ruch w polu grawitacyjnym

Fizyka 1- Mechanika. Wykład 4 26.X Zygmunt Szefliński Środowiskowe Laboratorium Ciężkich Jonów

Zasada zachowania pędu

27. RÓWNANIA RÓŻNICZKOWE CZĄSTKOWE

2) R stosuje w obliczeniach wzór na logarytm potęgi oraz wzór na zamianę podstawy logarytmu.

3. FUNKCJA LINIOWA. gdzie ; ół,.

3. Wykład Układy równań liniowych.

METODY OBLICZENIOWE. Projekt nr 3.4. Dariusz Ostrowski, Wojciech Muła 2FD/L03

Dystrybucje, wiadomości wstępne (I)

Równania różniczkowe cząstkowe drugiego rzędu

1 Układy równań liniowych

Mechanika ogólna / Tadeusz Niezgodziński. - Wyd. 1, dodr. 5. Warszawa, Spis treści

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.

ZAGADNIENIA PROGRAMOWE I WYMAGANIA EDUKACYJNE DO TESTU PRZYROSTU KOMPETENCJI Z MATEMATYKI DLA UCZNIA KLASY II

Rozszerzony konspekt preskryptu do przedmiotu Podstawy Robotyki

Matematyka II. Bezpieczeństwo jądrowe i ochrona radiologiczna Semestr letni 2018/2019 wykład 13 (27 maja)

Notacja Denavita-Hartenberga

Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne.

2. Układy równań liniowych

Wykład z równań różnicowych

Metody Lagrange a i Hamiltona w Mechanice

Ć W I C Z E N I E N R M-2

2 1 3 c c1. e 1, e 2,..., e n A= e 1 e 2...e n [ ] M. Przybycień Matematyczne Metody Fizyki I

Tadeusz Lesiak. Dynamika punktu materialnego: Praca i energia; zasada zachowania energii

Liczby zespolone. x + 2 = 0.

WYKŁAD 6 KINEMATYKA PRZEPŁYWÓW CZĘŚĆ 2 1/11

Transkrypt:

Sławomir Breiter Matematyczne podstawy mechaniki nieba I r. Astron. (II st.) wersja 16.12.2015

Rozdział 1 Równania ruchu w formalizmie newtonowskim Skoro mechanika nieba jest nauką o ruchu ciał niebieskich, to umiejętność formułowania równań ruchu ma znaczenie podstawowe. Zaczniemy od przypomnienia klasycznego formalizmu Newtona, który nakłada najmniej ograniczeń na postać sił działających w rozpatrywanym układzie. Ograniczymy się tylko do problemów dynamiki punktu materialnego, pozostawiając na uboczu kwestię ruchu obrotowego bryły sztywnej. 1.1 Formalizm newtonowski Najbardziej klasyczne podejście do mechaniki korzysta z równań ruchu w postaci wprowadzonej przez Newtona w trzech zasadach dynamiki. Przez formalizm newtonowski rozumieć będziemy rozpatrywanie ruchu w kategoriach takich pojęć podstawowych jak układ inercjalny (I zasada) oraz siła i przyspieszenie (II zasada) opisywane w naturalnych zmiennych kartezjańskich. Oczywiście, można w ramach formalizmu newtonowskiego wprowadzać inne układy zmiennych, ale przejście do nich wymaga najpierw ich zdefiniowania jako funkcji kartezjańskich położeń i prędkości. Jeśli więc mamy układ N punktów materialnych, to w świetle drugiej zasady dynamiki jego równania ruchu mają postać m i r i = F i (r 1,..., r N, ṙ 1,..., ṙ N, t), i = 1,..., N, (1.1) gdzie siła F i może zależeć od położeń r i i prędkości ṙ i wszystkich ciał oraz jawnie od czasu i co najważniejsze nie musi spełniać żadnych dodatkowych założeń. W newtonowskiej mechanice klasycznej siła nie zależy od 1

pochodnych r i rzędu wyższego niż pierwszy. Przykładem zastosowania formalizmu newtonowskiego mogą być znane z Wstępu do mechaniki nieba równania ruchu zagadnienia dwóch ciał i przeprowadzone następnie całkowanie tego zagadnienia. Stosując pojecie pędu możemy zapisać równania (1.1) w postaci p i = m i ṙ i, ṗ i = F i (r 1,..., r N, p 1,..., p N, t), (1.2) gdzie pierwsze równanie definiuje pęd jako iloczyn masy i prędkości, zaś drugie ustala równość między prędkością zmian pędu a działającą siłą. Jedną z zalet układu (1.2) jest to, że daje on przedsmak równań kanonicznych. W ramach formalizmu Newtona ważniejsze jednak jest to, że w ten sposób sprowadzamy równania ruchu do standardowej postaci z teorii równań rózniczkowych, otrzymując zamiast 3N równań drugiego rzędu układ 6N równań rzędu pierwszego ẇ = F (w, t), (1.3) gdzie wektor stanu ma składowe w = r 1... r N p 1... p N col (r 1,..., r N, p 1,..., p N ), a prawe strony równań ruchu to ( p1 F = col,... p ) N, F 1 (w, t),..., F N (w, t). m 1 m N Często jednak wygodniej jest posługiwać się prędkościami v i zamiast pędów. Używamy wtedy zamiast (1.3) układu ρ = G(ρ, t), (1.4) gdzie oraz ρ = col (r 1,..., r N, v 1,..., v N ), ( G = col v 1,... v N, F 1(ρ, t),..., F ) N(ρ, t). m 1 m N 2

Wbrew utartym schematom, układ z jawną zależnością siły od czasu jest tylko szczególnym przypadkiem układów zachowawczych (bez jawnej zależności od czasu). Wystarczy wprowadzić rozszerzony wektor stanu o 6N + 1 składowych w = col(u, w), z dodatkową zmienną u oraz wektor prawych stron F = col(1, F ) i mamy już równania zachowawcze w = F (w ), (1.5) z pierwszą składową czyli u = t + const. u = 1, Jeśli równania ruchu tworzą układ równań różniczkowych rzędu 2M bez jawnej zależności od czasu, to mówimy, że układ ma M stopni swobody. Stopniem swobody nazwiemy każda parę współrzędnych położenie-pęd (lub położenie-prędkość), wymaganą do opisu ruchu. Jeśli rząd układu jest nieparzysty, a wiąże się to z usuwaniem jawnej zależności od czasu, mówimy żargonowo o połowie stopnia swobody (zmienna u nie ma stowarzyszonego pędu jako niezależnej zmiennej, gdyż jej prędkość jest z definicji stała i wynosi 1 niezależnie od warunków początkowych). I tak, układ opisany równaniami (1.5) posiada 3N i pół stopnia swobody. Także w sytacjach, gdy utrzymaliśmy jawną zależność od czasu i formalnie posługujemy się nadal układem rzędu 2M, dorzucamy pół stopnia swobody, gdyż możliwe jest rozszerzenie wektora stanu do wymiaru 2M + 1, nawet jeśli go nie wykonaliśmy. Wspomniana wyżej dowolność siły sprawia, że formalizm newtonowski jest najogólniejszym sposobem analizy ruchu, dającym się zastosować we wszystkich zagadnieniach mechaniki klasycznej. Niestety, zaleta maksymalnej ogólności oznacza, że nie sposób powiedzieć niczego konkretnego o rozwiązaniach dowolnych równań ruchu w postaci Newtona, gdyż niewiele można powiedzieć o wszystkich możliwych zagadnieniach. Inną wadą jest żmudność przejścia od kartezjańskich położeń i prędkości do bardziej dogodnych zmiennych; zilustrujemy to przykładem równań ruchu wahadła matematycznego. 3

1.2 Wahadło matematyczne, oscylator harmoniczny i oscylator Duffinga Rozpatrzmy równania ruchu Newtona dla płaskiego wahadła matematycznego o stałej masie m, zawieszonego na nieważkim pręcie o długości l w polu grawitacyjnym o przyspieszeniu g (Rys. 1.1). Co prawda łatwo jest napisać, Rysunek 1.1: Wahadło matematyczne. że dla r = [x, y] T oraz F = [mg, 0] T równania ruchu przyjmują postać ẍ = g, ÿ = 0, (1.6) ale równania te są tylko punktem wyjścia do dalszej analizy, wymagającej uwzględnienia równania więzów x 2 + y 2 = l 2. (1.7) Dopiero równanie (1.7) zawiera istotna wiadomość, że układ ma nie dwa a tylko jeden stopień swobody. Ponieważ wahadło, jako formalny model matematyczny, pełni istotną rolę w mechanice nieba, poprowadźmy dalsze wyprowadzenie, wprowadzając jako zmienną kąt φ definiowany poprzez Różniczkując równania (1.8) dochodzimy do x = l cos φ, y = l sin φ. (1.8) ẋ = l φ sin φ, ẏ = l φ cos φ, 4

i dalej ẍ = l φ 2 cos φ l φ sin φ, ÿ = l φ 2 sin φ + l φ cos φ. Porównanie ich z równaniami (1.6) prowadzi do l φ 2 cos φ l φ sin φ = g, (1.9) l φ 2 sin φ + l φ cos φ = 0. (1.10) Należy teraz pomnożyć obie strony (1.9) przez l 1 sin φ zaś (1.10) przez l 1 cos φ i dopiero teraz, dodając stronami uzyskamy gdzie φ = ω 2 0 sin φ, (1.11) ω 0 = g l. Równanie różniczkowe drugiego rzędu (1.11) można także przedstawić jako układ dwóch równań pierwszego rzędu: jeśli wprowadzimy prędkość kątową Φ, to mamy φ = Φ, Φ = ω 2 0 sin φ, (1.12) czyli ρ = G(ρ), gdzie oraz ρ = (ρ 1, ρ 2 ) T = (φ, Φ) T, G = (ρ 2, ω 2 0 sin ρ 1 ) T = (Φ, ω 2 0 sin φ) T. W przedstawionym tu przykładzie sytuację komplikowało pojawienie się więzów. Można wysunąć zastrzeżenie, że przecież w zagadnieniach ruchu ciał niebieskich nie pojawią sie więzy trudno wyobrazić sobie planetę na sznurku. A jednak więzy mogą się zjawić nie tylko w postaci fizycznej. Każda całka ruchu Ψ(ρ, t) = const, definiuje w istocie powierzchnię, na której ruch musi się odbywać, pełniąc rolę matematycznego sznurka. Wykorzystanie całek ruchu do obniżenia liczby stopni swobody jest w formalizmie Newtona bardziej zawiłe niż w ramach formalizmu Lagrange a czy Hamiltona. 5

Załóżmy teraz, że maksymalne wychylenie wahadła (w radianach) jest niewielkie. Rozwijając prawą stronę równania (1.11) w szereg potęgowy wzorem MacLaurina, mamy sin φ = φ φ3 6 + O(φ5 ). Zaniedbując wyrazy mniejsze lub równe niż φ 5, sprowadzimy równania wahadła do postaci φ = Φ, Φ = ω0 2 φ + 1 (1.13) 6 ω2 0 φ3, czyli φ = ω 2 0 φ + 1 6 ω2 0 φ 3. Układ ten nazywamy oscylatorem Duffinga. Najdalej idące uproszczenie polega na przyjęciu sin φ φ, z błędem rzędu O(φ 3 ). Równania ruchu wahadła sprowadzaja się wtedy do równań oscylatora harmonicznego φ = Φ, Φ = ω 2 0 φ, (1.14) czyli φ = ω 2 0φ. Układ ten posiada proste rozwiązanie ogólne φ(t) = A sin (ω 0 t + χ), Φ(t) = A ω 0 cos (ω 0 t + χ), (1.15) zależne od dwóch stałych dowolnych: amplitudy A i fazy początkowej χ. Jest to w istocie rodzina rozwiązań elips na płaszczyźnie fazowej (φ, Φ). Rozwiązanie szczególne, czyli pojedynczą trajektorię na płaszczyźnie fazowej, otrzymamy zadając warunki początkowe w epoce t 0 φ 0 = φ(t 0 ), Φ 0 = Φ(t 0 ), i wyliczając z nich stałe dowolne A, χ. Zarówno wahadło jak i oscylator Duffinga posiadaja także rozwiązania ścisłe, zależne od dwóch stałych dowolnych, ale wymagają one wprowadzenia tak zwanych funkcji eliptycznych. 6

WYKŁAD 2 1.3 Metoda uzmienniania stałych Pozostając nadal na poziomie ogólności formalizmu newtonowskiego, wprowadzimy teraz nowy, dość szczególny rodzaj zmiennych. Z podstawowego kursu analizy matematycznej 1 można wynieść przekonanie, że metoda uzmienniania stałych jest metodą rozwiązywania równań różniczkowych zwyczajnych. Jest to prawdziwe, jeśli chodzi o równania liniowe niejednorodne, lecz w ogólnym przypadku równań nieliniowych metoda uzmienniania stałych jest jedynie sposobem przekształcenia równań różniczkowych do postaci, która czasem może uprościć dalsze kroki zmierzające do ich rozwiązania. Aby nie wdawać się w zbędne uogólnienia, skoncentrujmy się na przypadku układu mechanicznego o M stopniach swobody. Oznaczając przez r, v R M położenie i prędkość układu, możemy podać jego równania ruchu ṙ = v, v = F 0 (r, v). (1.16) Załóżmy, że układ z siłą (na jednostkę masy) F 0 jest całkowalny i potrafimy znaleźć jego rozwiązanie r = r(c, t), v = v(c, t), (1.17) jawnie zależne od czasu t oraz od stałych dowolnych C R 2M wyznaczanych z warunków początkowych. Zauważmy, że po lewej stronie równości mamy wielkości fizyczne: położenie r i prędkość v, natomiast po prawej funkcje r(c, t), v(c, t) czasu i stałych, które opisują zmiany położenia i prędkości. Zagadnienie (1.16) możemy nazwać zagadnieniem definiującym, a jego rozwiązanie (1.17) rozwiązaniem definiującym. Wprowadźmy teraz do układu (1.16) dodatkową siłę P ṙ = v, v = F 0 (r, v) + P (r, v). (1.18) Istotą metody uzmienniania stałych jest przyjęcie, że mimo pojawienia się zaburzenia P, będziemy nadal używać wzorów (1.17) wywodzących się z zagadnienia definującego. Ponieważ utrzymujemy postać rozwiązania jako 1 np. A. Sołtysiak Analiza matematyczna rozdz. 9. 7

funkcji stałych dowolnych i czasu, musimy dopuścić możliwość, że dotychczasowe stałe dowolne C przestają być stałymi i przybierają postać nieznanych funkcji czasu C(t). W tej sytuacji, czeka nas wyprowadzenie równań różniczkowych opisujących ewolucję uzmiennionych stałych C(t), nazywanych także stałymi oskulacyjnymi (lub zmiennymi oskulacyjnymi). Ogólna procedura zastąpienia równań (1.18) układem 2M równań dla Ċ wykorzystuje nawiasy Lagrange a i można ją znaleźć w starszych podręcznikach mechaniki klasycznej lub mechaniki nieba. W praktyce jednak, wygodniej jest analizować każdy przypadek osobno i wykorzystać w maksymalnym stopniu jego specyfikę. Równania dla uzmiennionych stałych można wyprowadzać na dwa zasadnicze sposoby: wychodząc od rozwiązania definiującego (1.17) lub wykorzystując całki układu. To drugie podejście bywa bardziej atrakcyjne, a nie narzuca nam zasadniczych ograniczeń, gdyż metoda uzmienniania stałych wymaga, z założenia, całkowalnego zagadnienia definiującego. Zagadnienie całkowalne to takie, dla którego znamy wszystkie całki ruchu w naszym przypadku 2M niezależnych całek Ψ i (r, v, t) = S i = const, i = 1,..., 2M, (1.19) co jest równoważne z możliwością podania ścisłego rozwiązania (1.17). Całkami ruchu nazywa sie równie często równania (1.19) jak i same funkcje Ψ i. Całkom ruchu zagadnienia definiującego towarzyszą stałe ruchu S i, które albo są wprost stałymi dowolnymi z rozwiązania definiującego, albo znamy związki między S i C. Ze stałości całki ruchu wynika Ṡ i = Ψ i = (DrΨ i ) v + (DvΨ i ) F 0 + D t Ψ i = 0, (1.20) gdzie skorzystaliśmy z reguł różniczkowania funkcji złożonej oraz z równań (1.16). Symbolem Dx oznaczać będziemy transponowany gradient, tzn. jeśli x R N jest wektorem kolumnowym, a F (x) dowolną funkcją, to DxF = ( F x 1,..., F x N ). (1.21) W metodzie uzmienniania stałych, całki zagadnienia definiującego mogą przestać być stałe po wprowadzeniu dodatkowej siły P. Zauważmy jednak, że jedynym źródłem zmienności stałych ruchu S staje się ta część pochodnej względem czasu, która zawiera P, co upoważnia nas do sformułowania równań ruchu Ṡ i = (DvΨ i ) P, i = 1,..., 2M. (1.22) Wzór ten można stosować na skróty według reguły: różniczkujemy względem czasu tylko występujące w całkach v i zastępujemy v siłą P. 8

Jeśli S = C, to równania (1.22) są tymi, których szukaliśmy. W przeciwnym wypadku, musimy je uzupełnić znajomościa zwiazków między S i C, które po zróżniczkowaniu prowadzą do czyli Ċ i = ( D S C i ) Ṡ, i = 1,..., 2M, (1.23) Ċ = ( D S C ) (DvΨ) P. Jeśli znamy tylko S(C), to będziemy musieli odwrócić macierz Jacobiego: D S C = (D C S) 1. Jest to dość prosty schemat, choć trzeba pamiętać, że prawe strony równań (1.22) muszą zostać wyrażone przy pomocy uzmiennionych stałych C za pośrednictwem rozwiązania definującego (1.17). Jak widać, nawet zastosowanie całek ruchu nie uwalnia nas od wymogu znajomości jawnego rozwiązania. Rozwiązanie układu (1.22) dostarczy nam 2M funkcji C i (t, C ), które muszą zależeć od nowych stałych dowolnych C. Te zaś najprościej zdefiniować jako warunki początkowe, to znaczy C = C(t 0 ). Kiedy podstawimy wartości C(t) na dany moment czasu do równań (1.17), dostaniemy wartości położeń i prędkości na tę epokę r(t) i v(t). 1.4 Uzmiennianie stałych dla oscylatora Duffinga Oscylator Duffinga (1.13) jest układem o jednym stopniu swobody, a więc zamiast wektorów r i v mamy po prostu r = φ i v = φ = Φ. Układem definującym z prawą stroną F 0 = ω0 2 φ jest oscylator harmoniczny (1.14), zaś zaburzeniem jest P = 1 6 ω2 0 φ3. Rozwiązanie definujące ma więc postać (1.15) zależną od dwóch stałych dowolnych ( ) A C =. χ Oscylator harmoniczny posiada dwie całki ruchu. Pierwsza z nich to niezależna od czasu całka energii ( Ψ 1 = 1 2 Φ 2 + ω0φ 2 2) = E = const, (1.24) 9

ze stałą ruchu E. Druga całka ruchu musi zależeć od czasu (jeśli układ o M stopniach swobody ma 2M całek ruchu, to co najmniej jedna z nich musi zależeć od czasu); najprościej wziąć wprost z rozwiązania [ ] ω0 φ Ψ 2 = arc tg ω 0 t = χ = const, (1.25) Φ ze stałą ruchu χ, a więc S = ( ) E. χ Zacznijmy od równań (1.22) dla uzmiennionych stałych ruchu po wprowadzeniu siły P. W przypadku, który rozpatrujemy (M = 1), pochodna wektorowa Dv to zwykła skalarna pochodna D Φ, czyli Ė = Ψ 1 P = Φ P, (1.26) Φ oraz χ = Ψ ( 2 Φ P = 1 1 + ( ω 0 φ) 2 ω ) 0 φ Φ 2 P = ω 0φ P. (1.27) 2E Φ Potrzebujemy teraz związków między C i S, żeby otrzymać równania (1.23). Związki te są proste, gdyż C 2 = S 2 = χ, natomiast po wstawieniu (1.15) do całki energii (1.24) widzimy, że E = ω2 0 2 A2, (1.28) czyli A Ȧ = Ė ω0 2 = Φ P ω0 2. (1.29) Ze związku (1.28) możemy skorzystać także w równaniu (1.27) i ostatecznie otrzymujemy równania dla uzmiennionych stałych: najpierw Ȧ = Φ P A ω0 2, χ = φ P A 2, ω 0 a potem, po wprowadzeniu rozwiązania definiującego (1.15), Ȧ = P ω 0 cos (ω 0 t + χ), χ = P A ω 0 sin (ω 0 t + χ). (1.30) 10

Równania (1.30) są ważne dla oscylatora z dowolną siłą zaburzającą P. W przypadku oscylatora Duffinga podstawimy do nich P = 1 6 ω2 0 φ 3 = 1 6 A3 ω 2 0 sin 3 (ω 0 t + χ). (1.31) Wystarczy już tylko podstawić (1.31) do prawych stron (1.30) a następnie przejść od iloczynów i potęg sinusa i cosinusa do postaci wielomianów trygonometrycznych. Wykorzystamy przy tym (sin y) 4 = 1 8 ( 3 4 cos 2 y + cos 4 y), oraz cos y (sin y) 3 = 1 8 ( 2 sin 2 y sin 4 y). W ten sposób otrzymujemy końcową postać równań ruchu dla małych drgań wahadła w zmiennych oskulacyjnych [ ] Ȧ = A 3 ω 1 1 0 24 sin 2ψ 48 sin 4ψ, gdzie symbol ψ oznacza ] χ = A 2 ω 0 [ 1 16 + 1 1 12 cos 2ψ 48 cos 4ψ, ψ = ω 0 t + χ. (1.32) Na pierwszy rzut oka, równania (1.32) wyglądają o wiele bardziej nieliniowo niż pierwotne (1.13). Można się nawet zastanawiać, czy warto je przekształcać do takiej postaci. Odpowiedź na to pytanie zależy od sposobu w jaki będziemy próbowali je rozwiązać. Dopiero gdy zapoznamy się z podstawami metod analitycznych i numerycznych mechaniki nieba stanie się jasne, którą z postaci równań ruchu wygodniej jest zastosować. Spróbujmy jednak pokazać, jak łatwo można teraz znaleźć przybliżone rozwiązanie równań (1.32). W pierwszym przybliżeniu podstawiamy do prawych stron wartości stałych zagadnienia definiującego A 0 = const oraz χ 0 = const wyliczone w epoce t 0 ze zmiennych φ i Φ. Mamy wtedy do czynienia z prostymi równaniami Ȧ f 1 (A 0, χ 0, t), χ f 2 (A 0, χ 0, t), które sprowadzają się do zwykłych całek oznaczonych t t A A 0 + f 1 dt, t 0 χ χ 0 + f 2 dt. t 0 11

Całkowanie prowadzi do gdzie A A 0 (1 A2 0 48 [cos 2ψ 0(t) cos 2ψ 0 (t 0 )] ) + A2 0 192 [cos 4ψ 0(t) cos 4ψ 0 (t 0 )], χ χ 0 A2 0 ω 0 16 (t t 0 ) + A2 0 24 [sin 2ψ 0(t) sin 2ψ 0 (t 0 )] A2 0 192 [sin 4ψ 0(t) sin 4ψ 0 (t 0 )], ψ 0 (t) = ω 0 t + χ 0. Można sprawdzić, że w epoce oskulacji t 0 mamy faktycznie χ χ 0 oraz A A 0. Jest to tylko pierwsze przybliżenie, ale zawiera cenne informacje: oskulacyjna amplituda drgań oscyluje wokół pewnej średniej wartości, natomiast faza posiada również wyraz wiekowy który modyfikuje okres drgań w zależności od amplitudy wychylenia. Uzyskanie podobnych wyników na podstawie oryginalnych równań Duffinga byłoby bardziej złożone. 12

WYKŁAD 3 1.5 Elementy oskulacyjne i równania Gaussa Tam, gdzie ruch orbitalny masy punktowej opisany przez zagadnienie dwóch ciał przestaje być modelem wystarczająco dokładnym, można wprowadzić jako zmienne oskulacyjne uzmiennione stałe orbity keplerowskiej czyli elementy oskulacyjne orbity. Jak wiemy z Wstępu do mechaniki nieba, ruch każdej z mas w zagadnieniu dwóch ciał z siłą F 0 = µ r 3 r, jest opisany jednoznacznie przez 6 stałych dowolnych, które najczęściej występują w postaci elementów keplerowskich E: a, e, I, ω, Ω, M 0 = M(t 0 ). Znamy już wzory definiujące transformację (r, v) t E t0, która z jednej strony pozwala wyliczać na dowolny moment czasu t położenie i prędkość ciała, dla którego podaliśmy elementy keplerowskie E w momencie t 0, a z drugiej pozwala wyliczyć z położenia i prędkości w momencie t elementy E dla epoki odniesienia t 0. Ponieważ E są stałymi ruchu, to biorąc (r, v) w dowolnym momencie t i wyliczając z nich elementy otrzymamy zawsze te same wartości E. Jeśli pojawi się dodatkowa siła i ruch ciała nie jest już ruchem keplerowskim, to nadal możemy wyliczać elementy keplerowskie według znanych już wzorów, ale teraz w każdej epoce t możemy otrzymać inne wartości elementów E t0 dla epoki odniesienia t 0. Zgodnie z zasadą metody uzmienniania stałych zaczynamy traktować elementy orbity jako funkcje czasu i nazywamy je elementami oskulacyjnymi. Należy wyraźnie odróżnić dwa momenty czasu pojawiające się w tym opisie. Epoka oskulacji t jest momentem czasu, w którym mamy dane położenie i prędkość służące do wyliczenia elementów E. Jednym z tych elementów jest anomalia średnia epoki odniesienia M 0 = M(t 0 ), którą otrzymujemy cofając lub popychając wartość anomalii średniej M z epoki t do epoki t 0. Ponieważ uzmienniliśmy stałe, to M 0 może być zmienną i w ogólności dla różnych epok oskulacji t 1 i t 2 będziemy mieli M 0 (t 1 ) M 0 (t 2 ). 13

Używamy więc pojęcia M 0 (t) anomalii średniej epoki odniesienia t 0 dla epoki oskulacji t. Czasami można uprościć sobie życie przyjmując, że t = t 0. W przypadku pozostałych elementów nie mamy tego problemu i wystarcza używanie pojęcia epoki oskulacji dla a(t), e(t), itd. Mówiąc najkrócej, elementy oskulacyjne epoki t to wartości elementów keplerowskich wyliczone dla dowolnej trajektorii wzorami pochodzącymi z zagadnienia dwóch ciał. Jeśli w poprzednim rozdziale traktowaliśmy wahadło jak oscylator o zmiennej w czasie amplitudzie i fazie, to teraz będziemy traktować dowolną trajektorię jak orbitę keplerowską o zmiennych w czasie elementach. Inna, bardziej poglądowa definicja brzmi: elementy oskulacyjne epoki t, to elementy orbity, po której poruszałoby się ciało, gdyby w epoce t przestała działać siła zaburzająca. Przystąpimy teraz do sformułowania równań ewolucji elementów oskulacyjnych dla dowolnej siły P zaburzającej zagadnienie dwóch ciał ṙ = v, v = µ r 3 r + P. (1.33) Znaczenie stałej µ zależy od typu zagadnienia względnego lub barycentrycznego. Wyprowadzenie równań dla ȧ, ė, itd. przy dowolnej postaci siły P zwanych równaniami Gaussa przeprowadzimy wykorzystując znane całki ruchu zagadnienia dwóch ciał. 1.5.1 Uzmiennione całki ruchu Przypomnijmy całki ruchu pojawiające się we względnym lub barycentrycznym zagadnieniu dwóch ciał. Bez względu na typ ruchu, mamy 7 całek niezależnych od czasu: Całkę siły żywej vel energii h = 1 2 v v µ r r. (1.34) Całki pól (momentu pędu) G = r v. (1.35) 14

Całki Laplace a e = v G µ r r, (1.36) które można także przedstawić w postaci ( µe = v 2 µ ) r (r v) v. (1.37) r Tylko 5 spośród nich jest wzajemnie niezależnych, gdyż istnieją dwa związki: G e = 0, oraz e 2 = 1 + 2hG 2 µ 2. Szóstą całką ruchu jest, w zależności od typu orbity, równanie Keplera (eliptyczne lub hiperboliczne) albo równanie Barkera. Ograniczymy nasze rozważania do orbit eliptycznych jako rozwiązania definiującego, więc szóstą całką ruchu będzie M 0 = E e sin E n(t t 0 ), (1.38) gdzie ruch średni n (nadal definiowany poprzez III prawo Keplera n 2 a 3 = µ) i anomalia mimośrodowa E są znanymi funkcjami położeń i prędkości. Zastosujmy teraz do pierwszych siedmiu całek wzór (1.22), a otrzymamy ḣ = v P, (1.39) Ġ = r P, (1.40) µė = 2(v P )r (r P )v (r v)p = = P G + v (r P ). (1.41) Ze względu na wyższy poziom komplikacji, równanie Keplera zostawimy sobie na później. 1.5.2 Równanie dla półosi wielkiej Równania (1.39-1.41) opisują zmiany stałych ruchu, które nie są elementami Keplerowskimi. Są przy tym na tyle ogólne, że nawet trochę żal je psuć przejściem do elementów oskulacyjnych. Na przykład równanie dla ḣ jest ważne dla wszystkich typów orbit, ale wydobycie z niego równania na zmiany oskulacyjnej półosi wielkiej a ograniczy jego stosowanie do orbit eliptycznych. Mamy bowiem wzór h = µ 2a, (1.42) który wiąże stałą siły żywej h z półosią wielką elipsy, ale dla orbit hiperbolicznych, gdzie mamy połoś rzeczywistą a, prawa strona ma inny znak, 15

natomiast dla orbit parabolicznych mamy z definicji h = 0 i dopuszczenie zmian h jest samo w sobie problematyczne. Ograniczmy się zatem do zaburzonego ruchu eliptycznego i wtedy ḣ = µ ȧ. (1.43) 2 a2 Przyrównując stronami (1.39) oraz (1.43) otrzymujemy pierwsze z równań Gaussa ȧ = 2a2 µ v P. (1.44) 1.5.3 Równanie dla mimośrodu Mimośród orbity to długość wektora Laplace a e. A zatem równanie opisujące zmiany oskulacyjnego mimośrodu możemy uzyskać z równania (1.41) dla ė. Wystarczy w tym celu skorzystać z pożytecznej tożsamości: dla każdego wektora x obowiązuje x ẋ = xẋ. A jeśli użyjemy wersora ˆx = x/ x = x/x, o jednostkowej długości, to ˆx ẋ = ẋ. Pomnóżmy więc obie strony (1.41) skalarnie przez wersor ê. Po lewej stronie pojawi się ê ė = ė i otrzymamy drugie z równań Gaussa µė = 2(r ê)(v P ) (v ê)(r P ) (r v)(ê P ). (1.45) Ograniczenie w stosowaniu tego równania pojawiło się w sposób nieco zakamuflowany: traci ono sens dla orbit kołowych z e = 0, gdyż wtedy nie istnieje wersor ê. 1.5.4 Kąty Eulera a prędkość kątowa Po znalezieniu wzorów dla ȧ i ė stajemy wobec problemu powiązania zmian wektorów G i e ze zmianami kolejnych elementów keplerowskich: Ω, I, ω, które maja charakter kątów Eulera typu 3-1-3 orientujących orbitę w przestrzeni. Wykorzystamy do tego ważne twierdzenie dotyczące związku prędkości kątowej z obrotami o kąty Eulera typu 3-1-3. Rozpatrzmy dwa prawoskrętne układy współrzędnych: stały, o wersorach osi (î, ĵ, ˆk) i obracający się, o wersorach osi (î, ĵ, ˆk ). W każdym momencie czasu możemy powiązać te dwa układy przez chwilowe wartości kątów Eulera ϕ, ϑ, ψ, związane z trzema obrotami: 16

Wokół osi ˆk podstawowego układu współrzędnych (î, ĵ, ˆk), o kąt ϕ. Taki obrót przenosi wersor î w położenie î wyznaczające linię przecięcia płaszczyzn podstawowych obu układów. Obrót wokół chwilowej osi î o kąt ϑ. W wyniku tej operacji wersor ˆk, który nie uległ zmianie przy pierwszym obrocie, przechodzi w nowy wersor ˆk. Obrót wokół osi ˆk o kąt ψ, który przenosi wersor î w wersor î. Jeśli kąty Eulera zmieniają się w czasie w sposób ciągły, to punkt wyznaczony przez koniec radialnego wersora ˆr sztywno związanego z układem (î, ĵ, ˆk ) (takiego, którego rzuty ˆr î, ˆr ĵ, ˆr ˆk są stałe w szczególności jeden z wersorów osi) zyskuje prędkość kątową ω r i mamy względem osi stałych dˆr dt = ω r ˆr. (1.46) TWIERDZENIE 1 Prędkość kątowa obrotu opisanego kątami Eulera 3-1-3 ϕ, ϑ, ψ wynosi ω r = ϕ ˆk + ϑ î + ψ ˆk. (1.47) Dowód tego twierdzenia znaleźć można w podręcznikach mechaniki klasycznej, ale jak zauważył C. Leubner (1981, Am. J. Phys. 49, 323) proste dowody wzoru (1.47), które trafiły do podręczników, są zazwyczaj niepoprawne. Warto zapamiętać, że podane twierdzenie jest ważne nie tylko w mechanice. W astronomii sferycznej i astrometrii może ono być zastosowane do opisu wpływu małych zmian kątów Eulera na położenie punktu na sferze niebieskiej ( ˆr ϕ ˆk + ϑ î + ψ ˆk ) ˆr. 17

WYKŁAD 4 1.5.5 Równania dla oskulacyjnej długości węzła wstępującego i nachylenia Przypomnijmy, że wektor momentu pędu G definiuje orientację płaszczyzny orbity w przestrzeni. Jest on prostopadły do tej płaszczyzny, więc nachylenie I definiujemy poprzez iloczyn skalarny z wersorem osi z układu Ĝ ẑ = cos I, (1.48) natomiast kierunek do węzła wstępującego dany jest wersorem ˆm = ẑ Ĝ sin I. (1.49) Ponieważ kąt między między wersorem osi x a wersorem ˆm jest równy długości węzła wstepującego Ω, widzimy że równania dla zmian I oraz Ω powinny winikać z równań (1.40) dla Ġ. Przypomnijmy teraz definicję układu orbitalnego perycentrycznego, którego trzy wersory to: ê, ˆQ = (Ĝ ê), oraz Ĝ. Jest on powiązany z układem dowolnym o wersorach ˆx, ŷ, ẑ obrotami o kąty ϕ = Ω, ϑ = I, oraz ψ = ω, a kolejne osie obrotu to ˆk = ẑ, î = ˆm, ˆk = Ĝ. Przedstawmy moment pędu G jako iloczyn długości i wersora GĜ. Równanie (1.40) przybiera wtedy postać Ġ = d dt ( ) G Ĝ = Ġ Ĝ + G d Ĝ = r P. dt Skąd biorą się zmiany kierunku Ĝ? Możemy uznać, że wersor G, jest to wektor ẑ aktywnie obrócony o kąty Eulera ϕ = Ω i ϑ = I (trzeci kąt ψ = ω jest nieistotny). Ciągła zmiany kątów Eulera Ω, I wywołują prędkość katową końca Ĝ i stosując Twierdzenie 1 uzyskamy wektorową równość Ġ Ĝ + G sin I Ω ˆm + G I ˆm Ĝ = r P, (1.50) która nie posiada wyrazu związanego z ω, gdyż G ωĝ Ĝ = 0. W wyrazie z Ω wykorzystaliśmy fakt, że ẑ Ĝ = sin I ˆm, w myśl równania (1.49). Jak z układu trzech równań (1.50) otrzymać dwa osobne równania skalarne dla Ω oraz I? Najgorsze, co by można wymyślić, to rozpisać wszystkie wektory na składowe w wybranej bazie i rozwiązywać układ trzech równań z 18

niewiadomymi Ġ, Ω, I. O wiele bardziej wydajne jest jednak podejście wektorowe, polegające na wykonaniu iloczynu skalarnego z umiejętnie dobranym wektorem. Jeśli interesuje nas Ω, to powinniśmy pomnożyć obie strony (1.50) przez wektor który jest prostopadły zarówno do Ĝ, jak i do ˆm Ĝ. Z tego punktu widzenia, idealnym wyborem jest wersor ˆm, który prowadzi do Ġ ˆm Ĝ + G sin I Ω ˆm ˆm + GI ˆm ( ˆm Ĝ) = ˆm (r P ). Ponieważ ˆm Ĝ = 0, ˆm ˆm = 1 oraz, w myśl reguły cyklicznego przestawiania czynników w mieszanym iloczynie wektorowym, zostaje nam ˆm ( ˆm Ĝ) = Ĝ ( ˆm ˆm) = 0, G sin I Ω = P ( ˆm r), gdzie prawa strona powstała przez cykliczne przestawienie czynników. Ponieważ ˆm i r leżą w płaszczyźnie orbity i ich iloczyn wektorowy ma kierunek Ĝ, a kąt jaki tworzą to tzw. argument szerokości f + ω (suma anomalii prawdziwej f i argumentu perycentrum), dochodzimy do kolejnego z równań Gaussa G sin I Ω = P Ĝ r sin (f + ω). (1.51) W podobny sposób otrzymamy równanie dla zmian nachylenia. Tym razem optymalny wybór wektora do iloczynu skalarnego to wersor ( ˆm Ĝ), prostopadły zarówno do linii węzłów, jak i do momentu pędu. Mnożąc (1.50) skalarnie przez ten wektor, otrzymujemy GI ( ) = ( ˆm Ĝ) (r P ) = P ( ˆm Ĝ) r. Zależnie od stopnia posiadanej wyobraźni przestrzennej, albo stosujemy tożsamość bac-cab ( ˆm Ĝ) r = ( ˆm r)ĝ (Ĝ r) ˆm = r cos (f + ω)ĝ, albo analizujemy kierunki i kąty między poszczególnymi wektorami, otrzymując ten sam wynik G I = P Ĝ r cos (f + ω). (1.52) Obydwa równania (1.51) oraz (1.52) nie mają sensu dla I = 0 lub I = π, gdyż korzystaliśmy w wyprowadzeniu z wersora ˆm, który nie istnieje w tych przypadkach. Również dla orbit prostoliniowych, gdy G = 0, równania te tracą sens, gdyż nie istniałby wersor Ĝ. 19

1.5.6 Równanie dla oskulacyjnego argumentu perycentrum Zmiany argumentu perycentrum, czyli kąta między ˆm a ê, otrzymamy z uzmiennionych całek Laplace a (1.41). Podobnie jak dla momentu pędu, przedstawimy wektor Laplace a jako iloczyn e = eê i uznamy go za wersor ˆx obrócony o kąty Ω, I, ω,po czym skorzystamy z Twierdzenia 1 ė = ėê + e dê ( ) dt = ėê + e Ω ẑ + I ˆm + ω Ĝ ê. (1.53) Niestety, nie możemy liczyć na usunięcie wszystkich pochodnych oprócz ω, więc stosujemy wariant skromniejszy: iloczyn skalarny z wersorem ˆQ = Ĝ ê, który leży w płaszczyźnie orbity i jest odległy od perycentrum o 90 w kierunku ruchu orbitalnego. Z definicji, ˆQ ê = 0, więc podstawiając (1.53) do (1.41) i mnożąc obie strony przez ˆQ mamy µe ( Ω ˆQ (ẑ ê) + I ˆQ ( ˆm ê) + ω ) = ˆQ R, gdzie przez R oznaczyliśmy jedną z dwóch postaci prawych stron równania wektorowego (1.41). Łatwo sprawdzić, że ˆQ (ẑ ê) = ẑ (ê ˆQ) = ẑ Ĝ = cos I, oraz ˆQ ( ˆm ê) = ˆm (ê ˆQ) = ˆm Ĝ = 0, więc, wybierając pierwszą postać prawych stron, ( µe ω + cos I Ω ) = 2(r ˆQ)(v P ) (v ˆQ)(r P ) (r v)( ˆQ P ). (1.54) Wyraz zawierający Ω zostawiliśmy chwilowo po lewej stronie dla podkreślenia, że przy I = 0 (gdy cos I = 1) prowadzi on do dobrze określonego równania dla długości perycentrum ϖ = ω + Ω. Natomiast w przypadku I = π, e = 0 lub orbit prostoliniowych, równanie Gaussa (1.54) traci sens. 1.5.7 Równania dla zmian anomalii Pozostało nam już tylko równanie dla zmian oskulacyjnej anomalii średniej epoki odniesienia t 0, czyli Ṁ 0 w zagadnieniu zaburzonym. Trafiamy tutaj na 20

dość nieprzyjemny problem. W pierwotnej postaci, równanie Keplera (1.38) miało postać M = E e sin E. Anomalia średnia jest w ruchu keplerowskim dana poprzez M(t) = n(t t 0 ) + M 0. Tylko że w zagadnieniu dwóch ciał ruch średni n = µa 3 jest stały, podczas gdy w ruchu zaburzonym zmienność półosi wielkiej uzmiennia n. Jak więc traktować M? Czy przyjąć czy może M(t) = n(t) (t t 0 ) + M 0, (1.55) M(t) = t t 0 n(t) dt + M 0, (1.56) jako definicję podstawową? Każde z tych podejść prowadzi do innej definicji M 0 w przypadku zaburzonym. Wariant (1.56) przyjmowany jest najczęściej, gdyż prowadzi do względnie prostego podczas gdy (1.55) oznacza Ṁ = n(t) + Ṁ0, (1.57) Ṁ = n + ṅ(t t 0 ) + Ṁ0, (1.58) co prowadzi do nieprzyjemnej sytuacji: jeśli ṅ ma charakter ograniczonych oscylacji o częstotliwości α, to pojawią się bardzo niepożądane wyrazy typu t cos αt, zwane mieszanymi wyrazami wiekowymi. Żeby uniknąć dylematów związanych z definicją M 0, obejdźmy problem w ten sposób, że wyprowadzimy równanie dla Ṁ, a wybór definicji M 0 pozostawimy otwarty. Co więcej, w wielu sytuacjach można się bez niego obejść i poprzestać na M(t). 21

WYKŁAD 5 Różniczkując równanie Keplera w przypadku zaburzonym Ṁ = Ė(1 e cos E) ė sin E, (1.59) widzimy, że potrzebna będzie pochodna anomalii mimośrodowej, gdyż wzór na ė został wyprowadzony wcześniej. Informację o Ė najlepiej otrzymać na podstawie prędkości kątowej anomalii prawdziwej f, gdyż ta druga ma prostą definicję geometryczną jako kąt między ê i ˆr. Wyjdźmy od oczywistego wzoru na prędkość v = ṙ = d(r ˆr) dt = ṙˆr + r dˆr dt. Zuważmy teraz, że wersor położenia ˆr możemy otrzymać z wersora ˆx poprzez obrót o katy Eulera Ω, I, ω + f ze znajomymi wersorami obrotu ẑ, ˆm, Ĝ. A więc można zastosować Twierdzenie 1 i napisać ( ) ṙˆr + r Ω ẑ + I ˆm + ( ω + f) Ĝ ˆr = v. Pomnóżmy skalarnie obie strony przez wersor ˆt = (Ĝ ˆr), prostopadły do wektora położenia, leżący w płaszczyźnie orbity i skierowany zgodnie z ruchem ciała. Po uwzględnieniu ˆr ˆt = 0, oraz otrzymujemy ˆt ( ˆm ˆr) = ˆm (ˆr ˆt) = ˆm Ĝ = 0, ˆt (ẑ ˆr) = ẑ (ˆr ˆt) = ẑ Ĝ = cos I, ( ) r Ω cos I + ω + f = v ˆt. Ale to, co widzimy po prawej stronie, to nic innego jak prędkość transwersalna, która z defincji ma postać v t = v ˆt = G r. Wzór dla prędkości kątowej anomalii prawdziwej w ruchu zaburzonym ma zatem postać f = G r 2 ω cos I Ω, (1.60) 22

taką jak w ruchu keplerowskim, tylko z poprawką na ruch linii apsyd od której mierzymy f. Aby znaleźć związek między Ė a f w przypadku zaburzonym, zróżniczkujmy funkcję r a = 1 e cos E = 1 e2 1 + e cos f, która może służyć jako związek między f i E. Uwzględniając możliwość zmian mimośrodu, dostaniemy cos E ė + e sin E Ė = r p [2 e + r a cos f ] ė + e r2 sin f a p f, (1.61) gdzie p = a(1 e 2 ), dla orbit eliptycznych. Po niezbyt wyrafinowanych przekształceniach, uwzględniających r = a (1 e cos E), r sin f = a 1 e 2 sin E, r cos f = a (cos E e), równanie (1.61) przyjmuje postać Ė = r a f sin E ė. (1.62) 1 e 2 1 e2 Podstawiając (1.62) i (1.60) do (1.59) dostajemy Ṁ = n r 2 ( a 2 1 e ( ω + cos I Ω) 1 + r ) sin E ė. (1.63) 2 p Uznamy to równanie za szóste z równań Gaussa, gdyż stosownie do wyboru definicji M 0 prowadzi ono bezpośrednio do Ṁ0 w połączeniu z równaniem (1.58) lub (1.57). 1.5.8 Składowe siły zaburzającej Przyglądając się równaniom (1.44, 1.45, 1.51, 1.52, 1.54) stwierdzamy, że zawierają one iloczyny skalarne siły zaburzającej P z rozmaitymi wektorami: r, v, ê, ˆQ i Ĝ. Pierwsze cztery z nich leżą w płaszczyźnie oskulacyjnej orbity, prostopadłej do chwilowego momentu pędu G. Staramy się ograniczyć liczbę tych iloczynów rozkładając P na składowe w jednej z trzech podstawowych baz: radialnej, stycznej lub perycentrycznej. Wszystkie trzy bazy mają wspólny wersor Ĝ, który dalej oznaczać będziemy przez ˆb i nazywać, zgodnie z terminologią geometrii różniczkowej, wersorem binormalnym. Baza radialna zdefiniowana jest przez wersory 23

Rysunek 1.2: Bazy radialna i styczna. Wersor binormalny skierowany jest do góry prostopadle do płaszczyzny rysunku. radialny ˆr wzdłuż promienia wodzącego, transwersalny ˆt prostopadły do radialnego, leżący w płaszczyźnie orbity i skierowany zgodnie z ruchem ciała, binormalny (normalny do płaszczyzny orbity) ˆb wzdłuż wektora momentu pędu. Składowe siły P w tej bazie oznaczymy odpowiednio przez R, T i B: P = Rˆr + Tˆt + Bˆb. Ich wartości można zdefiniować przy pomocy iloczynów P z wektorami r i G = r v R = P ˆr = P r r, ( G T = P ˆt = P G r ), (1.64) r B = P ˆb = P G G. Baza styczna składa się z następujących wersorów: normalnego ˆn, który określa kierunek normalnej zewnętrznej do krzywej jaką jest orbita, 24

stycznego ŝ, który pokrywa się z kierunkiem wektora prędkości, binormalnego ˆb, wspólnego dla obu baz. Siła P ma w tej bazie składowe N, S i B: P = N ˆn + Sŝ + Bˆb. Wartości tych składowych można wyliczyć z definicji ( v N = P ˆn = P v G ), G S = P ŝ = P v v, (1.65) B = P ˆb = P G G. Ponieważ składowa B jest jednakowa w obu bazach, pozostaje nam jedynie problem związku między składowymi R, T i N, S. Transformacja z r-t-b do n-s-b jest elementarna, gdyż wymaga jedynie obrotu o kąt π 2 δ, gdzie δ jest kątem między wektorami r i v (por. Rys. 1.2). A zatem czyli oraz ( R T ) = ( cos ( π 2 δ), sin ( π 2 δ) sin ( π 2 δ), cos ( π 2 δ) R = N sin δ + S cos δ, T = N cos δ + S sin δ, N = R sin δ T cos δ, S = R cos δ + T sin δ. ) ( N S ), (1.66) (1.67) (1.68) Funkcje trygonometryczne kąta δ są określone poprzez iloczyny wektorów r i v cos δ = r v r v = r ṙ r v = ṙ v, r v sin δ = = G r v r v = r f v. Jeśli sięgniemy do wzorów opisujących prędkość radialną ṙ i transwersalną rf oraz przyjmiemy skrótowe oznaczenie γ = 1 + 2 e cos f + e 2 25

tak, aby v = γ µ/p, to otrzymujemy cos δ = e sin f, γ sin δ = 1 + e cos f γ = p r γ. (1.69) Baza perycentryczna spotykana jest rzadziej. Tworzą ją wersory: perycentryczny ê, czyli wersor wektora Laplace a, skierowany do perycentrum, prostopadły do perycentrum ˆQ = ˆb ê, leżący w płaszczyźnie orbity (zwany też wersorem Hamiltona), binormalny ˆb. W odróżnieniu od radialnej i stycznej, baza ta jest nieokreślona w przypadku orbit kołowych. 1.5.9 Ostateczna postać wzorów Gaussa Po zdefiniowaniu baz, możemy przejść do ostatecznego uporządkowania równań Gaussa dla elementów oskulacyjnych wypisując każde z nich w trzech postaciach: najpierw w postaci wektorowej a następnie jako funkcje składowych R, T, B oraz N, S, B. Wyprowadzenie tych wzorów na podstawie równań (1.44, 1.45, 1.51, 1.52, 1.54, 1.63) jest elementarne i pozostawimy je jako samodzielne ćwiczenie. Podamy tylko wersję dla zaburzonych orbit eliptycznych. 26

Użyjemy oznaczeń s = sin I, c = cos I, p = a (1 e 2 ), oraz n = µ a 3. Równania dla pięciu elementów oskulacyjnych to: ȧ = 2 a2 µ P v = 2 n 1 e 2 [ (r v) r + (a p r 2 ) v [ R e sin f + T p ] = 2 v r n 2 a ] 1 ė = P µ a e 1 e 2 = [R sin f + T (cos f + cos E)] n a = 1 [ S 2 p v r cos E + N 1 e 2 sin E I r cos (f + ω) = (r v) P = µ p ω = r [ µ p µ p e r = 1 [ ( p R cos f + T 1 + r ) sin f e µ p S, (1.70) ], (1.71) r cos (f + ω) µ p B, (1.72) ] (cos E + e) r (p + r) sin f v ] c Ω P c Ω = 1 e v [2 S sin f N (e + cos E)] c Ω, (1.73) r sin (f + ω) r sin (f + ω) Ω = (r v) P = s µ p s B. (1.74) µ p Do tego dochodzi szóste równanie dla anomalii średniej Ṁ = n 1 [ n a 2 2 P r + ( µp ω + c Ω )] = n 1 n a 2 [ R (2 r e p cos f) + T (r + p) sin f ] e = n 1 e 2 v e [ N (cos f e) S lub jeszcze prostsze dla anomalii prawdziwej f = ( 1 + 2 r e2 p ) sin f ], (1.75) µ p r 2 ω c Ω. (1.76) 27

1.5.10 Elementy nieosobliwe WYKŁAD 6 Przyglądając się równaniom Gaussa zauważymy, że jeśli e = 0, to nie wolno używać wzorów dla ė, Ṁ i ω, gdyż albo wystąpi dzielenie przez zero, albo odwołamy się do nieokreślonych kątów f i E. Natomiast jeśli I = 0 lub I = π, to nie wolno używać równań dla I lub Ω, gdyż albo wystąpi dzielenie przez zero, albo pojawi się nieokreślony kąt f +ω. Oczywiście, nie oznacza to, że nie potrafimy się obchodzić z takimi orbitami. Wystarczy wtedy stosować tzw. elementy nieosobliwe, będące funkcjami elementów keplerowskich. Są to np. q = sin I 2 cos Ω, p = sin I 2 sin Ω, (1.77) ϖ = ω + Ω, dla małych nachyleń lub k = e cos ϖ, h = e sin ϖ, λ = M + ϖ, (1.78) dla małych mimośrodów. Niestety, te tradycyjne symbole kolidują z równie tradycyjnym p parametr orbity, q odległość perycentrum, h stała siły żywej, k stała Gaussa... Odpowiednia modyfikacja równań Gaussa prowadzi do równań pozbawionych osobliwości. Na przykład, dla małych mimośrodów używamy λ = Ṁ + ϖ, oraz k = ė cos ϖ e ϖ sin ϖ = ė k h 2 + k 2 h ϖ, ḣ = ė sin ϖ + e ϖ cos ϖ = ė h h 2 + k 2 + k ϖ. Zauważmy, że zmienne h, k są poprawnie określone nie tylko dla orbit kołowych, lecz i dla orbit z zerowym nachyleniem. To, że kąt ϖ jako formalna suma ω + Ω nie traci sensu geometrycznego przy zerowym nachyleniu, jest oczywiste: przechodzi on gładko w kąt płaski między wersorami ˆx i ê. 28

Pokażmy jednak, że równanie Gaussa dla ϖ nie zawiera osobliwości, jeśli wykonamy w nim stosowne przekształcenie. Przypomnijmy wzór (1.54), który przepiszemy w postaci gdzie ω = F cos I Ω, µ e F = 2(r ˆQ)(v P ) (v ˆQ)(r P ) (r v)( ˆQ P ). Mamy więc dla długości perycentrum ϖ = ω + Ω = F + (1 cos I) Ω. µ e W sytacji zerowego nachylenia wyraz F/(µ e) nie sprawia żadnych kłopotów, natomiast w Ω, które dane jest równaniem (1.74), pojawia się zrówno dzielenie przez sin I = 0, jak i nieokreślony kąt f + ω: Ω = r sin (f + ω) sin I G P ˆb. Po wstawieniu (1.74), równanie dla ϖ przybiera postać ϖ = F [ ] 1 cos I r sin (f + ω) µ e + P sin I G ˆb. Ale wyrażenie w nawiasie kwadratowym to nic innego jak tangens połowy nachylenia, więc mamy ϖ = F µ e + tg I 2 r sin (f + ω) G P ˆb. Przy nachyleniu I = 0, cały drugi składnik znika i problem nieokreślonego argumentu f +ω przestaje być istotny. Oczywiście, bardziej eleganckim rozwiązaniem jest wyrugowanie kąta ω, co łatwo zrealizować przy pomocy zmiennych p, q: sin (f + ω) = sin (f + ϖ Ω) = sin (f + ϖ) cos Ω cos (f + ϖ) sin Ω = = q sin (f + ϖ) p cos (f + ϖ) sin I, 2 i tak otrzymujemy jawnie nieosobliwe ϖ = F µ e + r(q sin (f + ϖ) p cos (f + ϖ)) G 1 p 2 q 2 P ˆb, (1.79) 29

gdzie podstawiliśmy cos I/2 = 1 sin 2 I/2 = 1 (p 2 + q 2 ). Przekształcanie do postaci nieosobliwej ze względu na mimośród przebiega podobnie. Odpowiednikiem wykorzystania tangensa połowy nachylenia jest wtedy przekształcenie 1 1 e 2 e = e 1 + 1 e 2. 1.6 Przykładowe zastosowania równań Gaussa Spróbujemy teraz zilustrować zastosowania równań Gaussa zanim jeszcze zajmiemy się ogólnymi metodami rozwiązywania równań ruchu. Istnieją dwa przypadki, w których zastosowanie równań Gaussa staje się uzasadnione: po pierwsze gdy mamy do czynienia z siłą dyssypatywną jak na przykład opór ośrodka, po drugie gdy stosujemy tzw. przybliżenie impulsowe, w którym siła zmienia się skokowo (fizycznie odpowiada to takim efektom jak odpalenie silnika statku kosmicznego, zaburzenie ruchu przez pojedyncze i krótkotrwałe zbliżenie z trzecim ciałem itp.). W pierwszym przypadku nie można wprowadzić potencjału, co uniemożliwia zastosowanie formalizmu bardziej szczegółowego niż newtonowski. W drugim posługiwanie się potencjałem jest w zasadzie możliwe, lecz zazwyczaj nieopłacalne. Przedstawmy przykłady obu zastosowań. 1.6.1 Wpływ oporu ośrodka na elementy oskulacyjne. Rozpatrzmy względne zagadnienie dwóch ciał, w którym na badaną masę działa hamująca siła P wywołana oporem nieruchomego ośrodka. Siła tego rodzaju skierowana jest stycznie do chwilowej orbity, w kierunku przeciwnym do wektora prędkości. Możemy więc zauważyć, że jej składowe w bazie stycznej maja wartości S = S(r, v) < 0, N = B = 0, gdzie bez względu na postać zależności tarcia od położenia ciała r i jego prędkości v, poprzestajemy jedynie na stwierdzeniu, że S < 0 a więc opór nie zanika ani (tym bardziej) nie zmienia znaku. Przyjrzyjmy się równaniom Gaussa (1.70 1.74), w których jedyną niezerową składową będzie S ȧ = 2 v n 2 a S < 0, ė = 2 p S r v 30 cos E,

I = Ω = 0, (1.80) ω = 2 S sin f. e v Pomijając równanie dla anomalii średniej (1.75) jako mniej istotne, zobaczmy jak wiele ważnych wniosków o ewolucji orbity można wysnuć z samych tylko równań Gaussa (bez ich rozwiązywania): 1. Półoś wielka orbity systematycznie maleje, gdyż ȧ < 0. W konsekwencji musi nastąpić kolizja obu mas zagadnienia dwóch ciał. 2. Działająca stycznie siła tarcia nie powoduje zmian w orientacji płaszczyzny orbity, gdyż nachylenie I oraz długość linii węzłów Ω pozostają stałe. A zatem trajektoria w tym zagadnieniu jest krzywą płaską o kształcie spiralnym (malejące a). 3. Zmiany oskulacyjnego mimośrodu zależą w sposób istotny od położenia badanej masy na orbicie: w pobliżu perycentrum (cos E > 0) opór ośrodka zmniejsza mimośród (ė < 0) natomiast w pobliżu apocentrum (cos E < 0) mimośród rośnie (ė > 0). Powstaje w tym momencie interesujące pytanie: czy zmiany mimośrodu mają charakter czysto okresowy? Innymi słowy, czy podczas każdego obiegu przyrost mimośrodu w pobliżu apocentrum jest w pełni kompensowany przez jego spadek w pobliżu perycentrum? Taka pełna symetria efektu zapobiegałaby systematycznym zmianom mimośrodu. Dokładna odpowiedź na to pytanie wymaga nie tylko znajomości dokładnej postaci siły P lecz również zastosowania odpowiedniej metody rozwiązywania równań ruchu. Można jednak pokusić się o pewne oszacowania: uwzględniając fizykę zagadnienia można przyjąć, że S(r, v) jest proporcjonalna do dodatniej potęgi v (najczęściej jest to v 1, v 3 2 lub v 2 ) oraz do niedodatniej potęgi odległości r β, gdzie β 0 (tzn. gęstość ośrodka jest albo stała albo maleje w miarę oddalania się od masy centralnej). Załóżmy, dla uproszczenia, że w ciągu jednego obiegu obowiązuje całka pól, a więc wartości iloczynu r v w perycentrum i w apocentrum są sobie równe (tzw. zasada dźwigni). W takim razie, oznaczając α 2p/(rv), mamy w perycentrum ė P = αs(q, v P ) < 0, a w apocentrum ė A = αs(q, v A ) > 0. 31

Zauważmy teraz, że S(q, v P ) > S(Q, v A ), co sugerują zarówno prędkości v P > v A jak i odległości q < Q. Jak widać, opór ośrodka powoduje systematyczny spadek mimośrodu orbity, gdyż ė P + ė A < 0. Przedstawione tu rozumowanie wymaga dwóch istotnych zastrzeżeń: po pierwsze, oparte jest na porównaniu dwóch punktów orbity i używa dość grubych przybliżeń; po drugie nie można twierdzić, jakoby mimośród asymptotycznie dążył do zera, gdyż równania Gaussa dla ė nie wolno stosować w przypadku małych mimośrodów. Malejący systematycznie mimośród jest typową cechą orbit eliptycznych poddanych oporowi ośrodka, ale wnioski o charakterze asymptotycznym, typu lim t e = 0, często są wyciągane zbyt pochopnie. 1.6.2 Manewry orbitalne (zmiana nachylenia) Jednym z prostszych zastosowań równań Gaussa jest opis manewru orbitalnego w przybliżeniu impulsowym. Manewr orbitalny to zmiana elementów orbity dokonywana przy pomocy silników korekcyjnych sztucznego satelity lub sondy kosmicznej. Przybliżenie impulsowe natomiast zakłada, że silniki działają stałą siła P (zwaną ciągiem) przez krótki czas t i zmiana w dowolnym elemencie orbity (na przykład w półosi wielkiej a) może być przedstawiona jako a ȧ t. (1.81) W każdym manewrze orbitalnym dąży się do uzyskania zamierzonej orbity przy minimalnym wydatku paliwa, co oznacza, że staramy się użyć jak najmniejszego impulsu (zwanego również popędem) W = P t. (1.82) Dla zilustrowania problemu zajmiemy się manewrem polegającym na zmianie nachylenia orbity. W świetle równania Gaussa (1.72) jedynie składowa normalna do płaszczyzny orbity powoduje zmianę nachylenia I, a zatem siła powodująca manewr powinna być skierowana prostopadle do płaszczyzny orbity i odpowiada jej impuls W = B t. Uzyskany przyrost nachylenia dany będzie wzorem I = r cos (f + ω) µ p W. (1.83) 32

Zastanówmy się teraz, w którym punkcie orbity należy uruchomić silniki aby uzyskać największy przyrost I przy zadanym W. Jedyną wielkością we wzorze (1.83) co do której mamy jakiś wybór jest anomalia prawdziwa f a więc musimy znaleźć maksimum funkcji r cos (f + ω) z warunku d (r cos (f + ω)) df = 0. Uwzględniając zależność r(f) otrzymamy r e sin f cos (f + ω) sin (f + ω) = 0. (1.84) p Dla małych wartości mimośrodu orbity e równanie (1.84) prowadzi do wniosku, że manewr zmiany nachylenia należy przeprowadzić w okolicach jednego z węzłów orbity, gdy (f + ω) 0 lub π. Analizując pozostałe równania Gaussa dochodzimy do wniosku, że manewr impulsem normalnym do płaszczyzny orbity przeprowadzony dokładnie w węźle spowoduje jedynie zmianę nachylenia nie wpływając na pozostałe elementy orbity. Zauważmy również, że przyrost I jest wprost proporcjonalny do odległości r ( ramię siły ), a zatem szczególnie uprzywilejowana będzie sytuacja, w której linia apsyd i linia węzłów pokrywają się, aby manewr można przeprowadzić zarazem w węźle i w apocentrum. 33

Rozdział 2 Formalizm kanoniczny WYKŁAD 7 Formalizm kanoniczny nazywany jest również formalizmem symplektycznym i stanowi on szczególny przypadek formalizmu Hamiltona. Podstawowe pojęcia tego formalizmu to położenia i pędy uogólnione oraz funkcja Hamiltona. Ruch układu mechanicznego zadany jest poprzez równania kanoniczne Hamiltona. W odróżnieniu od formalizmu newtonowskiego, zakres stosowalności formalizmu kanonicznego jest ograniczony, co bierze się z faktu, że cała dynamika układu jest zaszyfrowana w jednej skalarnej funkcji stanu (funkcji Hamiltona), która generuje prawe strony równań ruchu poprzez swój gradient. Musimy więc ograniczyć się do zagadnień z siłami potencjalnymi. Za tę cenę nabywamy jednak możliwość względnie prostego formułowania twierdzeń opisujących całe klasy ruchów. Z wielu sposobów wprowadzania formalizmu kanonicznego wybierzmy teorię form i równań Johanna Friedricha Pfaffa (1815). Najpierw jednak wprowadzimy kilka pojęć związanych z grupą macierzy symplektycznych. 2.1 Macierze i formy symplektyczne 2.1.1 Standardowa macierz symplektyczna i forma symplektyczna Oznaczmy przez J standardową macierz symplektyczną. Jest to antysymetryczna macierz kwadratowa stopnia parzystego 2M 2M, którą można zapisać w postaci blokowej jako jako ( ) 0M E J = M. (2.1) E M 0 M 34

Ponieważ E M oznacza macierz jednostkową M M, to na przykład dla dwóch stopni swobody mamy 0 0 1 0 0 0 0 1 J = 1 0 0 0. 0 1 0 0 Często można się spotkać z definicją standardowej macierzy symplektycznej która ma w porównaniu z (2.1) przestawione znaki, ale nie ma to wpływu na większość z dalszych wzorów. Standardowa macierz symplektyczna jest obiektem posiadającym szereg interesujących właściwości: J 2 J J = E 2M, J T J = E 2M, J 1 = J T = J, det J = 1. (2.2) Z dwóch wektorów x, y R 2M i macierzy J stopnia 2M można utworzyć algebraiczną formę dwuliniową 1 [x y] = x T Jy = x (Jy), (2.3) która nosi nazwę formy symplektycznej. Jest ona antysymetryczna, gdyż [y x] = y (Jx) = (Jx) y = (Jx) T y = x T J T y = x T Jy = [x y], gdzie skorzystaliśmy z przemienności iloczynu skalarnego i antysymetryczności macierzy J. Jak zwykle, antysymetryczność oznacza [x x] = 0. Jeśli w wektorach 2M-wymiarowych wydzielimy dwa M-wymiarowe bloki, na przykład x = col(q, Q), y = col(p, P ), to forma symplektyczna jest różnicą iloczynów skalarnych [x y] = q P p Q = q T P p T Q. (2.4) 2.1.2 Definicja macierzy symplektycznych Pamiętamy, że przekształcenia ortogonalne x x = Mx, y y = My, 1 Forma dwuliniowa to funkcja, która dwóm wektorom przyporządkowuje skalar i jest liniowa względem obu argumetów. Najbardziej znany przykład to iloczyn skalarny wektorów. 35

zachowują iloczyn skalarny, gdyż x y = (Mx) (My) = x T M T My = x y. W podobny sposób możemy zdefiniować liniowe przekształcenia symplektyczne x x = Sx, y y = Sy, postulując, aby dla każdej pary x y zachowywały one wartość formy symplektycznej [x y ] = [Sx Sy] = [x y]. (2.5) To oznacza warunek S T J S = J, (2.6) i każdą macierz S, która go spełnia, nazywamy macierzą symplektyczną. Korzystając z własności (2.2) łatwo można sprawdzić, że macierz standardowa J jest macierzą symplektyczną, gdyż J T JJ = EJ = J (od tego momentu opuszczamy indeks 2M macierzy jednostkowej dla skrócenia zapisu). Także macierz jednostkowa E jest macierzą symplektyczną: 2.1.3 Grupa symplektyczna E T JE = EJE = JE = J. Pokażemy teraz, że macierze symplektyczne stopnia 2M z działaniem mnożenia macierzy tworzą grupę, nazywaną grupą symplektyczną Sp(2M). Najpierw musimy wykazać, że iloczyn dwóch macierzy symplektycznych daje macierz symplektyczną, czyli że mnożenie jest działaniem wewnętrznym w Sp(2M). Niech S 1, S 2 Sp(2M). Wtedy, wychodząc od macierzy J, możemy zastosować dwa razy definicję (2.6) J = S T 2 JS 2 = S T 2 (S T 1 JS 1 )S 2 = (S T 2 S T 1 )J(S 1 S 2 ) = (S 1 S 2 ) T J(S 1 S 2 ), a to znaczy, że S = S 1 S 2 jest macierzą symplektyczną. Pozostały do sprawdzenia trzy warunki: łączność mnożenia, istnienie elementu neutralnego w zbiorze macierzy symplektycznych oraz istnienie elementu odwrotnego dla każdej macierzy symplektycznej. Pierwsze dwa są spełnione, gdyż łączność jest podstawową cechą iloczynu macierzy, zaś jego element neutralny, macierz E, jest macierzą symplektyczną, co pokazaliśmy 36